最新文章 - 至顶网

多模态AI

可控字幕生成

个性化AI系统

2025-07-23

AnyCap项目：清华大学团队打造的多模态字幕生成"魔法师"，让AI精准理解你的个性化需求

清华大学团队推出AnyCap项目，通过轻量级"即插即用"框架解决多模态AI字幕生成缺乏个性化控制的问题。该项目包含模型、数据集和评估基准，能让现有AI系统根据用户需求生成定制化字幕，在不重训基础模型的情况下显著提升控制能力，为AI内容创作的个性化发展奠定基础。

人工智能

消融实验

科学研究

2025-07-23

耶鲁大学团队开发AI科学助手：能否替代人类专家设计实验？

耶鲁大学团队开发了全球首个AI科学实验设计评估系统ABGEN，测试了18个先进AI模型设计消融实验的能力。研究发现最好的AI系统得分4.11分，仍低于人类专家的4.80分，但在人机协作模式下表现显著改善。研究还发现现有自动评估系统可靠性不足，建立了元评估基准ABGEN-EVAL。这项研究为AI在科学研究中的应用提供了重要评估框架。

视觉AI

强化学习

高效模型

2025-07-23

这个AI助手发明了一个"看图思考"的新技能，能像侦探一样根据需要放大图片寻找线索——香港中文大学团队如何让视觉AI变得更聪明节能

香港中文大学团队开发的VisionThink系统通过强化学习让AI视觉模型具备了类似人类的智能决策能力，能够根据任务需要动态调整图片处理精度。该系统在节省75%计算资源的同时还提升了识别准确性，在多个视觉任务中表现优于传统方法，为AI视觉系统的高效智能化发展指明了新方向。

人工智能

自然语言处理

自适应算法

2025-07-23

俄亥俄州立大学团队突破性研究：让AI模型学会"见机行事"的智能文本切割技术

俄亥俄州立大学团队开发了FlexiTokens技术，解决了AI文本处理中的"一刀切"问题。该技术让AI模型能够根据不同内容和场景自动调整分词策略，在医学、法律等专业领域和多语言处理方面表现出色，性能提升高达10%，同时显著提高处理效率。

视频插帧技术

布朗桥扩散

时间感知自编码器

2025-07-23

中央佛罗里达大学突破性视频插帧技术：让AI学会"脑补"丢失的视频画面

中央佛罗里达大学开发的TLB-VFI技术通过在像素空间和潜在空间同时提取时间信息，解决了视频帧插值中的关键问题。该技术使用布朗桥扩散和3D小波变换等创新方法，相比现有方法参数减少3倍、速度提升2.3倍，在最具挑战性测试中性能提升约20%，为视频处理领域带来重要突破。

人工智能

肖像动画

多人动画

2025-07-23

阿里巴巴研究团队突破多角色面部动画技术：让照片中的多个人物同时"活"起来

阿里巴巴集团高德地图团队与北京邮电大学合作开发的FantasyPortrait系统，实现了突破性的多人肖像动画技术。该系统采用隐式表情控制和遮罩交叉注意力机制，能够让静态照片中的多个人物同时展现不同的表情动作，在跨身份重现和多人协调动画方面显著优于现有方法，为影视制作、虚拟通信和游戏娱乐等领域带来革命性突破。

人工智能

代码生成

版本兼容性

2025-07-23

这些代码"变色龙"能适应不同版本的代码库吗？瑞士科学家们的惊人发现

瑞士和德国研究团队通过创建GitChameleon测试平台，发现当前最先进的AI编程助手在处理特定版本代码库时成功率仅48-51%。研究揭示了AI系统的"版本困惑症"问题，即难以准确区分不同版本库的用法差异。通过自我调试和文档检索等方法可显著改善AI表现，为未来开发更可靠的版本感知AI编程助手提供了重要参考。

多模态AI

超网络技术

模型组合优化

2025-07-23

学会"缝合"AI模型：马普所团队用超网络破解多模态模型组合难题

马普所研究团队提出HYMA方法，用超网络技术解决多模态AI模型组合难题。该方法能以传统网格搜索1/10的计算成本找到最优模型组合，改变了需要穷举尝试所有可能组合的现状。通过联合训练一个"万能连接器生成器"，HYMA可为任意模型对生成合适连接器，在保持性能的同时大幅提升效率。

跨模态学习

知识蒸馏

多模态AI

2025-07-23

西安电子科技大学团队发明"超级老师"新技术：让AI跨模态学习更聪明

西安电子科技大学研究团队提出MST-Distill框架，创新性地解决了跨模态知识蒸馏中的教师选择和知识漂移问题。该框架通过专业化教师混合体系和动态路由机制，让AI能够像人类一样综合处理视觉、听觉、文本等多种信息，在五个多模态数据集上均取得显著性能提升，为构建更智能的多模态AI系统提供了重要技术基础。

人工智能

协议测试

开源工具包

2025-07-23

开源MCPEval让协议级智能体测试即插即用

Salesforce研究团队发布开源工具包MCPEval，基于模型上下文协议(MCP)架构评估AI智能体工具使用性能。该工具突破传统静态测试局限，通过全自动化流程收集详细任务轨迹和协议交互数据，为智能体行为提供前所未有的可视化分析。MCPEval能快速评估MCP工具和服务器，生成综合评估报告，为企业智能体部署提供可操作的改进建议。

2025-07-23

第三届安富利汽车生态圈峰会盛大启幕，双城联动激发智慧出行产业新动能

7月22日，第三届安富利汽车生态圈峰会（AAES2025）在杭州正式拉开帷幕。本次峰会以“智行未来·AI时代的汽车生态变革”为主题，汇聚国内外知名车企及生态链合作伙伴，围绕“智能驾驶”、“新能源动力”、“车·AI跨界协同”三大核心议题展开深度研讨

红帽

2025-07-23

在代理式AI中构建信任

AI可信度的关键驱动力之一是模型供应链透明度——一个允许企业评估和验证复杂系统中使用的AI组件的来源、安全性和一致性的框架。如果无法清晰了解AI模型是如何构建、训练和部署的，就几乎不可能对系统需求进行风险分析。

夸克

AI

2025-07-23

国内首个通过主任医师评测的大模型，已在夸克AI搜索上线

夸克健康大模型通过12门主任医师考试，超半数医学生在使用。

2025-07-23

CPC2501M固态继电器集成电路，集成了用于可视门铃的铃声旁路功能

具有自我保护功能的紧凑型设计，简化了物联网安全系统、家庭和楼宇自动化的安装

2025-07-23

紧凑型PTS647轻触开关系列增加了降噪和防尘功能

更新后的型号为音频、工业和医疗设计提供低噪声切换功能

网络通信

超低延迟

市场拓展

2025-07-23

Colt推出超低延迟服务瞄准加密货币交易市场

Colt科技服务公司推出超低延迟云连接服务Colt ULL DCA，专门面向加密货币交易商和AI应用开发企业的高速需求。该服务结合超低延迟网络和专用云接入平台，绕过公共互联网提供专用高速路径。在AWS亚洲区域测试中，平均延迟比原生路由降低15%。随着亚太地区数字资产交易成熟和AI需求爆发，企业对安全高性能连接需求激增，Colt正加速在东南亚扩张布局。

PTC

2025-07-23

PTC 携手 Makersite 加速可持续产品开发

在 PTC，我们始终相信，最具可持续性的商业实践是将环境责任与财务成功相结合的实践，唯有如此，才能实现长期的采用和深远的影响。

人工智能

编码器解码器

模型训练

2025-07-23

约翰霍普金斯大学震撼发现：AI界的"双胞胎实验"揭示语言模型的真正奥秘

约翰霍普金斯大学研究团队开发了ETTIN模型套件，首次实现了编码器和解码器模型的公平比较。研究发现编码器擅长理解任务，解码器擅长生成任务，跨界训练效果有限。该研究为AI模型选择提供了科学依据，所有资料已开源供学术界使用。

人工智能

自然语言处理

情感分析

2025-07-23

博洛尼亚大学AI团队巧用情感分析，让AI更精准识别新闻中的主观表达

博洛尼亚大学团队开发出情感增强的AI系统，通过结合情感分析和文本分类技术，显著提升了新闻文章中主观性表达的识别准确率。该研究覆盖五种语言，在多项国际评测中取得优异成绩，为打击虚假信息和提升媒体素养提供了新工具。

让电脑用一个摄像头就能追踪3D世界中任何物体的运动轨迹：浙江大学团队让视频理解迈入新时代

3D点追踪技术

统一端到端框架

大规模数据训练

2025-07-23

让电脑用一个摄像头就能追踪3D世界中任何物体的运动轨迹：浙江大学团队让视频理解迈入新时代

这项由浙江大学周晓巍教授团队联合牛津大学、蚂蚁集团等机构开发的SpatialTrackerV2系统，实现了仅用普通摄像头就能精确追踪视频中任意点的三维运动轨迹。通过创新的统一框架和大规模数据训练，该技术在权威测试中相比前代方法准确率提升50%以上，运行速度快50倍，为机器人、自动驾驶、VR等领域提供了突破性的技术基础。

1
2
3
4
5
...
1714
1715

数源AI

AI源于数据，数源AI专注于AI领域入门及提升，让大家能够更加快速高效的完成相关专业知识的学习！学AI就来数源！

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: