最新文章第36页

2025-09-05

巴赫切希尔大学发现：智能目标检测模型在模糊噪音环境中的"视力"挑战

巴赫切希尔大学研究团队通过对五种不同规模YOLO模型的量化鲁棒性测试发现，静态INT8量化虽能带来1.5-3.3倍速度提升，但会显著降低模型对噪音等图像损伤的抵抗能力。他们提出的混合校准策略仅在大型模型处理噪音时有限改善，揭示了效率与鲁棒性平衡的复杂挑战。

多模态学习

科学发现自动化

视觉推理算法

2025-09-05

人工智能化身物理学家：北卡罗来纳大学团队开发能"看"懂运动规律的AI系统

北卡罗来纳大学团队开发的VIPER-R1系统首次实现了从视觉观察到物理定律的自动发现。该系统模拟物理学家的认知过程，通过观察运动图像和数据自动生成物理公式，准确率达81.2%，远超现有AI系统。这项技术有望加速工程、材料科学等领域的科学发现进程。

人工智能

视频生成

3D建模

2025-09-05

清华北航等打造"Droplet3D"：从视频中学会3D创作的AI系统

清华北航等联合开发Droplet3D系统，通过观看视频学习3D创作。该系统构建了包含400万3D模型的Droplet3D-4M数据集，每个模型配有85帧环绕视频和260词详细文本描述。用户只需提供一张图片和文字描述，即可生成高质量3D内容，支持精确的语言控制和风格化输入处理。实验显示其性能全面超越现有方法，在场景级生成方面展现独特优势。

计算机视觉

多模态学习

对称检测

2025-09-05

普渡大学团队首次让AI"看懂"对称美：CLIP模型开启视觉对称检测新时代

普渡大学研究团队开发出CLIPSym系统，首次结合视觉和语言信息进行对称检测。该系统通过CLIP模型同时理解图像和文字描述，使用语义感知提示聚合技术和旋转等变解码器，在三个标准数据集上均超越现有方法。研究证实了多模态学习在几何特征识别中的优势，为计算机视觉、建筑设计、工业质检等领域提供了新的技术方案。

腾讯联合多所名校重磅发布：AI写代码竟然存在严重安全漏洞，这套全球首个仓库级安全测试基准让所有大模型都露了底

人工智能

代码生成安全

基准测试评估

2025-09-05

腾讯联合多所名校重磅发布：AI写代码竟然存在严重安全漏洞，这套全球首个仓库级安全测试基准让所有大模型都露了底

腾讯联合多所名校发布全球首个AI代码安全评估基准A.S.E，对26个主流大模型进行全面测试。研究发现即使最先进的AI模型在代码安全方面仍存在显著缺陷，最佳模型安全得分仅46.72分。意外的是，"慢思考"模型表现不如"快思考"版本，开源模型在安全性上可与商业模型竞争。该研究揭示了AI代码生成的真实安全风险，为行业发展提供重要指导。

NVIDIA

AI工厂

供应链

2025-09-05

从“世界工厂”到“AI 工厂” 黄仁勋在中国看到了“下一场工业革命”

工业升级的关键，或许在于智能本身。“工业+机器人”将成为通向下一阶段工业体系的核心抓手。——黄仁勋。

雷鸟

2025-09-05

雷鸟创新宣布与B&O合作，2025年全球出货量排名第一

雷鸟创新宣布与Bang & Olufsen 达成全球长期技术合作。

2025-09-05

更高效、更智能、更韧性：大众汽车集团携手亚马逊云科技，助力生产转型迈入AI时代

更高效、更智能、更具韧性：大众汽车集团正加速迈向由AI驱动的未来汽车生产。亚马逊云科技与大众汽车在“数字化生产平台（Digital Production Platform）”的合作再延长五年。

香港中文大学推出TalkVid：让AI说话视频告别偏见，覆盖全球各种人群的超大数据集

音视频生成

数据集构建

AI公平性

2025-09-05

香港中文大学推出TalkVid：让AI说话视频告别偏见，覆盖全球各种人群的超大数据集

香港中文大学等机构联合发布TalkVid数据集，包含1244小时高质量说话视频，覆盖7729名不同背景说话者和15种语言。该数据集专门解决现有AI说话视频生成技术的种族、年龄、语言偏见问题。同时发布TalkVid-Bench评估基准，能够检测模型公平性。实验证明使用该数据集训练的模型在各群体上表现均衡，为构建更加公平包容的AI技术奠定基础。

代码嵌入

深度学习

智能检索

2025-09-05

MIT和Jina AI团队联手打造：小身材大能量的代码搜索新利器

MIT和Jina AI联合开发的jina-code-embeddings代码嵌入模型，通过改造预训练代码生成模型实现高效代码检索。该模型支持自然语言查询代码、技术问答和跨语言代码搜索，尽管参数规模较小（0.5B-1.5B），但在25项基准测试中表现优异，为AI辅助编程和智能开发环境提供了高性价比的基础工具。

F5

AI

算力

2025-09-05

穿越AI“巴别塔” 25岁的F5交出一张平台化“答卷”

深耕中国市场25年的F5选择主动“重构”。通过ADSP帮助企业构建面向AI原生架构的底层“数字操作系统”平台。

人工智能

动态数据混合

模型训练优化

2025-09-05

ByteDance推出TiKMiX：让AI训练像调味师一样动态调配数据配方

ByteDance研究团队提出TiKMiX方法，通过引入"组影响力"概念动态调整AI训练数据配比，解决传统静态配方导致的训练效率低下问题。该方法能根据模型不同训练阶段的数据偏好实时调整，仅用传统方法20%的计算资源就实现更优性能，在多项测试中平均提升2%效果，为大模型训练提供了更智能高效的解决方案。

2025-09-05

AI“卷”成了“牛马”，我们“卷”什么？

新工作时代：AI 工作流由谁主导？

人工智能

GUI操作系统

中文应用优化

2025-09-05

美团研究院打造超级GUI助手：让电脑和手机像人类一样"看懂"屏幕并自动操作

美团研究团队推出突破性GUI操作AI系统UItron，能够像人类一样理解屏幕内容并自动执行复杂操作任务。该系统采用三段式训练方法，在多项标准测试中表现卓越，特别是在中文应用场景下达到54.1%的任务成功率，显著超越其他同类系统。研究团队收集了超过一百万步中文应用操作数据，为GUI代理在中文环境的实际应用奠定了基础。

人工智能

界面自动化

无障碍技术

2025-09-05

当AI学会"察言观色"：卡内基梅隆等高校如何让盲人用户重新掌控自动化选择权

卡内基梅隆大学等机构研究团队开发了名为Morae的智能界面助手，专门解决盲人用户在使用AI自动化工具时失去选择权的问题。通过"动态模糊选择验证"机制，Morae能在关键决策点主动暂停询问用户偏好，而非自动替用户选择。用户研究显示，相比传统AI助手，Morae帮助用户做出了更多符合个人偏好的选择，显著提升了用户满意度和控制感。

音频语言模型

评估基准

人工智能

2025-09-05

斯坦福大学突破性音频AI评估：全面揭示音频语言模型真实能力与潜在风险

斯坦福大学研究团队构建了AHELM评估系统，首次对14个主流音频语言模型进行标准化全面测试。研究发现Gemini 2.5 Pro综合表现最佳但存在性别偏见，传统语音识别方法在多项任务中击败先进AI模型，揭示了当前音频AI技术的真实能力边界和潜在风险。

人工智能

机器人学习

深度学习

2025-09-05

机器人也能学会"七十二变"？清华大学团队让机器人从视频中学会灵巧操作

清华大学研究团队开发了HERMES系统，让机器人能通过观看人类操作视频学会复杂双手协作任务。该系统融合多源数据，采用通用奖励机制和虚实结合训练方法，配备精确导航定位能力。实验显示平均成功率达67.8%，在医疗、制造、家庭服务等领域展现广阔应用前景，代表了机器人从数据驱动向理解式学习的重要进展。

多模态AI

强化学习

自适应算法

2025-09-05

腾讯混元团队的新突破：AI模型也能学会"看情况办事"了！

腾讯混元团队开发出R-4B多模态大语言模型，实现了AI的"自动思考"能力。该模型能根据问题复杂程度智能选择回答模式：简单问题快速直答，复杂问题深度推理。通过双模式退火训练和强化学习优化，R-4B在25个基准测试中取得领先性能，4B参数量下达到16B模型的推理效果，同时大幅降低计算成本，为高效AI应用开辟新路径。

机器人技术

视觉-语言-动作模型

通用人工智能

2025-09-05

上海AI实验室发布EO-1机器人：全球首个真正会推理的机器人大脑诞生

上海AI实验室联合复旦大学等机构发布EO-1机器人智能系统，首次实现真正的机器人推理能力。该系统通过创新的"交错式视觉-文本-动作预训练"技术，让机器人具备了像人类一样"边看边想边做"的综合智能。EO-1在多个测试中超越现有系统，能够处理复杂的长期任务、进行战略推理，并适应不同硬件平台，标志着机器人技术迈入智能化新阶段。

人工智能

多模态学习

情感识别

2025-09-05

让AI既能看人脸又能听声音：比利时和美国科学家的多感官"读心术"突破

比利时蒙斯大学和美国南加州大学联合开发了Social-MAE，这是一个能够同时理解人脸表情和声音情感的AI系统。该系统通过分析8个连续视频帧和音频特征，在VoxCeleb2大型社交数据集上进行自监督学习，在情感识别、笑声检测和性格分析三项任务中均达到了业界最佳水平，为智能教育、医疗诊断、人机交互等领域开辟了新的应用前景。

Linkloud

GO global, BE global.

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: