耶鲁大学研究团队通过构建SCIREAS评估体系和KRUX分析框架,系统研究了大语言模型在科学推理中的表现。研究发现,模型的主要瓶颈不是推理能力而是知识检索能力,基础模型在获得外部知识支持后甚至能超越专门的推理模型。团队还开发了SCILIT01作为开源科学推理基线,为未来AI科学应用的改进提供了新方向。
微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。该技术采用连续语音编码器实现3200倍压缩率,结合大语言模型和下一令牌扩散技术,支持最多4个说话者的自然对话生成。在多项评测中全面超越现有系统,为播客制作、有声读物等应用开辟新可能。
上海人工智能实验室等机构联合发布CMPhysBench,这是首个专门评测AI在凝聚态物理领域能力的基准测试。研究包含520道研究生级别题目,并开发了新的SEED评分系统。测试结果显示,即使最强的AI模型准确率也不足30%,暴露了AI在深度科学推理方面的明显短板,为科学AI的发展指明了方向。
星际创想实验室发布突破性AI系统Spacer,通过"故意去语境化"技术让人工智能具备科学创新能力。系统由关键词挖掘引擎Nuri和概念生成管道组成,能从18万篇论文中发现新研究方向。验证显示其预测准确率达73.7%,概念重构成功率超85%,生成想法更接近顶级科学研究。
ByteDance研究团队开发的UltraMemV2成功让记忆层架构性能追平顶级8专家MoE模型,同时大幅降低内存访问成本。该技术通过五个关键改进,在长文本记忆等任务上表现更佳,验证了高达1200亿参数的可扩展性,为高效稀疏计算提供了重要替代方案,有望推动AI系统向更智能高效方向发展。
字节跳动推出OmniHuman-1.5,首次将认知科学的双系统理论应用到虚拟人技术中。该技术通过多模态大语言模型模拟人类的推理思考,结合创新的MMDiT架构和伪最后帧技术,让虚拟人不再只是机械地同步口型,而是能够根据说话内容的语义做出相应的表情和动作,大幅提升了虚拟人表现的自然度和智能化水平,为教育、娱乐、客服等领域带来革命性应用前景。
字节跳动团队开发的TreePO技术通过树状结构重新组织AI推理过程,让多个推理路径共享相同前缀,避免重复计算。该技术在保持准确率的同时将训练效率提升22%-43%,在数学推理任务上表现优异,准确率从46.63%提升至58.21%。这项创新不仅能让AI助手响应更快更准,还可应用于教育、科研等多个领域,代表了从追求模型规模向追求算法效率的重要转变。
OpenAI今日宣布计划为ChatGPT配备新的安全功能,当用户遭遇心理或情感困扰时能提供更有效的帮助。首项更新将专注于GPT-5的路由组件,能检测用户急性困扰并调用推理优化的大语言模型。公司还将推出家长控制功能,允许家长与青少年账户关联,设置年龄适宜的行为规则并禁用特定功能。系统检测到青少年处于急性困扰时会发送通知。OpenAI将与青少年发展、心理健康专家委员会及全球医师网络合作完善这些功能。
CTERA云文件服务公司发布的2025年数据与云战略调查报告显示,83%在过去两年遭受勒索软件感染的企业成功恢复,仅17%遭受永久数据丢失。调查涵盖美国、欧洲、中东、非洲和亚太地区300名高级IT和安全负责人,所有受访企业均在过去两年内遭遇勒索软件攻击。报告显示80%的领导者将安全视为2025年首要关注点,仅10%企业支付赎金。此外,98%受访者正在部署大语言模型和AI工具。
英伟达最新财报显示,尽管面临地缘政治压力和新兴竞争对手,公司依然保持强劲增长。超大规模云提供商如微软、谷歌和亚马逊AWS占其销售额近40%,体现了AI需求的高度集中。博通在数据中心领域的作用日益重要,其网络技术与英伟达GPU形成互补。企业级市场采用较慢,但概念验证项目增长显示需求正在复苏。
提示词恶意软件是一种针对对话式和生成式AI的新型恶意攻击,能强制AI执行用户不希望的指令。研究人员在黑帽大会上演示了如何通过隐藏在日常消息中的恶意提示词,让谷歌Gemini AI控制智能窗户、锅炉等设备。防护措施包括:及时更新设备系统,拒绝打开未知来源消息,避免让AI总结不可信内容,在邮件和日历等应用中禁用AI功能,以及谨慎复制粘贴邮件主题和文件名等内容。
微软向Windows Insider发布了Windows 11 25H2预览版,正式版将于今年晚些时候推出。该版本采用与24H2相同的服务分支,安装过程类似启用包。市场数据显示,Windows 11份额达49.08%,Windows 10为45.53%,新系统继续保持领先。在美国市场,Windows 11份额接近60%,而在欧洲市场Windows 10仍占主导地位。随着Windows 10即将停止免费支持,用户迁移趋势值得关注。
Denodo推出DeepQuery功能,声称可超越检索增强生成技术的局限性。该技术不仅检索事实,还能进行调查、综合分析并解释推理过程。DeepQuery基于Denodo数据管理平台的语义层,可直接访问实时企业数据,通过结构化推理分析多数据源,为复杂的多步骤分析问题提供可解释的答案。该技术面向业务用户和分析师,让非技术团队能用自然语言提问并获得基于证据的可信洞察。
数字内存计算芯片初创公司d-Matrix推出3D堆叠内存技术,声称相比当前行业标准HBM4,该技术可将AI模型运行速度提升10倍,能耗降低90%。该公司成立于2019年,采用LPDDR5内存配合数字内存计算硬件,通过改进的SRAM单元直接在内存阵列中执行计算。首款3DIMC芯片Pavehawk已在实验室投入运行,下一代架构Raptor将整合该技术。
高盛研究显示,受AI需求驱动,数据中心容量预计到2027年将激增50%,该行业能耗到2030年将翻倍。目前全球数据中心容量约62吉瓦,AI工作负载仅占13%,但预计2027年将达28%。AI数据中心繁荣可能使全球半导体收入在2024-2030年间翻倍,超过1万亿美元。然而高盛警告正密切关注AI采用可能不及预期的迹象。
研究显示,90%的企业正在试点或实施AI技术,较2023年的59%大幅上升。与此同时,网络安全威胁日益严峻,29%的技术领导者表示其组织在过去两年遭受重大攻击。AI正被广泛部署到网络安全团队中,从威胁检测到漏洞分析,各个环节都在AI化。因此,具备AI技能的网络安全人才需求激增,成为招聘的重要标准。未来网络安全将是人工智能与人类专家相结合的混合模式。
2025 年带来了地缘政治和经济的不确定性,使制造商不得不考虑将时间和资源投资于何处。因此,工程领导者正在关注产品开发和 CAD 的变化,这些变化可能会立即影响业务成果。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。