清华大学等机构组织的MARS2多模态推理挑战赛历时两个多月,76支知名团队参与,通过三个赛道全面考察AI在真实场景视觉定位、空间感知问答和广告视频推理等复杂任务上的能力,结果显示即使最先进AI模型表现仍不理想,为推动人工智能向真正智能化发展提供了重要基准和研究方向。
阿里巴巴通义实验室推出Wan-Animate,这是一项革命性的角色动画技术,能让静态照片中的人物按照参考视频动起来。该技术支持动画和替换两种模式,通过精确控制身体动作和面部表情,实现高质量角色视频生成。在与商业产品的对比中表现优异,研究团队承诺完全开源,为AI社区提供强大工具。
中科大与科大讯飞研究团队开发出THOR系统,创新性地解决了大语言模型在精确数学计算上的根本缺陷。该系统通过TIRGen数据生成、分层强化学习和实时自我纠错三大技术突破,让AI学会智能调用外部工具进行精确计算。在多项数学竞赛中,THOR表现卓越,在AIME竞赛中达到50%正确率,比同类模型提升近一倍,标志着AI数学推理能力的重大进步。
ZeroEntropy团队提出zELO训练方法,借鉴象棋ELO评分系统,通过AI模型两两比较文档相关性来训练重排序器。该方法避免了传统人工标注的高成本问题,训练出的zerank模型在多个领域测试中显著超越商业竞争对手,同时开源了模型权重和训练工具,为AI搜索技术发展提供了新的训练范式。
ServiceNow、Fundamental、Galileo.ai与Pulse作为Cloudera新合作伙伴,参加Cloudera年度大会EVOLVE25纽约站
Cloudera 凭借 REST Catalog推动 Iceberg创新,实现零拷贝数据共享和统一元数据智能
通过Dell ObjectScale与Cloudera的联合认证,双方客户可在其数据所在位置进行计算,同时拥有受控元数据和低延迟访问能力
如果说大模型的上半场是以互联网大数据预训练为代表的数字AI;而下半场,是以机器人、世界模型等为代表的物理AI。汽车可能正好处于两者之间的分水岭上。
美国网络安全和基础设施安全局指示联邦机构修补影响思科ASA 5500-X系列防火墙设备的两个零日漏洞CVE-2025-20362和CVE-2025-20333。这些漏洞可绕过VPN身份验证并获取root访问权限,已被黑客积极利用。攻击与国家支持的ArcaneDoor黑客活动有关,黑客通过漏洞安装bootkit恶意软件并操控只读存储器实现持久化。思科已发布补丁,CISA要求机构清点易受攻击系统并在今日前完成修补。
TimeWave是一款功能全面的计时器应用,超越了苹果自带时钟应用的功能。它支持创建流式计时器,让用户可以设置连续的任务计时,帮助专注工作。应用采用简洁的黑白设计,融入了Liquid Glass元素。内置冥想、番茄工作法、20-20-20护眼等多种计时模式,支持实时活动显示和Siri快捷指令。免费版提供基础功能,高级版需付费订阅。
亚马逊即将在周二举行备受瞩目的秋季硬件发布会,预计将推出多款新产品和技术更新。此次活动可能涵盖智能家居设备、语音助手技术升级以及其他消费电子产品的最新进展。业界普遍关注亚马逊在人工智能和物联网领域的新动向。
英伟达CEO预计到本十年末,AI基础设施投资将达3-4万亿美元。微软向OpenAI投资近140亿美元,Oracle获得3000亿美元计算合约,Meta计划在2028年前投资6000亿美元建设美国基础设施。这些投资正推动超大规模数据中心建设,但也给电网带来巨大压力。特朗普宣布的Stargate项目计划投资5000亿美元建设AI基础设施,成为历史上最大的AI基础设施项目。
风投正通过AI改造传统服务业务以获取软件般的高利润率。通用催化剂等公司投入15亿美元收购成熟专业服务公司,用AI自动化任务后再收购更多企业。虽然该策略在某些案例中显示出效果,但斯坦福研究发现40%员工因AI生成的低质量工作内容而承担更多负担,每人每月造成186美元的隐性成本。这表明仅仅部署AI并不能保证改善结果,服务业AI转型可能比预期更复杂。
伯克利与阿布扎比研究团队开发出RAPTOR系统,这是首个能够零调试控制多种无人机的通用AI控制器。该系统仅用2084个参数就能控制从32克到2.4公斤的各种无人机,通过创新的元模仿学习算法实现毫秒级快速适应,在10种真实无人机上验证了卓越性能,为无人机控制技术带来革命性突破。
伦敦玛丽女王大学研究团队开发出创新的数字音频技术,使用牛顿-拉夫逊数学方法成功复制经典Teletronix LA-2A模拟压缩器。该方法仅需五个参数和20分钟训练时间,大幅超越传统深度学习效率,并制作成开源VST插件4A-2A供音乐制作者免费使用,为虚拟模拟建模领域提供了高效可解释的新方案。
卡内基梅隆大学联合微软研究院提出首个针对结构化文本数据的差分隐私评测框架Struct-Bench。该框架通过上下文无关文法描述数据结构,从结构完整性、语义质量和应用效果三个维度评估合成数据质量。研究在七个数据集上测试发现,当前方法在结构化数据生成方面表现不佳,格式正确率普遍低于20%,为改进隐私保护数据生成技术提供了重要基准。
Stability AI团队开发的SP4D技术实现了AI视频生成的重大突破,首次让AI能够同时理解物体外观和运动结构。该技术通过双分支神经网络架构和创新的颜色编码方案,生成的视频内容不仅视觉真实,更具备完整的运动学信息,可直接用于专业动画制作,大幅提升了AI生成内容的实用价值和应用前景。
爱丁堡大学团队开发了ROOM医疗机器人训练模拟器,专门为支气管镜手术机器人生成逼真训练数据。该系统从患者CT扫描构建三维肺部模型,生成多模态传感器数据,解决了医疗机器人训练中真实数据稀缺的难题。实验证明ROOM数据能有效改善机器人的姿态估计和深度感知能力,为未来智能医疗技术发展奠定基础。
伊利诺伊大学等机构研究团队通过大规模实验发现了推荐系统中两种全新现象:双峰现象(性能先升后降再升再降)和对数现象(持续稳定提升)。研究揭示数据噪声是影响推荐系统可扩展性的关键因素,并发现SGL模型因其独特的抗噪机制表现最佳。该发现颠覆了传统认知,为推荐系统优化提供新思路,在某些情况下仅通过增加嵌入维度就能获得25%以上的性能提升。