答案引擎优化(AEO)正在重新定义真相的标准。与传统搜索引擎优化不同,AEO让AI系统直接生成答案,而非提供链接。研究显示70%的人会直接接受机器提供的信息,不加质疑。当资本主义与此结合,真相本身变得可以被购买和优化。AEO实质上是一种设计性审查,通过专有数据和封闭算法隐藏推理过程。我们需要重新引入摩擦和质疑机制,要求算法透明度和可追溯性,否则现实本身将成为可以随意调节的设置。
AI数据中心开发商Nscale在宣布与英伟达和OpenAI合作一周后,成功融资11亿美元。挪威能源集团Aker ASA领投,Point72、英伟达、诺基亚等参投。Nscale成立于2024年,从加密货币挖矿业务转型而来,现已成为英国AI设施建设计划的核心。公司估值约31亿美元,正与微软合作在英国建设最大AI超级计算机。
在亚太区,Hitachi Vantara推出了独特的“GPU”合作伙伴策略,但此“GPU”非彼“GPU”,这里代表了成长(Growth)、业绩(Performance)和团结(Unity)。
ETH苏黎世大学研究团队提出OBR(最优脑重建)框架,创新性解决了大语言模型压缩中量化与剪枝方法的根本冲突。通过"分组错误补偿"机制,OBR实现了W4A4KV4+50%稀疏性的极端压缩,在保持优秀性能的同时获得4.72倍速度提升和6.4倍内存节省,为边缘设备部署大模型开辟新道路。
斯坦福大学研究团队开发出概念组合学习框架,让AI系统像人类一样学会"举一反三"。该技术将复杂学习任务分解为基础概念模块,通过灵活组合处理新任务,学习效率比传统方法提高10倍。实验显示在多概念组合任务中准确率达78%,并具备跨领域迁移能力。这项突破为通用人工智能发展奠定重要基础,预计将在医疗、教育、自动驾驶等领域率先应用。
华盛顿大学研究团队成功开发出能够检测重度意识障碍患者大脑活动的"翻译系统",准确率达89%。该技术通过脑电图和人工智能算法,发现近40%被判定为"植物人"的患者实际仍有意识。系统不仅能诊断意识状态,还能预测康复前景,为患者家庭带来希望,推动了脑机接口技术革命性进展。
阿里巴巴通义实验室开发的WebWeaver框架通过双智能体协作和动态研究循环,让AI首次具备了类似人类专家的深度研究能力。该系统采用规划智能体进行探索式信息收集和大纲优化,写作智能体执行分层次的精确写作,有效解决了传统AI系统的静态规划和信息过载问题。在三大权威测试中均获得最佳成绩,并通过WebWeaver-3k数据集实现了技术向小模型的成功迁移。
阿里巴巴通义实验室开发的AgentScaler是一个能够智能使用工具的AI助手模型系列。通过创新的两阶段训练和自动化环境构建技术,AgentScaler在多个权威测试中表现优异,40亿参数的小模型就达到了300亿参数模型的性能。该研究首次实现了大规模环境自动构建来提升AI智能体能力,为AI助手的实用化应用奠定了基础。
重庆大学团队提出MHIM-MIL框架,通过"屏蔽困难实例挖掘"策略解决传统医学AI过度依赖简单特征的问题。该方法采用"老师-学生"协作机制,强制AI学习困难病例,在癌症诊断等多个医学任务中显著超越现有方法,同时大幅提升计算效率,为医学AI实际应用提供重要突破。
斯坦福大学研究团队开发出名为"投机采样"的AI训练新方法,通过引入小型草稿模型提供候选方案,让主模型无需从零开始计算,训练速度提升2-640倍,同时将能源消耗降低80%以上。这项技术大幅降低了AI模型训练成本,让普通人和小团队也能负担得起高质量AI模型开发,有望推动AI技术民主化普及。
这项研究开发了首个轻量级物理推理评估框架,测试四种主流视觉语言模型在抛射运动、碰撞动力学、力学和流体动力学四个领域的表现。结果显示中等规模的Qwen2.5-VL-7B意外击败最大模型获得最高分0.815,揭示了当前AI模型更擅长公式应用而非真正物理理解的局限性。研究为科学推理评估提供了可复制的工具,并指出概念性错误是主要问题,为未来AI发展指明方向。
Meta AI团队开发的AggLM技术突破了传统AI多数投票的局限,通过强化学习训练模型学会智能聚合多个候选答案。在数学竞赛测试中,该技术将正确率从35%提升至50%,相比传统方法提升45%。AggLM不仅能选择正确答案,还能创造性地组合不同答案中的有用信息,展现了AI向人类专家级推理能力的重要进步。
中科院自动化所团队开发出Reflection-V视觉推理模型,首次让AI学会在推理过程中主动回顾检查图像信息。该模型通过创新的多智能体训练数据构建和视觉注意力奖励机制,解决了传统AI视觉推理中"看一眼就算数"的问题,在数学推理、多学科知识问答等任务上显著超越现有模型,甚至在某些测试中超过参数量大5倍的模型。
心理健康挑战已达史无前例的水平,2024年美国近6000万成年人患有心理疾病,但仅半数接受治疗。专家正探索智能AI代理系统作为解决方案,这些自主代理具备独立决策、持续学习和主动干预能力。未来应用包括自主治疗代理、预测性心理健康生态系统和主动危机预防。该技术可提供24/7支持、实时监测心理状态、预测危机并部署个性化干预措施,有望创建更具响应性和预防性的心理健康生态系统。
上海人工智能实验室发布OmniWorld,这是首个专为4D世界建模设计的大规模多领域数据集。该数据集包含超过3亿帧数据,涵盖游戏、机器人、人类活动等多个领域,配备深度、相机位置、文本等多种标注。研究证明现有AI模型在复杂时空理解方面存在局限,而使用OmniWorld微调后性能显著提升,为自动驾驶、机器人、虚拟现实等应用发展奠定基础。
阿里通义实验室与浙江大学联合发布UI-S1系统,通过创新的半在线强化学习方法,让AI掌握了复杂的手机操作能力。该系统在多个测试平台上表现优异,相比基础模型在AndroidWorld上提升12%,在AITW上提升23.8%,为实现真正的智能手机助手迈出重要一步。
港科大研究团队开发的LazyDrag系统创新性地解决了图片拖拽编辑中的核心难题。该系统摒弃传统的隐式匹配方法,采用显式对应地图技术,实现了无需训练的高精度图片编辑。LazyDrag支持文字引导功能,能智能理解用户意图,在准确性和感知质量方面全面超越现有方法,为AI辅助图片编辑开辟了新方向。
MIT研究团队发现,AI图像生成模型的"局部思维"并非来自网络结构限制,而是源于训练数据中像素间的统计关联。通过巧妙实验证明,即使改变数据中的微妙模式,AI也会相应调整注意力策略。这一发现为开发更可解释、高效的AI系统提供了新思路,并揭示了数据质量在AI发展中被低估的重要性。
哥伦比亚大学研究团队通过精巧实验发现,经济稀缺性会像"认知病毒"一样占用大脑资源,导致注意力、工作记忆和认知灵活性下降,使人们更易做出短视决策。研究开发了注意力训练、认知重构等有效干预方法,并在就业援助、教育、医疗等领域成功应用,为重新理解贫困本质、设计认知友好政策提供了科学依据。
Spotify宣布已从其目录中删除7500万首"垃圾"音乐,作为打击日益泛滥的欺诈性音频内容和"AI垃圾"的努力。公司发布新政策禁止冒充、垃圾提交和欺诈版税生成。目前流媒体服务每日收到约15万首新曲目,其中28%为纯AI生成。主要唱片公司担心低质量内容稀释人类艺术家的版税池,而AI工具进一步加速了这一趋势。