最新文章
小模型也能学会深度思考:UCLA团队让2B视觉AI实现类人推理突破

小模型也能学会深度思考:UCLA团队让2B视觉AI实现类人推理突破

UCLA团队首次成功让20亿参数的小型视觉AI模型实现了类似DeepSeek R1的"啊哈时刻"现象。他们通过在未经指令微调的基础模型上直接应用强化学习,让模型学会了自我反思和深度推理,在视觉推理任务上取得了显著突破。研究还发现指令微调可能限制模型的推理能力发展,为AI训练方法提供了新的思路。

香港科大提出PreSelect:用AI预测能力来筛选高质量训练数据,10倍提升语言模型训练效率

香港科大提出PreSelect:用AI预测能力来筛选高质量训练数据,10倍提升语言模型训练效率

香港科技大学研究团队提出PreSelect方法,通过分析文本对不同AI模型能力的预测能力来筛选高质量训练数据。该方法基于"能够准确反映模型能力差异的文本往往也是最佳训练材料"的核心洞察,仅用轻量级fastText分类器就能实现大规模数据筛选,在多项实验中展现出10倍训练效率提升,为AI模型开发提供了经济高效的解决方案。

人工智能真的知道答案,却选择保持沉默?Google与Technion揭示大模型的"隐性知识"现象

人工智能真的知道答案,却选择保持沉默?Google与Technion揭示大模型的"隐性知识"现象

Google Research与以色列理工学院联合研究发现,大型语言模型存在显著的"隐性知识"现象——AI内部掌握的知识远超其外部表现,平均差距达40%。研究团队通过测试三个主流AI模型的1700个事实性问题,发现AI在内部完全知道答案但1000次尝试都不会说出的极端情况。这一发现揭示了AI语言生成机制的根本局限,为改进AI表现和理解智能系统认知机制提供了新视角。

西安交通大学团队提出MAPS:基于性格理论的多智能体系统,让AI像人类专家团队一样协作解决科学难题

西安交通大学团队提出MAPS:基于性格理论的多智能体系统,让AI像人类专家团队一样协作解决科学难题

西安交通大学团队提出MAPS多智能体系统,基于心理学大七人格理论设计7个专门化AI智能体协作解决多模态科学问题。系统采用苏格拉底式质疑方法进行自我监督,在数学、物理、化学问题求解上比现有最佳AI提升15.84%,甚至超越人类专家3.58%,为AI协作系统设计提供了新思路。

复旦大学研究团队突破:让AI机器人拥有"想象力",规划任务效率提升33%

复旦大学研究团队突破:让AI机器人拥有"想象力",规划任务效率提升33%

复旦大学研究团队开发出革命性的AI机器人训练方法"双重偏好优化",让机器人具备预测行动后果的"想象力"。该方法通过同时优化动作选择和状态预测,使7B参数模型的任务成功率提升31.4%,规划效率提升33.0%,甚至超越GPT-4o表现。研究建立了自动化数据收集系统和VoTa-Bench测试平台,为实现更智能的机器人助手奠定基础。

阿里达摩院VACE:一个模型搞定所有视频创作,从文字到视频再到精细编辑全包了

阿里达摩院VACE:一个模型搞定所有视频创作,从文字到视频再到精细编辑全包了

阿里达摩院推出VACE系统,这是首个能够统一处理文字转视频、视频编辑、遮罩编辑等12种视频任务的AI模型。通过创新的视频条件单元(VCU)和上下文适配器架构,VACE不仅能单独完成各类视频生成编辑任务,还支持任务组合创造出传统方法无法实现的效果,为视频创作提供了革命性的一站式解决方案。

Google DeepMind推出Gemma 3:轻量级多模态AI模型的革命性突破

Google DeepMind推出Gemma 3:轻量级多模态AI模型的革命性突破

Google DeepMind发布Gemma 3多模态AI模型家族,参数量从1B到27B,支持文字、图片理解和多语言处理,可在普通设备运行。创新的5:1注意力架构将内存消耗降低75%,支持128K长文档处理。在多项测试中表现优异,27B版本在聊天机器人竞技场排名第9,超越了许多更大规模的模型,实现了AI技术的真正民主化。

机器人终于学会了"察言观色":上海AI实验室让机器人只需10个示例就能掌握复杂任务

机器人终于学会了"察言观色":上海AI实验室让机器人只需10个示例就能掌握复杂任务

上海AI实验室等机构联合开发的Dita机器人学习模型实现重大突破,仅需10个示例就能让机器人掌握复杂任务。该模型创新性地结合扩散模型与Transformer架构,让机器人具备类似人类的环境观察和任务理解能力,在多个基准测试中表现优异,并成功完成包括倾倒液体、多步骤操作等高难度真实世界任务,为通用机器人智能发展开辟新路径。

Canonical重启TPM加密技术,Ubuntu 25.10版本即将支持

Canonical重启TPM加密技术,Ubuntu 25.10版本即将支持

Canonical宣布Ubuntu 25.10"Questing Quokka"将引入基于可信平台模块(TPM)芯片的全盘加密功能。该功能原计划在23.10版本推出,现在终于落地。新方案利用现代PC内置的TPM 2.0芯片存储加密密钥,支持自动解锁,无需手动输入密码。系统要求PC具备TPM 2.0芯片、UEFI固件并启用安全启动。相比传统LUKS加密方案,TPM加密可实现无人值守启动,特别适合服务器环境。该功能将采用统一内核镜像系统,通过snap包管理内核更新。

IOWN全光网络项目迎来五周年 与ITU签署合作协议

IOWN全光网络项目迎来五周年 与ITU签署合作协议

创新光学无线网络全球论坛在五周年之际与国际电信联盟签署合作协议,旨在加速光子技术发展。该项目由NTT主导,联合爱立信、诺基亚等巨头,致力于构建全光子网络基础设施,应对AI驱动的数据中心增长需求。研究显示,全球数据中心容量2024至2027年将增长57%,迫切需要更高带宽、更低延迟和能耗的网络解决方案。

乐天移动选择思科、诺基亚、F5为5G SA网络合作伙伴

乐天移动选择思科、诺基亚、F5为5G SA网络合作伙伴

乐天移动宣布选择思科、诺基亚和F5作为合作伙伴,共同支持其在日本的5G独立组网建设。该网络将采用云原生和AI驱动系统,旨在简化运营、降低成本并提升客户体验。作为2019年推出全球首个端到端云原生移动网络的先驱,乐天移动此次通过战略合作进一步推进网络自主运营。同时宣布在九州等地区扩大5G覆盖范围。

Meta投资千兆瓦数据中心打造"超级智能"实验室

Meta投资千兆瓦数据中心打造"超级智能"实验室

Meta公司报告运营成本和研发支出增长,正加速推进人工智能业务。公司成立Meta超级智能实验室,专注开发下一代AI模型。CEO扎克伯格表示将建设多个千兆瓦级集群,包括明年上线的1千兆瓦Prometheus集群和可扩展至5千兆瓦的Hyperion集群。最新财报显示收入成本增长16%,资本支出达170亿美元用于服务器、数据中心和网络基础设施投资。

Acumera收购Scale Computing后将采用Scale Computing品牌

Acumera收购Scale Computing后将采用Scale Computing品牌

边缘计算和网络安全供应商Acumera收购了超融合基础设施厂商Scale Computing,合并后的公司将沿用Scale Computing品牌。这一收购使Scale Computing成为最后一家被收购的独立HCI厂商。合并后的公司将结合Acumera的边缘网络安全能力和Scale的虚拟化平台,为多站点客户提供统一的边缘计算解决方案,预计年收入达3500万美元。

西部数据Q4业绩强劲增长,云存储需求推动近线硬盘业务深化

西部数据Q4业绩强劲增长,云存储需求推动近线硬盘业务深化

西部数据第四季度收入26.1亿美元,同比增长30%,净利润2.82亿美元。云端和数据中心客户贡献了90%的收入,显示出公司对近线硬盘产品线的高度依赖。全年收入95.2亿美元,同比增长51%,超出预期。公司出货12.9万台硬盘,其中近线硬盘930万台。AI技术发展将推动存储需求年增长率从15%提升至15-23%。

光学基础设施为何成为AI未来发展核心

光学基础设施为何成为AI未来发展核心

AI繁荣面临电力问题,但真正制约因素在基础设施层面。随着生成模型规模扩大,传统铜线互连开始不堪重负。硅光子技术使用光而非电传输数据,速度更快、功耗更低。以色列初创公司Teramount获得5000万美元A轮融资,专注光纤芯片连接器。据预测,协封装光学市场将在2028年达到21亿美元。AI数据中心电力需求可能在2026年翻倍,大部分电力消耗在数据传输而非计算。

2026年CIO预算规划:核心投资重点与AI转型策略

2026年CIO预算规划:核心投资重点与AI转型策略

面对地缘政治不稳定和AI快速发展,CIO们在制定2026年预算时更加谨慎。德勤CTO指出,变化速度前所未有,CIO需投资于具备可移植性的架构和团队建设。AI进步正影响预算分配,特别是计算资源和使用量预测方面。专家建议CIO应关注全栈工程能力、网络安全和云AI集成,同时平衡长期愿景与短期执行,为研发预留预算以应对不确定性。

AI智能体会颠覆SaaS市场吗?专家意见分歧

AI智能体会颠覆SaaS市场吗?专家意见分歧

随着AI智能体热度持续攀升,业界出现了一种观点认为这些突破性AI工具将终结长期主导的SaaS商业模式。微软CEO纳德拉等专家预测,AI智能体将具备多数据库操作功能,使底层SaaS工具变得过时。不过也有专家认为这种观点过于简化,虽然智能体会替代GUI界面交互,但SaaS后端功能仍然必要。当前SaaS公司正竞相转型为智能体平台,而智能体也需要SaaS的数据和合规框架支持。

思科开源AGNTCY项目推动多智能体系统发展

思科开源AGNTCY项目推动多智能体系统发展

思科于7月29日将AGNTCY项目捐赠给Linux基金会,为企业提供跨组织边界协调AI智能体的统一基础设施。该框架解决了企业级AI智能体协作的基础设施缺口,提供智能体发现、身份验证、安全消息传递和可观测性等核心能力。AGNTCY与Agent2Agent协议形成互补,为多智能体系统提供基础设施层支持。戴尔、谷歌云、甲骨文和红帽等主要厂商已成为创始成员,推动智能体互操作性标准发展。

Germ为Bluesky带来端到端加密消息功能

Germ为Bluesky带来端到端加密消息功能

新创公司Germ为Bluesky社交网络推出端到端加密消息服务,为用户提供比现有私信更安全的聊天选项。经过两年开发,该服务本周进入测试阶段,计划逐步扩大测试用户规模。Germ采用新兴技术如消息层安全协议和AT协议,无需手机号码即可实现安全通信。用户可通过"魔法链接"快速开始聊天,利用苹果App Clips技术无需下载完整应用。

高通推进数据中心CPU开发,正与头部云服务商洽谈合作

高通推进数据中心CPU开发,正与头部云服务商洽谈合作

高通公司宣布正在与领先的超大规模云服务商进行深度合作谈判,开发专用于数据中心的CPU产品。CEO阿蒙表示,公司正在开发通用CPU和推理集群产品,预计2028财年开始产生收入。同时,高通面临三星在高端智能手机市场的竞争压力,三星计划在2026年推出采用2纳米工艺的新款Exynos处理器。高通Q3财报显示营收增长10%至103.5亿美元,净利润增长25%。