最新文章
Firefox内置AI功能导致CPU占用率飙升

Firefox内置AI功能导致CPU占用率飙升

近期用户反映Firefox浏览器出现CPU和电力消耗激增问题,原因是Mozilla在最新版本中嵌入了LLM机器人用于标签组命名。后台运行的"推理引擎"进程造成了性能问题。Mozilla承认在功能推出过程中意外引入了性能漏洞,已暂停相关功能推广。用户可通过设置界面或about:config页面禁用AI聊天机器人功能来解决此问题。

名企齐聚!阿里云携手牧原、UU跑腿、新开普等豫企共绘数智未来

名企齐聚!阿里云携手牧原、UU跑腿、新开普等豫企共绘数智未来

阿里云AI势能·河南民营企业数智化创新大会在郑州召开。

Liquid AI推出LFM2-VL模型,让智能手机拥有快速视觉AI能力

Liquid AI推出LFM2-VL模型,让智能手机拥有快速视觉AI能力

Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。

SIGGRAPH|NVIDIA物理AI“全景”更新!
2025-08-13

SIGGRAPH|NVIDIA物理AI“全景”更新!

发布Cosmos世界模型及机器人基础设施,加感知到决策进化

阿里团队推出DeepPHY:首个专门测试AI视觉模型物理推理能力的综合评估平台
2025-08-13

阿里团队推出DeepPHY:首个专门测试AI视觉模型物理推理能力的综合评估平台

阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。

当善良声音变身恶意武器:AIM Intelligence团队揭秘音频AI的隐藏危机

当善良声音变身恶意武器:AIM Intelligence团队揭秘音频AI的隐藏危机

AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。

新加坡国立大学团队揭示:让AI既能看又能做的视觉强化学习新突破

新加坡国立大学团队揭示:让AI既能看又能做的视觉强化学习新突破

新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。

浙大团队揭秘:为什么AI机器人在现实世界中总是"掉链子"?OmniEAR基准测试暴露惊人真相

浙大团队揭秘:为什么AI机器人在现实世界中总是"掉链子"?OmniEAR基准测试暴露惊人真相

浙江大学研究团队通过OmniEAR基准测试揭示了当前AI模型在物理世界推理方面的严重缺陷。测试显示,即使最先进的AI在明确指令下能达到85-96%成功率,但面对需要从物理约束推断行动的任务时,成功率骤降至56-85%。研究发现信息过载反而降低AI协作能力,监督学习虽能改善单体任务但对多智能体协作效果甚微,表明当前架构存在根本局限性。

AI模型训练中藏着的秘密巨人:纽约大学和Aimpoint Digital Labs发现Transformer里的"超级激活"如何悄悄控制整个模型

AI模型训练中藏着的秘密巨人:纽约大学和Aimpoint Digital Labs发现Transformer里的"超级激活"如何悄悄控制整个模型

纽约大学和Aimpoint Digital Labs的研究团队首次揭示了Transformer模型训练中"大规模激活"的完整发展轨迹。这些影响力比普通激活大千倍的"超级激活"遵循可预测的数学规律,研究者开发出五参数公式能以98.4%准确率预测其变化。更重要的是,通过调整模型架构参数如注意力密度、宽深比等,可以在训练前就预测和控制这些关键激活的行为,为设计更高效、量化友好的AI模型提供了全新工具。

浙江大学团队发布OS Agents全景调研:让AI助手像钢铁侠贾维斯一样操控电脑手机

浙江大学团队发布OS Agents全景调研:让AI助手像钢铁侠贾维斯一样操控电脑手机

这项由浙江大学等多家机构联合完成的大规模调研首次系统性梳理了操作系统智能体这一前沿领域,全面分析了基于多模态大语言模型的AI助手如何像人类一样操作电脑手机。研究涵盖了技术架构、训练方法、评估体系和发展挑战,为实现类似贾维斯的智能数字助手提供了完整的技术路线图。

微软8月补丁修复8个关键远程代码执行漏洞

微软8月补丁修复8个关键远程代码执行漏洞

微软八月补丁星期二更新修复了超过100个漏洞,其中包括8个关键的远程代码执行漏洞,影响DirectX、Hyper-V、Office等多个产品。此外还修复了Windows NTLM权限提升漏洞、Hyper-V信息泄露漏洞等。值得关注的是Windows Kerberos权限提升漏洞CVE-2025-53779,虽然已有公开利用代码但暂无实际攻击证据。SharePoint的两个漏洞也需重点关注,特别是RCE漏洞CVE-2025-49712可能与已知认证绕过漏洞组合使用。

Google Photos经典搜索功能快速恢复方法:替代Ask Photos生成式AI搜索

Google Photos经典搜索功能快速恢复方法:替代Ask Photos生成式AI搜索

Google Photos推出快速修复方案,允许用户重新启用经典搜索功能,替代此前推出的"Ask Photos" Gemini AI搜索工具。这一调整回应了用户对传统搜索方式的需求,为那些更偏好直接关键词搜索而非AI对话式查询的用户提供了选择。

让机器学会记忆:浙江大学团队打造智能体的"程序性记忆"大脑

让机器学会记忆:浙江大学团队打造智能体的"程序性记忆"大脑

浙江大学和阿里巴巴团队开发Memp框架,为智能体构建程序性记忆能力。该系统通过构建、检索、更新三个模块,让智能体从过往经验中学习,显著提升任务成功率50%,执行效率提升一半。更重要的是,强模型的记忆可传递给弱模型,实现经验共享。这项研究为构建具有持续学习能力的智能系统开辟新路径。

卡内基梅隆大学突破性技术:让3D物体在任意光线下完美重现,就像换个房间换种效果

卡内基梅隆大学突破性技术:让3D物体在任意光线下完美重现,就像换个房间换种效果

卡内基梅隆大学开发的LightSwitch技术能让3D物体在任意光照环境下呈现真实外观,解决了传统重光照方法速度慢、效果不真实的问题。该技术采用材质感知和多视角一致性机制,将计算时间从数小时压缩至几分钟,在电影制作、游戏开发、虚拟现实等领域具有广阔应用前景。

清华大学和智谱AI联手打造355B参数超级AI大脑:GLM-4.5如何在推理、编程和智能代理三个关键领域同时称王

清华大学和智谱AI联手打造355B参数超级AI大脑:GLM-4.5如何在推理、编程和智能代理三个关键领域同时称王

清华大学和智谱AI联合发布GLM-4.5系列模型,这是首个在推理、编程和智能代理三大核心领域同时达到顶尖水平的开源AI模型。GLM-4.5拥有355B参数但仅激活32B,创新的混合推理模式能根据任务复杂度自动选择思考深度。该模型在12项基准测试中排名第三,智能代理任务排名第二,已完全开源供研究使用。

虚拟试衣新突破:NXN Labs研发的"换衣神器"让你秒变时尚博主

虚拟试衣新突破:NXN Labs研发的"换衣神器"让你秒变时尚博主

韩国NXN Labs开发的Voost系统实现了虚拟试衣技术的重大突破,能够同时处理"试穿"和"脱衣"两个相反任务。该系统使用统一的AI模型和创新的双向学习方法,在图像质量、细节保持和结构准确性方面都超越了现有技术,为电商购物和时尚行业带来革命性改变。

浙大团队开创GUI智能助手新方法:让AI精准识别屏幕元素如探案高手

浙大团队开创GUI智能助手新方法:让AI精准识别屏幕元素如探案高手

浙江大学联合多家机构提出AEPO方法,通过多答案生成和自适应探索奖励机制,显著提升AI在图形界面中的元素识别准确性。该技术让AI能同时考虑多个候选答案并科学评估,解决了传统方法容易陷入错误自信的问题,在五个基准测试中均达到业界领先水平,为智能GUI助手的实际应用奠定了重要基础。

编程大模型也能瘦身成功:上海交通大学团队让AI推理快43.5%的秘密武器

编程大模型也能瘦身成功:上海交通大学团队让AI推理快43.5%的秘密武器

上海交通大学团队开发的ASAP方法通过"锚点引导"和"首词惊喜度"两阶段技术,成功解决了AI推理模型内容冗长问题。该方法在保持准确性的同时,将推理速度提升43.5%,生成内容减少23.5%,为AI推理优化开辟了新方向,代表了从追求模型规模向追求效率质量平衡的重要转变。

没有视觉数据也能让AI变聪明?ETH苏黎世等机构揭秘无监督视觉语言模型适应新秘诀

没有视觉数据也能让AI变聪明?ETH苏黎世等机构揭秘无监督视觉语言模型适应新秘诀

这项ETH苏黎世等机构的综述研究首次从无标签视觉数据可用性角度系统分析视觉语言模型的无监督适应问题,提出了包含无数据迁移、无监督领域迁移、批次测试时适应和在线测试时适应四种场景的分类框架,详细梳理了每种场景下的核心方法和策略,为该领域提供了全面的理论指导和实践参考,推动AI向更灵活自主的方向发展。

厦门大学最新突破:让AI学会像人类一样操作电脑界面的神奇方法

厦门大学最新突破:让AI学会像人类一样操作电脑界面的神奇方法

厦门大学研究团队开发出UI-AGILE框架,通过"简单思考"策略、连续评分奖励和分解定位技术,让人工智能学会像人类一样精准操作电脑界面。该方法在专业测试中将定位准确率提升23%,仅需9000个样本就能高效训练。这项突破性技术具有强通用性,可直接提升现有AI系统性能,将很快应用于智能助手、自动化工具等日常软件中,为用户带来更便捷的人机交互体验。