微软研究团队开发了LettinGo框架,通过让AI用自然语言生成用户画像来改进推荐系统。该方法分三步:多模型探索生成多样化用户档案,通过实际推荐效果评估档案质量,最后用偏好对齐技术训练专门的档案生成器。在三个主要数据集上的实验显示,相比传统方法平均准确率提升20个百分点,且生成的档案更灵活、可解释性更强。
华盛顿大学研究团队开发了ConsumerBench测试框架,专门评估个人设备上多AI应用并发运行的性能。研究发现贪婪资源分配导致应用间严重不公平,语音识别等轻量应用被图像生成等重型应用"饿死";静态GPU分区虽然公平但效率低下;模型共享存在配置冲突。该框架为个人设备AI应用优化提供了重要指导。
这项由香港科技大学领导的研究首次建立了大语言模型安全守护栏的系统性评估框架。研究团队对13种主流守护栏进行了全面测试,提出了六维分类体系和SEU三维评估标准,揭示了不同守护栏在安全性、效率和实用性方面的权衡关系,为AI安全防护技术的选择和部署提供了科学指导。
南加州大学研究团队开发出一种名为PILS的新技术,能够通过分析AI模型输出时的概率信息来破解隐藏的系统指令。这种方法通过观察AI生成文本过程中多个步骤的"思考轨迹",将隐藏提示的恢复成功率提高了2-3.5倍。研究发现AI模型的概率输出存在于低维空间中,可以用数学方法进行压缩和逆向分析。这项发现对AI安全具有重要影响,揭示了当前依赖隐藏指令的安全机制可能存在漏洞,为AI安全防护提出了新挑战。
Meta FAIR等机构首次成功将语言模型水印技术应用于自回归图像生成,解决了图像水印领域的关键技术难题——反向循环一致性缺失。通过专门的模型微调和水印同步层,实现了对AI生成图片的可靠来源追踪,准确率接近100%,且不影响图片质量。该技术在多个主流图像生成模型上验证有效,为AI内容监管提供了重要技术支撑。
这项研究提出了Mirage框架,让AI学会像人类一样进行"心理想象"推理。通过生成压缩的潜在视觉标记而非完整图像,该方法在多个空间推理任务上显著超越传统文字推理和图像生成方法,为AI推理能力发展开辟了新路径。
Arelion升级其斯堪的纳维亚网络,连接超大规模数据中心以支持该地区蓬勃发展的AI市场。该网络基于1.6Tbps波长和可扩展400G相干可插拔光学技术,在奥斯陆、斯德哥尔摩和哥本哈根之间构建AI"超级高速公路"。升级将为企业客户提供增强的全球互联网骨干网接入和多样化连接服务。预计2025年第二季度末完成,并计划在2025年剩余时间及2026年继续投资。
CloudBees首席执行官Anuj Kapur表示,AI可能重新测试DevOps的基础假设,但警告不要为追求效率而创建黑盒代码。他指出,一些因担心错失机会而匆忙采用AI生成代码的客户正开始放缓步伐,变得更加谨慎。Kapur认为,将整代软件外包给提示工程将创建非人类生成的黑盒代码,虽然效率高但质量、测试覆盖率和漏洞问题值得担忧。
数据网络安全公司Rubrik宣布收购AI初创公司Predibase,交易金额在1-5亿美元之间。Predibase专注于帮助企业训练和微调开源AI模型。此次收购将使Rubrik用户能够通过Amazon Bedrock、Azure OpenAI和Google Agentspace等平台加速构建AI智能体。这是继Salesforce、Snowflake等公司之后,又一家通过收购来增强AI智能体技术栈的企业。
人工智能平台提供商Aquant推出"检索增强对话"(RAC)新技术,改变大语言模型信息检索和呈现方式。与传统检索增强生成(RAG)一次性提供完整答案不同,RAC采用逐步对话模式,像领域专家一样通过提问填补知识空白,生成定制化解决方案。该技术能整合手册、交易数据、作业历史等多种数据源,在成本、风险和时间之间找到最佳平衡,预计两年内成为AI检索指导的主要机制。
Anthropic今日升级其Artifacts功能,为用户提供与Claude AI模型协作的实时专用工作空间。升级后用户可将AI功能直接嵌入创作中,转化为AI驱动应用。自功能推出以来,数百万用户已创建超5亿个作品,包括生产力应用和教育游戏。新功能支持创建"会思考"的应用,如记忆选择的游戏角色、智能导师等。用户可免费分享创作,任何Claude账户都可访问。
Gartner发布2025年中国人工智能(AI)十大趋势。企业不应流连于夸大其词的宣传或陷入到过度炒作所带来的恐惧中,而是应该关注AI的可持续的发展路径、实际的经济效益以及切实可行的应用场景。
近年来,在创新、竞争性定价和战略投资的推动下,中国企业逐步拓展海外市场。国际化扩张虽然带来了新的商业机会,但多元文化背景的员工队伍也增加了管理复杂性。
韩国汉阳大学联合高通AI研究院开发出InfiniPot-V框架,解决了移动设备处理长视频时的内存限制问题。该技术通过时间冗余消除和语义重要性保留两种策略,将存储需求压缩至原来的12%,同时保持高准确性,让手机和AR眼镜也能实时理解超长视频内容。
纽约大学研究团队通过INT-ACT测试套件全面评估了当前先进的视觉-语言-动作机器人模型,发现了一个普遍存在的"意图-行动差距"问题:机器人能够正确理解任务和识别物体,但在实际动作执行时频频失败。研究还揭示了端到端训练会损害原有语言理解能力,以及多模态挑战下的推理脆弱性,为未来机器人技术发展提供了重要指导。
北卡罗来纳大学教堂山分校研究团队提出MEXA框架,通过动态选择和聚合多个专业AI模型来处理复杂的多模态推理任务。该方法无需额外训练,在视频理解、音频分析、3D场景理解和医学诊断等多个基准测试中显著超越现有模型,为AI系统设计提供了新思路。
孟买工程学院研究团队开发出突破性的多语言情感语音合成系统,能实现印地语与英语间的实时口音切换,同时准确表达多种情感。该系统在口音准确性上提升23.7%,情感识别准确率达85.3%,为南亚地区教育技术和无障碍软件应用开辟新道路。
上海AI实验室研究团队发现统一多模态AI中图像理解与生成任务存在根本冲突:理解需要逐层增强语义关联,生成则需要早期语义指导后期专注细节。他们提出UniFork架构,采用"共享浅层+分离深层"的Y型设计,有效解决任务冲突问题,在保持统一性同时达到专门模型性能水平。
新加坡国立大学团队开发出革命性的"拖拽式"AI技术DnD,能够在几秒钟内直接从文本描述生成大语言模型参数,无需传统耗时的训练过程。该技术在多个任务上表现优异,效率比传统方法提升2500-12000倍,为AI模型的快速定制化应用开辟了全新路径。