最新文章第79页

2025-08-27

微软研究院推出POML语言：让AI助手像使用模板一样聪明理解复杂指令

微软研究院推出POML标记语言，通过标准化模板解决AI对话格式混乱问题。该系统将内容与样式分离，能根据不同AI模型偏好自动调整格式，测试显示可将准确率提升9倍以上。研究团队开发了配套工具，用户无需编程基础即可创建复杂AI交互场景，为人机高效沟通提供了新方案。

斯坦福大学研究团队揭秘：为什么有些AI能"看"出你的每一次眼球转动？

斯坦福大学研究团队发现，通过眼球追踪技术可以识别AI语言模型的内部工作机制。研究人员让志愿者阅读不同AI模型生成的文本，发现每个模型都有独特的"生成指纹"，能通过人类阅读时的眼球运动模式被检测出来。这项技术可以80%以上准确率预测文本来源，为AI评估和人机交互优化提供新方法。

谷歌DeepMind团队打造AI"超级助手"：一次对话解决你所有复杂任务

谷歌DeepMind研究团队开发出革命性AI训练方法，让AI学会深度思考。通过"连续推理空间"技术，AI能在回答前进行内部分析和规划，一次性提供高质量解决方案。新方法在数学推理、逻辑分析等任务中表现显著提升，错误率明显降低。该技术有望应用于教育、医疗、商业咨询等领域，为用户提供更智能可靠的AI助手服务。

2025-08-27

L3级智能体落地，联想百应智能体2.0重磅升级开启AI服务新范式

业内首家！联想百应智能体2.0重磅升级以L3级智能体能力赋能中小企业。

定档9月13日，2025 AI创新者大会暨第二届提示工程峰会重磅来袭

一句提示词，一个新世界 (One word, one world)。

博通宣布对VMware Cloud Foundation平台进行重大升级，将私有AI服务集成到核心订阅中，并为vSAN存储虚拟化软件添加云原生对象存储支持。此举旨在满足企业对简化基础设施、高效AI采用和网络安全的需求。升级包括与英伟达合作的VMware Private AI Foundation服务、支持AMD GPU、Amazon S3兼容对象存储、与Canonical合作的Ubuntu容器镜像，以及新的四阶段自动化安全流程。博通还推出了面向高监管行业的VCF网络合规高级服务。

人工智能

图像编辑

模型优化

2025-08-27

Gemini 2.5 Flash Image企业级图像编辑一致性与精准控制升级

Google正式发布Gemini 2.5 Flash Image模型，该模型此前在测试版中被称为nanobanana。新模型为企业创意项目提供更多选择，能够快速修改图像外观并提供比以往模型更强的控制能力。该模型在保持人物相似度和编辑一致性方面表现出色，支持多轮编辑、照片融合等功能，并已集成到Gemini应用中供付费和免费用户使用。

人工智能

存储技术

缓存优化

2025-08-27

华为将推出AI SSD缓解GPU内存瓶颈问题

华为即将发布AI固态硬盘，配合统一缓存管理软件，将键值缓存数据从GPU高带宽内存中转移到SSD存储，避免重复计算以提升AI处理速度。该方案采用分层缓存架构，整合GPU内存、CPU内存和SSD存储。华为还将运用XtremeLink技术和SpeedFlex印刷电路板技术。此举旨在解决GPU服务器内存墙问题，帮助中国构建新的AI生态系统。

人工智能

图像生成

新型算法

2025-08-27

谷歌发布新版图像生成AI挑战Photoshop地位

谷歌发布Gemini 2.5 Flash Image升级版，支持语音和文本提示生成图像，可替换照片中的人物、更改服装或合并真实图像与新背景。该工具目前仅在Gemini移动应用中提供。测试显示其处理速度极快，能在几秒内完成复杂的图像编辑任务，包括自动补全缺失的身体部位和衣物细节。谷歌集成了SynthID水印技术识别AI生成图像，并设置了内容安全防护措施。

人工智能

浏览器技术

安全防护

2025-08-27

Anthropic推出Chrome浏览器AI智能体Claude

Anthropic发布基于Claude AI模型的浏览器智能体研究预览版，目前向1000名Max计划订阅用户开放。用户可通过Chrome扩展与Claude在侧边栏窗口中交互，Claude能够理解浏览器上下文并代表用户执行任务。随着谷歌反垄断案临近，浏览器正成为AI实验室的新战场。Anthropic已实施多项安全防护措施，将提示注入攻击成功率从23.6%降至11.2%，并限制访问金融、成人内容等敏感网站。

人工智能

视频生成

深度学习

2025-08-27

滑铁卢大学科学家发明神奇AI：仅凭声音就能生成开口说话的逼真视频

这项研究展示了一种革命性的AI技术，能够仅通过音频生成高度逼真的说话视频。滑铁卢大学研究团队开发的Audio2Photoreal系统巧妙结合了深度学习、扩散模型等先进技术，实现了声音到面部动作的精准转换。该技术在影视制作、在线教育、新闻媒体等领域具有广阔应用前景，将大幅降低视频制作成本和门槛。虽然仍面临计算资源需求高、隐私安全等挑战，但其突破性创新为未来视频内容创作开辟了全新路径。

人工智能

自然语言处理

多视角学习

2025-08-27

腾讯深圳大学革命性突破：让电脑理解语言的秘密武器终于诞生

腾讯和深圳大学联合开发的多视角语言理解技术取得重大突破，通过创新的训练方法让人工智能具备接近人类水平的语言理解能力。系统能准确识别讽刺、情感变化等复杂语言现象，在多项测试中表现优异，已在客服、教育、医疗等领域开始应用，未来有望广泛改善人机交互体验。

人工智能

机器学习

模型优化

2025-08-27

腾讯等机构联手揭秘：AI大模型的"幻觉"问题终于有解了

腾讯AI Lab等机构联合研究解决了AI大语言模型的"幻觉"问题。他们开发的"迭代自调优"方法教会AI诚实承认不确定性，而非编造错误信息。实验证明该方法显著提升了AI的诚实度和可靠性，同时保持了有用性。这项突破将让AI助手在医疗、教育、法律等关键领域变得更加可信，为构建可靠的人工智能系统奠定基础。

AI在虚拟世界中的"英雄之旅"：AIRI研究团队如何打造测试智能规划能力的全新战场

长期规划测试

虚拟环境评估

AI规划能力基准

2025-08-27

AI在虚拟世界中的"英雄之旅"：AIRI研究团队如何打造测试智能规划能力的全新战场

AIRI研究团队开发了HeroBench测试平台，在RPG风格虚拟世界中评估25个大型语言模型的长期规划能力。研究发现AI在复杂多步骤规划任务中表现差异巨大，顶级模型Grok-4达到91.7%成功率，但加入升级机制和干扰因素后性能显著下降。该研究揭示了传统学术测试无法反映的AI规划能力真实水平，为改进AI长期规划提供了重要基准。

数学推理

大语言模型

求助行为

2025-08-27

数学AI也会"装懂"？清华和川大团队发现大模型不会主动求助的惊人真相

四川大学和北京智源人工智能研究院研究团队发现，当前最先进的大语言推理模型存在"装懂"问题：面对信息不完整的数学题时，只有25%会主动询问缺失信息，大部分选择猜测答案。研究构建CRITIC-math数据集系统测试了这一现象，发现AI表现出思维背叛、过度思考、幻觉填空三种典型行为，揭示了当前AI训练中忽视求助意识培养的根本缺陷。