最新文章第7页

2025-06-24

亚马逊AI助手Alexa+用户突破100万，月费定价19.99美元

亚马逊确认其升级版数字助手Alexa+用户数已超过100万。该服务由生成式AI驱动，目前仍处于邀请测试阶段，尚未公开发布。Alexa+提供更自然的对话交互、智能家居集成和AI扩展功能，早期访问期间免费使用，正式发布后Prime会员免费，非Prime用户每月收费19.99美元。用户反馈不一，但亚马逊表示已推出近90%的预告功能。

人工智能

模型上下文协议

可观测性平台

2025-06-24

Salesforce发布Agentforce 3，提升AI智能体可见性和连接性

Salesforce发布Agentforce 3，这是其企业级人工智能产品的重大升级，新增AI代理观察和控制功能。该平台帮助企业构建、定制和部署生成式AI代理，自主辅助员工工作。新版本推出命令中心，提供完整的可观察性和模型上下文协议支持，实现与其他代理和服务的即插即用兼容性，并新增100多个预构建行业操作，加速标准化AI代理部署。

自动驾驶汽车

智能交通管理

城市政策创新

2025-06-24

自动驾驶汽车加速落地，城市如何引领变革

自动驾驶汽车已在旧金山、凤凰城等城市运营，不再是遥远的概念。Waymo等公司正扩大车队规模，特斯拉也在奥斯汀推出首个自动驾驶服务。自动驾驶技术有望提高交通安全、效率和可持续性，减少90%由人为错误导致的交通事故。但若缺乏监管，可能增加车辆行驶里程、加剧拥堵。城市需要通过路边管理、数据共享要求、电气化激励等政策工具，主动规划自动驾驶未来，确保其服务于公共利益。

人工智能

AI助手

高级编辑器

2025-06-24

Grok将推出电子表格编辑功能挑战微软谷歌

泄露代码显示xAI正在为Grok开发高级文件编辑器，支持电子表格功能。该功能允许用户在编辑文件的同时与Grok对话并获得AI助手支持。这标志着xAI正努力与OpenAI、谷歌和微软竞争，将AI副驾驶嵌入生产力工具中。此举可能是马斯克将X打造成集文档、聊天、支付和社交媒体于一体的"超级应用"计划的重要一步。

人工智能

计算机视觉

公共卫生

2025-06-24

AI如何成为蚊子"神探"：孟加拉国大学研究团队打造史上最强蚊子繁殖点监测系统

孟加拉国联合国际大学研究团队开发了VisText-Mosquito多模态数据集，这是首个集成视觉检测和自然语言推理的蚊子繁殖点识别系统。该系统包含1970张标注图像，能够识别五类繁殖容器并进行水面分割，同时提供人类可理解的判断解释。YOLOv9s等模型达到92.9%检测精度，为全球蚊媒疾病防控提供了AI技术支撑。

机器人控制

扩散策略

动态引导

2025-06-24

斯坦福大学：机器人也能"听从内心声音"，无需重新训练就能精准执行新任务

斯坦福大学推出DynaGuide技术，让机器人无需重新训练就能通过视觉示例学会新任务。该系统采用独立的动态模型为机器人提供实时行为指导，成功率达70%，在处理模糊指令时比传统方法强5.4倍。技术支持多目标引导和即插即用部署，已在真实机器人上验证成功，为个性化机器人服务开辟新路径。

人工智能安全

注意力机制

越狱攻击防御

2025-06-24

特拉维夫大学AI研究员惊人发现：越"万能"的AI攻击越善于"劫持"注意力

特拉维夫大学研究团队通过分析GCG攻击机制，发现越狱攻击的成功依赖于"注意力劫持"现象，即攻击后缀能占据AI注意力机制的主导地位。研究表明，攻击的万能性与劫持强度直接相关，并基于此开发了增强攻击效果和防御攻击的实用方法，为AI安全研究提供了新视角。

台湾大学与NVIDIA联手：让普通人在家用电脑上也能训练超大AI模型的革命性方法

内存优化

大模型训练

技术民主化

2025-06-24

台湾大学与NVIDIA联手：让普通人在家用电脑上也能训练超大AI模型的革命性方法

台湾大学与NVIDIA合作开发了EMLoC技术，让普通用户能在24GB消费级显卡上训练38B参数的超大AI模型。该方法通过创建智能"模拟器"将训练内存需求降至推理水平，配合独创的LoRA校正算法确保训练效果。这项突破大幅降低了AI模型定制化门槛，有望推动AI技术民主化发展。

清华和中科院团队造出"AI奥数团队"：像人类专家一样学习积累经验，解题能力直逼顶级AI

多智能体推理

经验学习记忆系统

协作式问题解决

2025-06-24

清华和中科院团队造出"AI奥数团队"：像人类专家一样学习积累经验，解题能力直逼顶级AI

美国加州大学洛杉矶分校等机构联合开发的Xolver系统，创新性地让AI学会像奥数团队一样协作解题和积累经验。该系统通过多智能体协作和双重记忆机制，在数学竞赛和编程挑战中取得突破性成绩，即使使用小型模型也能超越大型商用AI，为人工智能的发展开辟了新路径。

人工智能

测试用例生成

代码调试

2025-06-24

大语言模型能否成为编程"探错神器"？同济、东北、港科大、耶鲁联合发布首个测试用例生成能力评估基准

这项跨国研究首次系统评估了大语言模型生成编程测试用例的能力。研究团队构建了包含500个竞赛问题和10万错误代码的TestCase-Eval基准，设计了故障覆盖和故障暴露两个核心任务。测试19个主流模型后发现，最佳模型仅达43.8%成功率，远低于人类专家的93.3%，揭示了AI在程序调试辅助方面的巨大改进空间。

强化学习

熵正则化

人工智能推理

2025-06-24

让AI自己学会探索：熵的力量如何让人工智能像真正的科学家一样思考

这项由中国人民大学、微软亚洲研究院等机构联合完成的研究发现，通过监测AI思考过程中的"不确定性"（熵值），可以识别出有价值的探索性思考时刻。研究团队设计了一种仅需一行代码的简单方法，在AI训练时给予探索性思考额外鼓励，显著提升了AI在数学竞赛等复杂推理任务上的表现，让AI学会了更像人类的深度思考方式。

MBZUAI团队突破性技术：让x86程序瞬间"变身"ARM，性能还比苹果原生方案更快

人工智能

汇编代码翻译

跨架构兼容性

2025-06-24

MBZUAI团队突破性技术：让x86程序瞬间"变身"ARM，性能还比苹果原生方案更快

MBZUAI研究团队开发的GG技术突破了跨架构程序翻译难题，通过AI将x86程序准确翻译为ARM版本，准确率达99.39%。与苹果Rosetta 2相比，性能快73%、省电47%、内存占用少141%。该技术采用大型语言模型结合严格测试验证，为硬件架构迁移提供了高效解决方案，将推动ARM处理器在数据中心的快速普及。

视觉信息提取

强化学习

医疗数据处理

2025-06-24

医学文档秒变结构化数据：百川智能团队用强化学习仅靠100张图片就让AI读懂医疗报告

百川智能团队提出了一种基于强化学习的医疗文档视觉信息提取方法，仅用100张标注图片就实现了医疗报告的高精度结构化数据转换。该方法采用平衡的精确度-召回率奖励机制和创新的采样策略，在医疗VIE任务上达到77.81的F1分数，显著超越商业模型表现，为医疗信息化提供了高效解决方案。

微软亚洲研究院重大发现：AI推理训练真的能让机器变聪明，关键在于思维过程而非答案

人工智能

强化学习

推理评估

2025-06-24

微软亚洲研究院重大发现：AI推理训练真的能让机器变聪明，关键在于思维过程而非答案

微软亚洲研究院团队通过创新的评估方法发现，具有可验证奖励的强化学习(RLVR)能够真正提升AI的推理能力，而非仅仅改善答案准确率。研究提出了CoT-Pass@K评估标准，要求AI不仅给出正确答案还需保证推理过程正确，实验证明RLVR训练显著提升了AI的逻辑推理质量，为开发更可靠的AI推理系统奠定重要基础。

智能体测试时计算扩展

人工智能协作优化

AI推理策略创新

2025-06-24

OPPO AI团队首次系统探索：让AI智能体进行推理思考的四大策略

OPPO AI团队首次系统性探索了如何让AI智能体进行更深入的推理思考。研究提出ATTS框架，包含并行采样、序列修正、验证合并和多样化探索四大策略。实验发现，给智能体更多尝试机会能显著提升性能，但关键在于知道何时反思而非盲目增加思考。多模型协作效果尤其突出，四个AI模型协作成功率达74.55%。这项工作为AI智能体发展指明了从增大模型转向优化推理策略的新方向。

人工智能

图像生成

流映射算法

2025-06-24

NVIDIA让AI绘图秒变闪电：新技术让复杂图像生成从几十步缩减到4步

NVIDIA团队开发出革命性AI图像生成技术AYF，成功将传统需要几十步的复杂图像生成过程压缩至仅4步，同时保持高质量输出。该技术通过创新的流映射方法和双重训练目标，解决了现有快速生成方法质量差或多步性能退化的问题，在ImageNet等标准测试中表现优异，为AI图像生成的实用化应用奠定了重要基础。

人工智能

工具调用

自我批判能力

2025-06-24

让AI自己发现错误并改正：中科大团队推出首个工具调用自我纠错能力评估基准

中科大团队发布CRITICTOOL基准，首次系统评估大型语言模型工具调用自我批判能力。研究发现当前AI模型包括GPT-4o在内，遇到工具使用错误时恢复能力有限，最高仅达70%水平。该基准通过内部错误和外部环境错误两大类五种模式，结合数据进化策略，为AI工具使用可靠性评估提供重要参考。

人工智能

自适应推理

模型优化

2025-06-24

问题解决的智慧新招：中文大学团队用"免问"方法让AI推理更聪明更省钱

中文大学等机构联合研究提出"问题自由微调"方法，解决AI推理模型在简单问题上过度思考的问题。该方法训练时移除问题输入，仅学习推理过程，使AI能自适应选择短推理或长推理模式。实验显示该方法在保持性能的同时将回答长度减少50%以上，在噪声、跨域和低资源场景中表现优异。

机器人变聪明了，但运行太慢怎么办？上海交大团队的EfficientVLA让机器人大脑提速93%

机器人加速优化

视觉-语言-动作模型

无训练压缩框架

2025-06-24

机器人变聪明了，但运行太慢怎么办？上海交大团队的EfficientVLA让机器人大脑提速93%

上海交大团队开发EfficientVLA框架，通过三重优化策略让机器人大脑提速93%：简化语言模块冗余层、精选关键视觉信息、缓存动作生成中间结果。该无训练方案将计算量降至28.9%，任务成功率仅降0.6%，为高性能机器人在普通硬件上的实用化部署开辟新路径。

当AI代理不再是纸上谈兵：斯坦福MIT等顶尖院校联合推出xbench，让AI真正走进职场的革命性测试平台

人工智能

职业评估

商业应用

2025-06-24

当AI代理不再是纸上谈兵：斯坦福MIT等顶尖院校联合推出xbench，让AI真正走进职场的革命性测试平台

这项由18所顶尖高校联合开展的研究推出了革命性的AI代理评估平台xbench，彻底改变了传统以技术能力为中心的评测方式，转而采用真实职业场景的实战检验。研究团队在招聘和营销两个专业领域构建了完整的评估体系，让AI代理像实习生一样直接承担真实工作任务，用实际成果证明商业价值。通过对九个主流AI代理的全面测试，发现不同模型在专业任务中的表现差异显著，技术评测高分未必转化为实用价值。

Linkloud

GO global, BE global.

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

芝加哥大学赵燕斌：我们做的是让AI看不见的“艺术”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: