最新文章第5页

2025-07-15

如何让大语言模型学会正确使用工具？伊利诺伊大学香槟分校团队的"ToolRL"训练秘诀

伊利诺伊大学香槟分校研究团队提出ToolRL方法，通过精细的奖励机制训练大语言模型正确使用工具。该方法突破传统监督微调局限，采用格式奖励和正确性奖励相结合的评估体系，在多个基准测试中相比基础模型提升17%，相比传统方法提升15%，显著改善了模型的工具使用能力和泛化性能。

M-A-P团队发布COIG-P：首个百万级中文人工智能偏好训练数据集，重新定义AI中文对话能力

M-A-P团队发布的COIG-P数据集包含100万个高质量中文偏好样本对，通过15个AI模型协作生成和8个AI评委评分构建。该数据集覆盖对话、编程、数学等六大领域，显著提升了中文AI模型性能，相关模型在AlignBench评测中获得2%-12%的性能提升。团队还开源了中文奖励模型CRM和评估基准CRBench，为中文AI社区提供了重要的开源基础设施。

UC伯克利大学突破性研究：让AI自己决定何时"并行思考"，推理效率飙升23%

UC伯克利大学研究团队提出了自适应并行推理方法，让AI学会自主决定何时串行思考、何时并行处理任务。该方法通过训练AI掌握类似项目经理的资源分配能力，在数学推理任务上实现了23.4%的性能提升，并显著降低了处理延迟，为AI推理能力发展开辟了新方向。

视觉语言模型也能深度思考：香港科技大学推出VL-Rethinker，让AI看图答题像人类一样反思纠错

香港科技大学研究团队推出VL-Rethinker，这是首个能在视觉语言任务中进行深度反思的AI系统。通过创新的"选择性样本回放"和"强制反思"训练策略，VL-Rethinker在数学视觉推理等任务上显著超越GPT-o1，证明了AI可以学会像人类一样自我检查和纠错，为构建更智能可靠的多模态AI系统开辟了新路径。

Indeed运用AI技术助力求职者寻找新岗位

Indeed通过云原生和数据驱动的数字化转型，为AI时代做好了准备。公司CIO Anthony Moisant表示，他们不仅在采用AI，更在构建一个智能代理公司，将人类智慧与机器智能相结合。公司已完成从本地服务器向AWS的迁移，建立了统一的数据湖架构，并基于Apache Iceberg构建数据湖仓。目前已有4个Salesforce代理投入生产，6个内部智能产品上线，另有20多个代理正在开发中。

AI第四次浪潮来临，企业准备好迎接未来了吗？

AI第四代生成式AI标志着技术范式转变，正在用户体验、应用自动化和平台三个层面为企业带来重大价值和颠覆。企业应关注商业价值而非技术本身，需要从业务问题出发量化价值。未来五年将在认知任务处理上取得巨大进展，但需要创新思维应对劳动力转型。六大颠覆性支柱包括下一代AI能力、数据平台、机器人技术、量子计算、企业用户体验和云架构等。

研究发现AI工具让开源软件开发者效率降低19%

METR研究机构的随机对照试验显示，经验丰富的开源代码开发者在使用AI工具时效率实际下降。研究跟踪16名开发者完成246项任务，发现尽管开发者预期AI能提升24%效率，实际却慢了19%。AI虽减少了编码时间，但审查AI输出、提示AI系统和等待生成的时间更长。开发者仅接受44%的AI生成代码而无需修改。

AWS发布Kiro：集成AI智能体的"规格化编程"开发环境

AWS发布开发环境Kiro预览版，集成AI代理帮助软件工程师将想法转化为生产就绪代码。Kiro支持"规格编码"，开发者可用自然语言描述需求，AI自动生成需求文档、用户故事和代码任务。系统包含规格同步、钩子触发等功能，确保代码质量和文档同步。支持模型上下文协议扩展，提供丰富的开源AI工具库。

AI智能体验证：2025年关键技术产业的崛起

2025年，人工智能进入智能体时代，AI不再只是分析数据或生成文本，而是能够代表用户执行实际操作。AI智能体可以预订旅行、管理预算、处理保险理赔等，但这种自主性也带来了巨大风险。与传统软件不同，智能体在动态环境中运作，行为难以预测。目前的测试方法无法应对复杂的现实场景，急需新的验证层来持续监控和验证智能体行为，确保其安全可靠地运行。

诺基亚网络API在谷歌云市场上线

诺基亚在谷歌云市场推出三项网络API服务：按需服务质量、号码验证和设备位置验证。开发者可通过这些API接入多个移动网络，创建新应用程序。诺基亚的Network as Code平台为开发者提供标准化网络功能访问，无需了解底层网络技术。该生态系统包含全球45个以上合作伙伴，旨在通过API将可编程网络资产与开发者生态系统连接，为消费者、企业和工业客户创造新用例。

数据中心电力消耗与供应挑战：AI时代的能源瓶颈

数据中心正面临电力供应限制阻碍其增长的时期。戴尔奥罗集团研究显示，2025年第一季度数据中心物理基础设施市场同比增长17%，这是连续第四个季度实现两位数增长。AI工作负载推动液冷技术收入翻倍，高密度功率机架接近600千瓦。美国能源部报告称，数据中心2023年消耗美国总电力的4.4%，预计2028年将达到6.7-12%。全球数据中心电力消耗约占总电力3%，到2030年可能翻倍。

IT领域十大过度炒作的技术

CIO们指出，技术变革步伐加快带来了众多新兴技术，但许多技术并未兑现预期效益。生成式AI连续第三年上榜，智能体AI因成本高昂和商业价值不明被过度炒作。数字员工、AIOps、量子计算等技术的现实能力仍落后于期望。元宇宙、AR/VR等空间计算技术采用缓慢，多云策略在互操作性方面存在挑战。

汽车软件质量管控新范式：AI 驱动的智能座舱测试革新

Testin 云测凭借旗下 Testin XAgent 智能座舱 AI 智能化测试系统，与百度 Apollo、阿里云、科大讯飞等科技企业一同入选。值得一提的是，Testin 云测是本次获选名单中唯一的 AI 测试服务商，这无疑是行业对其在汽车智能服务领域 AI 测试技术领先性与应用创新性的高度认可。

从核心到边缘，Solidigm SSD助力破解AI存储难题

在今日开幕的2025年全球闪存峰会上，Solidigm亚太区销售副总裁倪锦峰在主题演讲中，详细介绍了Solidigm的创新之道——高性能存储如何在性能、容量和能耗上呈现出适合AI时代存力需求的“新范式”。

全球首个AI智能体安全测试标准发布，蚂蚁集团、清华大学、中国电信等联合编制

世界数字科学院（WDTA）在联合国日内瓦总部正式发布AI STR系列新标准《AI智能体运行安全测试标准》。

2025年企业网络安全指南：构建数字时代防护体系

随着数字化时代的到来，网络安全威胁呈指数级增长。勒索软件、AI驱动的网络攻击和物联网设备漏洞成为主要威胁。企业需要建立全面的风险管理策略，包括风险评估、安全措施实施和持续监控。新兴技术如人工智能、区块链和量子计算为网络安全带来新机遇。组织应重视员工培训、供应链安全、数据治理和事件响应能力建设。

AWS Bedrock负责人Atul Deo：更便宜AI与新型智能体的未来之路

AWS Amazon Bedrock负责人Atul Deo正致力于让人工智能软件变得更便宜和更智能。他在12月re:Invent大会前只有六个月时间来证明这一目标的可行性。Deo表示AI领域发展速度前所未有，模型每几周就会改进，但客户只有在经济效益合理时才会部署。为此，AWS推出了提示缓存、智能路由、批处理模式等功能来降低推理成本，同时开发能执行多步骤任务的自主代理软件，将AI应用从聊天机器人转向实际业务流程自动化。

人工智能

学术写作助手

动态文献检索

2025-07-14

滑铁卢大学研究团队突破性发明：让AI像真正的学者一样写论文和找文献

滑铁卢大学研究团队开发出ScholarCopilot，一个革命性的AI学术写作助手。该系统突破传统"先检索后生成"模式，实现写作过程中的动态文献检索和精确引用。基于50万篇arXiv论文训练，引用准确率达40.1%，大幅超越现有方法。在人类专家评估中，引用质量获100%好评，整体表现优于ChatGPT。这项创新为AI辅助学术写作开辟新道路。

人工智能

图神经网络

新型算法

2025-07-14

哥伦比亚大学发布革命性AI检索技术：用"异构图"重新定义智能问答系统

哥伦比亚大学研究团队发布NodeRAG技术，通过异构图结构革新智能问答系统。该方法将文档信息分解为7种节点类型，采用双重搜索机制，在多个权威测试中准确率达89.5%，检索效率提升50%以上，为智能信息检索技术带来重大突破。

新硅NewGeek

追踪每一个硅基生命的动向

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: