最新文章
OpenAI 更新其全新 Responses API:快速支持 MCP、原生 GPT-4o 图像生成及更多企业功能

OpenAI 更新其全新 Responses API:快速支持 MCP、原生 GPT-4o 图像生成及更多企业功能

OpenAI 今天推出新版 Responses API 更新,新增远程 MCP、原生图像生成、代码解释器和改进的文件搜索能力,帮助企业构建智能自动化代理,同时维持原有定价。

Mistral AI 发布 Devstral——一款能在笔记本上运行的强大新型开源软件工程代理模型

Mistral AI 发布 Devstral——一款能在笔记本上运行的强大新型开源软件工程代理模型

法国 Mistral AI 携手 All Hands AI 推出 Devstral——一款拥有240亿参数的开源语言模型,专为软件工程代理开发设计,能跨文件理解代码、执行多步骤任务,并在 SWE-Bench 测试中表现出色,以 Apache 2.0 许可证开放供开发者与企业灵活使用。

F5《2025年应用战略现状》报告:AI 落地加速,企业战略从讨论迈向行动
2025-05-22

F5《2025年应用战略现状》报告:AI 落地加速,企业战略从讨论迈向行动

F5报告强调了企业如何在运营复杂性中推进人工智能(AI)驱动的转型。报告指出,96%受访 IT决策者表示已部署AI模型,这一比例相较 2023年提升四分之一。

Klarna 使用其 CEO 的 AI 化身发布财报

Klarna 使用其 CEO 的 AI 化身发布财报

本文报道 Klarna 采用 CEO 的 AI 化身发布财报,展示 AI 在提升效率和盈利中的作用,并探讨 AI 替代高管的可能性。

Gartner发布企业构建智能应用的五项基本原则

Gartner发布企业构建智能应用的五项基本原则

Gartner 2025大中华区高管交流大会于近日盛大召开, Gartner 发布最新研究,阐释生成式人工智能(GenAI)如何改变行业实践,推动企业软件从“辅助工具”迈向“智能代理”的根本性转变。GenAI将彻底重塑企业应用的目的、功能以及人机交互方式。

AI 数据中心增长如何改变建设需求

AI 数据中心增长如何改变建设需求

本文探讨了人工智能驱动的数据中心建设变革,涵盖半导体进步、高密度供电、先进冷却及模块化设计,揭示未来数据中心的高效、灵活与可持续发展趋势。

估算 AI 能耗极为棘手——但这份报告作出了一次尝试

估算 AI 能耗极为棘手——但这份报告作出了一次尝试

报告通过实测与专家访谈,分析各型AI模型(如 Llama 3.1 8B 与 405B)的能量消耗,指出文本与视频生成的耗能差异,呼吁提高对AI能耗透明度。

2025-05-22

2025达索系统企业转型智造论坛系列活动全国巡回开展中

达索系统“2025企业转型智造论坛(IMF)”系列活动自今年4月启动以来,正在全国范围内巡回开展中。

链式模型:微软打造的"俄罗斯套娃"语言模型将提高训练效率和推理灵活性

链式模型:微软打造的"俄罗斯套娃"语言模型将提高训练效率和推理灵活性

微软研究院提出Chain-of-Model学习范式,将因果关系融入大型语言模型的隐藏状态。这一创新通过"链式表示"将模型参数分为多个子表示链,使模型能够逐层扩展且保持前序能力。研究成果包括CoLM和CoLM-Air两种实现,实验证明它们不仅性能与标准Transformer相当,还提供了高效训练和灵活推理的优势,包括能够渐进扩展模型规模、提供多尺度子模型以及显著加速预填充计算。这一突破为解决大型语言模型训练成本高和部署缺乏灵活性的问题提供了新思路。

大模型不再"想"得太多:字节跳动AdaCoT通过强化学习实现自适应思维链

大模型不再"想"得太多:字节跳动AdaCoT通过强化学习实现自适应思维链

这篇研究介绍了字节跳动团队开发的AdaCoT框架,通过强化学习实现大型语言模型的自适应思维链触发。该框架将问题设计为帕累托优化,平衡推理质量与计算效率,使模型能根据输入复杂度自主决定是否使用详细推理。研究结果显示,在维持高性能的同时,AdaCoT能将思维链使用率降低至3.18%,响应令牌数减少约70%,大幅提升模型效率和用户体验。

AdaptThink:教会推理模型如何灵活选择思考方式

AdaptThink:教会推理模型如何灵活选择思考方式

这项由清华大学张嘉杰等人开发的AdaptThink算法,教会了AI推理模型根据问题难度自动选择思考模式。研究发现,对于简单问题,直接给出答案(NoThinking模式)不仅效率高,准确率还可能更好;而复杂问题则需要深入思考(Thinking模式)。通过强化学习技术,AdaptThink实现了智能切换:在三个数学数据集上,模型响应长度减少53%的同时准确率还提高了2.4%。这项研究为AI推理模型开辟了新思路,使它们更接近人类灵活思考的能力。

MM-PRM:通过可扩展的步骤级监督提升多模态数学推理能力

MM-PRM:通过可扩展的步骤级监督提升多模态数学推理能力

这篇研究论文介绍了MM-PRM,一种用于增强多模态数学推理能力的过程奖励模型。研究团队首先构建了一个强大的多模态策略模型MM-Policy,然后创建了包含10,000个多模态数学问题的数据集MM-K12。利用蒙特卡洛树搜索(MCTS)框架,他们自动生成了超过70万个步骤级别的标注,无需人工参与。最终的奖励模型在Best-of-N推理设置中显著提升了多个基准测试的性能,包括MM-K12、OlympiadBench和MathVista等。研究还发现软标签、较小的学习率和路径多样性是优化PRM性能的关键因素。

FedSVD:使用自适应正交化技术提升LoRA在联邦学习中的隐私保护能力

FedSVD:使用自适应正交化技术提升LoRA在联邦学习中的隐私保护能力

这项研究提出了FedSVD,一种在联邦学习环境中提升低秩适应(LoRA)微调效果的新方法。研究团队通过引入基于奇异值分解的自适应正交化技术,成功解决了差分隐私随机梯度下降(DP-SGD)与LoRA结合时导致的噪声放大问题。实验表明,FedSVD在GLUE基准测试上显著优于现有方法,特别是在严格隐私保护条件下性能更加稳定,为隐私保护型分布式AI训练提供了新的技术路径。

阿里云:以战略级投入,全力支持中国企业出海
2025-05-22

阿里云:以战略级投入,全力支持中国企业出海

阿里云在全球29个地域运营了87个可用区,可提供394款云与AI产品、59项技术服务,是亚太规模第一的云服务商。

2025-05-22

2025 IAI传鉴国际创意节今日在北京开幕 | 鉴势新生力

本届峰会聚焦AI、消费升级、内容创新等核心议题,让我们共同聚焦这场思想盛宴,解码智能科技如何成为品牌破局增长的核心引擎,在技术革新与行业演进的交汇点上,探寻广告营销的未来。

Salesforce 以 AI 代理为金融服务公司带来更多人性化体验

Salesforce 以 AI 代理为金融服务公司带来更多人性化体验

本文介绍了 Salesforce 推出专为金融服务设计的 Agentforce 平台预建 AI 模板,帮助银行、保险和理财等业务自动化,从而减轻专业人员的行政负担,提升客户体验。

开放系统如何驱动 AI 性能

开放系统如何驱动 AI 性能

本文探讨开放系统在大语言模型优化中的核心作用,详细说明 GPU 调优、编译器修正和网络优化如何推动 AI 性能提升,并以 CentML 平台为例展示开源系统如何降低成本、提升效率。

VAST Data 推出 AI 操作系统

VAST Data 推出 AI 操作系统

VAST Data 发布 AI 操作系统,构建分布式智能代理计算平台及云端统一数据存储,加速 AI 任务与海量数据处理。

Hitachi Vantara 推出 VSP 360,一站式存储控制平面

Hitachi Vantara 推出 VSP 360,一站式存储控制平面

VSP 360 是 Hitachi Vantara 推出的全新管理层,统一管理 VSP One 存储资源,支持混合云部署、AIOps 智能预测及自动化运维。

人类的下一次飞跃:量子 AI、UBI 和全民公平的机会

人类的下一次飞跃:量子 AI、UBI 和全民公平的机会

量子 AI 结合量子计算与人工智能,为全球 UBI 提供可能,通过优化资源分配和经济建模推动公平与稳定,激发创新和人类潜能,迈向从生存到繁荣的新纪元。