在今日举行的 2025 云栖大会上,SAP宣布与阿里巴巴集团战略合作最新进展,即日起四款SAP全球领先的云解决方案将分批落地阿里云,向中国企业提供服务。
OpenAI团队的最新研究揭示了大语言模型产生幻觉的根本原因:AI就像面临难题的学生,宁愿猜测也不愿承认无知。研究发现,即使训练数据完全正确,统计学原理也会导致AI产生错误信息。更重要的是,现有评估体系惩罚不确定性表达,鼓励AI进行猜测。研究提出了显式置信度目标等解决方案,通过改革评估标准让AI学会诚实地说"不知道",为构建更可信的AI系统指明方向。
字节跳动AI实验室提出"逆向工程推理"新范式,通过从优质作品反推思考过程的方式训练AI进行创意写作。该方法创建了包含2万个思考轨迹的DeepWriting-20K数据集,训练的DeepWriter-8B模型在多项写作评测中媲美GPT-4o等顶级商业模型,为AI在开放性创意任务上的应用开辟了新道路。
ByteDance Seed团队开发的UI-TARS-2是一个革命性的AI助手,能够通过观看屏幕并用鼠标键盘操作电脑,就像人类一样完成各种任务和游戏。该系统采用创新的"数据飞轮"训练方法,在多项测试中表现出色,游戏水平达到人类的60%左右,在某些电脑操作测试中甚至超越了知名AI产品,展现了AI从对话工具向真正智能助手演进的巨大潜力。
北京交通大学与阿里巴巴AMAP团队合作开发FE2E框架,首次将图像编辑模型应用于单目深度估计任务。该方法仅用71K训练图像就在ETH3D数据集上实现35%性能提升,超越了使用100倍数据的DepthAnything系列。通过重新设计训练目标、采用对数量化和联合估计策略,FE2E证明了选择合适基础模型比单纯增加数据量更有效,为资源受限环境下的高精度几何估计开辟了新路径。
腾讯AI实验室开发出全球首个平行思维AI系统Parallel-R1,通过强化学习让人工智能掌握了类似人类的多角度同时思考能力。该系统在数学推理测试中表现显著提升,平均准确率提高8.4%,最高提升达42.9%。研究还发现AI会自然演化思维策略,从探索式转向验证式平行思维,展现出类似人类专家的认知发展轨迹。
新加坡南洋理工大学研究团队开发的SimpleTIR方法,通过识别并过滤"无效回合"解决了AI多轮推理中的稳定性问题。该方法让AI在AIME24数学测试中的准确率从22.1分跃升至50.5分,训练过程更加稳定,并让AI自动掌握了交叉验证、渐进推理和自我纠错等高级推理模式,为开发更可靠的AI助手提供了重要技术突破。
马里兰大学研究团队发现,通过强化学习训练AI模型担任视觉问答评委,不仅能提升其评判能力,还意外地增强了答题能力。他们开发的LLaVA-Critic-R1模型在26个视觉推理任务中平均提升5.7%性能,并具备自我改进功能,测试时可通过自我批评获得额外13.8%提升,展现了评委训练的双重价值。
香港科技大学团队提出WebExplorer框架,通过"模型驱动探索"和"迭代查询演化"两阶段生成高质量训练数据,成功训练出80亿参数的WebExplorer-8B模型。该模型在多个信息搜索基准测试中超越了720亿参数的大型模型,支持长达100轮的工具调用和128K上下文长度,展现了开源AI在网络助手领域的突破潜力。
清华大学研究团队发现AI训练中的监督微调和强化学习本质上优化同一目标,提出统一策略梯度估计器理论框架和混合后训练算法。该方法能动态调整训练策略,在数学推理任务上比最强基准方法高出7个百分点,大大降低训练成本和技术门槛,为更智能AI助手的普及奠定基础。
滑铁卢大学研究团队开发了VerlTool框架,突破了AI模型无法使用外部工具的限制。该框架通过异步执行和模块化设计,让AI智能体能在多轮交互中学会使用各种工具,实现了从"孤立思考"到"协作解决问题"的重大转变,在六个领域的测试中都展现了卓越性能,为AI发展开启了新的可能性。
KAIST研究团队提出VIRAL方法,通过视觉表征对齐技术解决多模态大语言模型视觉理解不精准的问题。该方法让AI模型内部视觉表征与预训练视觉基础模型保持一致,避免训练中视觉细节的丢失,在对象计数、空间推理等视觉任务上取得显著性能提升,为多模态AI的视觉理解能力改进提供了简单有效的解决方案。
北京智源人工智能研究院团队提出InfoSeek框架,通过创新的数据合成方法让3B小模型在深度研究任务上媲美大模型。该框架将复杂问题形式化为层次约束满足问题,采用双代理系统构建高质量训练数据,成功训练出在BrowseComp-Plus基准测试中超越多个商用API的模型,证明了精心设计数据的重要性,为AI深度推理能力发展奠定基础。
当前世界充满变数,IT领域除AI外鲜少受到关注。从气候变化到地缘政治紧张局势,IT在公众讨论中边缘化。这在技术变革关键时刻十分危险。CEO、高管和媒体对IT缺乏深度思考,普遍持"不坏就别谈"的态度。CIO需要重新获得利益相关者关注,克服对IT运营的冷漠和无知。技术文盲问题严重,大多数人从未构建过IT系统。IT行业需要重新赢得人心,大幅提升公众IT知识水平。
技术驱动的变革比以往更加频繁,但成功并不能得到保证。Gartner研究显示,只有五分之一的组织能够在75%或更多时间内从转型项目中获得预期收益。其余都是昂贵的失败。有效的变革管理能够提高技术采用率,服务于业务目标。变革管理不再是边缘活动或软技能,而是决定新举措是否能够创造商业价值的核心绩效学科。
近日,全球领先的连接和电源解决方案供应商Qorvo(R)(纳斯达克代码:QRVO)宣布推出一款全新的Ku波段波束成形芯片AWMF-0247,以满足在紧凑型且对功耗敏感的卫星通信(SATCOM)应用中,对时分双工(TDD)终端日益增长的需求。