最新文章第17页

2025-10-15

快手团队突破大模型训练难题：让AI既会探索又能收敛的全新方法

快手科技团队提出CE-GPPO算法，解决大型语言模型强化学习训练中的探索-利用平衡难题。通过重新利用传统方法丢弃的"越界"词元信息，实现对策略熵的精细控制。在数学推理任务上显著超越现有方法，7B模型性能提升3个百分点，为AI模型训练提供新思路。

SCENEWEAVER：清华和智源研究院联手打造AI室内设计师，一句话就能设计出完美房间

SCENEWEAVER是清华大学和智源研究院联合开发的突破性AI室内设计系统，能够仅通过自然语言描述自动生成完整的三维房间场景。该系统采用多工具整合和自反思规划机制，模仿专业设计师的工作流程，在视觉真实性、物理合理性和功能完整性方面均显著超越传统方法，为AI辅助创意设计开启了新的可能性。

马里兰大学揭秘：AI推理过程竟然和人类解题思路惊人相似

马里兰大学研究团队首次使用舍恩菲尔德情节理论分析AI推理过程，发现先进AI模型的思考模式与人类学生解题过程惊人相似。通过对3000多个句子的详细标注，研究揭示了AI在七种思维模式间的转换规律，为理解AI"黑盒"提供了科学框架，并实现了80%准确率的自动化分析。

阿里巴巴团队开发聊天式推荐系统：让购物App能听懂你的真心话

阿里巴巴联合人民大学开发的RecBot系统通过自然语言交互revolutionize推荐体验，用户可直接说"我要蓝色的但不要花纹"等指令，系统立即理解并调整推荐策略。该双智能体架构在三个月实际部署中显著提升用户满意度和商业指标，代表推荐系统从被动算法向智能助手的重要转型。

苹果公司颠覆蛋白质折叠：SimpleFold让复杂生物学变得简单如变魔术

苹果公司发布SimpleFold，这是首个基于流匹配的蛋白质折叠模型，完全使用通用Transformer架构。该模型摒弃了传统方法中的多序列比对、配对表示等复杂组件，在保持竞争性能的同时实现了20倍以上的计算效率提升。SimpleFold支持多样性结构生成，在标准基准测试中表现出色，并展现良好的扩展性。

北加州大学突破性发现：在家用电脑上就能模拟海洋"龙卷风"！Python编程让复杂流体力学研究走进寻常百姓家

这项研究开发了kh2d-solver，一个用Python编写的开源工具包，能在普通台式机上高效模拟海洋和大气中的开尔文-亥姆霍兹不稳定性。通过四个测试案例，研究发现双剪切层的混合效率比强迫湍流高2.8倍，挑战了传统认知。该工具大幅降低了复杂流体力学模拟的技术门槛，为科学计算民主化做出重要贡献。

探索全球贸易密码：斯坦福团队如何教会AI破解神秘的商品分类编码

Flexify.AI团队开发了首个专门用于全球贸易HTS关税编码分类的AI基准测试和模型ATLAS。该研究基于美国海关18731个真实裁决案例，训练出的ATLAS模型在10位编码分类上达到40%准确率，超越GPT-5等主流模型15个百分点，同时成本降低5倍并支持私有部署，为解决全球贸易中的关键分类瓶颈提供了开源解决方案。

IBM研究院带来语音理解新突破：让AI更懂人话的训练秘籍

IBM研究院开发出群体相对策略优化(GRPO)方法来训练语音感知大语言模型，通过让AI生成多个答案并比较优劣进行学习，在语音问答和自动翻译任务上取得显著性能提升。实验显示该方法比传统监督微调效果更好，BLEU分数最高提升10.9%，为语音理解AI的发展开辟了新路径。

上海交通大学团队重磅发布：让AI真正读懂整个代码仓库，这次不再只是看片段了

上海交通大学团队构建了SWE-QA仓库级代码问答基准测试，包含576个高质量问答对，评估AI理解整个代码库而非片段的能力。研究开发了SWE-QA-Agent智能代理系统，通过迭代推理和多工具协作回答复杂代码问题。实验显示Claude 3.7 Sonnet表现最佳，AI在概念性问题上表现良好但在需要深度推理的定位问题上仍有挑战。

PTC 推出全新服务全生命周期管理 AI 解决方案，助力现场服务和服务供应链现代化

PTC（纳斯达克代码：PTC）近日宣布，其 ServiceMax(R) 现场服务管理解决方案和 Servigistics(R) 服务供应链优化解决方案现推出全新的服务全生命周期管理（SLM）人工智能服务。

瑞典银行与政府联手加强国家网络安全防护体系

瑞典央行与金融机构及国家安全部门深化合作，共同应对网络威胁。今年5月，瑞典遭遇大规模分布式拒绝服务攻击，政府和金融机构受到严重冲击。总理克里斯特松承诺增加资金支持，建立更强大的公私合作伙伴关系。央行将举办第二届在线网络安全挑战峰会，鼓励金融机构提升网络安全能力。瑞典金融协会敦促建立危机管理机制，与国家网络安全中心等机构协调配合。

5个强大ChatGPT指令快速减轻工作压力

工作压力源于大脑储存混乱而非系统。本文介绍5个ChatGPT提示词，帮你将工作压力转化为结构化行动：优先级排序任务清单、快速撰写专业邮件回复、从冗长文档中提取关键信息、生成问题解决方案、高效准备会议内容。通过系统化处理工作事务，将分散的精力转为专注执行，让大脑专注于决策而非重复劳动。

英伟达DGX Spark：小巧超算处理大模型的新选择

英伟达推出售价3000-4000美元的DGX Spark，号称"全球最小AI超算"。该设备搭载128GB内存，基于Blackwell架构的GB10芯片，虽然速度不及RTX 5090，但能运行消费级显卡无法处理的大模型。支持2000亿参数模型推理和700亿参数模型微调，在AI开发领域具有独特优势，但软件生态仍需完善。

美中AI竞争升级：美国巨额交易对战中国开源策略

周一OpenAI与博通达成数百万美元协议，这是美国科技巨头高风险并购和战略合作的最新案例。美国正在少数主导企业间形成AI影响力的集中整合，而中国AI企业则采取不同路线，强调开源创新并在更广泛的企业中分散发展机会。OpenAI将于明年下半年推出定制芯片组并建设总容量10吉瓦的数据中心，此前还与AMD签署数十亿美元多年协议。这些对比鲜明的策略正在塑造动态竞争的全球AI格局。

微软租用Nscale葡萄牙AI数据中心扩增算力

微软将在葡萄牙锡尼什的Start Campus数据中心园区租用Nscale的计算能力，以满足人工智能需求的快速增长。该项目将使用英伟达最新的1.26万颗Blackwell Ultra GB300 GPU芯片，计划于2026年初投入运营。面对算力短缺，微软近期与多家"新云"提供商签署合作协议。该数据中心园区总投资预计85亿欧元，全部使用可再生能源供电并采用海水冷却技术。

SAP调研显示：中国企业AI投资回报率将达34%

SAP最新发布的《SAP AI价值报告》显示，中国企业在AI上的投入已开始产生正向回报。该报告由SAP委托牛津经济研究院开展，调研了澳大利亚、巴西、中国、德国、印度、新加坡、英国、美国共8个国家不同规模企业的1600位高层管理者，其中包括200位中国企业受访者。

圣母大学团队发布史上最全面大语言模型跨学科应用报告：从历史哲学到生物工程，AI如何重塑13个学术领域

圣母大学研究团队发布了迄今最全面的大语言模型跨学科应用调研报告，系统梳理了AI在人文、商业、科学工程等13个领域的应用现状。研究发现，大语言模型在文本处理和模式识别方面表现优异，但在创造性思维和价值判断上仍有局限。报告强调人机协作是未来发展方向，并为不同需求用户提供了具体的模型选择建议。

Oracle宣布推出Oracle AI Database 26ai和Oracle Autonomous AI Lakehouse两款产品。AI数据库26ai作为长期支持版本，在数据库引擎中原生集成AI功能，包括AI向量搜索、模型上下文协议服务器支持和AI代理框架。该版本还提供量子安全加密和硬件加速支持。自主AI湖仓平台结合了自主AI数据库和Apache Iceberg表格式，支持跨云和混合环境的AI分析工作负载，提供动态扩展和统一数据治理能力。