最新文章第22页

2025-09-17

打造更公平的AI训练：Mozilla和EleutherAI联手制定开放数据集最佳实践指南

Mozilla和EleutherAI联合发布了一份关于创建开放授权大语言模型训练数据集的最佳实践指南。该研究通过召集30位专家，制定了七个核心原则和详细的技术建议，旨在解决当前AI训练数据版权争议、透明度不足等问题，推动构建更加开放、公平和可持续的AI生态系统，为未来AI发展提供了重要的指导框架。

人工智能

深度学习

新型算法

2025-09-17

腾讯AI实验室发现：聪明的AI也会"思维跳跃"，新方法让机器学会深度思考

腾讯AI实验室发现先进AI模型存在"思维不足"问题：在解决困难问题时频繁跳跃思路而非深入思考，导致错误答案消耗225%更多资源。研究团队提出TIP方法，通过惩罚思维切换来训练AI专注力，显著提升推理效率和准确性。这项发现改变了我们对AI推理过程的认知，强调深度思考比广度探索更重要。

人工智能

计算机视觉

深度学习

2025-09-17

香港大学团队推出MangaNinja：让线条画自动变彩图的AI绘画助手

MangaNinja是香港大学团队开发的AI线条画上色系统，能够根据参考图自动为黑白线条画精确上色。该系统采用双分支架构和渐进式补丁打乱训练策略，即使参考图与线条画姿势差异很大也能准确匹配。用户可通过点控制功能实现精细调节，支持多参考图融合和跨角色创意上色。在综合测试中表现优异，为动画制作和数字艺术创作提供了强大工具。

人工智能

批评微调

数学推理

2025-09-17

学会批评比学会模仿更有效：AI从"差评师"变身"数学高手"的奇妙旅程

加拿大滑铁卢大学研究团队发现，让AI学会"批评"错误答案比学会"模仿"正确答案更能提升数学推理能力。这种"批评微调"方法仅用5万样本训练1小时，就达到了传统方法用250万样本的效果，在六个数学基准测试中平均提升4-10%，为AI训练开辟了新路径。

自然语言处理

对话优化

人机交互

2025-09-17

AI"人情味"大突破：让冷冰冰的聊天机器人变得温暖如朋友

这项由土耳其研究者完成的研究通过创新的训练方法，成功让大语言模型的对话变得更加自然和富有人情味。研究团队使用对比学习的方式，让AI学会区分正式冷淡和温暖友好的表达方式，在真人评测中获得了近90%的支持率，同时基本保持了原有的专业能力，为人机交互的未来发展开辟了新的可能性。

生物医学AI

视觉语言模型

开放数据集

2025-09-17

斯坦福大学发布BIOMEDICA：从2400万张医学图片中诞生的AI医生助手

斯坦福大学研究团队构建了包含2400万医学图像的BIOMEDICA数据库，并开发出性能卓越的BMC-CLIP医学AI模型。该项目通过从600万篇科学文献中提取图像和文字，创建了医学领域最大的开放数据集，在40项医学任务测试中平均性能提升6.56%，计算效率提高10倍，为医学AI发展提供了重要基础资源。

机器人技术

视觉语言模型

空间约束优化

2025-09-17

让机器人也能"理解"世界：北大团队打造会思考的通用机械手

这项由北大团队开发的OmniManip系统，通过创新的物体中心表示方法和双重闭环控制，让机器人能够理解自然语言指令并在复杂环境中精确操作。系统在12项真实任务测试中达到68.3%成功率，远超传统方法，展现了从服务机器人到工业制造等广泛应用前景。该技术为实现真正智能的通用机器人奠定了重要基础。

检索增强生成

多步推理

测试时计算扩展

2025-09-17

微软推出CoRAG：让AI学会像侦探一样一步步搜索信息

微软和人民大学联合开发的CoRAG系统让AI学会了多步骤推理，像侦探破案一样逐步收集信息解答复杂问题。该系统通过训练AI进行分步搜索，在多跳推理任务上比传统方法准确率提升10个百分点以上，并首次在KILT基准测试中创造新纪录。用户可根据需求选择不同计算策略，平衡性能与成本。

视频超分辨率

文本生成视频模型

时空增强技术

2025-09-17

南京大学团队突破视频超分辨率技术：让模糊视频重获新生的神奇方法

南京大学团队开发出STAR视频超分辨率技术，通过借用文本生成视频模型的智慧，配合局部信息增强模块和动态频率损失机制，成功解决了现实世界视频修复中的画质模糊和时间不连贯问题。该技术在多项测试中表现优异，特别是在处理人脸和文字等细节内容时效果显著，为珍贵但画质不佳的视频修复提供了全新解决方案。

人工智能

机器人学习

视频生成

2025-09-17

机器人也能预测未来？上海AI实验室打造"会做梦"的机器人大脑

上海AI实验室等机构联合开发的EnerVerse系统，首次让机器人具备了"想象未来"的能力。通过将视频生成技术与机器人控制结合，该系统能够预测操作过程并生成相应动作。核心创新包括块状自回归生成、自由锚点视角和4D数据生成引擎，在LIBERO基准测试中达到最佳水平，并在真实环境中成功完成复杂操作任务。

日本Sakana AI实验室让大模型学会"自我改造"：AI系统首次掌握实时自我调节能力

人工智能

参数高效微调

自适应系统

2025-09-17

日本Sakana AI实验室让大模型学会"自我改造"：AI系统首次掌握实时自我调节能力

日本Sakana AI实验室开发出Transformer?系统，首次实现AI模型实时自我调节能力。该系统通过奇异值微调技术，让大模型能根据任务类型自动调整内部参数配置，仅用传统方法1%的参数量就实现显著性能提升。系统采用两轮推理机制和强化学习训练，在数学、编程、视觉等多领域测试中均表现优异，甚至支持跨模型的专家知识迁移，为构建真正智能的自适应AI系统奠定了技术基础。

视频编辑

计算机视觉

人工智能

2025-09-17

香港大学团队让视频编辑像玩拼图一样简单：把任何物体精准插入视频的魔法技术

香港大学联合阿里巴巴达摩院开发出VideoAnydoor技术，实现视频中物体的精准插入和运动控制。该技术通过ID提取器、像素变形器和3D神经网络三大创新组件，让用户仅需提供参考图片和轨迹就能完成专业级视频编辑。在多项评估中表现卓越，为视频创作、虚拟试装、影视制作等领域带来革命性突破。

人工智能

多模态语音交互

全双工对话系统

2025-09-17

阿里巴巴团队发布MinMo：让AI和人类像朋友一样自然聊天的革命性语音模型

MinMo是阿里巴巴通义实验室开发的80亿参数多模态语音模型，在140万小时语音数据上训练，实现了全双工语音交互，支持多语言识别翻译、情感分析、风格控制等功能，语音响应延迟仅100-800毫秒，在各项语音任务上达到业界最佳性能，代表了AI语音交互技术的重大突破。

多模态数学推理

过程奖励模型

人工智能可解释性

2025-09-17

清华大学团队发布URSA：首个多模态数学推理过程奖励模型，让AI数学推理像人一样可验证

清华大学团队发布URSA系统，这是首个针对多模态数学推理的过程奖励模型。该系统通过创新的三阶段训练框架，不仅能解决复杂的图文结合数学问题，更重要的是能提供完全可验证的推理过程。URSA在六个标准测试中全面超越同规模开源模型，甚至在平均性能上超过GPT-4o达2.7个百分点，代表了AI推理可解释性的重要突破。

多模态AI

计算机视觉

模型优化

2025-09-17

中科院团队推出LLaVA-Mini：仅用一个视觉token实现高效图像视频理解

中科院团队开发的LLaVA-Mini实现了多模态AI领域的重大突破，将图像理解所需的视觉token从576个压缩至1个，性能不降反升。通过创新的预融合技术和智能压缩机制，该模型计算量减少77%，速度提升3倍，内存占用减少600倍。这一成果使普通设备也能进行高效的图像视频理解，为多模态AI的普及化应用奠定了基础。

亚马逊云科技

Graviton4

2025-09-17

更多“厨师”、更快“出餐”：Graviton4的性价比账单

每一次Amazon Graviton的升级，都带来了两位数的性能提升，同时单位算力的功耗也在持续下降，这也预示着我们也正在迈入新一轮高效算力时代。

PTC

2025-09-17

PTC推出Arena AI助手以加速PLM和QMS工作流程

PTC今日宣布发布其Arena(R)产品生命周期管理（PLM）和质量管理系统（QMS）的人工智能（AI）助手，助力团队加速价值实现。

PEC

至顶网

至顶科技

Agent

2025-09-17

智能体互联的“Email时刻”到来，MCP塑造“智能体经济”基石

在“PEC 2025 AI创新者大会暨第二届提示工程峰会”的“MCP引领Agent互联网新世界的钥匙与协议”分论坛上，来自至顶网、AIGC Link等联合主办方的专家与产业先锋们，围绕MCP的技术演进、应用潜力与生态建设展开深入交流，探讨其在推动Agent互联网走向大规模协同中的关键作用。

人工智能

编程竞赛

模型评估

2025-09-17

阿里巴巴团队推出CODEELO：首个让AI与人类程序员公平竞技的编程挑战平台

阿里巴巴团队开发了CODEELO，这是首个让AI模型与人类程序员在相同条件下公平竞技的编程评估平台。该系统通过直接将AI代码提交到真实竞赛平台CodeForces进行评判，实现了零误判和完全公平的评估环境。测试33个主流AI模型发现，只有OpenAI的o1-mini表现突出（评级1578，超越90%人类选手），大多数模型仍处于人类参赛者最低20%水平，揭示了AI在复杂推理任务中的真实能力差距。

人工智能

视频生成

偏好对齐

2025-09-17

清华大学与快手联合推出VideoReward：让AI视频生成更懂人心的突破性方法

这项由清华大学与快手科技等机构合作的研究构建了包含18.2万个人工标注样本的大规模视频偏好数据集，开发了VideoReward多维度视频评价系统，并提出了Flow-DPO等三种对齐算法，成功让AI视频生成模型学会按照人类偏好创作内容，显著提升了生成视频的质量和用户满意度。

数源AI

AI源于数据，数源AI专注于AI领域入门及提升，让大家能够更加快速高效的完成相关专业知识的学习！学AI就来数源！

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: