最新文章
机器人学会双手协作!清华北大联合打造超强仿真平台DualTHOR,让AI机器人像人一样思考

机器人学会双手协作!清华北大联合打造超强仿真平台DualTHOR,让AI机器人像人一样思考

中科院、北大、清华联合开发的DualTHOR平台首次为双臂人形机器人提供真实家庭环境仿真训练。该平台不仅支持双手协作任务,还引入意外机制模拟现实不确定性。实验发现现有AI模型在双手协调方面表现不佳,为未来家庭服务机器人发展指明方向。

北航大学团队突破:AI代码生成不再"自欺欺人",用属性测试让程序真正靠谱

北航大学团队突破:AI代码生成不再"自欺欺人",用属性测试让程序真正靠谱

北京航空航天大学研究团队提出了Property-Generated Solver框架,通过属性测试解决AI代码生成中的"自欺欺人"问题。该方法使用双智能体协作,一个负责代码生成,一个负责属性验证,避免了传统测试依赖具体输输出对的局限性。实验显示相比现有方法在代码正确率上提升23%-37%,为AI辅助编程提供了更可靠的解决方案。

重新定义机器人双臂协作:上海AI实验室等机构推出RoboTwin 2.0,让机器人像人类一样灵活操作

重新定义机器人双臂协作:上海AI实验室等机构推出RoboTwin 2.0,让机器人像人类一样灵活操作

这项由上海交通大学、香港大学、上海AI实验室等16个机构联合完成的突破性研究,推出了RoboTwin 2.0智能机器人训练系统。该系统通过自动代码生成、全方位环境随机化和个性化适应策略,让机器人能在虚拟世界中学会复杂双手协作技能并成功转移到真实环境。实验显示真实世界任务成功率提升367%,完全开源共享推动整个机器人学界发展。

浙江大学研究团队推出ReCode:让AI程序员学会跟上时代,再也不怕API过时

浙江大学研究团队推出ReCode:让AI程序员学会跟上时代,再也不怕API过时

浙江大学研究团队推出ReCode框架,通过强化学习解决AI编程助手使用过时API接口的问题。该方法让7B参数模型在特定任务上超越32B大模型,同时保持通用编程能力基本不变。ReCode收集约2000个真实API更新案例进行训练,在CodeUpdateArena测试集上取得显著提升,为AI适应动态技术环境提供了有效解决方案。

AI调试也会累?堪培拉大学发现大模型调试能力竟然会"用完"

AI调试也会累?堪培拉大学发现大模型调试能力竟然会"用完"

澳大利亚堪培拉大学研究团队首次发现AI在调试代码时存在"疲劳"现象,调试能力会按指数衰减规律急剧下降。研究提出了调试衰减指数(DDI)评估框架,能预测AI调试的最佳干预时机。通过战略性重启方法,在合适时机让AI重新开始,可显著提升调试成功率而无需额外计算资源,为AI编程工具的优化使用提供了科学指导。

当你说话时,AI是如何学会7种语言的精准表达:Cohere Labs团队的多语言推理突破

当你说话时,AI是如何学会7种语言的精准表达:Cohere Labs团队的多语言推理突破

Cohere Labs研究团队提出了一种革命性的多语言AI优化方法,无需重新训练模型即可显著提升非英语语言的表现。通过"多重采样+智能选择"策略,让AI生成多个候选答案后选出最优回应。实验显示该方法让8B参数小模型在多语言任务上挑战大型商业模型,平均性能提升6.8-17.3个百分点,为AI多语言应用开辟了高效可行的新路径。

清华大学推出MATE系统:让AI成为残障人士的"万能翻译官"

清华大学推出MATE系统:让AI成为残障人士的"万能翻译官"

清华大学研究团队开发了MATE多智能体翻译系统,这是首个专为残障人士设计的开源AI辅助工具。该系统能在文字、语音、图像间智能转换,如将图片转为语音描述、语音转文字等。系统包含8个专业智能体协作,准确率达91.7%,支持本地运行保护隐私,为视听障碍等用户群体提供了强大的信息获取工具。

聊天机器人用的词典可以更省电?西班牙研究团队发现AI"节能密码"

聊天机器人用的词典可以更省电?西班牙研究团队发现AI"节能密码"

这项研究首次系统探索了为聊天机器人定制词汇处理系统的节能潜力。通过对8个主流AI模型的测试,发现专门优化的tokenizer可减少5-10%的token数量,直接转化为相应的能耗降低。在全球AI服务规模下,这种看似微小的优化能带来显著的环保和经济效益,为AI可持续发展提供了新思路。

多模态AI学会了"边搜边想":ByteDance团队让机器人像人类一样智能搜索

多模态AI学会了"边搜边想":ByteDance团队让机器人像人类一样智能搜索

ByteDance与南洋理工大学联合开发的MMSearch-R1是首个端到端多模态搜索强化学习框架,让AI学会了"按需搜索"——知道何时依靠内在知识、何时主动搜索外部信息。该系统整合图像和文本搜索工具,通过精心设计的奖励机制训练AI的搜索判断力,在知识密集型任务中准确率超越同规模基线3%,搜索调用减少30%以上,为构建更智能可靠的AI助手开辟了新道路。

让专家"接力"工作,AI模型变得更聪明了——西北大学等顶尖院校联手破解人工智能效率难题

让专家"接力"工作,AI模型变得更聪明了——西北大学等顶尖院校联手破解人工智能效率难题

西北大学等顶尖院校联合提出专家链(CoE)架构,通过让AI模型内部专家依次协作而非并行工作,在相同计算预算下将数学推理验证损失从1.20降至1.12,同时减少17.6%-42%内存使用。这种"接力式"处理方式为AI模型扩展提供了新维度,证明了智能协作比简单资源堆砌更有效。

大语言模型能否像人类一样产生意见分歧?苏黎世联邦理工学院团队揭示AI标注者的局限性

大语言模型能否像人类一样产生意见分歧?苏黎世联邦理工学院团队揭示AI标注者的局限性

苏黎世联邦理工学院团队通过大规模实验发现,当前主流大语言模型在预测人类标注分歧方面存在显著局限。研究对比了RLVR和RLHF两类模型,发现RLVR模型虽然擅长处理标准化任务,但在理解观点多样性方面表现不佳。这一发现对AI标注系统的实际应用具有重要指导意义。

风电场的"智能医生":如何让风力发电机更聪明地预测故障

风电场的"智能医生":如何让风力发电机更聪明地预测故障

本研究通过访谈五位风电专业人士,发现预测维护模型虽能有效减少重大故障停机时间约20%,但在识别渐进性小故障方面存在不足,同时面临假阳性、传感器可靠性和新旧系统整合等挑战。数字孪生、SCADA系统等先进技术显著提升了运维效率,但仍需在AI算法优化、实时数据整合等方面持续改进。

让大型AI模型减肥变身,马普所等机构打造"瘦身"版训练新方法

让大型AI模型减肥变身,马普所等机构打造"瘦身"版训练新方法

德国马普所等机构提出OFTv2,一种更高效的AI模型训练方法。通过将计算从"权重中心"转为"输入中心",结合Cayley-Neumann参数化技术,实现了10倍训练加速和3倍内存节省。该方法还扩展到量化模型训练,创造了QOFT框架,在数学推理等任务上超越了流行的QLoRA方法,为大型AI模型的高效训练提供了新方案。

2025-06-30

上海市虚拟现实产业大会落幕

本次峰会以“科幻无界·虚实共生”为主题,汇聚政府领导、行业专家、企业代表及高校学者,共同探讨虚拟现实技术与科幻文化产业深度融合的创新路径,助力上海构建“科技+文化”双轮驱动的产业生态新格局。

当AI推理变得更聪明时,速度却越来越慢:加州大学圣地亚哥分校找到了"双线程加速"的解决方案

当AI推理变得更聪明时,速度却越来越慢:加州大学圣地亚哥分校找到了"双线程加速"的解决方案

加州大学圣地亚哥分校研究团队提出"前瞻推理"技术,解决大型AI推理模型速度慢的问题。该方法通过多模型协作,在步骤级别进行推测而非逐词猜测,结合语义验证实现高质量加速。实验显示可达2.1倍加速且几乎不影响准确性,为推理加速突破了传统1.4倍的算法天花板。

游戏世界也能"人工制造"?Skywork AI让你用键盘鼠标随心创造虚拟世界

游戏世界也能"人工制造"?Skywork AI让你用键盘鼠标随心创造虚拟世界

Skywork AI推出Matrix-Game,这是首个能根据键盘鼠标操作实时生成交互式游戏世界的AI模型。该系统使用2700小时《我的世界》视频训练,拥有170亿参数,能精确响应用户指令生成符合物理规律的游戏场景。研究团队还开发了GameWorld Score评测标准,验证了Matrix-Game在控制精度和视觉质量方面显著超越现有模型,为AI辅助游戏开发和虚拟世界创建开辟了新方向。

当AI遇上SQL难题:香港大学团队打造智能数据库修复神器BIRD-FIXER

当AI遇上SQL难题:香港大学团队打造智能数据库修复神器BIRD-FIXER

香港大学团队开发出AI数据库修复工具BIRD-FIXER,能自动诊断和修复SQL查询错误。该研究构建了包含1100个真实SQL问题的基准测试,创新性地采用"逆向工程"策略生成训练数据,让AI学会像专家一样调试代码。BIRD-FIXER在基准测试中达到38%的成功率,超越多个商业AI模型,为中小企业提供了实用的数据库问题解决方案,大大降低了SQL使用门槛。

突破CFG瓶颈:ETH科学家让AI图像生成在低指导下也能输出高质量画面

突破CFG瓶颈:ETH科学家让AI图像生成在低指导下也能输出高质量画面

ETH科学家突破AI图像生成经典难题,提出频率解耦指导方法,让AI在低指导条件下也能生成高质量图像。该方法通过分别控制图像的低频结构和高频细节,完美平衡了图像质量与多样性,无需重训练即可应用于所有现有模型,在多个基准测试中均显著超越传统方法。

中科院与百川智能联手推出机器人"全才":能看会说还会做的统一智能体

中科院与百川智能联手推出机器人"全才":能看会说还会做的统一智能体

中科院团队首次实现机器人视觉、语言、动作三位一体统一建模,开发出UniVLA模型。该模型采用创新的"世界模型"训练策略,通过观看视频学习物理规律,在多个基准测试中创下新纪录。LIBERO测试成功率达95.5%,比此前最好成绩提升10个百分点。技术突破在于将不同模态信息转换为统一数字令牌,实现端到端学习,为通用机器人智能奠定基础。

当AI也要学会"言行一致":腾讯与港大团队打造更聪明的视频理解模型

当AI也要学会"言行一致":腾讯与港大团队打造更聪明的视频理解模型

腾讯与港大研究团队提出GRPO-CARE方法,解决AI视频理解中推理过程混乱的问题。通过创建SEED-Bench-R1基准测试和双重奖励机制,让AI在提高准确率的同时保持推理逻辑性,在最难测试中性能提升6.7%,推理一致性提升24.5%,为构建更可信的AI系统奠定基础。