最新文章第6页

2025-08-18

CCF HPC China 2025｜联想 AI 基础设施 “一横五纵” 产品矩阵精彩亮相

联想万全大模型训推一体机荣获HPC China 2025产品创新奖。

人工智能

强化学习

模型训练

2025-08-18

人工智能学会了如何在探索与利用之间找平衡：中国人民大学提出的新训练方法让AI更聪明

中国人民大学和字节跳动联合提出Pass@k训练方法，通过给AI模型多次答题机会来平衡探索与利用。该方法不仅提升了模型的多样性表现，还意外改善了单次答题准确率。实验显示，经过训练的7B参数模型在某些任务上超越了GPT-4o等大型商业模型，为AI训练方法论贡献了重要洞察。

成员推理攻击

自然语言处理

隐私保护技术

2025-08-18

USC团队新突破：用文本就能轻松检测AI模型的隐私泄露，颠覆传统方法

南加州大学等机构研究团队开发出突破性的"N-gram覆盖攻击"方法，仅通过分析AI模型生成的文本内容就能检测其是否记住了训练数据，无需访问模型内部信息。该方法在多个数据集上超越传统方法，效率提升2.6倍。研究还发现新一代AI模型如GPT-4o展现出更强隐私保护能力，为AI隐私审计和版权保护提供了实用工具。

人工智能

强化学习

模型优化

2025-08-18

微软团队新突破：让AI推理"短小精悍"而非冗长啰嗦，效果竟然更好？

微软研究团队发现AI推理模型存在"长度膨胀"问题——回答冗长啰嗦但准确性并未提升。他们提出GFPO方法，通过训练时生成更多候选答案但只学习最简洁有效的回答，成功将AI回答长度减少46%-85%，同时保持原有准确性。该方法在数学竞赛、科学问答等多个基准测试中表现优异，为AI推理效率优化提供了新思路。

人工智能

混合专家架构

参数优化

2025-08-18

华沙大学联合团队首次破解大型AI模型训练难题：让"专家混合"架构也能轻松调参

华沙大学联合研究团队首次将μ参数化技术成功扩展至混合专家架构，解决了MoE模型训练中的超参数调优难题。通过理论分析和实验验证，证明了小模型上找到的最佳学习率可直接应用于大模型，大幅降低训练成本。研究发现专家网络应视为隐藏权重，路由器应视为输出权重，采用不同缩放策略，为大规模AI模型高效训练提供重要工具。

AI语言模型遇到"混淆问题"时为何表现不佳？印度理工学院等联合研究揭示大模型推理盲区

人工智能

自然语言处理

评估框架

2025-08-18

AI语言模型遇到"混淆问题"时为何表现不佳？印度理工学院等联合研究揭示大模型推理盲区

印度理工学院等机构研究发现，即使是最先进的AI模型如GPT-4o、Claude等，在面对间接表达、干扰信息或背景过载的"混淆问题"时，准确率会从70-80%骤降至25-40%。研究团队开发的ObfusQAte评估框架首次系统性揭示了大语言模型的这一重要缺陷，为改进AI推理能力和提高实际应用可靠性提供了重要基准。

ASM-UNet：让医疗影像识别系统拥有"火眼金睛"，清华大学团队攻克精细结构分割难题

医疗影像分割

自适应扫描技术

精细粒度分割

2025-08-18

ASM-UNet：让医疗影像识别系统拥有"火眼金睛"，清华大学团队攻克精细结构分割难题

清华大学团队开发的ASM-UNet系统通过创新的自适应扫描机制，首次实现了医疗影像精细结构的智能识别。该系统结合群体共性和个体差异的双重评分策略，在胆管系统等微小复杂结构分割上取得突破性进展。团队还构建了BTMS数据集，为精细粒度医疗影像分割提供标准测试平台，推动精准医疗发展。

当照片"有洞有残缺"时，AI也能巧手补天：北京大学团队让3D重建告别"马赛克"困扰

3D重建技术

视频扩散模型

计算机视觉

2025-08-18

当照片"有洞有残缺"时，AI也能巧手补天：北京大学团队让3D重建告别"马赛克"困扰

GSFixer是由北京大学等机构联合开发的3D重建技术，专门解决从稀少照片中重建高质量3D模型的难题。该技术通过参考引导的视频扩散模型，融合2D语义和3D几何信息，确保生成的新视角与原始照片保持一致性。相比现有方法在图像质量和结构准确性方面都有显著提升，可广泛应用于文物保护、房地产、影视游戏等领域。

人工智能

图像编辑

新型算法

2025-08-18

香港科技大学发布 CannyEdit：让AI图像编辑从此告别"塑料感"，实现真正的无缝融合

这项研究推出了CannyEdit图像编辑框架，通过选择性边缘控制和双重提示策略，实现了前所未有的自然编辑效果。在用户测试中，普通用户仅有49.2%能识别出其编辑痕迹，远低于其他方法的76-89%识别率。该技术无需专门训练，可处理添加、移除、替换等多种编辑任务，为AI图像编辑的实用化应用奠定了重要基础。

多智能体强化学习

空中搬运操作

分布式协作控制

2025-08-18

多台无人机不用对话也能抬重物？代尔夫特理工大学用AI让空中搬运变得聪明又安全

代尔夫特理工大学研究团队首次实现了完全分布式的多无人机协作搬运系统，通过多智能体强化学习让三台无人机在无需相互通信的情况下精确控制悬挂重物的6自由度姿态。该方法仅通过观察被搬运物体状态实现隐性协作，计算效率比传统集中式方法提升13倍，并展现出优异的容错能力。

人工智能

视频生成

轻量化模型

2025-08-18

视频生成黑科技：腾讯团队仅用1%参数就让AI精准识别人脸，一张照片秒变高质量视频

腾讯微信视觉团队提出Stand-In框架，仅用1%参数实现高质量身份保持视频生成。该方法通过条件图像分支和受限自注意力机制，让AI在生成视频时能持续参考原始照片，确保人物面部特征一致。在多项评测中表现优异，面部相似度0.724，支持零样本泛化到非人类主体，可即插即用集成到各种应用中。

蚂蚁集团提出GRAO：让AI模型在"模仿-探索-超越"中实现自我优化的统一对齐框架

人工智能

强化学习

模型对齐

2025-08-18

蚂蚁集团提出GRAO：让AI模型在"模仿-探索-超越"中实现自我优化的统一对齐框架

蚂蚁集团智能医疗部门提出GRAO统一对齐框架，通过"模仿-探索-超越"三阶段机制解决传统AI对齐方法局限性。该方法相比监督微调、强化学习等基线方法分别实现57.70%、7.95%等显著提升，特别在专家混合模型上表现突出，为大型语言模型对齐优化提供新范式。

能看会听还记得住！ByteDance推出超级AI助手，能像人一样积累记忆的M3-Agent

人工智能

多模态推理

长期记忆系统

2025-08-18

能看会听还记得住！ByteDance推出超级AI助手，能像人一样积累记忆的M3-Agent

ByteDance研究团队推出的M3-Agent是首个具备长期记忆能力的多模态AI代理。它能同时处理视频、音频信息，像人类一样积累经验和知识。系统采用情节记忆和语义记忆双重机制，以实体为中心组织信息，并通过多轮推理解决复杂问题。在专门构建的M3-Bench测试中，M3-Agent全面超越现有技术，为智能助手的发展开辟了新方向。

人工智能

多模态技术

模型融合

2025-08-18

微软研究院突破：能看能编程的AI"达芬奇"，让机器同时拥有眼睛和程序员的大脑

微软研究院开发的VisCodex实现了多模态AI的重要突破，通过创新的模型融合技术让AI同时具备视觉理解和编程能力。该系统采用任务向量融合方法，将视觉语言模型与编程模型巧妙结合，并构建了包含59.8万样本的多模态编程数据集。测试显示其性能已接近GPT-4o水平，为未来的智能编程辅助和低代码开发提供了新的可能性。

人工智能

强化学习

元学习算法

2025-08-18

清华大学开发AI导师AMFT：像经验丰富的老师一样智能调配学习方法

清华大学研究团队开发了AMFT自适应元微调方法，通过智能元学习控制器动态平衡模仿学习与强化学习，解决传统AI训练中的灾难性遗忘问题。该方法在数学推理、视觉推理等多项任务中创造最佳成绩，不仅提高了性能还增强了泛化能力，为开发更可靠的AI推理系统提供了新思路。

自然语言处理

大型语言模型

AI协作优化

2025-08-18

机器人解释官：让AI自动生成的解释像人类一样帮助模型做决策

德国慕尼黑工业大学研究团队探索了AI自动生成解释是否能帮助其他AI模型提升决策性能。研究使用四个大型语言模型生成自然语言解释，并测试其对传统模型和先进语言模型的影响。结果显示，解释能显著改善传统模型表现，但对大型语言模型效果复杂，有时甚至产生负面影响。研究为理解AI协作机制和优化多模型系统提供了重要见解。

人工智能

记忆系统

有状态智能体

2025-08-18

智能体类型与记忆系统的深度解析

在AI智能体的发展中，记忆能力成为区分不同类型的关键因素。专家将AI智能体分为七类：简单反射、基于模型反射、目标导向、效用导向、学习型、多智能体系统和层次化智能体。有状态的智能体具备数据记忆能力，能提供持续上下文，而无状态系统每次都重新开始。未来AI需要实现实时记忆访问，将存储与计算集成在同一位置，从而创造出具备人类般记忆能力的数字孪生系统。

人工智能

基础设施建设

投资策略

2025-08-18

OpenAI CEO计划投入数万亿美元建设AI基础设施

OpenAI首席执行官阿尔特曼表示，公司计划在不久的将来投入数万亿美元用于AI基础设施建设，包括数据中心建设等。他正在设计新型金融工具来筹集资金。阿尔特曼认为当前AI投资存在过度兴奋现象，类似于90年代互联网泡沫，但AI技术本身是真实且重要的。他承认GPT-5发布存在问题，并表示OpenAI未来可能会上市。