最新文章
多台无人机不用对话也能抬重物?代尔夫特理工大学用AI让空中搬运变得聪明又安全

多台无人机不用对话也能抬重物?代尔夫特理工大学用AI让空中搬运变得聪明又安全

代尔夫特理工大学研究团队首次实现了完全分布式的多无人机协作搬运系统,通过多智能体强化学习让三台无人机在无需相互通信的情况下精确控制悬挂重物的6自由度姿态。该方法仅通过观察被搬运物体状态实现隐性协作,计算效率比传统集中式方法提升13倍,并展现出优异的容错能力。

视频生成黑科技:腾讯团队仅用1%参数就让AI精准识别人脸,一张照片秒变高质量视频

视频生成黑科技:腾讯团队仅用1%参数就让AI精准识别人脸,一张照片秒变高质量视频

腾讯微信视觉团队提出Stand-In框架,仅用1%参数实现高质量身份保持视频生成。该方法通过条件图像分支和受限自注意力机制,让AI在生成视频时能持续参考原始照片,确保人物面部特征一致。在多项评测中表现优异,面部相似度0.724,支持零样本泛化到非人类主体,可即插即用集成到各种应用中。

蚂蚁集团提出GRAO:让AI模型在"模仿-探索-超越"中实现自我优化的统一对齐框架

蚂蚁集团提出GRAO:让AI模型在"模仿-探索-超越"中实现自我优化的统一对齐框架

蚂蚁集团智能医疗部门提出GRAO统一对齐框架,通过"模仿-探索-超越"三阶段机制解决传统AI对齐方法局限性。该方法相比监督微调、强化学习等基线方法分别实现57.70%、7.95%等显著提升,特别在专家混合模型上表现突出,为大型语言模型对齐优化提供新范式。

能看会听还记得住!ByteDance推出超级AI助手,能像人一样积累记忆的M3-Agent

能看会听还记得住!ByteDance推出超级AI助手,能像人一样积累记忆的M3-Agent

ByteDance研究团队推出的M3-Agent是首个具备长期记忆能力的多模态AI代理。它能同时处理视频、音频信息,像人类一样积累经验和知识。系统采用情节记忆和语义记忆双重机制,以实体为中心组织信息,并通过多轮推理解决复杂问题。在专门构建的M3-Bench测试中,M3-Agent全面超越现有技术,为智能助手的发展开辟了新方向。

微软研究院突破:能看能编程的AI"达芬奇",让机器同时拥有眼睛和程序员的大脑

微软研究院突破:能看能编程的AI"达芬奇",让机器同时拥有眼睛和程序员的大脑

微软研究院开发的VisCodex实现了多模态AI的重要突破,通过创新的模型融合技术让AI同时具备视觉理解和编程能力。该系统采用任务向量融合方法,将视觉语言模型与编程模型巧妙结合,并构建了包含59.8万样本的多模态编程数据集。测试显示其性能已接近GPT-4o水平,为未来的智能编程辅助和低代码开发提供了新的可能性。

清华大学开发AI导师AMFT:像经验丰富的老师一样智能调配学习方法

清华大学开发AI导师AMFT:像经验丰富的老师一样智能调配学习方法

清华大学研究团队开发了AMFT自适应元微调方法,通过智能元学习控制器动态平衡模仿学习与强化学习,解决传统AI训练中的灾难性遗忘问题。该方法在数学推理、视觉推理等多项任务中创造最佳成绩,不仅提高了性能还增强了泛化能力,为开发更可靠的AI推理系统提供了新思路。

机器人解释官:让AI自动生成的解释像人类一样帮助模型做决策

机器人解释官:让AI自动生成的解释像人类一样帮助模型做决策

德国慕尼黑工业大学研究团队探索了AI自动生成解释是否能帮助其他AI模型提升决策性能。研究使用四个大型语言模型生成自然语言解释,并测试其对传统模型和先进语言模型的影响。结果显示,解释能显著改善传统模型表现,但对大型语言模型效果复杂,有时甚至产生负面影响。研究为理解AI协作机制和优化多模型系统提供了重要见解。

智能体类型与记忆系统的深度解析

智能体类型与记忆系统的深度解析

在AI智能体的发展中,记忆能力成为区分不同类型的关键因素。专家将AI智能体分为七类:简单反射、基于模型反射、目标导向、效用导向、学习型、多智能体系统和层次化智能体。有状态的智能体具备数据记忆能力,能提供持续上下文,而无状态系统每次都重新开始。未来AI需要实现实时记忆访问,将存储与计算集成在同一位置,从而创造出具备人类般记忆能力的数字孪生系统。

OpenAI CEO计划投入数万亿美元建设AI基础设施

OpenAI CEO计划投入数万亿美元建设AI基础设施

OpenAI首席执行官阿尔特曼表示,公司计划在不久的将来投入数万亿美元用于AI基础设施建设,包括数据中心建设等。他正在设计新型金融工具来筹集资金。阿尔特曼认为当前AI投资存在过度兴奋现象,类似于90年代互联网泡沫,但AI技术本身是真实且重要的。他承认GPT-5发布存在问题,并表示OpenAI未来可能会上市。

案例 | 研华助力真健康打造国际首创穿刺手术机器人,安全精准、一针到位
2025-08-18

案例 | 研华助力真健康打造国际首创穿刺手术机器人,安全精准、一针到位

在全国 70 余家三甲医院,真健康穿刺手术机器人实现了“安全精准、一针到位”。依托研华高性能边缘AI硬件与医疗级显示器支撑,这一国产医疗创新突破了传统经验依赖,实现亚毫米级穿刺精度,让医疗更高效、更安全。

HPE焕新品牌战略,进一步拓展中国市场合作伙伴生态
2025-08-18

HPE焕新品牌战略,进一步拓展中国市场合作伙伴生态

更开放的市场发展策略将助力中国客户畅享HPE领先的人工智能、云与网络解决方案组合。

香港理工大学团队突破:让AI在分子世界里"边想边创造",推理过程也能看得见

香港理工大学团队突破:让AI在分子世界里"边想边创造",推理过程也能看得见

香港理工大学联合多所高校开发的Mol-R1框架,首次实现了AI在分子发现中的透明推理。该系统通过PRID方法学习专家推理模式,配合MoIA迭代训练策略,不仅能准确生成分子结构,还能展示完整思考过程。相比现有模型,Mol-R1推理更简洁高效,为药物研发等领域的AI应用提供了重要的安全保障。

船舶导航启发:蚂蚁集团团队打造"多个AI大脑"协作解决复杂问题

船舶导航启发:蚂蚁集团团队打造"多个AI大脑"协作解决复杂问题

蚂蚁集团AWorld团队发表突破性研究,创建动态多智能体协作系统解决AI稳定性难题。研究灵感来源于船舶导航,通过执行智能体和守护智能体的协作机制,在GAIA测试中准确率达67.89%,稳定性提升17.3%,荣登开源项目排行榜第一名。该系统为构建可靠智能系统开辟新路径,具有广阔应用前景。

GPT-4o生成的合成图像让AI画画更聪明:上海AI实验室团队揭开数据质量的秘密

GPT-4o生成的合成图像让AI画画更聪明:上海AI实验室团队揭开数据质量的秘密

本研究揭示了合成数据在AI图像生成训练中的独特价值,创建了18万张GPT-4o生成的Echo-4o-Image数据集。相比真实图像,合成图像能补充稀有幻想场景、提供纯净训练信号、实现精确的长尾属性控制。基于此数据集训练的Echo-4o模型在指令跟随、创意生成和多图融合任务上均实现显著提升,并展现出良好的跨模型迁移能力。

百度等机构联合推出MathReal:真实世界里的AI数学能力究竟如何?

百度等机构联合推出MathReal:真实世界里的AI数学能力究竟如何?

百度等机构联合推出MATHREAL数据集,首次系统评估AI模型在真实K-12教育场景中的数学推理能力。通过2000道真实拍摄的数学题目,研究发现即使是最先进的AI模型在面对模糊、倾斜等真实条件时准确率也只有53.9%,远低于标准测试表现,揭示了当前AI教育应用的重大局限性。

上海交大和复旦大学揭秘:AI视觉模型的"视觉陷阱"——当智能助手被恶意操控时会发生什么?

上海交大和复旦大学揭秘:AI视觉模型的"视觉陷阱"——当智能助手被恶意操控时会发生什么?

上海交大和复旦大学研究团队发现了AI视觉系统的重大安全漏洞——IAG攻击。这种攻击能让AI助手在视觉定位时被恶意操控,无论用户询问什么,都会指向攻击者预设的错误目标,且几乎无法被察觉。实验显示攻击成功率超65%,现有防御技术完全失效,对机器人、自动驾驶等应用构成严重威胁。

浙大团队破解AI大模型"教学相长"难题:让机器老师和学生同时进步

浙大团队破解AI大模型"教学相长"难题:让机器老师和学生同时进步

浙江大学团队开发的Cooper框架实现了AI训练中的"教学相长",通过同步优化策略模型和奖励模型,成功解决了传统训练中的奖励黑客攻击问题。该框架让AI老师和学生同步成长,在数学推理任务上实现了显著性能提升,为构建更稳定可靠的AI系统开辟了新路径。

上海交通大学团队让AI文本生成速度飞跃:比传统模型快2.5倍的D2F技术问世

上海交通大学团队让AI文本生成速度飞跃:比传统模型快2.5倍的D2F技术问世

上海交通大学邓志杰教授团队开发出革命性的D2F技术,成功让AI文本生成速度比传统模型快2.5倍。该技术通过巧妙的分块并行处理和预测机制,在大幅提升速度的同时保持文本质量不变,打破了AI领域长期存在的"速度与质量不可兼得"难题,为未来AI应用带来重大突破。

谷歌等机构推出超快AI图像生成技术:让模型不再费力"思考",直接画出好图片

谷歌等机构推出超快AI图像生成技术:让模型不再费力"思考",直接画出好图片

德国慕尼黑工业大学联合谷歌等机构推出HyperNoise技术,通过训练专门的"噪声超网络"为AI图像生成模型提供最优起始条件,在几乎不增加推理时间的情况下显著提升生成质量。该技术将复杂的优化过程从推理时转移到训练时,实现了速度与质量的完美平衡,为快速高质量AI图像生成提供了突破性解决方案。

密歇根大学提出AimBot:机器人学会"瞄准镜"功能,让机械臂拥有射手般精准操控能力

密歇根大学提出AimBot:机器人学会"瞄准镜"功能,让机械臂拥有射手般精准操控能力

密歇根大学研究团队提出AimBot技术,通过在机器人视觉系统中添加类似瞄准镜的射击线和十字准星,显著提升机械臂操作精度。该技术计算效率极高(不到1毫秒),无需修改现有模型架构,在仿真和真实环境测试中都带来显著性能提升,特别是在复杂长期任务中成功率提升5-6个百分点。技术具有良好的环境适应性,为制造业、医疗、家庭服务等领域的机器人应用提供了重要技术支撑。