最新文章
AI终于学会了记忆:南洋理工大学团队让虚拟世界永不遗忘的突破性进展

AI终于学会了记忆:南洋理工大学团队让虚拟世界永不遗忘的突破性进展

南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。

MTS AI重磅推出:让AI写代码像作家写小说一样精彩的"智能编程助手"

MTS AI重磅推出:让AI写代码像作家写小说一样精彩的"智能编程助手"

MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。

多模态大模型的"指令遵循"能力大突破:上海AI实验室团队让AI像人一样精确理解视觉任务要求

多模态大模型的"指令遵循"能力大突破:上海AI实验室团队让AI像人一样精确理解视觉任务要求

上海AI实验室联合多家机构推出MM-IFEngine系统,专门解决多模态AI的"指令遵循"难题。该系统能自动生成复杂的图片-指令训练数据,并创建了包含400题、32种约束类型的MM-IFEval评测基准。实验显示训练后的AI模型在指令遵循能力上提升10%以上,在保持原有能力的同时显著提高了对复杂要求的理解和执行能力。

加州大学洛杉矶分校突破性研究:AI对话攻防战的多轮博弈新纪元

加州大学洛杉矶分校突破性研究:AI对话攻防战的多轮博弈新纪元

这项突破性研究首次系统性地揭示了多轮对话攻击对AI安全的严重威胁,开发了X-Teaming智能攻击框架和XGuard-Train防护数据集。研究显示当前AI系统面对精心设计的多轮攻击时失守率高达98%,但通过新构建的大规模训练数据集可将这一风险显著降低,为AI安全防护提供了重要工具和新思路。

当AI拥有了永久记忆:上海交通大学团队打造的MemOS让大模型告别"健忘症"

当AI拥有了永久记忆:上海交通大学团队打造的MemOS让大模型告别"健忘症"

上海交通大学团队开发了MemOS记忆操作系统,让AI拥有真正的长期记忆能力。该系统统一管理参数记忆、激活记忆和明文记忆三种类型,通过MemCube智能单元实现记忆的生命周期管理和跨类型转换。在LOCOMO基准测试中,MemOS在所有推理任务上均获得最佳成绩,特别在多跳推理和时间推理中表现突出。

智能时代,同球共济!2025世界人工智能大会将于7月26日启幕

7月10日,上海市政府新闻办举行2025世界人工智能大会暨人工智能全球治理高级别会议新闻发布会,上海市政府副秘书长、市经济信息化委主任张英介绍大会总体安排和筹备进展情况。

AI催生下的价值迁徙,神州数码与阿里云合作的“生态位”再定义

AI催生下的价值迁徙,神州数码与阿里云合作的“生态位”再定义

在云计算浪潮中厚积薄发的“上升螺旋”,为阿里云和神州数码在AI时代的同频共振奠定了最坚实的基础。

铠侠UFS 4.1闪存承诺提升AI应用性能表现

铠侠UFS 4.1闪存承诺提升AI应用性能表现

铠侠正在测试最新的UFS v4.1嵌入式闪存芯片,专为智能手机和平板电脑设计,可提供更快的下载速度和更流畅的设备端AI应用性能。该芯片采用218层TLC 3D NAND技术,提供256GB、512GB和1TB容量选择。相比v4.0产品,随机写入性能提升约30%,随机读取性能提升35-45%,同时功耗效率改善15-20%。新标准还增加了主机发起碎片整理、增强异常处理等功能特性。

Google Firebase Studio推出智能体模式实现自动化编程

Google Firebase Studio推出智能体模式实现自动化编程

谷歌在伦敦云峰会上发布Firebase Studio更新,新增Gemini命令行界面集成、模型上下文协议支持和"代理模式"。代理模式提供三种AI协作层次:对话式"询问"模式用于头脑风暴,人机协作代理需开发者确认代码变更,以及几乎完全自主的代理模式。尽管谷歌声称已有数百万应用使用该平台,但目前仍需精心设计提示词,非工程师用户还无法直接创建成熟应用。

上海AI实验室重大突破:用普通相机就能拍出超高速慢镜头,4D重建技术颠覆传统拍摄

上海AI实验室重大突破:用普通相机就能拍出超高速慢镜头,4D重建技术颠覆传统拍摄

上海AI实验室团队提出创新的异步拍摄方案,仅用普通相机就能实现高速4D重建。该方法通过错开相机启动时间将有效帧率从25FPS提升至100-200FPS,并结合视频扩散模型修复稀疏视角导致的重建伪影。实验结果显示,新方法在处理快速运动场景时显著优于现有技术,为低成本高质量4D内容创作开辟新路径。

上海AI实验室联手复旦大学:让AI学会像人类一样比较和评价,重新定义奖励模型的训练方式

上海AI实验室联手复旦大学:让AI学会像人类一样比较和评价,重新定义奖励模型的训练方式

上海AI实验室联手复旦大学提出了POLAR方法,这是一种革命性的奖励模型训练技术。通过让AI学会识别不同策略间的差异而非死记评分标准,POLAR在多项任务上实现了显著提升,7B参数模型超越72B现有最强基线,为AI对齐问题提供了全新解决思路。

复旦大学推出BMMR数据集:让AI跨越知识鸿沟,从数学天才走向通识博士

复旦大学推出BMMR数据集:让AI跨越知识鸿沟,从数学天才走向通识博士

复旦大学团队发布BMMR数据集,这是首个大规模跨学科多模态推理评估基准,包含11万个涵盖300个学科的大学水平问题。研究发现即使最先进的AI模型在跨学科推理中表现有限,揭示了当前AI发展的重要盲点。该数据集支持中英双语,配备专门的推理过程评估工具,为AI向通用智能发展提供重要支撑。

谷歌为Veo 3增加图像转视频生成功能

谷歌为Veo 3增加图像转视频生成功能

谷歌周四宣布,通过Gemini应用为其Veo 3 AI视频生成器增加图像生成视频功能。该功能此前已在5月I/O开发者大会上推出的AI视频工具Flow中提供。目前Veo 3视频生成功能已在150多个国家推出,仅限Google AI Ultra和Pro用户使用,每日限制生成3个视频。用户可上传照片并添加音频描述来生成视频。发布7周来,用户已创建超过4000万个视频,所有视频都带有可见和不可见的数字水印。

机器人也能"预知未来"?上海交通大学团队让AI先想象再行动,准确率飙升至76.7%

机器人也能"预知未来"?上海交通大学团队让AI先想象再行动,准确率飙升至76.7%

上海交通大学等多所院校联合开发的DreamVLA系统让机器人具备了"预知未来"的能力,通过预测动态变化、空间结构和物体语义来指导行动,在真实世界测试中达到76.7%成功率,在模拟环境CALVIN基准中创下4.44平均任务长度新纪录。该系统采用分块注意力机制协调三种预测能力,并使用扩散变换器从噪声中生成精确动作,代表了从"反应式"向"预测式"机器人智能的重要突破。

英伟达计划推出专为中国市场设计的AI芯片

英伟达计划推出专为中国市场设计的AI芯片

据报道,英伟达计划最早于9月推出专为中国市场设计的AI芯片,以应对美国出口限制。该芯片基于Blackwell RTX Pro 6000处理器,已经过修改以符合现有AI芯片限制规定,不包含高带宽内存和NVLink高速通信接口等高级功能。此前英伟达CEO表示不再将中国市场纳入收入预测,但这一变化可能是短暂的。

AI训练数据的"营养配餐师":中科院如何让机器学习吃得更好

AI训练数据的"营养配餐师":中科院如何让机器学习吃得更好

这项由中科院计算所团队开发的REFINEX框架,通过创新的删除式编辑方法,解决了AI训练数据质量低的问题。该方法先用专家模型生成高质量文本,再提取删除操作训练小型编辑模型,既保证了数据质量又提高了处理效率。实验显示,REFINEX让750M参数模型性能提升2.6%-7.2%,同时显著降低训练成本。

ArtifactsBench:腾讯混元团队重新定义AI代码生成评测标准,让机器写出真正能看能用的界面程序

ArtifactsBench:腾讯混元团队重新定义AI代码生成评测标准,让机器写出真正能看能用的界面程序

腾讯混元团队推出ArtifactsBench,这是全球首个专门评测AI生成视觉交互代码质量的综合基准系统。该系统包含1825个真实应用场景测试任务,创新性地通过实际运行代码、动态截图、多模态AI评委等方式,从功能性、美观度、用户体验等十个维度进行评测。实验结果显示其与人类专家判断一致性超过90%,与业界金标准WebDev Arena的一致性达94.4%,为AI代码生成能力评估树立了新标准。

YouTube新政策旨在减少AI生成的低质量视频内容

YouTube新政策旨在减少AI生成的低质量视频内容

YouTube计划7月15日更新货币化政策,针对"非真实"内容进行打击,主要目标是减缓平台上AI生成内容的泛滥。新政策将更好识别批量生产和重复性内容,包括仅有表面差异的旁白故事频道和相同解说的幻灯片视频。虽然YouTube强调这只是对现有"重复内容"指导原则的小幅更新,但业界认为此举主要针对低价值AI垃圾内容问题。

突破复杂指令编辑难题:加州大学伯克利分校团队推出X-Planner,让AI图像编辑像聊天一样简单

突破复杂指令编辑难题:加州大学伯克利分校团队推出X-Planner,让AI图像编辑像聊天一样简单

这项由加州大学伯克利分校、香港大学和Adobe联合开展的研究,开发了名为X-Planner的AI图像编辑规划系统,解决了现有AI工具难以理解复杂编辑指令的问题。该系统能将"让图片看起来像夏天"等自然语言指令智能分解为具体编辑步骤,并自动生成精确的控制信息,显著提升了AI图像编辑的准确性和可控性。

从看图说话到看视频聊天:Salesforce带来史上最强多模态理解新突破

从看图说话到看视频聊天:Salesforce带来史上最强多模态理解新突破

本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准,首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线,展示了从专门化向通用化发展的重要趋势,为多媒体内容理解、智能搜索和人机交互带来突破性进展。