最新文章
清华大学团队重磅突破:AI学会了"完美人体姿态",比传统方法准确度提升61%

清华大学团队重磅突破:AI学会了"完美人体姿态",比传统方法准确度提升61%

清华大学团队开发出DPoser-X人体姿态AI系统,使用创新的扩散模型技术统一处理全身、手部、面部姿态建模。该系统采用混合训练策略和截断时间步调度,在8个权威测试基准上比现有方法准确度提升61%。技术可广泛应用于动画制作、体育训练、医疗康复、虚拟现实等领域,代表AI理解人类行为的重要突破。

Meta研究团队推出FACTORY:让最强AI也束手无策的事实核查挑战

Meta研究团队推出FACTORY:让最强AI也束手无策的事实核查挑战

Meta研究团队推出FACTORY测试系统,这是首个大规模人工验证的AI事实准确性评估基准,包含超过1万个高难度问题。测试结果显示,即使是最先进的AI系统在面对复杂事实性问题时准确率也仅约60%,远低于传统测试中的90%以上表现。该研究揭示了当前AI系统在专业知识覆盖和复杂推理能力方面的不足。

软件工程师的AI助手真能独当一面?Nebius AI 72B参数强化学习智能体破解代码修复难题

软件工程师的AI助手真能独当一面?Nebius AI 72B参数强化学习智能体破解代码修复难题

Nebius AI研究团队成功开发出基于强化学习的软件工程智能体,能够像经验丰富的程序员一样独立调试代码。该智能体基于Qwen2.5-72B模型训练,通过两阶段策略将SWE-bench Verified基准测试成功率从20%提升至39%,可处理长达13万令牌的复杂交互,在真实GitHub项目中进行多轮调试。研究证明开源模型通过精心设计的强化学习训练策略,无需依赖昂贵专有模型即可达到世界领先性能,为AI编程助手的实用化和普及奠定了重要技术基础。

AI教学神器大升级:上海AI实验室团队让机器人导师学会"真正的"指导学生

AI教学神器大升级:上海AI实验室团队让机器人导师学会"真正的"指导学生

上海AI实验室联合复旦大学团队开发的IFDecorator框架,通过协作对抗数据飞轮、意图检查和作弊监测三大创新技术,有效解决了AI训练中的"奖励黑客"问题。该方法让AI从表面应付转向真正理解任务意图,在IFEval测试中达到87.43%准确率,超越GPT-4o等知名模型,且作弊率降低近一半。这项突破为开发更可靠智能的AI助手奠定基础。

小米竟然让电脑学会了听音识字:MiDashengLM如何革命性地理解音频世界

小米竟然让电脑学会了听音识字:MiDashengLM如何革命性地理解音频世界

小米公司发布了MiDashengLM,这是一个革命性的音频理解AI系统,能同时理解语音、音乐和环境声音,并用自然语言描述听到的内容。该系统采用创新的"通用音频字幕"训练方法,在多项测试中全面超越现有顶尖系统,运行速度提升4-20倍。研究团队承诺完全开源所有数据、代码和模型权重,为音频AI领域树立了新标杆,有望改变我们与数字设备的交互方式。

深圳大学团队破解3D工业检测难题:让机器像人类一样"记住"新产品缺陷

深圳大学团队破解3D工业检测难题:让机器像人类一样"记住"新产品缺陷

深圳大学团队开发了C3D-AD持续学习框架,解决3D异常检测中的"灾难性遗忘"问题。系统通过三个创新模块:统一特征空间的KAL、智能信息管理的KAA和记忆保持的RPP,实现在学习新产品检测的同时保留对历史产品的检测能力,在三个数据集上取得显著性能提升。

华东师范大学团队推出Sel3DCraft:让文字变3D模型像画画一样轻松直观

华东师范大学团队推出Sel3DCraft:让文字变3D模型像画画一样轻松直观

华东师范大学研究团队开发的Sel3DCraft系统通过可视化交互解决了文字转3D建模的用户体验难题。该系统采用双分支生成、多视角评分和智能关键词推荐技术,将创作效率提升70.5%,质量评分达4.58分。用户无需专业知识即可通过直观界面进行3D创作,代表了AI辅助创作工具的重要进展。

StepFun公司联合中科院突破:让AI从"翻译错误"变身"数学家",准确率高达40.5%

StepFun公司联合中科院突破:让AI从"翻译错误"变身"数学家",准确率高达40.5%

中科院联合StepFun公司开发了AI数学翻译系统StepFun-Formalizer,能将自然语言数学问题转换为严格的形式化数学语言。通过创新的四阶段训练方法,该系统在权威测试中达到40.5%准确率,超越所有现有专业和通用AI模型,为自动定理证明和数学教育等应用奠定基础。

英伟达发布Cosmos世界模型及机器人基础设施

英伟达发布Cosmos世界模型及机器人基础设施

英伟达在SIGGRAPH大会上发布了全新的AI世界模型、库和机器人开发基础设施。其中最引人注目的是Cosmos Reason,这是一个70亿参数的"推理"视觉语言模型,专门用于物理AI应用和机器人。新发布的还包括Cosmos Transfer-2模型,能够从3D仿真场景加速合成数据生成,以及速度优化版本。公司还推出了神经重建库、RTX Pro Blackwell服务器和DGX Cloud云平台,旨在为机器人开发提供完整的解决方案。

戴尔和HPE基于英伟达Blackwell架构扩展AI基础设施产品线

戴尔和HPE基于英伟达Blackwell架构扩展AI基础设施产品线

两大企业基础设施厂商宣布产品线扩展,为客户提供更多大规模部署人工智能工作负载的选择。戴尔更新AI数据平台,新增非结构化数据引擎,并推出搭载英伟达RTX PRO 6000 Blackwell GPU的PowerEdge服务器。HPE扩展AI优化系统配置,支持自主AI和物理AI应用。两家公司均集成英伟达最新Blackwell架构GPU和AI软件套件,提供从数据处理到模型推理的完整解决方案。

Reddit封锁互联网档案馆阻止AI公司数据抓取

Reddit封锁互联网档案馆阻止AI公司数据抓取

Reddit已开始阻止互联网档案馆索引其热门帖子,原因是发现AI公司绕过平台限制,通过抓取档案馆的存档内容获取Reddit数据。此前,互联网档案馆的时光机可靠地存档Reddit页面、用户资料和评论,但现在只能存档Reddit主页截图。Reddit发言人表示,公司发现AI公司违反平台政策,从时光机抓取数据。Reddit同时提出隐私担忧,认为档案馆存档用户已删除的内容存在问题。这一限制可能与Reddit寻求更多AI数据授权交易有关。

2025年软件供应链面临的最大挑战

2025年软件供应链面临的最大挑战

Canonical与IDC、谷歌合作发布研究报告,调查了500家大型企业的软件供应链安全状况。研究发现,70%的企业正在采用开源软件以降低成本和推动创新,但90%的组织在开源供应链管理方面存在困难。主要挑战包括漏洞补丁管理复杂、软件依赖关系可见性不足、AI安全风险担忧以及合规要求日益严格。报告建议企业应自动化系统更新、从可信源获取软件包,并将软件供应链纳入核心交付流程。

Ocean推出Gmail生产力管理新应用

Ocean推出Gmail生产力管理新应用

新款个人生产力应用Ocean正式发布,专为Gmail用户提供收件箱分类、邮件转任务和会议安排功能。该应用作为第三方Gmail客户端,内置任务管理器可将邮件转换为待办事项,支持富文本格式、截止日期设置和文件夹整理。Ocean提供强大的收件箱分类工具,可筛选首次发件人、频繁联系人等不同类别邮件,还具备订阅管理和会议调度功能。目前iPhone版已上线,Mac版开发中,采用67美元非循环会员制,提供14天免费试用。

Pure Storage声称其闪存在功耗和碳排放方面超越固态硬盘

Pure Storage声称其闪存在功耗和碳排放方面超越固态硬盘

Pure Storage发布研究报告,声称其直接闪存模块(DFM)在功耗和碳排放指标上优于传统SSD和机械硬盘。该公司表示,DFM具有更大容量且采用系统级管理,能以更少设备数量满足容量和吞吐量需求,从而降低电力消耗。在10年使用周期的对比测试中,150TB DFM系统的年功耗比HDD系统低4.8倍,碳排放量也显著更低。Pure Storage认为,系统级闪存存储在速度、密度、可持续性和可靠性方面均超越HDD。

Nvidia在SIGGRAPH 2025发布下一代智能体AI和推理机器人模型

Nvidia在SIGGRAPH 2025发布下一代智能体AI和推理机器人模型

英伟达宣布扩展智能AI模型产品线,推出RTX Pro 6000 Blackwell服务器版GPU,为企业提供高性能AI推理能力。公司发布两款新推理模型Nemotron Nano 2和Llama Nemotron Super 1.5,用于构建更智能的AI代理。此外,英伟达还推出Cosmos Reason视觉语言模型,为机器人和物理AI提供视觉推理能力,使机器能够像人类一样思考和规划行动。

Arqit量子加密技术公司加入沃达丰创新生态圈

Arqit量子加密技术公司加入沃达丰创新生态圈

量子安全公司Arqit Quantum已加入沃达丰Tomorrow Street创新中心2025年Scaleup X项目。该创新中心位于卢森堡,旨在连接高增长科技公司与全球合作伙伴和客户。Arqit提供独特的加密软件服务,可保护网络设备、云机器和静态数据免受当前和未来攻击威胁,包括量子计算机攻击。通过加入该项目,Arqit将探索在电信、关键基础设施和企业领域部署量子安全解决方案的机会。

Deepfake检测技术逐步成熟,需求迫在眉睫

Deepfake检测技术逐步成熟,需求迫在眉睫

随着AI技术成本大幅下降和深度伪造技术日益精进,德勤预估到2027年深度伪造诈骗将给美国造成400亿美元损失。在拉斯维加斯安全会议上,专家展示了当前反深度伪造检测技术约90%的准确率。图像操控是最令人担忧的诈骗手段,特别是在金融领域的身份验证中。语音克隆技术也在快速发展,FBI已发出相关警告。专家建议结合技术检测和人工验证,通过元数据分析、边缘检测等方法识别伪造内容。

Vercel推出v0.app,用户可通过提示词创建并部署应用程序

Vercel推出v0.app,用户可通过提示词创建并部署应用程序

前端开发公司Vercel推出v0.app,这是其AI应用构建工具的最新版本。该服务允许任何人仅通过自然语言描述就能创建完整的应用程序或网站,包括前端、后端、AI生成内容和逻辑功能。v0.app采用多个AI代理协同工作,负责网络搜索、文件读取、设计灵感等任务,将体验从"提示和修复"转变为"描述和交付"。用户无需编程技能,只需描述想要构建的内容,AI就能自动处理所有编码复杂性并部署应用。

Adobe推出AI新功能提升Photoshop图像融合效果

Adobe推出AI新功能提升Photoshop图像融合效果

Adobe推出Photoshop新AI功能Harmonize,旨在解决图像合成中的光影匹配问题。该工具通过机器学习技术,一键调整图像的光照环境、色彩和阴影,让合成对象自然融入背景。经过多年研发,该功能已在测试版中发布,能将原本繁琐的修图过程缩短至几分钟。同时Adobe还将推出生成式放大工具和升级版移除功能,旨在提升而非替代人类编辑工作。

云端数据防泄露完全指南:将数据泄露扼杀在摇篮里

云端数据防泄露完全指南:将数据泄露扼杀在摇篮里

数据丢失防护(DLP)涵盖了防止未经授权数据泄露的战略和操作措施。随着大量工作负载迁移到云端,许多专家对云DLP提出需求。然而讨论往往缺乏明确要求,存在项目风险。有效的云DLP策略需要明确两个基本问题:哪些用户在范围内,DLP解决方案应覆盖哪些通信渠道。不同用户群体面临不同的泄露风险:业务用户主要通过邮件和网络上传,而工程师和管理员拥有更多技术选择。组织应结合邮件DLP、终端DLP和网络DLP三种主要解决方案,同时配合严格的防火墙规则和安全开发环境,构建全面的数据保护体系。