这项由阿里巴巴云计算联合浙江大学、南京理工大学开展的研究提出了Repair-R1方法,革命性地改变了自动化程序修复的思路。不同于传统的"先修复后测试"方式,该方法要求AI首先生成诊断性测试用例来理解错误根因,再进行针对性修复。通过强化学习框架同时优化测试生成和代码修复能力,在四个基准数据集上取得显著改进:修复成功率提升2.68%-48.29%,测试生成成功率提升16.38%-53.28%。这种"理解驱动"的修复策略为智能编程助手开辟了新方向。
OpenAI发布两款开源推理模型gpt-oss-120b和gpt-oss-20b,分别具有1170亿和210亿参数,可运行代码并与外部系统交互。其中20b版本仅需16GB显存,适合设备端部署。同时Anthropic推出Claude Opus 4.1升级版,在编程能力测试中得分提升至74.5%,并改进了研究和数据分析功能。
谷歌DeepMind发布Genie 3人工智能模型,可基于自然语言提示生成交互式虚拟世界。该模型是Genie系列第三代产品,能够模拟森林、高山景观等室内外环境,支持用户通过指令修改天气、调整视角或添加物体。相比前代产品,Genie 3可持续渲染数分钟,分辨率提升至720p,并具备视觉记忆功能。该模型可用于训练具身智能体,为自主系统如工业机器人提供更高质量的训练环境。目前仅向有限测试者开放研究预览版。
真正开启新一轮上行周期,生成式AI无疑是最具确定性的方向,它正深刻重构内容创作、技术底座、商业模式,为游戏产业打开全新的增长通道。
闪迪在FMS 2025展会上发布了256TB容量的UltraQLC SN670固态硬盘,计划于2026年上半年出货。该产品采用BiCS 218层3D NAND闪存技术和PCIe Gen5接口,专为AI驱动的数据密集型工作负载设计。硬盘配备定制控制器和先进优化技术,具备动态频率调节功能,可在给定功耗下提升10%性能表现,并通过数据保持配置减少33%的数据回收循环。
OpenAI发布gpt-oss-120b和gpt-oss-20b两款开源模型,这是自2019年GPT-2以来首次发布开放权重模型。用户可下载到本地硬件运行,支持模拟推理、工具使用和深度定制。小模型需16GB内存,大模型需80GB内存。两款模型均采用混合专家架构,支持可配置的思维链,上下文窗口为128000个token。性能接近专有云模型,但仅支持文本处理。
MLPerf存储基准测试第二版显示,测试系统服务的加速器数量比2023年1.0版本增加约一倍。MLCommons表示本轮测试参与度大幅提高,提交机构地域代表性更强,系统多样性更丰富。该基准测试评估存储系统在Unet3D、Cosmoflow和Resnet50 AI训练任务中的性能,以及Llama 3训练中的检查点性能。随着AI训练集群GPU数量增加,故障率上升,检查点技术成为标准做法。
谷歌DeepMind发布新一代世界模型Genie 3,相比前代产品实现多项关键提升。新模型支持720p分辨率输出,可持续运行数分钟而不产生伪影,并首次支持实时交互和文本提示功能,用户可通过文本指令动态改变模拟世界状态。DeepMind将其定位为AI智能体训练工具,可用于自动驾驶等场景的"假如"情况训练,提高模型可靠性。
Aquant公司推出智能体AI平台,专为复杂设备服务组织打造。该平台允许服务团队创建、集成和部署定制AI代理,提供故障排除、知识搜索、零件识别等预构建代理。用户可利用专业工具构建定制代理或集成自有代理,支持多渠道部署和企业系统集成。平台内置服务专业知识,提供检索增强对话层,确保响应与业务指标对齐,助力服务团队提升效率。
谷歌DeepMind发布了Genie 3基础世界模型,该实验室称其为通向通用人工智能的重要里程碑。Genie 3是首个实时交互的通用世界模型,能够生成照片级逼真和想象世界。该模型可通过文本提示生成数分钟的多样化3D环境,分辨率达720p,帧率24fps。最重要的是,Genie 3的模拟在时间上保持物理一致性,因为模型能够记住先前生成的内容。研究人员认为世界模型是实现AGI的关键,特别是对于具身智能体的训练。
Meta CEO扎克伯格宣称未来的设备是AI智能眼镜,焦点正从VR头显转向面部眼镜。苹果、谷歌、三星等巨头都看好AR未来。作为AR/VR设备评测师,作者认为目前Meta Quest系列仍是最佳选择,但2025年硬件格局将发生巨变。三星谷歌的Project Moohan混合现实设备即将发布,Meta可能推出带显示屏的高端智能眼镜和神经输入腕带,苹果Vision Pro将升级M芯片并支持控制器,Valve传闻中的新VR头显可能重新定义游戏空间。
随着AI技术快速发展,IT职业格局正在重塑。热门趋势包括:专注人类优势的工作、设计智能适应系统、网络安全混合方法、跨领域技术通才和AI产品开发。而传统的代码维护、手动威胁检测、追求所有技术技能、某些认证以及与业务目标脱节的技术技能正在降温。专家建议IT专业人员应将技术流利性与创造力、好奇心结合,重点发展监督和协调AI系统的能力。
Liquid Web对1000多名IT专业人士的调查显示,86%的IT专业人员目前在基础架构中使用专用服务器,42%正将工作负载从公有云迁移回专用服务器。55%的受访者认为完全控制和定制化是选择专用服务器的主要原因。合规性、性能可变性和控制权丧失成为云遣返的主要驱动因素,而意外成本和资源浪费也推动了这一趋势。
谷歌DeepMind推出Genie 3"世界模型",仅需提示词或图像即可创建交互式世界。该模型支持720p分辨率24帧每秒的实时渲染,相比前代产品显著提升了视觉保真度和记忆能力,可保持数分钟的视觉一致性。用户能够实时修改环境、添加对象、改变天气或插入新角色。DeepMind将其视为AI研究工具,用于训练embodied agents并生成合成训练数据。尽管仍存在局限性如无法模拟真实地点、易产生AI幻觉等,但该技术为游戏开发和AGI研究提供了新可能性。
博通推出Jericho4网络芯片,能够连接超过100万个处理器跨越多个数据中心,数据处理能力是前代产品的四倍。该芯片可连接距离超过100公里的设施,帮助云公司将较小的数据中心连接成大型AI系统。随着GPU集群功耗增大,单一建筑难以容纳,新芯片为分布式部署提供解决方案。
Google的AI学习工具NotebookLM现已面向13岁及以上用户开放,并作为Google Workspace for Education套件的核心服务提供给所有年龄段用户。这款基于Gemini技术的工具能够上传文档、PDF、网站或Google文档,快速生成数字笔记本,提供问答、摘要、思维导图、视频解释和播客式音频摘要等功能。虽然AI可能出错,但每个输出都包含可追溯到源材料的引用链接。Google承诺不会使用用户聊天记录或上传资料进行训练。
AI音频独角兽公司ElevenLabs周二发布新模型,允许用户生成音乐并声称可商用。这标志着该公司从主要专注AI音频工具向音乐生成领域扩张。由于版权争议,AI音乐生成并非易事。去年Suno和Udio因涉嫌使用版权材料训练模型被起诉。ElevenLabs与独立音乐数字发行平台Merlin Network和Kobalt Music Group达成协议,获得其音乐材料用于AI训练的授权。
谷歌宣布其AI笔记应用NotebookLM现已向年轻用户开放,此前该应用仅限18岁以上用户使用。现在13岁以上的消费者和所有年龄段的Google教育工作区用户都可使用。学生可将笔记转换为播客式音频概述、创建交互式思维导图等。谷歌表示对18岁以下用户执行更严格的内容政策,用户聊天和上传内容不会被人工审查或用于AI训练。此举正值OpenAI为ChatGPT推出学习模式,显示各公司正加剧AI教育领域的竞争。
2025年8月5日,致力于将 AI 技术应用于复杂环境中数据的Cloudera今日宣布收购Taikun。Taikun是在混合云及多云环境中管理Kubernetes和云基础设施的领先平台提供商。
今天,伟创力在台北举行的OCP亚太峰会(Open Compute Project, 开放计算计划,简称:OCP)上宣布推出一款全新的电源架系统,以加速800 伏直流(800VDC)电力架构的应用,满足AI基础设施及AI工厂日益增长的需求。