Liqid发布了新产品,支持主机服务器应用程序访问由GPU、内存和存储池构建的动态编排GPU服务器系统,专注于AI推理和代理应用。该公司从PCIe Gen 4架构升级至PCIe 5,支持CXL 2.0内存池化。新产品包括Matrix软件、可组合GPU服务器、可组合内存和I/O加速器等。系统提供两种配置:UltraStack可为单台服务器提供最多30个GPU和100TB DRAM;SmartStack可在最多20个服务器节点间池化30个GPU。
Uber宣布与Lucid和Nuro合作部署至少2万辆自动驾驶出租车。Lucid负责制造基于Gravity电动SUV的改装车辆,Nuro提供自动驾驶软件。车辆搭载英伟达DRIVE Thor芯片的Nuro Driver模块,具备L4级自动驾驶能力。该服务将于2026年底在美国单一城市启动,随后6年内部署超过2万辆车辆。
法国AI实验室Mistral为其Le Chat聊天机器人推出多项新功能,包括"深度研究"模式、原生多语言推理和高级图像编辑功能。深度研究模式将Le Chat转变为协调研究助手,能够规划、澄清需求、搜索和综合数据。该功能面向消费者和企业用户,可进行详尽的旅行规划分析和企业研究。Mistral专注于将Le Chat集成到企业生态系统中,支持本地数据连接,无需上传至云端。新增的项目功能帮助用户组织聊天、文档和想法,多语言推理现已支持法语、西班牙语、日语等。
AWS为S3对象存储新增向量存储桶功能,旨在降低Amazon OpenSearch Service中低频访问向量的存储成本。该功能专为向量数据存储设计,可将上传、存储和查询向量的总成本降低90%。新的向量存储桶提供专用API,无需预配置基础设施即可存储和查询向量数据。每个存储桶最多支持10000个向量索引,每个索引可容纳数千万个向量。该功能已与Amazon Bedrock Knowledge Bases集成,支持构建RAG应用程序,并可与OpenSearch Service协同工作以优化成本。
谷歌澄清ChromeOS不会完全转变为Android,而是基于Android底层技术构建ChromeOS体验,实现更高性能和更好的设备协同。新的统一代码库将减少开发工作量,简化AI功能访问,同时保持ChromeOS的安全性和管理能力。这一变化可能影响入门级Chromebook的硬件要求,但将为两个平台带来显著优势,包括更好的Android应用兼容性和多用户支持。
开放闪存平台(OFP)旨在用直接访问的闪存盒替代全闪存阵列,每个闪存盒配备控制器DPU、Linux系统和并行NFS软件。该倡议由Hammerspace主导,针对新云、超大规模和AI公司在数据中心设计演进中面临的基础设施限制。OFP通过结合IPU/DPU技术、闪存优化机箱和Linux协议,提供高密度、低功耗的存储解决方案,满足AI应用从PB级向EB级数据容量需求的扩展。
ERP系统市场近年来相对稳定,但AI正在改变一切。供应商们正竞相在产品组合中嵌入AI功能,构建包括可组合应用、集中数据存储和可扩展云平台的生态系统。Oracle凭借AI投资超越SAP成为ERP收入领导者,而AI代理已从实验阶段进入实际应用,能够管理整个工作流程并进行自动化决策。本文盘点了Oracle、SAP、微软等十大最具影响力的ERP厂商及其AI战略。
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
以色列魏茨曼科学研究所、英特尔实验室和d-Matrix研究人员开发出新算法,能显著降低大语言模型服务成本。该算法基于投机解码技术,无需专门的草稿模型即可将令牌生成速度提升2.8倍。研究提出三种方法:令牌级交集、字符串级精确匹配和字符串级拒绝采样,解决了不同模型词汇表匹配问题。算法已集成到Hugging Face框架中,开发者仅需一行代码即可使用。
2025年7月17日,慧与科技宣布与迈阿密自由公园(Miami Freedom Park)及迈阿密国际足球俱乐部(Inter Miami CF,后简称迈阿密国际)正式达成合作协议。
AWS在纽约峰会上发布Amazon Bedrock AgentCore,这是一个企业级AI代理构建、部署和运营平台。该平台支持开源框架如CrewAI、LangChain等,提供运行时、内存、身份管理、可观测性等核心服务。Box、巴西伊塔乌银行等企业已开始使用该平台构建生产级应用。平台采用按需付费模式,目前在部分AWS区域提供预览版,2025年9月16日前免费试用。
网约车巨头Uber宣布与中国科技公司百度达成多年战略合作,计划在美国和中国以外地区推出数千辆自动驾驶出租车。服务将从今年晚些时候开始,首先在亚洲和中东的未指定国家推出。百度的Apollo自动驾驶汽车已在中国11个城市运营,成本仅为3.7万美元,远低于行业平均的20万美元。用户可选择乘坐自动驾驶车辆或人工驾驶车辆。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。
香港大学团队开发的OmniPart系统实现了AI领域的重要突破,让计算机首次具备了像人类一样的"零件思维"。该系统能从单张2D图片生成具有清晰零件结构的3D模型,用户可通过简单的颜色遮罩控制分解过程。系统采用两阶段设计:先进行结构规划预测零件位置,再同步生成所有零件。实验显示其性能显著优于现有方法,生成效率提升20倍,为3D内容创作、游戏开发、虚拟现实等领域开辟了新的可能性。
腾讯研究团队首次开发出RLVER框架,通过可验证的情感反馈训练AI理解人类情感。该方法让70亿参数的小型AI模型在情感智能测试中从13.3分跃升至79.2分,达到大型商业模型水平。研究创新性地使用虚拟用户的真实情感变化作为训练信号,并发现"先思考再回应"模式显著提升AI的共情能力。这项突破为AI情感智能发展开辟新路径,有望在心理健康支持、教育和客户服务等领域产生广泛应用。
北卡罗来纳大学团队提出R1-RE框架,通过强化学习训练小模型模拟人类专家推理过程,在关系抽取任务中实现跨领域突破。该方法使7B参数模型达到GPT-4o级别性能,跨领域准确率提升30%,为AI推理训练提供新范式。
德国图宾根大学研究团队发现现代AI视觉模型具备强大的图像排序能力,能够理解年龄、美观程度等连续属性并进行准确排序。研究测试了7种AI模型在9个数据集上的表现,发现CLIP模型表现最佳,且仅需极少样本就能学会排序。这一突破为照片管理、电商展示、社交媒体等领域提供了新的技术方案。
KAUST团队开发UnMix-NeRF技术,首次实现3D场景重建与材料识别的同步。该系统利用光谱成像技术,能够识别物体的材料特性,不仅重建逼真3D场景,还可自动分离不同材料区域。技术在多个数据集上表现优异,为机器人、增强现实、工业检测等领域带来新突破。