思科与英伟达、VAST Data合作推出安全AI工厂,整合服务器、GPU和存储设备为企业提供一体化AI基础设施。该方案采用融合基础设施形式,以AI POD作为核心组件,搭载英伟达RTX PRO 6000 Blackwell GPU和思科UCS服务器。存储方面支持NetApp、Pure Storage或VAST Data产品。VAST声称其InsightEngine能够加速RAG管道,将响应延迟从分钟级降至秒级,支持企业级智能体AI应用。
随着人工智能深度融入商业文化,97%的高管认为生成式AI将改变其公司和行业。然而,当人们越来越依赖AI处理记忆、推理和创造性任务时,认知外包现象悄然兴起。研究表明,数字依赖正在重塑记忆模式,可能削弱问题解决能力和批判性思维。组织需要在效率与能力保持之间找到平衡,通过认知训练、批判性参与等方式,将AI视为增强工具而非替代品。
Pegasystems将其低代码平台Pega Infinity从单体架构转向独立服务模式,通过与NetApp Instaclustr合作管理Apache Cassandra、Kafka等开源数据基础设施组件。这一转型让30名工程师团队每年节省超6万工作小时,无需再为管理外部资源分心,可专注解决核心业务问题。合作模式允许服务部署在Pega自有的AWS和GCP账户中,确保完全控制权。
OpenAI将于明年首次生产自主人工智能芯片,与美国半导体巨头博通合作设计。这一举措旨在满足巨大的算力需求并减少对英伟达的依赖。博通CEO透露获得一个神秘客户100亿美元订单,该芯片将主要供OpenAI内部使用。此举效仿了谷歌、亚马逊和Meta等科技巨头的策略。随着AI基础设施市场蓬勃发展,定制AI芯片市场份额不断增长,博通股价今年上涨超30%。
谷歌发布的Gemini 2.5 Flash Image AI图像编辑模型被用户昵称为"纳米香蕉"。该模型在添加图像元素和保持人物一致性方面表现出色,处理速度快且自动添加水印。但存在明显局限:只能生成方形图像、会降低照片分辨率、难以处理复杂编辑任务如移除反射等。谷歌表示正在改进相关问题。该功能免费提供,付费用户可获得更多使用额度。
Anthropic公司同意支付15亿美元,并销毁所有用于训练AI模型的盗版书籍副本。这项和解协议被认为是美国版权诉讼史上最大的公开赔偿。涉及50万部被盗版作品,每位作者将获得每部作品3000美元的赔偿。该和解案需要法院批准才能最终确定,初步批准可能在本周获得。作者组织称这一结果向AI公司传达了强烈信息,表明盗用版权作品训练AI将面临严重后果。
OpenAI宣布将于2026年推出AI驱动的求职平台,并启动新的认证项目OpenAI Certifications。该求职平台利用AI技术匹配求职者与雇主,可能与LinkedIn形成竞争。认证项目涵盖从基础AI素养到提示工程等专业技能,用户可通过ChatGPT内置学习工具准备考试。OpenAI承诺到2030年为1000万美国人提供认证,旨在提升全民AI应用能力。
AI推理初创公司Baseten完成1.5亿美元D轮融资,估值达21.5亿美元。该轮融资由BOND领投,谷歌母公司Alphabet旗下CapitalG等多家知名机构参投。Baseten提供AI推理加速平台,声称性能比竞品快50%,支持本地部署和云端托管。平台采用拓扑感知并行技术优化硬件使用,通过算子融合和量化工具提升模型性能,并提供完整的开发者工具链和监控功能。
初创公司Geniez推出软件解决方案,将AI大语言模型和智能代理与大型机连接,实现实时数据提取供AI使用。该方案突破IBM大型机数据孤岛限制,为非IBM的LLM和AI代理提供实时访问。公司由Model9前高管创立,支持DB2、IMS等多种大型机数据源,兼容Meta、OpenAI等主流AI模型,具备企业级可靠性和安全性。
浙江大学等联合研究发现,AI强化学习效果取决于"模型-任务对齐"程度。当AI擅长某任务时,单样本训练、错误奖励等非常规方法也有效;但面对陌生任务时,这些方法失效,只有标准训练有用。研究团队通过大量实验证实,这种"舒适圈"现象比数据污染更能解释训练差异,为AI训练策略优化提供了新思路。
巴赫切希尔大学研究团队通过对五种不同规模YOLO模型的量化鲁棒性测试发现,静态INT8量化虽能带来1.5-3.3倍速度提升,但会显著降低模型对噪音等图像损伤的抵抗能力。他们提出的混合校准策略仅在大型模型处理噪音时有限改善,揭示了效率与鲁棒性平衡的复杂挑战。
北卡罗来纳大学团队开发的VIPER-R1系统首次实现了从视觉观察到物理定律的自动发现。该系统模拟物理学家的认知过程,通过观察运动图像和数据自动生成物理公式,准确率达81.2%,远超现有AI系统。这项技术有望加速工程、材料科学等领域的科学发现进程。
清华北航等联合开发Droplet3D系统,通过观看视频学习3D创作。该系统构建了包含400万3D模型的Droplet3D-4M数据集,每个模型配有85帧环绕视频和260词详细文本描述。用户只需提供一张图片和文字描述,即可生成高质量3D内容,支持精确的语言控制和风格化输入处理。实验显示其性能全面超越现有方法,在场景级生成方面展现独特优势。
普渡大学研究团队开发出CLIPSym系统,首次结合视觉和语言信息进行对称检测。该系统通过CLIP模型同时理解图像和文字描述,使用语义感知提示聚合技术和旋转等变解码器,在三个标准数据集上均超越现有方法。研究证实了多模态学习在几何特征识别中的优势,为计算机视觉、建筑设计、工业质检等领域提供了新的技术方案。
腾讯联合多所名校发布全球首个AI代码安全评估基准A.S.E,对26个主流大模型进行全面测试。研究发现即使最先进的AI模型在代码安全方面仍存在显著缺陷,最佳模型安全得分仅46.72分。意外的是,"慢思考"模型表现不如"快思考"版本,开源模型在安全性上可与商业模型竞争。该研究揭示了AI代码生成的真实安全风险,为行业发展提供重要指导。
工业升级的关键,或许在于智能本身。“工业+机器人”将成为通向下一阶段工业体系的核心抓手。——黄仁勋。
更高效、更智能、更具韧性:大众汽车集团正加速迈向由AI驱动的未来汽车生产。亚马逊云科技与大众汽车在“数字化生产平台(Digital Production Platform)”的合作再延长五年。
香港中文大学等机构联合发布TalkVid数据集,包含1244小时高质量说话视频,覆盖7729名不同背景说话者和15种语言。该数据集专门解决现有AI说话视频生成技术的种族、年龄、语言偏见问题。同时发布TalkVid-Bench评估基准,能够检测模型公平性。实验证明使用该数据集训练的模型在各群体上表现均衡,为构建更加公平包容的AI技术奠定基础。
MIT和Jina AI联合开发的jina-code-embeddings代码嵌入模型,通过改造预训练代码生成模型实现高效代码检索。该模型支持自然语言查询代码、技术问答和跨语言代码搜索,尽管参数规模较小(0.5B-1.5B),但在25项基准测试中表现优异,为AI辅助编程和智能开发环境提供了高性价比的基础工具。