斯坦福大学和字节跳动联合研究团队开发出混合上下文(MoC)技术,革命性地解决了AI长视频生成中的记忆与计算难题。该技术将视频生成重新定义为信息检索问题,通过智能选择最相关历史信息,实现了85%稀疏化率,计算效率提升7倍,生成速度提升2.2倍,能稳定生成分钟级高质量连贯视频,为视频创作民主化开辟新路径。
Accenture研究团队推出MCP-Bench评估基准,通过连接28个真实服务器和250个工具构建复杂任务生态系统,测试AI助手处理现实多步骤任务的综合能力。研究发现即使顶级模型在基本工具使用上已趋成熟,但在多工具协调和长期规划方面仍面临重大挑战,为AI助手发展指明新方向。
英国谢菲尔德大学研究团队通过分析三类AI模型在软推理任务中的表现,发现了思维链推理的两面性:影响力和忠实性。蒸馏推理模型高度依赖推理过程并能纠错,而指令调优模型更多进行事后解释。研究揭示不同训练方法造就不同推理风格,对AI可解释性应用具有重要指导意义。
俄罗斯Sber AI实验室创建了史上最大规模的面部视频健康检测数据集MCD-rPPG,包含600名参与者的多角度视频和13种健康指标数据。他们开发的AI模型能仅通过观察面部视频就检测心跳、血压等健康指标,心跳检测误差仅4.86拍每分钟,处理速度比现有模型快13%。这项技术有望让智能手机变成便携健康监测设备,推动远程医疗和个人健康管理的发展。
aiOla公司研究团队首次为语音识别AI装上"思维透视镜",系统揭示了AI将声音转化为文字的内部机制。研究发现编码器不仅处理声音还理解语义,AI内部"知道"的信息比输出的更多,幻觉和重复问题可被精确定位和预测。这项突破性工作为构建更可靠的语音识别系统提供了理论基础,推动了AI可解释性研究的发展。
快手团队联合清华、浙大推出MIDAS数字人系统,通过创新的自回归视频生成框架实现多模态实时交互。系统采用深度压缩自编码器将视频压缩64倍,结合大语言模型处理音频、姿态、文本等多种输入,配合轻量级扩散头生成高质量视频。可支持双人对话、跨语言合成等应用,生成视频长达4分钟无明显质量下降,为数字人实时交互应用奠定重要技术基础。
上海AI实验室等机构联合开发了CODA系统,这是一个能够操作复杂专业软件的AI助手。它模仿人类大脑分工,分为负责规划的"大脑皮层"和负责执行的"小脑"两个部分,通过两阶段训练策略实现专业化和通用化。在四个科学软件的测试中,CODA平均成功率达到21.04%,显著超过传统方法,展现出良好的学习和适应能力。
谷歌DeepMind团队开发出突破性的AI元学习技术,让人工智能首次具备了类似人类的"举一反三"能力。通过结合元学习和神经网络架构自动搜索,AI系统能够快速适应全新任务,仅需传统方法十分之一的训练数据就能达到相似性能。这项技术在医疗诊断、个性化推荐等领域展现出巨大应用潜力,为AI从简单模式识别向真正智能学习的转变奠定了重要基础。
API管理工具厂商Kong宣布收购开源使用计量和计费平台开发商OpenMeter。此次收购将为Kong Konnect平台增加原生货币化功能,帮助企业大规模计量、定价和货币化API、AI令牌及数据流。随着API成为AI模型和服务的主要接口,传统计费系统面临挑战。整合预计2026年初完成,OpenMeter的7人团队全部加入Kong。
芬兰量子计算初创公司IQM Quantum Computers完成3.2亿美元B轮融资,累计融资总额达6亿美元。本轮融资由美国投资方Ten Eleven Ventures领投。IQM专注于超导量子比特计算机开发,其旗舰产品IQM Radiance提供20至150量子比特选择。公司计划利用资金扩展美国业务,建设云数据中心基础设施和制造产线,目标在2032年前实现百万量子比特规模。
Cohesity采用三层架构发展模式,包括成熟的备份恢复业务、快速成长的安全功能,以及新兴的AI能力。CEO表示收购Veritas后,公司结合了增长、技术开发和盈利能力,无需额外融资。公司将备份、安全和AI功能应用于数百EB级数据存储,并与Databricks等合作提供数据分析服务。Cohesity采用案例研究营销策略,通过获得行业领导者客户来推动品牌认知和销售增长。
量子计算正接近主流应用阶段,专家建议CIO应立即启动战略规划。由于企业完全过渡到量子计算需要5-10年时间,CIO需要开始制定量子安全计划。关键步骤包括:识别适用的量子计算用例、培养内部人才或寻求外部咨询、与量子技术供应商建立合作关系。特别需要关注加密安全风险,实施后量子密码学解决方案应对潜在威胁。
Veeam发布了备份软件一体机,旨在简化其数据平台备份和网络弹性产品的部署、安装和运营。该一体机以预配置的可启动ISO镜像或虚拟设备形式交付,运行在加固的Linux"精简操作系统"上,自动维护并优化安全实践。产品支持x86服务器硬件,无供应商锁定,成本更低。具备内置不可变性和零信任控制以防范勒索软件,支持即时恢复到Azure云端。
XenData宣布将为其磁带和云归档系统新增ALTO休眠磁盘归档支持,使客户能够在单一文件系统下管理磁带、磁盘和云存储,并内置复制功能。ALTO III机箱可容纳60块22TB磁盘,提供高达1320TB容量,功耗仅0.25W/TB,磁盘寿命超过十年。该解决方案特别适合需要大量并发恢复的活跃归档应用。
人工智能初创公司You.com宣布完成1.5亿美元C轮融资,估值达15亿美元,由Cox Enterprises领投。该公司从消费级搜索引擎转向企业市场,现提供多种API服务帮助企业构建AI应用,包括研究API、数据API、智能API等。其平台集成OpenAI、Anthropic等多家AI模型,月处理查询超10亿次,服务客户涵盖DuckDuckGo等知名企业。
## 腾讯发布HunyuanWorld-Voyager开源AI模型,可将单张图片生成3D一致性视频序列,用户可控制相机路径"探索"虚拟场景。该模型同时生成RGB视频和深度信息,支持直接3D重建。模型采用Transformer架构,使用超10万视频片段训练,在WorldScore基准测试中获得77.62最高分。但需要60GB以上GPU内存运行,且在欧盟等地区使用受限。
山东大学等高校联合研究揭示智能手机AI助手隐私保护能力严重不足。研究团队构建了首个隐私意识评估基准SAPA-Bench,包含7138个真实场景。测试结果显示,即使最佳模型的隐私风险感知能力也仅达67%,多数开源模型仅30%左右。研究发现闭源模型表现优于开源模型,明确提示可显著提升隐私感知能力。
香港理工大学等机构研究团队发现扩散语言模型存在"早期答案收敛"现象:高达99%的问题在推理中途就已得出正确答案,却仍继续无效推理。基于此发现,团队开发了Prophet方法,通过监控AI推理信心动态决定提前停止时机,实现3.4倍推理加速且几乎不损失准确性,为AI文本生成效率优化开辟新方向。
Meta AI团队开发出STEPWISER系统,让AI模型学会像资深评委一样分析和评判推理步骤质量。该方法通过强化学习训练,让AI先进行深度分析再给出判断,在ProcessBench测试中准确率相比传统方法提升32-56%。STEPWISER还能通过"块重置推理"策略实时纠错,提高推理准确率10-18%,为构建更可靠的AI推理系统提供了重要突破。