最新文章
斯坦福大学和字节跳动联手打造:让AI生成超长视频不再是梦想

斯坦福大学和字节跳动联手打造:让AI生成超长视频不再是梦想

斯坦福大学和字节跳动联合研究团队开发出混合上下文(MoC)技术,革命性地解决了AI长视频生成中的记忆与计算难题。该技术将视频生成重新定义为信息检索问题,通过智能选择最相关历史信息,实现了85%稀疏化率,计算效率提升7倍,生成速度提升2.2倍,能稳定生成分钟级高质量连贯视频,为视频创作民主化开辟新路径。

Accenture研究团队推出MCP-Bench:让AI助手在复杂现实任务中接受终极考验

Accenture研究团队推出MCP-Bench:让AI助手在复杂现实任务中接受终极考验

Accenture研究团队推出MCP-Bench评估基准,通过连接28个真实服务器和250个工具构建复杂任务生态系统,测试AI助手处理现实多步骤任务的综合能力。研究发现即使顶级模型在基本工具使用上已趋成熟,但在多工具协调和长期规划方面仍面临重大挑战,为AI助手发展指明新方向。

AI推理链条真的在推理,还是只是在自我催眠?英国谢菲尔德大学揭秘思维链的真相

AI推理链条真的在推理,还是只是在自我催眠?英国谢菲尔德大学揭秘思维链的真相

英国谢菲尔德大学研究团队通过分析三类AI模型在软推理任务中的表现,发现了思维链推理的两面性:影响力和忠实性。蒸馏推理模型高度依赖推理过程并能纠错,而指令调优模型更多进行事后解释。研究揭示不同训练方法造就不同推理风格,对AI可解释性应用具有重要指导意义。

俄罗斯Sber AI实验室让手机摄像头成为健康检测神器,600人参与史上最大规模"看脸测心跳"实验

俄罗斯Sber AI实验室让手机摄像头成为健康检测神器,600人参与史上最大规模"看脸测心跳"实验

俄罗斯Sber AI实验室创建了史上最大规模的面部视频健康检测数据集MCD-rPPG,包含600名参与者的多角度视频和13种健康指标数据。他们开发的AI模型能仅通过观察面部视频就检测心跳、血压等健康指标,心跳检测误差仅4.86拍每分钟,处理速度比现有模型快13%。这项技术有望让智能手机变成便携健康监测设备,推动远程医疗和个人健康管理的发展。

语音识别AI的"思维透视镜":aiOla团队首次揭开机器如何"听懂"人话的黑盒子

语音识别AI的"思维透视镜":aiOla团队首次揭开机器如何"听懂"人话的黑盒子

aiOla公司研究团队首次为语音识别AI装上"思维透视镜",系统揭示了AI将声音转化为文字的内部机制。研究发现编码器不仅处理声音还理解语义,AI内部"知道"的信息比输出的更多,幻觉和重复问题可被精确定位和预测。这项突破性工作为构建更可靠的语音识别系统提供了理论基础,推动了AI可解释性研究的发展。

快手团队打造MIDAS:让AI数字人能像真人一样实时对话互动

快手团队打造MIDAS:让AI数字人能像真人一样实时对话互动

快手团队联合清华、浙大推出MIDAS数字人系统,通过创新的自回归视频生成框架实现多模态实时交互。系统采用深度压缩自编码器将视频压缩64倍,结合大语言模型处理音频、姿态、文本等多种输入,配合轻量级扩散头生成高质量视频。可支持双人对话、跨语言合成等应用,生成视频长达4分钟无明显质量下降,为数字人实时交互应用奠定重要技术基础。

AI智能助手终于学会像人类一样操作电脑软件:上海AI实验室团队打造大脑分工新模式

AI智能助手终于学会像人类一样操作电脑软件:上海AI实验室团队打造大脑分工新模式

上海AI实验室等机构联合开发了CODA系统,这是一个能够操作复杂专业软件的AI助手。它模仿人类大脑分工,分为负责规划的"大脑皮层"和负责执行的"小脑"两个部分,通过两阶段训练策略实现专业化和通用化。在四个科学软件的测试中,CODA平均成功率达到21.04%,显著超过传统方法,展现出良好的学习和适应能力。

谷歌DeepMind重磅发布:AI如何像人类一样学会"举一反三"?

谷歌DeepMind重磅发布:AI如何像人类一样学会"举一反三"?

谷歌DeepMind团队开发出突破性的AI元学习技术,让人工智能首次具备了类似人类的"举一反三"能力。通过结合元学习和神经网络架构自动搜索,AI系统能够快速适应全新任务,仅需传统方法十分之一的训练数据就能达到相似性能。这项技术在医疗诊断、个性化推荐等领域展现出巨大应用潜力,为AI从简单模式识别向真正智能学习的转变奠定了重要基础。

Kong收购OpenMeter 助力API和AI货币化变现

Kong收购OpenMeter 助力API和AI货币化变现

API管理工具厂商Kong宣布收购开源使用计量和计费平台开发商OpenMeter。此次收购将为Kong Konnect平台增加原生货币化功能,帮助企业大规模计量、定价和货币化API、AI令牌及数据流。随着API成为AI模型和服务的主要接口,传统计费系统面临挑战。整合预计2026年初完成,OpenMeter的7人团队全部加入Kong。

IQM量子获得3.2亿美元融资,目标拓展美国市场并挑战百万量子比特规模

IQM量子获得3.2亿美元融资,目标拓展美国市场并挑战百万量子比特规模

芬兰量子计算初创公司IQM Quantum Computers完成3.2亿美元B轮融资,累计融资总额达6亿美元。本轮融资由美国投资方Ten Eleven Ventures领投。IQM专注于超导量子比特计算机开发,其旗舰产品IQM Radiance提供20至150量子比特选择。公司计划利用资金扩展美国业务,建设云数据中心基础设施和制造产线,目标在2032年前实现百万量子比特规模。

Cohesity三层架构战略与跟随领导者营销模式

Cohesity三层架构战略与跟随领导者营销模式

Cohesity采用三层架构发展模式,包括成熟的备份恢复业务、快速成长的安全功能,以及新兴的AI能力。CEO表示收购Veritas后,公司结合了增长、技术开发和盈利能力,无需额外融资。公司将备份、安全和AI功能应用于数百EB级数据存储,并与Databricks等合作提供数据分析服务。Cohesity采用案例研究营销策略,通过获得行业领导者客户来推动品牌认知和销售增长。

CIO如何为即将到来的量子计算时代做好准备

CIO如何为即将到来的量子计算时代做好准备

量子计算正接近主流应用阶段,专家建议CIO应立即启动战略规划。由于企业完全过渡到量子计算需要5-10年时间,CIO需要开始制定量子安全计划。关键步骤包括:识别适用的量子计算用例、培养内部人才或寻求外部咨询、与量子技术供应商建立合作关系。特别需要关注加密安全风险,实施后量子密码学解决方案应对潜在威胁。

Veeam推出基于Linux的备份软件一体机

Veeam推出基于Linux的备份软件一体机

Veeam发布了备份软件一体机,旨在简化其数据平台备份和网络弹性产品的部署、安装和运营。该一体机以预配置的可启动ISO镜像或虚拟设备形式交付,运行在加固的Linux"精简操作系统"上,自动维护并优化安全实践。产品支持x86服务器硬件,无供应商锁定,成本更低。具备内置不可变性和零信任控制以防范勒索软件,支持即时恢复到Azure云端。

XenData新增ALTO磁盘归档支持功能

XenData新增ALTO磁盘归档支持功能

XenData宣布将为其磁带和云归档系统新增ALTO休眠磁盘归档支持,使客户能够在单一文件系统下管理磁带、磁盘和云存储,并内置复制功能。ALTO III机箱可容纳60块22TB磁盘,提供高达1320TB容量,功耗仅0.25W/TB,磁盘寿命超过十年。该解决方案特别适合需要大量并发恢复的活跃归档应用。

You.com获1.5亿美元融资,助力开发者构建AI应用

You.com获1.5亿美元融资,助力开发者构建AI应用

人工智能初创公司You.com宣布完成1.5亿美元C轮融资,估值达15亿美元,由Cox Enterprises领投。该公司从消费级搜索引擎转向企业市场,现提供多种API服务帮助企业构建AI应用,包括研究API、数据API、智能API等。其平台集成OpenAI、Anthropic等多家AI模型,月处理查询超10亿次,服务客户涵盖DuckDuckGo等知名企业。

腾讯发布新AI模型,一张照片即可生成3D探索世界

腾讯发布新AI模型,一张照片即可生成3D探索世界

## 腾讯发布HunyuanWorld-Voyager开源AI模型,可将单张图片生成3D一致性视频序列,用户可控制相机路径"探索"虚拟场景。该模型同时生成RGB视频和深度信息,支持直接3D重建。模型采用Transformer架构,使用超10万视频片段训练,在WorldScore基准测试中获得77.62最高分。但需要60GB以上GPU内存运行,且在欧盟等地区使用受限。

AI究竟能不能成为“第十艺术”?这个圆桌聊点不一样的!

AI究竟能不能成为“第十艺术”?这个圆桌聊点不一样的!

电影被称为“第七艺术”,游戏被誉为“第九艺术”,那AI,算不算“第十艺术”?

智能手机代理的隐私"第三只眼":山东大学等高校联合揭秘AI助手是否会泄露你的隐私

智能手机代理的隐私"第三只眼":山东大学等高校联合揭秘AI助手是否会泄露你的隐私

山东大学等高校联合研究揭示智能手机AI助手隐私保护能力严重不足。研究团队构建了首个隐私意识评估基准SAPA-Bench,包含7138个真实场景。测试结果显示,即使最佳模型的隐私风险感知能力也仅达67%,多数开源模型仅30%左右。研究发现闭源模型表现优于开源模型,明确提示可显著提升隐私感知能力。

让AI文本生成像翻书一样快:香港理工大学等机构揭秘扩散语言模型的"未卜先知"能力

让AI文本生成像翻书一样快:香港理工大学等机构揭秘扩散语言模型的"未卜先知"能力

香港理工大学等机构研究团队发现扩散语言模型存在"早期答案收敛"现象:高达99%的问题在推理中途就已得出正确答案,却仍继续无效推理。基于此发现,团队开发了Prophet方法,通过监控AI推理信心动态决定提前停止时机,实现3.4倍推理加速且几乎不损失准确性,为AI文本生成效率优化开辟新方向。

顶级学府Meta AI团队重磅发布:让AI模型学会"反省"自己的推理过程,准确度飙升60%

顶级学府Meta AI团队重磅发布:让AI模型学会"反省"自己的推理过程,准确度飙升60%

Meta AI团队开发出STEPWISER系统,让AI模型学会像资深评委一样分析和评判推理步骤质量。该方法通过强化学习训练,让AI先进行深度分析再给出判断,在ProcessBench测试中准确率相比传统方法提升32-56%。STEPWISER还能通过"块重置推理"策略实时纠错,提高推理准确率10-18%,为构建更可靠的AI推理系统提供了重要突破。