最新文章第4页

2025-09-04

斯坦福大学和字节跳动联手打造：让AI生成超长视频不再是梦想

斯坦福大学和字节跳动联合研究团队开发出混合上下文（MoC）技术，革命性地解决了AI长视频生成中的记忆与计算难题。该技术将视频生成重新定义为信息检索问题，通过智能选择最相关历史信息，实现了85%稀疏化率，计算效率提升7倍，生成速度提升2.2倍，能稳定生成分钟级高质量连贯视频，为视频创作民主化开辟新路径。

Accenture研究团队推出MCP-Bench：让AI助手在复杂现实任务中接受终极考验

人工智能

工具使用评估

多任务协调

2025-09-04

Accenture研究团队推出MCP-Bench：让AI助手在复杂现实任务中接受终极考验

Accenture研究团队推出MCP-Bench评估基准，通过连接28个真实服务器和250个工具构建复杂任务生态系统，测试AI助手处理现实多步骤任务的综合能力。研究发现即使顶级模型在基本工具使用上已趋成熟，但在多工具协调和长期规划方面仍面临重大挑战，为AI助手发展指明新方向。

人工智能

思维链推理

可解释性研究

2025-09-04

AI推理链条真的在推理，还是只是在自我催眠？英国谢菲尔德大学揭秘思维链的真相

英国谢菲尔德大学研究团队通过分析三类AI模型在软推理任务中的表现，发现了思维链推理的两面性：影响力和忠实性。蒸馏推理模型高度依赖推理过程并能纠错，而指令调优模型更多进行事后解释。研究揭示不同训练方法造就不同推理风格，对AI可解释性应用具有重要指导意义。

俄罗斯Sber AI实验室让手机摄像头成为健康检测神器，600人参与史上最大规模"看脸测心跳"实验

远程医疗

光电容积脉搏波描记

健康监测数据集

2025-09-04

俄罗斯Sber AI实验室让手机摄像头成为健康检测神器，600人参与史上最大规模"看脸测心跳"实验

俄罗斯Sber AI实验室创建了史上最大规模的面部视频健康检测数据集MCD-rPPG，包含600名参与者的多角度视频和13种健康指标数据。他们开发的AI模型能仅通过观察面部视频就检测心跳、血压等健康指标，心跳检测误差仅4.86拍每分钟，处理速度比现有模型快13%。这项技术有望让智能手机变成便携健康监测设备，推动远程医疗和个人健康管理的发展。

语音识别

机器学习

可解释性

2025-09-04

语音识别AI的"思维透视镜"：aiOla团队首次揭开机器如何"听懂"人话的黑盒子

aiOla公司研究团队首次为语音识别AI装上"思维透视镜"，系统揭示了AI将声音转化为文字的内部机制。研究发现编码器不仅处理声音还理解语义，AI内部"知道"的信息比输出的更多，幻觉和重复问题可被精确定位和预测。这项突破性工作为构建更可靠的语音识别系统提供了理论基础，推动了AI可解释性研究的发展。

人工智能

视频生成

数字人交互

2025-09-04

快手团队打造MIDAS：让AI数字人能像真人一样实时对话互动

快手团队联合清华、浙大推出MIDAS数字人系统，通过创新的自回归视频生成框架实现多模态实时交互。系统采用深度压缩自编码器将视频压缩64倍，结合大语言模型处理音频、姿态、文本等多种输入，配合轻量级扩散头生成高质量视频。可支持双人对话、跨语言合成等应用，生成视频长达4分钟无明显质量下降，为数字人实时交互应用奠定重要技术基础。

AI智能助手终于学会像人类一样操作电脑软件：上海AI实验室团队打造大脑分工新模式

人工智能

GUI操作

强化学习

2025-09-04

AI智能助手终于学会像人类一样操作电脑软件：上海AI实验室团队打造大脑分工新模式

上海AI实验室等机构联合开发了CODA系统，这是一个能够操作复杂专业软件的AI助手。它模仿人类大脑分工，分为负责规划的"大脑皮层"和负责执行的"小脑"两个部分，通过两阶段训练策略实现专业化和通用化。在四个科学软件的测试中，CODA平均成功率达到21.04%，显著超过传统方法，展现出良好的学习和适应能力。

人工智能

元学习

神经网络架构搜索

2025-09-04

谷歌DeepMind重磅发布：AI如何像人类一样学会"举一反三"？

谷歌DeepMind团队开发出突破性的AI元学习技术，让人工智能首次具备了类似人类的"举一反三"能力。通过结合元学习和神经网络架构自动搜索，AI系统能够快速适应全新任务，仅需传统方法十分之一的训练数据就能达到相似性能。这项技术在医疗诊断、个性化推荐等领域展现出巨大应用潜力，为AI从简单模式识别向真正智能学习的转变奠定了重要基础。

人工智能

API管理

货币化变现

2025-09-04

Kong收购OpenMeter 助力API和AI货币化变现

API管理工具厂商Kong宣布收购开源使用计量和计费平台开发商OpenMeter。此次收购将为Kong Konnect平台增加原生货币化功能，帮助企业大规模计量、定价和货币化API、AI令牌及数据流。随着API成为AI模型和服务的主要接口，传统计费系统面临挑战。整合预计2026年初完成，OpenMeter的7人团队全部加入Kong。

量子计算

错误纠正技术

百万量子比特扩展

2025-09-04

IQM量子获得3.2亿美元融资，目标拓展美国市场并挑战百万量子比特规模

芬兰量子计算初创公司IQM Quantum Computers完成3.2亿美元B轮融资，累计融资总额达6亿美元。本轮融资由美国投资方Ten Eleven Ventures领投。IQM专注于超导量子比特计算机开发，其旗舰产品IQM Radiance提供20至150量子比特选择。公司计划利用资金扩展美国业务，建设云数据中心基础设施和制造产线，目标在2032年前实现百万量子比特规模。

数据保护

人工智能

企业战略

2025-09-04

Cohesity三层架构战略与跟随领导者营销模式

Cohesity采用三层架构发展模式，包括成熟的备份恢复业务、快速成长的安全功能，以及新兴的AI能力。CEO表示收购Veritas后，公司结合了增长、技术开发和盈利能力，无需额外融资。公司将备份、安全和AI功能应用于数百EB级数据存储，并与Databricks等合作提供数据分析服务。Cohesity采用案例研究营销策略，通过获得行业领导者客户来推动品牌认知和销售增长。

量子技术

企业安全

战略规划

2025-09-04

CIO如何为即将到来的量子计算时代做好准备

量子计算正接近主流应用阶段，专家建议CIO应立即启动战略规划。由于企业完全过渡到量子计算需要5-10年时间，CIO需要开始制定量子安全计划。关键步骤包括：识别适用的量子计算用例、培养内部人才或寻求外部咨询、与量子技术供应商建立合作关系。特别需要关注加密安全风险，实施后量子密码学解决方案应对潜在威胁。

数据保护

Linux系统

软件一体机

2025-09-04

Veeam推出基于Linux的备份软件一体机

Veeam发布了备份软件一体机，旨在简化其数据平台备份和网络弹性产品的部署、安装和运营。该一体机以预配置的可启动ISO镜像或虚拟设备形式交付，运行在加固的Linux"精简操作系统"上，自动维护并优化安全实践。产品支持x86服务器硬件，无供应商锁定，成本更低。具备内置不可变性和零信任控制以防范勒索软件，支持即时恢复到Azure云端。

存储技术

磁盘归档

统一管理

2025-09-04

XenData新增ALTO磁盘归档支持功能

XenData宣布将为其磁带和云归档系统新增ALTO休眠磁盘归档支持，使客户能够在单一文件系统下管理磁带、磁盘和云存储，并内置复制功能。ALTO III机箱可容纳60块22TB磁盘，提供高达1320TB容量，功耗仅0.25W/TB，磁盘寿命超过十年。该解决方案特别适合需要大量并发恢复的活跃归档应用。

人工智能

应用程序接口

企业服务

2025-09-04

You.com获1.5亿美元融资，助力开发者构建AI应用

人工智能初创公司You.com宣布完成1.5亿美元C轮融资，估值达15亿美元，由Cox Enterprises领投。该公司从消费级搜索引擎转向企业市场，现提供多种API服务帮助企业构建AI应用，包括研究API、数据API、智能API等。其平台集成OpenAI、Anthropic等多家AI模型，月处理查询超10亿次，服务客户涵盖DuckDuckGo等知名企业。

人工智能

视频生成

3D重建技术

2025-09-04

腾讯发布新AI模型，一张照片即可生成3D探索世界

## 腾讯发布HunyuanWorld-Voyager开源AI模型，可将单张图片生成3D一致性视频序列，用户可控制相机路径"探索"虚拟场景。该模型同时生成RGB视频和深度信息，支持直接3D重建。模型采用Transformer架构，使用超10万视频片段训练，在WorldScore基准测试中获得77.62最高分。但需要60GB以上GPU内存运行，且在欧盟等地区使用受限。

AI

PEC 2025 AI创新者大会暨第二届提示工程峰会

数字艺术

2025-09-03

AI究竟能不能成为“第十艺术”？这个圆桌聊点不一样的！

电影被称为“第七艺术”，游戏被誉为“第九艺术”，那AI，算不算“第十艺术”？

智能手机代理的隐私"第三只眼"：山东大学等高校联合揭秘AI助手是否会泄露你的隐私

人工智能

隐私保护

智能手机代理

2025-09-03

智能手机代理的隐私"第三只眼"：山东大学等高校联合揭秘AI助手是否会泄露你的隐私

山东大学等高校联合研究揭示智能手机AI助手隐私保护能力严重不足。研究团队构建了首个隐私意识评估基准SAPA-Bench，包含7138个真实场景。测试结果显示，即使最佳模型的隐私风险感知能力也仅达67%，多数开源模型仅30%左右。研究发现闭源模型表现优于开源模型，明确提示可显著提升隐私感知能力。

人工智能

扩散语言模型

推理加速

2025-09-03

让AI文本生成像翻书一样快：香港理工大学等机构揭秘扩散语言模型的"未卜先知"能力

香港理工大学等机构研究团队发现扩散语言模型存在"早期答案收敛"现象：高达99%的问题在推理中途就已得出正确答案，却仍继续无效推理。基于此发现，团队开发了Prophet方法，通过监控AI推理信心动态决定提前停止时机，实现3.4倍推理加速且几乎不损失准确性，为AI文本生成效率优化开辟新方向。

顶级学府Meta AI团队重磅发布：让AI模型学会"反省"自己的推理过程，准确度飙升60%

人工智能

强化学习

新型算法

2025-09-03

顶级学府Meta AI团队重磅发布：让AI模型学会"反省"自己的推理过程，准确度飙升60%

Meta AI团队开发出STEPWISER系统，让AI模型学会像资深评委一样分析和评判推理步骤质量。该方法通过强化学习训练，让AI先进行深度分析再给出判断，在ProcessBench测试中准确率相比传统方法提升32-56%。STEPWISER还能通过"块重置推理"策略实时纠错，提高推理准确率10-18%，为构建更可靠的AI推理系统提供了重要突破。

数源AI

AI源于数据，数源AI专注于AI领域入门及提升，让大家能够更加快速高效的完成相关专业知识的学习！学AI就来数源！

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: