最新文章第4页

2025-09-29

推动AI繁荣的数十亿美元基础设施交易内幕

英伟达CEO预计到本十年末，AI基础设施投资将达3-4万亿美元。微软向OpenAI投资近140亿美元，Oracle获得3000亿美元计算合约，Meta计划在2028年前投资6000亿美元建设美国基础设施。这些投资正推动超大规模数据中心建设，但也给电网带来巨大压力。特朗普宣布的Stargate项目计划投资5000亿美元建设AI基础设施，成为历史上最大的AI基础设施项目。

人工智能

服务业转型

投资策略

2025-09-29

AI改造传统服务业或比风投想象的更困难

风投正通过AI改造传统服务业务以获取软件般的高利润率。通用催化剂等公司投入15亿美元收购成熟专业服务公司，用AI自动化任务后再收购更多企业。虽然该策略在某些案例中显示出效果，但斯坦福研究发现40%员工因AI生成的低质量工作内容而承担更多负担，每人每月造成186美元的隐性成本。这表明仅仅部署AI并不能保证改善结果，服务业AI转型可能比预期更复杂。

无人机控制

元模仿学习

自适应控制系统

2025-09-29

伯克利与阿布扎比团队让小小无人机秒变全能飞行员：一个大脑控制千种不同机型

伯克利与阿布扎比研究团队开发出RAPTOR系统，这是首个能够零调试控制多种无人机的通用AI控制器。该系统仅用2084个参数就能控制从32克到2.4公斤的各种无人机，通过创新的元模仿学习算法实现毫秒级快速适应，在10种真实无人机上验证了卓越性能，为无人机控制技术带来革命性突破。

音频处理

牛顿-拉夫逊优化

虚拟模拟建模

2025-09-29

伦敦玛丽女王大学：用牛顿数学法让数字音响完美复制经典模拟压缩器

伦敦玛丽女王大学研究团队开发出创新的数字音频技术，使用牛顿-拉夫逊数学方法成功复制经典Teletronix LA-2A模拟压缩器。该方法仅需五个参数和20分钟训练时间，大幅超越传统深度学习效率，并制作成开源VST插件4A-2A供音乐制作者免费使用，为虚拟模拟建模领域提供了高效可解释的新方案。

卡内基梅隆大学团队提出Struct-Bench：首个针对结构化文本生成的隐私保护评测框架

差分隐私

结构化数据生成

数据质量评测

2025-09-29

卡内基梅隆大学团队提出Struct-Bench：首个针对结构化文本生成的隐私保护评测框架

卡内基梅隆大学联合微软研究院提出首个针对结构化文本数据的差分隐私评测框架Struct-Bench。该框架通过上下文无关文法描述数据结构，从结构完整性、语义质量和应用效果三个维度评估合成数据质量。研究在七个数据集上测试发现，当前方法在结构化数据生成方面表现不佳，格式正确率普遍低于20%，为改进隐私保护数据生成技术提供了重要基准。

4D视频生成

运动学部件分割

双向扩散融合

2025-09-29

Stability AI团队突破：让AI不仅会"看"还会"动"的神奇技术

Stability AI团队开发的SP4D技术实现了AI视频生成的重大突破，首次让AI能够同时理解物体外观和运动结构。该技术通过双分支神经网络架构和创新的颜色编码方案，生成的视频内容不仅视觉真实，更具备完整的运动学信息，可直接用于专业动画制作，大幅提升了AI生成内容的实用价值和应用前景。

医疗机器人

物理仿真

数据合成

2025-09-29

爱丁堡大学ROOM框架：让机器人医生在虚拟肺部中练习手术的神奇模拟器

爱丁堡大学团队开发了ROOM医疗机器人训练模拟器，专门为支气管镜手术机器人生成逼真训练数据。该系统从患者CT扫描构建三维肺部模型，生成多模态传感器数据，解决了医疗机器人训练中真实数据稀缺的难题。实验证明ROOM数据能有效改善机器人的姿态估计和深度感知能力，为未来智能医疗技术发展奠定基础。

协同过滤

双峰现象

2025-09-29

推荐系统的"双峰"之谜：伊利诺伊大学团队发现嵌入维度扩展的惊人规律

伊利诺伊大学等机构研究团队通过大规模实验发现了推荐系统中两种全新现象：双峰现象（性能先升后降再升再降）和对数现象（持续稳定提升）。研究揭示数据噪声是影响推荐系统可扩展性的关键因素，并发现SGL模型因其独特的抗噪机制表现最佳。该发现颠覆了传统认知，为推荐系统优化提供新思路，在某些情况下仅通过增加嵌入维度就能获得25%以上的性能提升。

人工智能

音频推理

新型算法

2025-09-29

浦项科技大学研究团队：让AI学会"脑补"声音，无需听觉也能推理音频知识

浦项科技大学研究团队发现当前AI模型缺乏音频推理能力，仅凭文字描述无法判断声音属性。他们构建了AuditoryBench++测试平台，涵盖音调、音量比较等5类任务，发现主流AI模型表现接近随机猜测。研究团队提出AIR-CoT方法，通过两阶段训练让AI学会"想象"声音：先识别需要音频推理的文本片段，再调用音频知识模块生成声音特征。实验显示该方法显著提升了AI的音频推理能力。

人工智能

强化学习

图形用户界面自动化

2025-09-29

明灯科技团队打造智能GUI助手：让电脑像人一样"看懂"界面并自动操作

明灯科技团队开发了名为Mano的智能GUI助手系统，能够像人一样"看懂"电脑界面并自动执行复杂操作任务。该系统采用三阶段训练方法，结合基础技能培训、策略优化和实战适应，在Mind2Web和OSWorld测试中取得显著性能提升。系统还包含智能数据采集、验证和身份认证等辅助模块，通过持续学习机制不断自我改进，为GUI自动化领域带来重要突破。

北大港科大联手突破：让AI学会"看图说话"编辑视频，无需训练就能插入删除替换任何物体

视频编辑

Diffusion Transformers

自适应上下文丰富

2025-09-29

北大港科大联手突破：让AI学会"看图说话"编辑视频，无需训练就能插入删除替换任何物体

这项由北京大学和香港科技大学联合完成的研究开发了ContextFlow系统，实现了无需训练的高质量视频物体编辑。该系统通过RF-Solver高精度反演和自适应上下文丰富机制，能够精确插入、替换或删除视频中的物体，同时保持背景完整和时间连续性，在多项指标上超越现有方法，为视频编辑技术带来重大突破。

印度理工学院新突破：让小模型也能像大模型一样聪明，无需标注数据的AI视觉问答训练法

人工智能

视觉语言模型

知识蒸馏

2025-09-29

印度理工学院新突破：让小模型也能像大模型一样聪明，无需标注数据的AI视觉问答训练法

印度理工学院团队开发出MPA模型对等对齐器，这是一种革命性的AI训练方法，能让小型视觉语言模型在无需人工标注数据的情况下，通过大模型指导显著提升性能。该技术通过三步法实现知识传递：大模型自动出题答题、精准识别知识差距、针对性强化训练。实验显示小模型性能提升高达15.2%，成本仅为传统方法的几十分之一，为AI技术普及开辟新路径。

人工智能

主权AI

数据中心建设

2025-09-29

加拿大推出首个主权AI工厂，由TELUS主导建设

TELUS与NVIDIA和HPE合作，在魁北克省里穆斯基市推出加拿大首个完全主权AI工厂。该设施运行在加拿大本土基础设施上，让企业能够在不跨境的情况下开发、训练和运营AI模型。设施采用可再生能源，具备高效冷却系统。这一举措呼应了全球主权AI发展趋势，旨在确保加拿大在敏感数据处理方面的自主权，为医疗和金融等行业提供符合数据驻留要求的AI解决方案。

网络安全

恶意软件防护

调查报告

2025-09-29

Mac用户终于开始重视恶意软件威胁

Moonlock发布的2025年Mac安全调查显示，Mac用户对恶意软件的认知正在发生重要转变。仅15%的受访者认为macOS免疫恶意软件，较2023年的28%大幅下降。66%的Mac用户在过去一年中至少遭遇过一次网络威胁。调查还发现，72%的用户担心人工智能助长网络威胁，46%认为需要额外安全软件保护。

人工智能

智能体

实验结果

2025-09-29

AI安全组织发现智能体工具实际拖慢开源开发者效率

AI安全组织METR通过随机对照试验发现，经验丰富的开源开发者使用AI工具时，完成任务时间比不使用工具时延长19%。研究涉及16名开发者，平均每个任务耗时2小时。研究人员认为，AI基准测试可能高估了AI能力，因为现实开发中存在需要人类直觉和常识解决的问题，而AI模型在这些方面表现不足。

人工智能

自动化技术

经济转型理论

2025-09-29

经济奇点时代即将到来的五大认知误区

经济奇点指绝大多数人类失去工作的时刻。作者分析了关于经济奇点的五个常见误区：自动化不会造成失业、工作提供人生意义、经济奇点是坏事、收入分配问题及就业逐步消失。文章指出，认知自动化与过往机械化不同，将全面替代人类工作。失去工作后人们仍可从家庭、兴趣中获得意义。关键挑战是收入分配，需要大规模财富再分配和接近免费的商品服务。就业可能突然全面消失，社会必须提前准备应对方案。

人工智能

大语言模型

使用指南

2025-09-29

避开这11个ChatGPT陷阱：AI大语言模型使用禁区指南

ChatGPT是强大的AI工具，能帮助写邮件和头脑风暴，但在某些领域使用它可能造成严重后果。大语言模型可能自信地给出错误、过时或有偏见的信息。在健康诊断、心理治疗、紧急安全决策、个人财务规划、机密数据处理、违法行为、学术作弊、实时信息监控、赌博预测、法律文件起草和艺术创作等11个方面，依赖ChatGPT可能带来真实世界的风险和危害。

人工智能

AI评估

投资回报优化

2025-09-29

医疗AI规模化部署的新标准：AI评估与KPI体系为何不可或缺

医疗AI的前景不再是理论，但大多数试点项目无法规模化。在Epic和Cerner等EMR平台中，AI要实现企业级应用，必须证明技术可靠性和可衡量价值。严格的AI评估（evals）和明确的关键绩效指标（KPIs）是成功的必要支柱。评估确保系统准确性和安全性，KPIs量化临床价值和投资回报率。

人工智能

自然语言处理

新型架构

2025-09-29

哈佛研究中心探讨人类智能与AI计算智能是否本质相同

哈佛大学伯克曼·克莱因中心探讨人类智能是否实际上就是一种计算智能形式。谷歌技术与社会首席技术官在秋季演讲系列中力挺"大脑即计算机"观点，认为大脑不仅像计算机，本身就是计算机。该理论将大脑比作预测性处理器，类似大语言模型通过预测下一个词元工作。支持者认为通过扩大计算规模可实现AGI，但也有声音质疑当前架构可能遇到瓶颈。研究者希望通过破解AI内部机制来理解人类思维。

大模型

智能汽车

2025-09-28

千里科技AI战略布局完成第一步，新品牌、新计划开启新阶段

9月28日，“新韵重庆千里智驾——AI重庆智驾之夜暨千里科技品牌发布会”在重庆隆重举行。

Linkloud

GO global, BE global.

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: