最新文章
复旦大学团队揭秘:为什么给AI"喂"更多数据反而让它变笨了?

复旦大学团队揭秘:为什么给AI"喂"更多数据反而让它变笨了?

复旦大学研究团队通过对五个大型语言模型的深入分析,发现了AI训练中的一个反常现象:增加训练数据量不仅没有提升模型性能,反而导致最高14%的性能下降。研究揭示,精细调优过程中高达90%的参数更新对知识提升无效甚至有害,通过恢复这些无用参数可显著改善模型表现。这一发现挑战了"数据越多越好"的传统观念,为开发更高效的AI训练方法提供了新思路。

POSTECH团队突破性成果:仅需粗糙3D模型就能生成电影级场景视频

POSTECH团队突破性成果:仅需粗糙3D模型就能生成电影级场景视频

POSTECH研究团队开发出VideoFrom3D框架,能够仅凭粗糙3D模型、摄像机轨迹和参考图片生成高质量场景视频。该方法巧妙结合图像和视频扩散模型优势,通过稀疏锚点生成和几何引导插值两个模块,实现了传统3D制作流程的革命性简化。实验证明该方法在多种复杂场景下表现优异,为3D内容创作提供了更高效的解决方案。

Meta推出ARE平台:让AI智能体像真人一样在手机环境中工作和协作

Meta推出ARE平台:让AI智能体像真人一样在手机环境中工作和协作

Meta超级智能实验室开发了ARE平台和Gaia2基准测试,为AI智能体创造了更真实的训练和评估环境。ARE支持异步交互,模拟真实世界的复杂性和不确定性。Gaia2包含1120个场景,评估AI的七项核心能力。实验显示最强模型成功率仅42%,特别在时间管理和处理歧义方面表现较差,揭示了当前AI技术的局限性和改进方向。

微软推出"氛围工作"模式,为Office套件加入AI智能体

微软推出"氛围工作"模式,为Office套件加入AI智能体

微软宣布为Word和Excel推出基于OpenAI的AI代理模式,通过简单提示即可自动生成文档和分析数据。Word用户可享受"氛围写作"功能,利用现有文档组装报告和提案。Excel代理能分析电子表格数据并生成可视化报告。尽管在SpreadsheetBench基准测试中准确率仅为57.2%,低于人类平均水平71.3%,但微软强调其针对实际工作场景优化。此外,微软还发布了基于Anthropic的Office代理,显示其正逐步减少对OpenAI的依赖。

OpenAI推出智能购物系统挑战谷歌亚马逊

OpenAI推出智能购物系统挑战谷歌亚马逊

OpenAI为美国ChatGPT用户推出"即时结账"功能,用户可在对话中直接购买Etsy和Shopify商品,无需跳转至外部网站。该功能支持Apple Pay、Google Pay等多种支付方式,并计划接入超过100万家Shopify商户。OpenAI还将开源其代理商务协议技术,与谷歌的代理支付协议形成竞争。这标志着电商购物模式的重大转变,AI聊天机器人可能重塑在线零售发现和支付生态系统。

DeepSeek:中国AI聊天应用全面解析

DeepSeek:中国AI聊天应用全面解析

中国AI实验室DeepSeek本周爆红,其聊天机器人应用登顶苹果和谷歌应用商店榜首。DeepSeek由量化对冲基金High-Flyer支持,使用计算高效技术训练AI模型,让华尔街分析师质疑美国能否保持AI领先地位。该公司发布的V3和R1推理模型在多项基准测试中表现出色,价格远低于同类产品。尽管面临美国芯片出口限制和政府设备禁用,DeepSeek仍凭借技术创新和低成本策略在全球AI市场引发关注。

Valkey 9发布在即:开源数据库加强与Redis竞争

Valkey 9发布在即:开源数据库加强与Redis竞争

开源键值数据库Valkey将于下月发布第9版,承诺改进资源优化和可用性。Valkey于去年4月从Redis分叉而来,在Linux基金会支持下由AWS、谷歌等公司backing。新版本将支持集群模式下的多个逻辑数据库,允许不同应用共享同一Valkey实例,解决资源配置挑战。此外还提供统一的自动故障转移配置和安全关闭模式,确保从开发到生产环境的一致性。

ComplexChaos认为AI能帮助人们找到共同点

ComplexChaos认为AI能帮助人们找到共同点

初创公司ComplexChaos正在开发AI工具来促进合作并缩短群体达成共识的时间。该工具结合了谷歌的Habermas Machine和OpenAI的ChatGPT,能够生成问题、设定对话目标并总结长文档。在与九个非洲国家的年轻代表进行的气候谈判准备试验中,参与者报告协调时间减少了60%,91%的参与者表示AI工具帮助他们看到了原本会错过的观点。

托管数据中心被低估的可持续发展优势

托管数据中心被低估的可持续发展优势

企业寻求改善数据中心可持续性时,除了投资先进冷却和水管理技术外,迁移到托管设施是更简单快速的选择。托管数据中心通过规模效应、先进可持续技术、高效利用率和位置灵活性等优势,在环境友好性方面通常优于私有数据中心。尽管存在一些局限性,但整体而言托管设施能提供更好的可持续性结果。

VirtualZ推出新品FlowZ和Zaac,助力大机与云端数据互通

VirtualZ推出新品FlowZ和Zaac,助力大机与云端数据互通

VirtualZ公司在原有Lozen数据访问和PropelZ数据提取产品基础上,新推出FlowZ和Zaac两款产品。FlowZ支持大机与x86服务器及公有云应用间的双向文件数据访问,无需额外编码。Zaac作为双向网关,将本地存储和云存储呈现为大机本地设备,显著降低成本并加快部署速度。两款产品均支持将大机数据整合到AI管道中,助力企业实现混合云集成。

Harness收购Qwiet AI强化开发运维安全能力

Harness收购Qwiet AI强化开发运维安全能力

软件交付公司Harness宣布收购AI驱动的漏洞检测企业Qwiet AI,旨在将安全性直接嵌入DevOps管道。此次收购将Qwiet的代码属性图与Harness的软件交付图集成,提升漏洞检测精度。Qwiet声称拥有97%的真阳性率和92%的开源漏洞检测率,可帮助开发者专注于真正重要的安全风险,并提供经验证的代码修复方案。

5G FWA CPE设备出货量在全球七大区域中四个占据主导地位

5G FWA CPE设备出货量在全球七大区域中四个占据主导地位

全球移动供应商协会研究显示,5G固定无线接入市场持续增长,2024年用户终端设备出货量达2800万台,同比增长22%。预计2025年将增长26%至3530万台。首次有超过一半的全球区域报告5G设备出货量占比超50%,其中北美和印度分别达到93%和92%。5G独立组网设备占95%,毫米波设备预计增长47%。

顶级AI公司加码世界模型开发应对大语言模型增长放缓

顶级AI公司加码世界模型开发应对大语言模型增长放缓

全球顶级人工智能公司正加大对"世界模型"的投资,寻求实现机器"超级智能"的新途径。谷歌DeepMind、Meta和英伟达等公司正开发能通过视频和机器人数据学习导航物理世界的系统,而非仅依赖语言。这一转变源于大语言模型发展遭遇瓶颈,各公司LLM性能提升速度放缓。英伟达表示世界模型市场潜力巨大,可达100万亿美元规模。

2025-09-29

激荡三十载:英飞凌与中国半导体产业的时代交响

1995年的中国,经济的腾飞还没有多少明显的征兆。那一年,中国以7345.48亿美元的GDP体量位居全球第八,仅占世界经济总量的2.37%。彼时,长三角和珠三角的电子工厂里,工人们正埋头组装着VCD播放机。

量子计算遇上传统算法:康考迪亚大学团队揭示混合模型的神奇表现

量子计算遇上传统算法:康考迪亚大学团队揭示混合模型的神奇表现

康考迪亚大学研究团队通过对比混合量子-经典神经网络与传统模型在三个基准数据集上的表现,发现量子增强模型在准确率、训练速度和资源效率方面均显著优于传统方法。研究显示混合模型的优势随数据集复杂度提升而增强,在CIFAR100上准确率提升9.44%,训练速度提升5-12倍,且参数更少。该成果为实用化量子增强人工智能铺平道路。

阿拉伯语AI迎来春天:KAUST团队如何让机器真正"懂"阿拉伯语

阿拉伯语AI迎来春天:KAUST团队如何让机器真正"懂"阿拉伯语

沙特KAUST大学团队开发了专门针对阿拉伯语的AI模型家族"Hala",通过创新的"翻译再调优"技术路线,将高质量英语指令数据转化为450万规模的阿拉伯语语料库,训练出350M到9B参数的多个模型。在阿拉伯语专项测试中,Hala在同规模模型中表现最佳,证明了语言专门化策略的有效性,为阿拉伯语AI发展和其他语言的专门化模型提供了可复制的技术方案。

全方位视觉时代:360度摄像头如何让机器人拥有"千里眼"——香港科技大学团队的突破性研究

全方位视觉时代:360度摄像头如何让机器人拥有"千里眼"——香港科技大学团队的突破性研究

香港科技大学团队发表重要研究,提出PANORAMA系统架构解决机器人视觉局限性问题。研究系统分析了360度全方位视觉技术在具身AI时代面临的数据瓶颈、模型能力和应用空白三大挑战,并提出包含数据采集、感知、应用和部署四个子系统的完整解决方案。团队还制定了六阶段发展路线图,从数据集整合到最终部署,为实现真正的机器人全方位感知能力提供了清晰的技术路径。

抖音团队打造全新视觉语言AI:SAIL-VL2以小博大,2B参数也能媲美大模型

抖音团队打造全新视觉语言AI:SAIL-VL2以小博大,2B参数也能媲美大模型

抖音SAIL团队联合新加坡国立大学开发的SAIL-VL2多模态AI模型,以2B-8B的紧凑参数实现了超越大型模型的性能。通过精心的数据筛选、渐进式训练和架构优化,在106个数据集测试中表现卓越,其中2B版本在4B以下开源模型中排名第一,8B-Thinking版本在推理任务上达到开源第一。该模型证明了"小而精"的发展路径,为AI技术的普及和高效部署提供了新思路。

大语言模型的"方向盘"失控了?加州大学团队揭秘AI行为控制的隐藏陷阱

大语言模型的"方向盘"失控了?加州大学团队揭秘AI行为控制的隐藏陷阱

加州大学团队首次全面评估了五种主流AI行为控制技术,发现当前方法在提升AI安全性的同时会产生意想不到的副作用。研究通过SteeringControl框架测试发现,不同控制方法在不同AI模型上效果差异巨大,且普遍存在"行为纠缠"问题。该研究为AI安全控制技术的发展提供了重要诊断工具和改进方向。

微软亚洲研究院新发现:计算机也能像人类一样从说话声音中"听出"面部表情

微软亚洲研究院新发现:计算机也能像人类一样从说话声音中"听出"面部表情

微软亚洲研究院开发的AV-DiT系统实现了音视频联合生成的重大突破,能够像人类一样理解声音与面部表情的对应关系。该系统采用扩散变换器架构,通过创新的注意力机制和分层处理策略,实现了高质量的音视频同步生成。实验显示其生成内容接近真实水平,在视频会议、内容创作、教育等领域具有广阔应用前景,代表了多媒体理解技术的重要进展。