这项由北京大学人工智能研究院完成的研究,首次从数据压缩理论角度揭示了大型语言模型存在"弹性"现象——即使经过精心安全对齐,模型仍倾向于保持预训练时的行为分布。
过去七年中,基于机器学习的AI工具几乎完全自动化了地震学的基础任务——地震检测。AI模型能够检测到比人工分析师更小的地震,特别是在城市等嘈杂环境中。斯坦福团队开发的地震变换器等模型使用一维卷积和注意力机制,在包含120万个人工标记样本的数据集上训练。这些工具通常能发现比传统方法多10倍以上的地震,为火山结构成像和地质研究提供了更全面的地震目录。
杰斐逊城市医疗集团作为密苏里州中部最大的多专科医疗服务机构,正在使用AI管理会议、简化临床文档和优化医疗流程。该集团在联络中心AI应用方面较为谨慎,担心完全数字化会影响患者体验。CIO表示未来会在统一通信平台集成AI,但部署时机将由医疗专业人员决定。目前已采用AI辅助临床文档记录和会议管理功能。
研究人员发现,大型语言模型如ChatGPT、Gemini和Claude仅需250个恶意文档就能被植入后门漏洞。研究测试了6亿到130亿参数的模型,发现无论模型规模如何,植入后门所需的恶意样本数量基本恒定,而非按比例增长。攻击者可通过在训练数据中插入特定触发短语的文档,操控模型输出。虽然现有安全训练可在很大程度上修复这些后门,但研究强调需要更强的防御策略来应对这一威胁。
研究显示,超过81%的IT决策者正在采用AI技术辅助IT采购过程。AI主要应用于供应商评估审查、解决方案推荐、RFP自动化创建以及采购后性能ROI测量等环节。多家企业案例表明,AI能够显著缩短供应商评估时间,从数周压缩至数天,同时帮助识别兼容性问题和合同异常条款。企业普遍采用"信任但验证"的方式,将AI输出作为决策输入而非最终答案,确保人工最终审核。
卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化,创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练,能动态调整隐私保护策略,在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短,同时增强了抗隐私攻击能力,为敏感数据的AI应用开辟了新路径。
腾讯混元团队联合北京大学提出MixGRPO技术,通过混合ODE-SDE采样策略和滑动窗口机制,将AI图像生成训练效率提升50%-71%,同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略,专注于图像生成早期阶段的重点优化,并引入高阶求解器进一步加速训练过程,为AI图像生成的产业化应用提供了更高效可行的解决方案。
北京大学团队创建C3基准测试集,系统评估十款主流语音对话模型处理复杂对话的能力。研究发现即使最先进的GPT-4o音频版在英文对话中准确率仅55.68%,中文表现更差。语义歧义和省略现象是最大挑战,中文处理难度显著高于英文。该研究首次揭示了语音AI在真实对话场景中的局限性,为技术发展提供重要指引。
微软研究院联合多所大学开发了villa-X机器人学习系统,该系统通过引入"潜在动作"中间表示,成功解决了机器人理解人类指令并转化为具体动作的难题。系统采用分层专家设计,结合视觉和物理信息学习,在仿真和真实机器人实验中都表现优异,特别是在跨机器人平台的泛化能力上取得重要突破,为通用机器人智能奠定了基础。
人工智能正以超出预期的速度改变软件世界。本周OpenAI发布ChatGPT应用,谷歌推出Gemini Enterprise平台,亚马逊发布Quick Suite,都旨在通过AI代理改造9000亿美元的企业软件市场。尽管存在泡沫担忧,AI资金仍持续涌入,Reflection AI获20亿美元融资,n8n获1.2亿美元投资。同时硬件需求激增,OpenAI采购100亿美元AMD硬件,马斯克xAI为第二个数据中心采购180亿美元英伟达芯片,可能引发长达十年的定价危机。
OpenAI本周推出开发者应用集成功能,允许用户直接通过ChatGPT与第三方应用交互。Spotify成为首批合作伙伴之一,用户可要求ChatGPT创建播放列表、推荐歌曲等。连接账户后,AI可访问用户喜好和听歌历史,提供个性化建议。该功能支持145个国家的所有ChatGPT用户使用,但需注意数据隐私风险。
量子计算机制造商IonQ宣布将从投资公司Heights Capital获得20亿美元融资。该公司计划通过以每股93美元的价格出售1650万股股票筹集约四分之三的资金。Heights Capital还购买了4500万份认股权证。IonQ目前的旗舰产品是包含36个量子比特的Forte Enterprise量子计算机,正在开发性能更强的Tempo芯片。公司还收购了Oxford Ionics等量子硬件开发商,计划在2027年构建包含1万个量子比特的系统。
据报道,苹果收购Prompt AI的交易基本确定,该初创公司领导层已召开全体会议讨论协议细节。Prompt的核心产品Seemour将AI技术应用于安防摄像头,可识别特定人员、宠物和物体,发送异常活动警报并提供文字描述。这种收购人才和技术而非整个公司的策略已成为科技巨头在AI领域的常见做法,部分为了避免监管审查。
微软Windows Copilot功能获得重大更新,现在支持直接创建Office文档,包括Word、Excel和PowerPoint文件。此外,新版本还增加了Gmail连接功能,用户可以通过Copilot智能助手管理和处理邮件。这些新功能进一步增强了Windows系统的办公效率和跨平台协作能力。
中国移动合作伙伴江波龙,在中国移动合作伙伴大会上集中展示面向AI、云计算及数据中心的企业级存储方案,与产业链伙伴合创AI+时代。
这项研究开发了Hi3DEval系统,这是首个能够从整体、局部和材质三个层面全面评估3D模型质量的智能系统。通过创新的视频分析和3D几何特征结合方法,系统在各项评估指标上都显著超越了传统方法,为3D内容创作提供了标准化的质量检测工具,在游戏开发、虚拟现实、电商展示等领域具有广阔的应用前景。
电子科技大学等多所院校联合开发的RPCANet++系统,通过巧妙结合传统数学理论与深度学习技术,实现了既高效又可解释的稀疏物体分割。该系统在红外小目标检测、医学血管分割、工业缺陷检测等多个领域表现优异,为构建可信赖的AI视觉系统提供了新思路。
波兰科学家开发GENIE技术,首次实现既能产生电影级超逼真画面又能实时编辑的3D渲染系统。该技术巧妙融合神经辐射场和高斯点云两种方法的优势,通过创新的飞溅网格编码和光线追踪搜索算法,让虚拟场景可以像橡皮泥一样随意塑造,同时保持照片级的视觉质量。这项突破性技术有望革命性改变电影制作、游戏开发、虚拟现实等领域的内容创作方式。