一句提示词,一个新世界 (One word, one world)。
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
技术岗位失业率仅为2.9%,使得IT人才竞争异常激烈。72%的CIO将招聘和留住技能人才视为首要问题。研究显示,自愿离职率低于10%的组织,其整体绩效表现高出18%。成功的员工保留策略包括:识别高绩效员工、主动参与互动、赋予挑战性工作、强调工作影响力、让员工感受价值认可、提供针对性培训,以及专注于所有员工的成长发展。
戴尔第二财季营收同比增长19%至创纪录的298亿美元,其中服务器和网络业务在AI需求推动下暴涨69%。基础设施解决方案集团营收增长44%至168亿美元,首次超越客户解决方案集团。公司上半年AI解决方案出货额达100亿美元,超过去年全年,并将全年AI服务器出货指导价提升至200亿美元。全闪存存储产品表现强劲,但传统存储需求疲软。
字节跳动团队开发了首个AI研究助手评估系统ReportBench,通过对比AI生成报告与专家综述论文的引用质量,并验证陈述准确性来评估AI助手表现。研究发现OpenAI Deep Research引用准确率38.5%,Gemini为14.5%,两者都存在陈述和引用幻觉问题。该系统为AI研究助手建立了标准化质量检测工具,推动行业发展。
台湾大学研究团队开发了MovieCORE数据集,这是首个专门训练AI深度理解电影内容的创新工具。该数据集通过多AI智能体协作生成复杂问题,采用认知分类法测量思维深度,99.2%的问答需要高层次思维。研究还开发了ACE增强技术,可将AI性能提升25%。实验显示现有AI在深度视频理解方面仍存在显著不足,为未来AI发展指明了方向。
东京科学技术大学团队通过大规模实验发现,专家混合模型在处理推理任务时存在"专家过多反而有害"的现象。研究显示,对于记忆性任务,专家数量越多性能越好;但对于数学推理等需要深度思考的任务,存在最优专家数量,超过这个临界点性能会下降。该发现为AI系统架构设计提供了重要指导,揭示了"少而精"策略在某些场景下优于"多而全"的传统观念。
南京大学等高校联合研究团队开发出ObjFiller-3D技术,巧妙地将3D物体修复转化为视频编辑问题。该技术利用视频模型的时序一致性优势,能够高质量修复3D物体缺失部分,在图像质量和处理速度上均大幅超越现有方法。技术支持参考图像引导修复,可广泛应用于文物保护、数字内容创作等领域,为3D修复和编辑任务提供了统一高效的解决方案。
伦斯勒理工学院研究团队通过网络科学方法首次系统揭示了大语言模型的内部"认知架构"。研究发现AI模型采用类似鸟类大脑的弱定位架构,模块间通过分布式协作而非专业化分工来处理认知任务。这一发现颠覆了基于功能模块优化的传统思路,指出应充分利用网络级协作来提升AI性能。
腾讯和清华研究团队首次从数学理论角度解释了为什么AI需要外部工具。研究证明纯文本AI存在"隐形枷锁",无法突破预训练的能力边界,而工具集成能打破这种限制,让AI获得全新的问题解决策略。团队还开发了ASPO算法,解决了训练AI更早使用工具的技术难题。实验显示配备工具的AI在数学问题上全面超越纯文本版本,展现出三种新奇认知模式,为构建更强大的AI系统提供理论指导。
亚利桑那州立大学团队开发出MMTok技术,通过多模态覆盖最大化方法,让视觉语言AI模型在保持98.7%准确度的同时实现1.87倍速度提升。该方法同时考虑图片和文字信息来智能选择关键视觉令牌,将处理的视觉信息从2880个压缩到160个,显著降低计算成本和内存使用,为AI系统的实际部署提供了高效解决方案。
NousResearch团队发布的Hermes 4是一个突破性的混合推理AI模型,它首次实现了结构化多步推理与广泛指令执行能力的完美结合。该模型通过创新的"思考截止"训练技术和大规模开放数据集,在数学推理、编程、知识问答等任务上达到顶尖水平,同时展现出卓越的个性化适应能力,为AI技术的开放化发展树立了新标杆。
荷兰埃因霍芬理工大学研究团队开发出一种智能心脏超声除雾技术,能够自动识别图像中被"雾霾"污染的区域并进行有针对性清理。该技术结合语义分割和扩散模型,首先让AI识别心脏各部分结构,然后根据不同区域特点采用不同强度的除雾处理,在国际挑战赛中表现优异,为解决心脏超声图像质量问题提供了新思路。
马里兰大学研究团队开发了"去预设"方法,通过将复杂声明分解为无预设前提的简单问题,让AI像侦探般系统性验证每个假设。该方法显著提升AI信息验证准确率2-5%,大幅降低对提示词变化的敏感性,为构建更可靠的AI系统提供新思路。研究在生物医学等复杂领域表现尤其出色。
中科大团队开发了MeshSplat技术,仅用两张照片就能重建完整3D场景。该技术首次将2D高斯散点应用于稀疏视角表面重建,通过加权距离约束和法向预测网络显著提升重建质量。实验显示其性能比现有方法提升30%,在房地产、电商、文物保护等领域具有广泛应用前景。
希腊亚里士多德大学研究团队开发了REGEN系统,通过两阶段神经网络框架实现游戏画面的实时真实化增强。该系统先用EPE方法离线生成高质量样本,再训练轻量级网络模仿效果,在《侠盗猎车手5》上实现了30帧每秒的处理速度,比传统方法快32倍且画面质量相当,为游戏产业和AI训练数据生成提供了实用解决方案。
科技亿万富翁拉里·埃里森资助的研究团队将向英国牛津大学投资1.18亿英镑,用于将AI技术应用于疫苗研究。牛津疫苗研究小组将领导这一项目,研究人体免疫系统对严重细菌感染和抗生素耐药性的反应。该项目由曾主导新冠疫苗试验的安德鲁·波拉德教授领导,计划采用人体挑战模型,让志愿者在受控条件下接触细菌,然后运用现代免疫学和AI工具来精确识别预测保护效果的免疫反应,以开发针对致命疾病的创新疫苗。
据报道,ChatGPT开发商OpenAI计划在印度建设一座耗电量超过1吉瓦的数据中心,目前正寻找当地合作伙伴。该设施预计可容纳至少5.9万片英伟达B200芯片。这可能是OpenAI全球数据中心计划的一部分,旨在为国际用户提供更低延迟服务。OpenAI CEO奥特曼将于下月访问印度,公司还计划年底前在新德里开设办事处。
AI智能体不再局限于重复性任务处理,正逐步渗透到企业高层战略决策领域。麦肯锡研究显示,53%的高管和44%的中层管理者已在工作中使用生成式AI。LVMH、贝莱德等知名企业纷纷构建智能体平台,用于市场监控、数据分析和战略决策支持。虽然智能体尚未完全接管决策权,但已成为领导者的重要助手,帮助他们更好地导航商业环境并预警潜在风险。