Salesforce和伊利诺伊大学联合发布UserRL框架,通过八个虚拟训练场景和强化学习方法,专门训练AI助手的用户交互能力。该框架显著提升了AI理解用户真实意图的准确率(超过100%),并让AI学会了主动询问、协作解决问题等更自然的交互方式,为打造更智能、更人性化的AI助手奠定了重要技术基础。
宾汉姆顿大学研究团队评估了八个开源大语言模型检测反犹言论的能力,使用国际大屠杀纪念联盟定义作为标准。研究开发了"引导式思维链"新方法,显著提升了所有模型的检测性能。Llama 3.1 70B表现最佳,甚至超越了专门训练的GPT-3.5。研究还分析了AI模型的常见错误类型和解释差异,为AI在敏感内容审核领域的应用提供了重要参考。
Amazon研究团队开发出CompLLM压缩技术,能让AI处理长文档的速度提升4倍,内存消耗减半。该技术将长文档分段压缩成"概念嵌入",实现线性复杂度处理,解决了传统AI在处理超长文本时的计算瓶颈。实验显示在处理超长文档时性能优于传统方法,压缩结果可重复使用,为AI应用的效率优化提供了新方案。
延世大学研究团队开发了BESPOKE评估基准,通过收集30位用户三周内2870个真实会话数据,从需求对齐、内容深度、语调和解释方式四个维度评估AI助手个性化能力。研究发现当前主流AI系统个性化表现普遍不足,平均得分仅60多分,但通过智能利用用户历史信息可显著改善效果,为开发更贴心的个性化AI助手提供了科学评估工具。
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
微软今日发布Windows 11版Copilot人工智能助手升级版本。部分功能即日上线,其他功能将通过Windows Insider测试计划提供。所有用户现可使用具备计算机视觉功能的Copilot Vision,支持应用界面导航、文本生成和设计建议等。新版Copilot Actions可执行多步骤自动化任务,包括处理本地PDF文件和访问OneDrive、Google Drive存储文件。此外还将添加语音控制、设置页面快速访问等功能。
苹果研究人员发布新AI模型ADE-QVAET,通过结合四种AI技术克服现有大语言模型在分析大规模代码库时的局限性。该模型不直接分析代码,而是通过代码指标数据寻找漏洞模式,在软件漏洞预测数据集上表现优异。此外,苹果还开发了自动化测试系统和SWE-Gym训练环境,后者训练的AI代理能正确解决72.5%的真实代码修复任务,为软件开发自动化带来新突破。
刚果民主共和国正在推广英加水电站作为AI数据中心的廉价绿色电源。该水电站位于刚果河上,目前仅产出不到2吉瓦电力,但潜在发电量达44吉瓦,几乎是中国三峡大坝的两倍。随着AI使用激增,多家科技巨头正在寻求千兆瓦级数据中心项目。世界银行已承诺投资10亿美元推进该项目开发,预计英加三期项目总投资超过200亿美元。
这项UC圣迭戈研究首次系统解决了AI图像生成中的重叠布局难题。研究团队开发了OverLayScore评估指标和OverLayBench数据集,发现现有AI在复杂重叠场景中表现显著下降。他们提出的CreatiLayout-AM模型通过非模态掩码监督,让AI学会理解被遮挡物体的完整形状,在重叠区域生成精度上获得显著提升,为AI视觉生成技术发展提供了新的解决方案。
斯坦福大学研究团队深入分析了广泛使用的AI评判系统Arena-Hard Auto,发现了三个重大问题:AI评委经常不按既定标准评判(规划失效),不同评判维度高度重合无法独立区分(因子坍塌),以及ELO评分系统通过数学变换掩盖了底层的不确定性。研究开发了专门的诊断工具来检测这些问题,并提出了改进建议,对依赖AI评判系统的学术研究和商业应用具有重要警示意义。
斯坦福大学研究团队开发出"边听边想"的音频识别新技术,让人工智能像侦探一样逐步分析声音。系统将音频分成半秒片段,对每段进行多次推理,再用语言模型综合判断。相比传统方法只在最后给答案,新技术实现渐进式理解,准确率从84%提升至88.3%。该技术可应用于智能家居、医疗设备、工业监测等领域,让AI决策更透明可信。
AutoIntent是俄罗斯研究团队开发的革命性自动化文本分类工具。它能够自动选择最佳的嵌入模型、分类算法和决策阈值,让普通用户无需专业知识就能构建高效的意图识别系统。在标准测试中,AutoIntent不仅准确率超过现有工具,训练效率也提升一倍以上,特别在多标签分类和超范围检测方面表现突出,为AI技术普及化开辟了新路径。
HPE存储业务表现优异,公司重新公开报告存储收入数据,Alletra Storage MP成为主导产品。在AI驱动的市场变革中,HPE将存储作为AI系统销售的重要组成部分,Alletra存储连续三个季度实现三位数同比增长。公司调整财务报告结构,突出云和AI业务,存储收入重新独立披露。面对Dell、NetApp和Pure Storage等竞争对手,HPE依托服务器和网络优势推动存储销售增长。
能源初创公司联邦聚变系统宣布与谷歌DeepMind合作,利用AI技术优化其即将建成的Sparc反应堆运行。双方将使用DeepMind的Torax软件模拟反应堆内等离子体,并结合AI模型帮助实现聚变发电。聚变发电有望提供零排放的大量电力,AI公司看好聚变作为数据中心电源。谷歌此前已投资多家聚变公司,并计划从CFS首个商业电站采购200兆瓦电力。
Omdia最新研究显示,以AWS、微软和谷歌云为首的超大规模云市场企业软件销售额预计将从2024年的300亿美元激增至2030年的1630亿美元。这一增长反映了企业对市场采购模式的日益采用和智能AI销售的急剧上升。2025-2030年复合年增长率预计达29.1%。基础设施软件、DevOps和商业应用将占总支出的63%,而智能AI和网络安全成为高增长领域。
Oracle在其拉斯维加斯AI世界大会上发布大量AI功能,涵盖云基础设施、应用和数据分析。专家指出,尽管Oracle全面拥抱AI,但用户的采用路径仍不明确。公司扩展了Fusion云应用的AI代理工作室,支持OpenAI等第三方LLM提供商,并推出代理市场。然而,客户在数据质量和治理方面面临挑战,需要制定完善的数据策略才能实现AI的商业价值。
阿联酋物流巨头Aramex在2025年迪拜Gitex全球大会上宣布与亚马逊云科技AWS达成重要合作,成功将大洋洲数据中心迁移至AWS云平台。此次迁移涉及88台虚拟机,包括关键数据库和应用工作负载。该合作旨在构建云原生AI赋能的物流生态系统,提升运营效率、安全性和灾难恢复能力,为全球客户提供更可靠的服务体验,同时支持可持续发展目标。
知名Doom开源移植项目GZDoom因创始人插入AI生成代码引发社区分裂。项目维护者在代码中添加了ChatGPT生成的未经测试代码片段,并试图删除相关讨论记录。开发者们对使用"无法验证GPL兼容性的抓取代码"表示强烈反对,认为AI工具不应用于开源项目。大批开发者因此创建了名为UZDoom的新分支,采用更透明的协作开发模式,去除"一人决定一切"的管理方式。