MBZUAI研究团队提出令牌顺序预测方法,通过让AI学习词汇排序而非精确预测来改进语言模型训练。该方法比传统下一词预测和多令牌预测都更有效,在3.4亿到70亿参数的模型上均显示出优势,且计算成本更低。研究证明了降低任务难度反而能获得更好效果的训练策略价值。
ByteDance团队开发的HeteroScale系统通过三层智能架构解决大规模AI服务GPU调度难题。系统创新性地使用decode TPS作为调度指标,建立异构资源管理框架和网络感知调度机制,在生产环境管理数万GPU,实现26.6%利用率提升和41.3%资源节约,为AI服务资源管理提供新范式。
斯坦福和伯克利联合开发了DeepScholar-Bench系统,专门评估AI进行学术研究综述的能力。研究通过让AI撰写论文的"相关工作"部分,从知识综合、检索质量和可验证性三个维度测试AI表现。结果显示最先进的AI系统综合得分不超过19%,表明AI学术研究能力仍有巨大提升空间,为未来AI助手发展指明了方向。
天津大学研究团队开发的MotionFlux系统通过矫正流匹配技术和TAPO偏好对齐优化,实现了毫秒级的实时文字到动作生成。该系统在保持高质量动作生成的同时,将推理速度提升了数千倍,在语义对齐准确率上也显著优于现有方法,为游戏、虚拟现实、教育培训等领域的实时应用奠定了技术基础。
腾讯AI实验室联合多所大学开发出Vision-SR1方法,通过"观察-描述-验证"的训练策略解决视觉语言模型的两大问题:依赖文字线索猜答案的"语言捷径"和描述不存在内容的"视觉幻觉"。该方法要求AI先详细描述图片内容,再仅凭描述回答问题,强化真实视觉理解能力。实验显示在多个测试集上效果显著提升,为开发更可靠的AI视觉系统提供重要技术基础。
伊斯法罕医科大学研究团队开发出DrugReasoner,这是首个能够像人类专家一样"推理"的药物审批预测AI系统。该系统基于LLaMA架构,不仅能预测新药是否会被批准,更重要的是能详细解释推理过程。在多项测试中表现优异,AUC值达0.732,明显超越传统方法,为制药行业提供了前所未有的透明化决策工具,有望显著提高药物研发效率。
这项由南京大学团队开发的FASB技术让AI学会了"察言观色"和"知错能改"。通过实时监控AI内部状态并动态调整干预强度,该方法在多个测试中将AI回答准确率提升了近50%。研究团队创新性地引入了回退机制,让AI能在发现问题时"重新来过",显著提升了回答质量。该技术在教育、客服、内容创作等领域具有广阔应用前景。
中科大和百度联合研究团队开发了S2K框架,这是一种创新的大语言模型专业领域适配技术。该框架通过智能的内外部知识融合机制和分阶段训练策略,仅用传统方法1%的训练数据就能让通用模型在医学、法律、金融等专业领域达到专家级问答水平,为人工智能在专业领域的高效应用提供了新的解决方案。
这项由TripleSun公司Jakub Michańków博士领导的突破性研究,系统评估了深度神经网络在金融收益概率分布预测中的应用效果。研究采用CNN和LSTM架构,结合正态分布、学生t分布和偏斜学生t分布,在六个全球主要股指上进行验证。结果显示LSTM配备偏斜学生t分布的模型表现最优,不仅在分布预测精度上超越传统方法,在风险价值评估中也展现出与经典GARCH模型相当的性能,为金融风险管理提供了新的技术路径。
英国研究人员开发出一项名为Fastball的三分钟检测技术,通过脑电图头戴设备分析大脑对图像的识别能力,能够在认知衰退早期发现记忆问题。研究涉及107名参与者,发现该技术可有效识别轻度认知障碍患者的记忆缺陷,比现有诊断工具提前10-20年发现阿尔茨海默病征象。该技术可在家中使用,为早期干预治疗提供可能。
随着智能代理AI的兴起,CIO必须调整IT战略重点、降低新安全风险并为员工重新培训技能。75%的CIO将在AI和机器学习项目上投入更多时间。IT部门需要从管理基础设施转向编排智能化,在每个业务流程中嵌入AI代理。CIO应重新考虑人机协作模式、多学科敏捷团队演进、IT治理职能重新定位,以及培养AI数据质量专家、AI诊断师等新兴角色技能。
通用人工智能(AGI)备受关注,但实现时间仍存争议。专家预测AGI将在5-20年内实现,但面临数据质量、安全性和组织准备等挑战。IT领导者需要建立AI就绪的数据基础,制定治理框架,通过低风险试点项目逐步推进。AGI将重塑组织结构和工作方式,要求企业在技术能力提升的同时注重道德责任和风险管控。
量子算法公司Phasecraft宣布获得3400万美元新融资,用于加速将量子计算的理论前景转化为实际应用。该公司成立于2019年,专注于开发超高效算法,使当前不完美的量子设备能够在实际环境中提供有意义的结果。公司采用硬件无关方法,与谷歌、IBM等多家硬件提供商合作,并与多个行业伙伴共同开发定制解决方案,应用于材料发现、化学、能源系统和物流优化等领域。
Rubrik的虚拟气隙不可变云备份库现已支持谷歌云平台,加入原有的AWS和Azure支持。Rubrik云备份库作为Rubrik安全云的组件,提供托管式、云原生、安全隔离的云端不可变备份存储库。该解决方案在网络攻击或其他不利事件发生时,确保客户能够获得干净、未受损的数据副本进行恢复,包含基于角色的访问控制和客户管理密钥加密功能。
浙江大学团队构建了全球首个中文法律诉求生成数据集ClaimGen-CN,包含20万份真实民事法律文书,涵盖100种纠纷类型。研究创新性地关注普通人法律需求,提出事实性和清晰性双重评估标准。通过测试六大主流AI模型发现,当前技术在法律知识理解、逻辑推理等方面仍存在不足,为未来AI法律助手发展指明方向。
耶鲁大学研究团队通过构建SCIREAS评估体系和KRUX分析框架,系统研究了大语言模型在科学推理中的表现。研究发现,模型的主要瓶颈不是推理能力而是知识检索能力,基础模型在获得外部知识支持后甚至能超越专门的推理模型。团队还开发了SCILIT01作为开源科学推理基线,为未来AI科学应用的改进提供了新方向。
微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。该技术采用连续语音编码器实现3200倍压缩率,结合大语言模型和下一令牌扩散技术,支持最多4个说话者的自然对话生成。在多项评测中全面超越现有系统,为播客制作、有声读物等应用开辟新可能。
上海人工智能实验室等机构联合发布CMPhysBench,这是首个专门评测AI在凝聚态物理领域能力的基准测试。研究包含520道研究生级别题目,并开发了新的SEED评分系统。测试结果显示,即使最强的AI模型准确率也不足30%,暴露了AI在深度科学推理方面的明显短板,为科学AI的发展指明了方向。
星际创想实验室发布突破性AI系统Spacer,通过"故意去语境化"技术让人工智能具备科学创新能力。系统由关键词挖掘引擎Nuri和概念生成管道组成,能从18万篇论文中发现新研究方向。验证显示其预测准确率达73.7%,概念重构成功率超85%,生成想法更接近顶级科学研究。
ByteDance研究团队开发的UltraMemV2成功让记忆层架构性能追平顶级8专家MoE模型,同时大幅降低内存访问成本。该技术通过五个关键改进,在长文本记忆等任务上表现更佳,验证了高达1200亿参数的可扩展性,为高效稀疏计算提供了重要替代方案,有望推动AI系统向更智能高效方向发展。