## 腾讯发布HunyuanWorld-Voyager开源AI模型,可将单张图片生成3D一致性视频序列,用户可控制相机路径"探索"虚拟场景。该模型同时生成RGB视频和深度信息,支持直接3D重建。模型采用Transformer架构,使用超10万视频片段训练,在WorldScore基准测试中获得77.62最高分。但需要60GB以上GPU内存运行,且在欧盟等地区使用受限。
山东大学等高校联合研究揭示智能手机AI助手隐私保护能力严重不足。研究团队构建了首个隐私意识评估基准SAPA-Bench,包含7138个真实场景。测试结果显示,即使最佳模型的隐私风险感知能力也仅达67%,多数开源模型仅30%左右。研究发现闭源模型表现优于开源模型,明确提示可显著提升隐私感知能力。
香港理工大学等机构研究团队发现扩散语言模型存在"早期答案收敛"现象:高达99%的问题在推理中途就已得出正确答案,却仍继续无效推理。基于此发现,团队开发了Prophet方法,通过监控AI推理信心动态决定提前停止时机,实现3.4倍推理加速且几乎不损失准确性,为AI文本生成效率优化开辟新方向。
Meta AI团队开发出STEPWISER系统,让AI模型学会像资深评委一样分析和评判推理步骤质量。该方法通过强化学习训练,让AI先进行深度分析再给出判断,在ProcessBench测试中准确率相比传统方法提升32-56%。STEPWISER还能通过"块重置推理"策略实时纠错,提高推理准确率10-18%,为构建更可靠的AI推理系统提供了重要突破。
MBZUAI研究团队提出令牌顺序预测方法,通过让AI学习词汇排序而非精确预测来改进语言模型训练。该方法比传统下一词预测和多令牌预测都更有效,在3.4亿到70亿参数的模型上均显示出优势,且计算成本更低。研究证明了降低任务难度反而能获得更好效果的训练策略价值。
ByteDance团队开发的HeteroScale系统通过三层智能架构解决大规模AI服务GPU调度难题。系统创新性地使用decode TPS作为调度指标,建立异构资源管理框架和网络感知调度机制,在生产环境管理数万GPU,实现26.6%利用率提升和41.3%资源节约,为AI服务资源管理提供新范式。
斯坦福和伯克利联合开发了DeepScholar-Bench系统,专门评估AI进行学术研究综述的能力。研究通过让AI撰写论文的"相关工作"部分,从知识综合、检索质量和可验证性三个维度测试AI表现。结果显示最先进的AI系统综合得分不超过19%,表明AI学术研究能力仍有巨大提升空间,为未来AI助手发展指明了方向。
天津大学研究团队开发的MotionFlux系统通过矫正流匹配技术和TAPO偏好对齐优化,实现了毫秒级的实时文字到动作生成。该系统在保持高质量动作生成的同时,将推理速度提升了数千倍,在语义对齐准确率上也显著优于现有方法,为游戏、虚拟现实、教育培训等领域的实时应用奠定了技术基础。
腾讯AI实验室联合多所大学开发出Vision-SR1方法,通过"观察-描述-验证"的训练策略解决视觉语言模型的两大问题:依赖文字线索猜答案的"语言捷径"和描述不存在内容的"视觉幻觉"。该方法要求AI先详细描述图片内容,再仅凭描述回答问题,强化真实视觉理解能力。实验显示在多个测试集上效果显著提升,为开发更可靠的AI视觉系统提供重要技术基础。
伊斯法罕医科大学研究团队开发出DrugReasoner,这是首个能够像人类专家一样"推理"的药物审批预测AI系统。该系统基于LLaMA架构,不仅能预测新药是否会被批准,更重要的是能详细解释推理过程。在多项测试中表现优异,AUC值达0.732,明显超越传统方法,为制药行业提供了前所未有的透明化决策工具,有望显著提高药物研发效率。
这项由南京大学团队开发的FASB技术让AI学会了"察言观色"和"知错能改"。通过实时监控AI内部状态并动态调整干预强度,该方法在多个测试中将AI回答准确率提升了近50%。研究团队创新性地引入了回退机制,让AI能在发现问题时"重新来过",显著提升了回答质量。该技术在教育、客服、内容创作等领域具有广阔应用前景。
中科大和百度联合研究团队开发了S2K框架,这是一种创新的大语言模型专业领域适配技术。该框架通过智能的内外部知识融合机制和分阶段训练策略,仅用传统方法1%的训练数据就能让通用模型在医学、法律、金融等专业领域达到专家级问答水平,为人工智能在专业领域的高效应用提供了新的解决方案。
这项由TripleSun公司Jakub Michańków博士领导的突破性研究,系统评估了深度神经网络在金融收益概率分布预测中的应用效果。研究采用CNN和LSTM架构,结合正态分布、学生t分布和偏斜学生t分布,在六个全球主要股指上进行验证。结果显示LSTM配备偏斜学生t分布的模型表现最优,不仅在分布预测精度上超越传统方法,在风险价值评估中也展现出与经典GARCH模型相当的性能,为金融风险管理提供了新的技术路径。
英国研究人员开发出一项名为Fastball的三分钟检测技术,通过脑电图头戴设备分析大脑对图像的识别能力,能够在认知衰退早期发现记忆问题。研究涉及107名参与者,发现该技术可有效识别轻度认知障碍患者的记忆缺陷,比现有诊断工具提前10-20年发现阿尔茨海默病征象。该技术可在家中使用,为早期干预治疗提供可能。
随着智能代理AI的兴起,CIO必须调整IT战略重点、降低新安全风险并为员工重新培训技能。75%的CIO将在AI和机器学习项目上投入更多时间。IT部门需要从管理基础设施转向编排智能化,在每个业务流程中嵌入AI代理。CIO应重新考虑人机协作模式、多学科敏捷团队演进、IT治理职能重新定位,以及培养AI数据质量专家、AI诊断师等新兴角色技能。
通用人工智能(AGI)备受关注,但实现时间仍存争议。专家预测AGI将在5-20年内实现,但面临数据质量、安全性和组织准备等挑战。IT领导者需要建立AI就绪的数据基础,制定治理框架,通过低风险试点项目逐步推进。AGI将重塑组织结构和工作方式,要求企业在技术能力提升的同时注重道德责任和风险管控。
量子算法公司Phasecraft宣布获得3400万美元新融资,用于加速将量子计算的理论前景转化为实际应用。该公司成立于2019年,专注于开发超高效算法,使当前不完美的量子设备能够在实际环境中提供有意义的结果。公司采用硬件无关方法,与谷歌、IBM等多家硬件提供商合作,并与多个行业伙伴共同开发定制解决方案,应用于材料发现、化学、能源系统和物流优化等领域。
Rubrik的虚拟气隙不可变云备份库现已支持谷歌云平台,加入原有的AWS和Azure支持。Rubrik云备份库作为Rubrik安全云的组件,提供托管式、云原生、安全隔离的云端不可变备份存储库。该解决方案在网络攻击或其他不利事件发生时,确保客户能够获得干净、未受损的数据副本进行恢复,包含基于角色的访问控制和客户管理密钥加密功能。
浙江大学团队构建了全球首个中文法律诉求生成数据集ClaimGen-CN,包含20万份真实民事法律文书,涵盖100种纠纷类型。研究创新性地关注普通人法律需求,提出事实性和清晰性双重评估标准。通过测试六大主流AI模型发现,当前技术在法律知识理解、逻辑推理等方面仍存在不足,为未来AI法律助手发展指明方向。