最新文章
人类的下一次飞跃:量子 AI、UBI 和全民公平的机会

人类的下一次飞跃:量子 AI、UBI 和全民公平的机会

量子 AI 结合量子计算与人工智能,为全球 UBI 提供可能,通过优化资源分配和经济建模推动公平与稳定,激发创新和人类潜能,迈向从生存到繁荣的新纪元。

让大语言模型学会何时"少思考":新加坡国立大学研究团队开发出自适应推理框架

让大语言模型学会何时"少思考":新加坡国立大学研究团队开发出自适应推理框架

这项新加坡国立大学的研究开发了"Thinkless"框架,解决了大语言模型在推理时的效率问题。研究者通过引入两种控制标记和创新的解耦式相对策略优化算法,使模型能够智能地决定何时使用详细推理、何时直接给出简洁答案,就像人类面对不同难度问题时会灵活调整思考深度一样。实验结果表明,这种方法能减少50%-90%的详细推理使用,显著提高效率同时保持准确度,为构建更智能、更高效的AI系统铺平了道路。

静态与动态的和谐:成功大学3D-4D高斯分布融合技术突破动态场景建模效率瓶颈

静态与动态的和谐:成功大学3D-4D高斯分布融合技术突破动态场景建模效率瓶颈

这项研究提出了一种名为"混合3D-4D高斯分布"的新方法,巧妙解决了动态场景重建的效率问题。研究团队发现传统4D高斯分布技术在处理静态区域时存在大量冗余,因此开发了自动识别静态/动态区域的算法,并将静态部分转换为3D表示,动态部分保留4D表示。实验证明,该方法在保持高品质渲染的同时,将训练时间从数小时缩短至约12分钟,为虚拟现实与增强现实应用提供了更高效的动态场景重建工具。

CPGD:让语言模型的规则强化学习更稳定可靠

CPGD:让语言模型的规则强化学习更稳定可靠

这项研究提出了CPGD算法,解决语言模型规则强化学习中的训练不稳定问题。通过用策略梯度损失替代PPO-clip损失,并引入裁剪机制和策略漂移正则化,CPGD有效避免了现有方法中由重要性采样比率引起的训练崩溃。实验结果表明,CPGD在多个多模态数学基准测试上显著优于其他强化学习算法,与基础模型相比平均提升11.0%的性能,尤其在领域内测试上提升21.8%,展现出卓越的稳定性和泛化能力。

拆解界面,组合交互:香港大学和Salesforce AI的创新研究让电脑操作模型更精准

拆解界面,组合交互:香港大学和Salesforce AI的创新研究让电脑操作模型更精准

这项由香港大学和Salesforce AI Research联合开展的研究解决了AI助手操作电脑时的关键障碍:GUI定位能力。研究者创建了新的OSWORLD-G基准测试(564个样本)和JEDI数据集(400万示例),通过将复杂界面交互分解为基础组件重新训练模型。实验证明这种方法大幅提升了AI在精确操作计算机方面的能力,使OSWorld基准测试成功率从5%提高到27%,为构建更自然的人机交互系统奠定了基础。

拆解断点思维链:大模型推理效率革命 - 阿姆斯特丹大学与Salesforce AI联合研究

拆解断点思维链:大模型推理效率革命 - 阿姆斯特丹大学与Salesforce AI联合研究

这项研究提出了一种名为"断点思维链推理"的创新方法,颠覆了大语言模型中"完整思考过程必不可少"的传统观念。研究表明,在思考链中途截断并直接生成答案竟能达到甚至超过完整推理的准确率,同时显著节省计算资源。基于此,研究者开发了"断点采样"框架,在思考轨迹数量、每轨迹解答数量和思考截断深度三个维度上灵活分配资源。在多个复杂推理基准测试中,断点采样实现了更优的准确率与计算成本平衡,为资源受限环境下的AI部署提供了实用解决方案。

VisionReasoner:中国香港中文大学与智谱研究院联合打造的一体化视觉感知推理系统

VisionReasoner:中国香港中文大学与智谱研究院联合打造的一体化视觉感知推理系统

香港中文大学与智谱研究院的研究团队提出了VisionReasoner,一个基于强化学习的统一视觉感知与推理框架。该模型能够同时处理检测、分割和计数三类视觉任务,通过结构化推理过程分析图像内容。实验显示,与Qwen2.5VL相比,该模型在COCO检测、ReasonSeg分割和CountBench计数任务上分别提升了29.1%、22.1%和15.3%,同时保持了出色的视觉问答能力,证明了统一视觉框架的可行性和高效性。

神经符号查询编译器:让搜索意图识别更精准更高效

神经符号查询编译器:让搜索意图识别更精准更高效

这项研究提出了QCompiler,一个神经符号框架,旨在提升检索增强生成系统中的搜索意图识别精确度。研究团队设计了最小且充分的BNF语法来形式化复杂查询,并开发了包含查询表达式翻译器、词法语法分析器和递归下降处理器的编译系统,将查询编译为抽象语法树。叶节点子查询的原子性确保了更精确的文档检索和回答生成,显著提升了处理复杂查询的能力。实验证明该方法在多个基准测试中表现优异,尤其在处理依赖型查询时优势明显。

加速TarFlow采样:GS-Jacobi迭代法让AI图像生成提速5倍

加速TarFlow采样:GS-Jacobi迭代法让AI图像生成提速5倍

这项研究提出了一种加速TarFlow图像生成模型采样过程的方法。研究人员发现TarFlow中的块具有不同重要性:少数块在图像生成中起主要作用,而其他块贡献较小;有些块对初始值敏感,其他块则相对稳健。基于此,他们提出了收敛排名指标(CRM)和初始猜测指标(IGM),并开发了高斯-赛德尔-雅可比迭代方法。实验表明,该方法在四种TarFlow模型上实现了2.51-5.32倍的加速,同时保持图像质量。这一技术为高效AI图像生成提供了重要解决方案。

当"AI助手"失灵:SPOT—一个用于科学论文自动化验证的全新基准测试

当"AI助手"失灵:SPOT—一个用于科学论文自动化验证的全新基准测试

SPOT是一项开创性研究,揭示了大型语言模型在科学论文错误检测方面的严重不足。研究团队创建了包含83篇跨10个学科领域的论文基准,每篇均包含导致勘误或撤回的已验证错误。最先进的AI模型在此任务上表现惊人地差,最佳模型o3的召回率仅为21.1%,精确率仅为6.1%。案例研究显示,这些模型在长尾知识和复杂推理方面存在根本性缺陷,犯下类似学生的基础错误。这一发现对依赖AI辅助科研的趋势敲响了警钟,强调了当前AI能力与可靠科学验证要求之间的巨大差距。

图表博物馆:测试大型视觉-语言模型的视觉推理能力——德克萨斯大学奥斯汀分校团队开创性研究

图表博物馆:测试大型视觉-语言模型的视觉推理能力——德克萨斯大学奥斯汀分校团队开创性研究

德克萨斯大学奥斯汀分校的研究团队开发了一个名为CHARTMUSEUM的全新基准测试,专门评估大型视觉-语言模型理解图表的能力。研究表明,即使最先进的AI模型在图表视觉推理任务上远远落后于人类表现——虽然人类能达到93%的准确率,但最佳模型Gemini-2.5-Pro仅达到63%,开源模型表现更差。研究揭示模型在处理视觉推理问题时比文本推理问题表现低35%-55%,并通过错误分析确定了当前模型在符号选择、视觉比较、轨迹跟踪和数值识别等方面的关键挑战,为未来模型改进提供了明确方向。

物理驱动的精细人体动作生成:西北工业大学推出FinePhys框架,让AI生成的体操动作更加真实

物理驱动的精细人体动作生成:西北工业大学推出FinePhys框架,让AI生成的体操动作更加真实

西北工业大学研究团队开发了FinePhys框架,解决了AI生成的人体动作不符合物理规律的问题。该系统通过在线估计2D姿态并转换为3D骨架,再利用欧拉-拉格朗日方程进行物理重估计,最终生成物理上合理的精细人体动作视频。在体操动作数据集上的实验显示,FinePhys生成的视频明显优于现有方法,特别是在保持生物力学结构和动作自然度方面。这一突破为影视特效、游戏开发和虚拟现实等领域带来新可能。

Red Hat Linux 获得生成式 AI 升级及其它管理利好

Red Hat Linux 获得生成式 AI 升级及其它管理利好

Red Hat 子公司推出的全新 RHEL 10 聚焦混合云及 AI 工作负载,通过生成式 AI 助手 Lightspeed 简化 Linux 管理,同时集成量子抗性加密和容器原生 OS 管理,实现 IT 运维一体化。

昇腾AI开发者峰会

昇腾AI开发者峰会

2025年5月23日 14:00-16:00

鲲鹏开发者峰会

鲲鹏开发者峰会

2025年5月23日 10:00-12:00

2025-05-21

MCP引领Agent互联网新时代暨物理AI模型新篇章,2025年第二届AIGC上海开发者大会即将在模力社区举办

MCP引领Agent互联网新时代暨物理AI模型新篇章,2025年第二届AIGC上海开发者大会即将在模力社区举办

DigiCert 与 Panasonic 携手加速 Matter 智能家居设备普及

DigiCert 与 Panasonic 携手加速 Matter 智能家居设备普及

Panasonic Industry Europe 与 DigiCert 合作,将 DigiCert Device Trust Manager 集成至 PAN-MaX 服务,实现 Matter 设备自动认证,加速智能家居产品安全、合规生产,助力制造商抢占市场先机。

戴尔科技全球峰会|戴尔科技:以软件驱动的解耦架构创新重塑数据中心运营
2025-05-21

戴尔科技全球峰会|戴尔科技:以软件驱动的解耦架构创新重塑数据中心运营

戴尔科技的存储和网络弹性更新以更强性能和更高效率帮助客户存储并保护关键数据

人工智能正在重写我们的现实:你的自由是在扩展还是在缩减?

人工智能正在重写我们的现实:你的自由是在扩展还是在缩减?

本文探讨了人工智能如何通过重构内在情感、认知和外部社交、社会结构,既可能扩展也可能限制我们的自由,呼吁以人为本、主动掌控AI未来。

LLM情境调节与持续工作流程提示:革新化学分子式的多模态验证技术

LLM情境调节与持续工作流程提示:革新化学分子式的多模态验证技术

这项研究探索了如何通过"LLM情境调节"和"持续工作流程提示"技术来提高大型语言模型在验证化学分子式时的准确性。研究者发现,普通提示方法往往不可靠,因为LLM倾向于自动"纠正"错误而非指出它们。然而,通过精心设计的情境调节提示,研究成功引导Gemini 2.5 Pro不仅识别出文本中的错误,还发现了之前人工审阅未察觉的图像中的分子式错误。这一概念验证研究表明,即使不修改模型本身,也能通过适当的提示策略显著提高LLM在科学技术文档细节验证中的表现。