最新文章
中科大团队推出深度研究智能体新基准:机器也能像博士生一样写研究报告了?

中科大团队推出深度研究智能体新基准:机器也能像博士生一样写研究报告了?

中科大团队推出深度研究智能体评测基准DeepResearch Bench,包含100个跨22领域的博士级研究任务,创新性地设计了RACE和FACT双重评估框架,分别评判AI生成报告质量和信息收集能力。测试显示谷歌Gemini表现最佳,该研究为AI研究助手行业建立了首个科学统一的评估标准。

从真实到合成:如何让AI批量制造出千万条复杂又多样的用户指令——中科大和Metastone公司的突破性研究

从真实到合成:如何让AI批量制造出千万条复杂又多样的用户指令——中科大和Metastone公司的突破性研究

中科大与Metastone公司合作提出"归因接地"框架,通过分析真实指令的产生机制来大规模合成高质量训练数据。该方法将指令归因于文档、用户和动机三要素,构建了100万条指令的SynthQuestions数据集。实验显示,用该数据集训练的AI模型性能显著提升,证明了质量胜过数量的重要性,为解决AI训练数据稀缺问题提供了新思路。

等一下,我们真的需要"等"吗?——伦敦大学学院团队发现AI推理过程中的"思考"可能是多余的

等一下,我们真的需要"等"吗?——伦敦大学学院团队发现AI推理过程中的"思考"可能是多余的

伦敦大学学院研究团队开发的NOWAIT方法通过阻止AI生成"等等"、"嗯"等思考词汇,在保持准确性的同时将AI输出长度减少27%-51%。该方法无需重新训练模型,可直接应用于现有AI系统,为提高AI推理效率提供了简单有效的解决方案。

从采用到优势:2025年企业大语言模型十大发展趋势

从采用到优势:2025年企业大语言模型十大发展趋势

Kong Research发布的2025年企业大语言模型采用报告基于550名IT领导者调研,揭示了企业生成式AI从谨慎探索转向战略必需的十大趋势:投资大幅增长,72%企业预计支出上涨;谷歌以69%使用率领先OpenAI;企业偏好付费解决方案;安全隐私仍是主要障碍;国际供应商获得认可;混合策略兴起;客户支持和开发者生产力成主要应用场景;开源模型受青睐;成本仍是关键障碍;82%企业对AI影响持乐观态度。

GenLayer推出AI与区块链结合的全新品牌营销激励机制

GenLayer推出AI与区块链结合的全新品牌营销激励机制

GenLayer启动首个激励测试网Asimov,推出智能区块链基础设施。该平台结合AI模型和区块链技术,通过大语言模型验证器处理主观决策,为AI代理时代构建去中心化法律基础设施。同时发布Rally营销协议,利用AI自动评估社交媒体内容并分发奖励,品牌可设定规则让系统自主管理影响者营销活动,大幅降低运营成本并提高透明度。

GridGain技术助力AI推理,分布式内存架构释放计算潜能

GridGain技术助力AI推理,分布式内存架构释放计算潜能

GridGain软件通过集群服务器实现内存共享,使内存密集型应用能在单独内存不足的服务器上运行。该技术在AI推理领域日益重要,因为所需令牌数量不断增长。软件提供跨x86服务器集群的分布式内存空间,具备大规模并行架构。GridGain声称其引擎可用于任何数据驱动的分析或事件处理项目,提供超低延迟的分布式多模型数据存储和计算引擎,实时为AI推理引擎提供企业数据。

PPG集团CIO拉马钱德兰的云端变革之路

PPG集团CIO拉马钱德兰的云端变革之路

PPG副总裁兼首席信息官Bhaskar Ramachandran正在领导一项多方面的转型战略,通过云技术和AI推动创新、客户增长和新能力建设。他采用"云端唯一"而非"云优先"策略,目前已实现97%的云迁移率。PPG利用AI优化涂料配方研发和质量控制,每年投入7亿美元研发资金。在生成式AI应用中,公司花费8个月时间训练IT服务台聊天机器人。

从试点到落地:制药行业GenAI规模化应用的关键要素

从试点到落地:制药行业GenAI规模化应用的关键要素

制药行业的GenAI热潮正从早期试验走向务实应用。通用GenAI工具在精准度要求极高的生命科学领域遇到瓶颈,需要转向领域专用的智能助手。企业面临的真正挑战不是算法优化,而是系统集成、治理框架建设和投资回报率证明。成功的关键在于构建团队AI应用能力,建立支持创新的治理体系,以及将GenAI深度嵌入现有工作流程。未来AI智能体的兴起将进一步重塑制药企业运营模式。

5G-A全场景物联,实现AI智赋万物

5G-A全场景物联,实现AI智赋万物

赵东指出,IoT智联万物,AI开启未来,IoT与AI融合共生让智能无处不在、无所不达。他进一步在发言中表示“实现万物智联需要具备三大关键要素:全场景物联,让所有对象可连接;全超宽网络,让所有数据联云联算;全智能加持,让所有应用可模型化。”

华为汪涛:AI全面重构超宽带网络,激发商业新增长

华为汪涛:AI全面重构超宽带网络,激发商业新增长

在峰会上,华为常务董事汪涛发表了“AI全面重构超宽带(UBB)网络,激发商业新增长”主题演讲,并推出AI UBB解决方案,包括AI FAN、AI OTN、AI WAN和ADN四大部分,端到端覆盖家庭网络、承载网络和UBB智能管控系统。

中国联通携手华为打造5G-A x AI时代融智新品,正式开启AI to X新时代

中国联通携手华为打造5G-A x AI时代融智新品,正式开启AI to X新时代

融合“云智手机”等云智产品的“5G-A云智融合套餐”在会上亮相,彰显网络、产品、生态协同创新成果,开启“AI to X”新时代。

西云数据亮相亚马逊云科技中国峰会,以技术创新赋能行业变革

日前,宁夏西云数据科技有限公司亮相“2025亚马逊云科技中国峰会”,全面展示了其先进技术、卓越运营及丰富的行业实践。

中国电信联合华为发布“智聚大上行”创新技术,赋能5G-A产业焕新升级

中国电信联合华为发布“智聚大上行”创新技术,赋能5G-A产业焕新升级

会上,中国电信与华为联合发布了“基于智能编排和上行频谱解耦与池化,形成智能大上行技术”最新创新技术成果。

对话SUSE亚太区CTO Vishal Ghariwala:用开源拆掉企业AI的“无形围墙”
2025-06-19

对话SUSE亚太区CTO Vishal Ghariwala:用开源拆掉企业AI的“无形围墙”

在他看来,企业对AI的恐惧源自未知,而破解未知的钥匙,就藏在“AI平台+开源”这个看似简单的公式里。

2025-06-19

通义APP全面升级翻译能力,打造最强翻译综合体

升级后的翻译能力不仅支持119种语言和方言。

AI模型"性格"大揭秘:斯坦福和魁北克团队首创"超新星事件"测试法,发现人工智能也有独特人格

AI模型"性格"大揭秘:斯坦福和魁北克团队首创"超新星事件"测试法,发现人工智能也有独特人格

斯坦福和魁北克研究团队首创"超新星事件数据集",通过让AI分析历史事件和科学发现来测试其"性格"。研究发现不同AI模型确实表现出独特而稳定的思维偏好:有些注重成就结果,有些关注情感关系,有些偏向综合分析。这项突破性研究为AI评估开辟了新方向,对改善人机协作和AI工具选择具有重要意义。

代码验证能否做到既快又准?威斯康星大学破解大型语言模型编程任务的速度与精度平衡难题

代码验证能否做到既快又准?威斯康星大学破解大型语言模型编程任务的速度与精度平衡难题

威斯康星大学研究团队提出"生成-筛选-排序"策略,通过结合快速筛选器和智能奖励模型,在AI代码验证中实现了11.65倍速度提升,准确率仅下降8.33%。该方法先用弱验证器移除明显错误代码,再用神经网络模型精确排序,有效解决了传统方法在速度与准确性之间的两难选择,为实用化AI编程助手铺平了道路。

约翰霍普金斯大学揭秘:AI为什么总是对外部建议"充耳不闻"?

约翰霍普金斯大学揭秘:AI为什么总是对外部建议"充耳不闻"?

约翰霍普金斯大学研究团队发现,即使给AI模型提供近乎完美的外部反馈,它们仍然无法完全吸收并达到理论最佳表现,这种现象被称为"反馈摩擦"。研究通过九项不同任务测试了多个先进AI模型,发现所有模型都存在这一局限性,且主要原因是模型的反馈抗拒而非反馈质量问题,为AI自我改进研究指明了新方向。

韩国大学联合耶鲁大学:让AI医生学会"边推理边验证",小模型也能超越大模型诊断准确率

韩国大学联合耶鲁大学:让AI医生学会"边推理边验证",小模型也能超越大模型诊断准确率

这项由韩国大学联合耶鲁大学等多所院校开展的研究,开发了名为Med-PRM的医疗AI推理框架。该系统让AI在诊断时能够实时查阅医学文献并验证每个推理步骤,使80亿参数的小模型在医学考试中首次突破80%准确率,训练成本仅需20美元却超越了成本数万美元的竞争对手,为医疗AI的普及和可靠性提升提供了新路径。

哈工大团队革命性突破:AI智能体终于学会了像人类一样长期规划和思考

哈工大团队革命性突破:AI智能体终于学会了像人类一样长期规划和思考

哈工大研究团队开发出革命性AI智能体Mirage-1,首次实现了像人类一样的长期规划和跨应用操作能力。该系统通过分层多模态技能学习和技能增强搜索算法,在Android和网页环境测试中分别取得32%、19%、15%和79%的性能提升,为AI助手的实用化发展奠定了重要基础。