最新文章
Anthropic CEO:我们每一代模型都赚钱,亏损是因扩展定律,和云不同,模型API业务不会商品化,一亿美金挖人只为几行代码
2025-08-11

Anthropic CEO:我们每一代模型都赚钱,亏损是因扩展定律,和云不同,模型API业务不会商品化,一亿美金挖人只为几行代码

Stripe联合创始人John Collison最近与Anthropic CEO Dario Amodei(达里奥·阿莫代)进行了一次对话。

OpenAI GPT-5突破性安全架构:当AI学会"思考"后如何确保不越界
2025-08-11

OpenAI GPT-5突破性安全架构:当AI学会"思考"后如何确保不越界

GPT-5是OpenAI于2025年8月发布的新一代多模式大模型,兼具高效应答与深度推理能力,并在安全性、准确性和多语言表现上取得显著提升,尤其在医疗、内容安全与防越狱方面展现突破性进步。

2025-08-11

从 “人工主导” 到 “AI 赋能”:2025 测试行业三大趋势与企业应对策略

过去 24 个月,生成式 AI 让软件测试第一次真正意义上进入了“自驱”时代。据世界质量报告指出,高达 75% 的公司正在积极投资于 AI 以提升质量保证能力。

EVOLVE 2025|  推进AI从PoC到“生产线” Cloudera开辟了这样一条路!
2025-08-11

EVOLVE 2025| 推进AI从PoC到“生产线” Cloudera开辟了这样一条路!

据质量、数据访问权限、安全合规、跨环境调度、成本控制构成了企业级AI生产环境的多维挑战。

2025-08-11

EVOLVE 2025|Cloudera重塑数据底座“基本盘” 加速AI“增长飞轮”

在数字经济飞速发展的今天,数据已无可争议地成为驱动AI创新的核心要素。然而,企业在AI落地过程中常面临数据分散、治理不善、访问受限等挑战,使得许多概念验证项目(PoC)难以推进至生产环境。

EVOLVE 2025|跨越数据主权与云弹性   Cloudera“融合三部曲”定义AI转型“四重境界”

EVOLVE 2025|跨越数据主权与云弹性 Cloudera“融合三部曲”定义AI转型“四重境界”

Cloudera的技术实践,折射出当下企业数据智能化转型的核心命题,更体现出四层境界的思考。

哈工大和360研究团队突破AI"偷懒思维":让人工智能真正听懂复杂指令的秘密武器

哈工大和360研究团队突破AI"偷懒思维":让人工智能真正听懂复杂指令的秘密武器

哈工大和360研究团队联合开发了Light-IF框架,成功解决了大型语言模型在处理复杂指令时的"偷懒思维"问题。该框架通过教AI学会"预览和自检"的工作方式,显著提升了AI对多重约束条件任务的处理能力。Light-IF-32B模型在四个权威测试平台上均取得最佳成绩,超越了多个知名大型模型。研究团队已开源相关模型和代码,为AI助手的发展开辟了新方向。

T-Tech实验室让AI机器人能用眼看能动手,如同训练一个聪明学徒完成复杂任务

T-Tech实验室让AI机器人能用眼看能动手,如同训练一个聪明学徒完成复杂任务

T-Tech实验室开发出革命性的VL-DAC训练方法,让AI机器人能够通过观看简单模拟环境学会复杂的现实世界技能。该方法将AI的"观察思考"与"实际行动"分开训练,避免了传统方法需要复杂参数调整的问题。实验证明,AI在导航、卡牌游戏等简化环境中训练后,在真实世界的游戏控制、空间规划和网页操作任务中性能分别提升50%、5%和2%,为降低AI开发成本开辟了新路径。

ByteDance发布DreamVVT:让任何人都能在视频中"换衣服"的AI魔法师

ByteDance发布DreamVVT:让任何人都能在视频中"换衣服"的AI魔法师

DreamVVT是ByteDance团队开发的突破性AI视频虚拟试穿系统,采用创新的两阶段设计:先为关键帧生成精准试穿效果,再生成流畅完整视频。该系统能处理复杂的真实场景,包括户外环境、360度转身等高难度动作,在多项评测中达到最优性能。技术核心在于充分利用预训练模型优势,通过多模态信息融合实现高质量的服装替换效果。

大语言模型也会"技能退化"?北大阿里巴巴联合研究揭示AI训练中的隐藏危机

大语言模型也会"技能退化"?北大阿里巴巴联合研究揭示AI训练中的隐藏危机

北京大学与阿里巴巴联合研究发现大语言模型在强化学习训练中存在"能力边界塌陷"问题,即模型虽然测试成绩提升但整体能力范围缩小。研究团队提出RL-PLUS方法,通过多重要性采样和探索优势函数,实现内外部学习结合,在六个数学基准测试中达到最先进性能,并展现出优异的跨领域泛化能力,为AI持续学习提供了重要技术突破。

华为突破5G网络故障诊断难题:让AI像老工程师一样"看透"网络问题根源

华为突破5G网络故障诊断难题:让AI像老工程师一样"看透"网络问题根源

华为研究团队开发出基于大语言模型的5G网络故障诊断系统,通过双阶段训练方法让AI学会像专家一样分析网络问题根源。他们创建了TeleLogs数据集,包含网络配置参数和故障案例。实验显示,经过训练的小参数模型诊断准确率达95.86%,远超现有方法,且能提供详细解释,为网络运维自动化带来突破性进展。

塔尔图大学最新突破:让普通显微镜像"火眼金睛"一样精准识别细胞

塔尔图大学最新突破:让普通显微镜像"火眼金睛"一样精准识别细胞

塔尔图大学研究团队开发了IAUNet细胞分割系统,这是首个将U-Net与Transformer查询机制结合的生物医学AI技术。该系统能够精确识别明场显微镜下重叠的细胞,性能超越现有方法同时参数更少。研究团队还构建了Revvity-25数据集,包含110张高精度标注图像,每个细胞使用60-400个多边形点精确描绘。IAUNet在多个数据集上均取得最佳性能,为药物研发、疾病诊断等提供重要工具。

不用看到论文全文也能明白:VeriGUI让AI智能体学会"复杂电脑操作"的创新数据集

不用看到论文全文也能明白:VeriGUI让AI智能体学会"复杂电脑操作"的创新数据集

VeriGUI是新加坡南洋理工大学等机构开发的GUI智能体训练数据集,专门用于教AI学会复杂电脑操作。该数据集最大创新是将复杂任务分解为可独立验证的子任务,每个任务平均包含214个操作步骤,涵盖网页和桌面两大场景。目前最先进AI智能体测试成功率仅8.5%,显示了数据集的挑战性,为开发真正实用的数字助理AI奠定了重要基础。

上海AI实验室让AI学会玩转全新软件,不再需要人类手把手教学

上海AI实验室让AI学会玩转全新软件,不再需要人类手把手教学

上海人工智能实验室等机构联合开发了SEAgent,这是一个能够自主学习使用新软件的AI系统。不同于传统需要大量人工标注的AI助手,SEAgent通过自我探索和试错学习,在五种专业软件上将成功率从11.3%提升至34.5%。该系统采用"专家到通才"的训练策略,先培养各软件专家再整合知识,最终性能超越专家组合。研究已开源,为构建真正智能的自适应AI助手提供了新思路。

AI大脑"推理能力"被质疑:亚利桑那州立大学揭示链式思维的真面目

AI大脑"推理能力"被质疑:亚利桑那州立大学揭示链式思维的真面目

亚利桑那州立大学研究团队通过DataAlchemy实验环境发现,大语言模型的链式思维推理能力实际上是一种"海市蜃楼"现象。当面对与训练数据相似的问题时AI表现优秀,但遇到略有差异的情况时推理能力会急剧下降。研究揭示AI更像是在进行精巧的模式匹配而非真正的逻辑推理,对AI实际应用具有重要警示意义。

韩国大学团队推出CoTox:让AI像毒理学专家一样思考药物毒性

韩国大学团队推出CoTox:让AI像毒理学专家一样思考药物毒性

韩国大学研究团队开发的CoTox框架通过整合化学结构、生物通路和基因本体论信息,让AI能够像毒理学专家一样进行逐步推理,预测药物的多器官毒性。该方法在六种毒性类型预测中平均F1分数达到0.663,显著超越传统机器学习和深度学习方法,并能提供详细的毒性机制解释。

社交AI也能拥有情商?卡内基梅隆大学团队的突破性训练方法让机器人学会察言观色

社交AI也能拥有情商?卡内基梅隆大学团队的突破性训练方法让机器人学会察言观色

卡内基梅隆大学等高校研究团队开发出SOTOPIA-RL框架,首次成功训练AI掌握复杂社交技能。该方法通过逐句精细评分和多维度评估,让AI学会在对话中平衡目标达成、关系维护和知识获取。测试显示AI社交表现大幅提升,在困难场景中达成率提升至8.31分,为开发更智能的AI客服、教育和医疗助手奠定基础。

微软突破性框架让AI智能体像学生一样持续进化学习

微软突破性框架让AI智能体像学生一样持续进化学习

微软研究院推出Agent Lightning框架,实现AI智能体的持续学习能力。该框架采用强化学习方法,让任何AI智能体都能通过与环境互动来不断改进性能,无需修改原有代码即可接入。通过训练-智能体解聚架构和统一数据接口,Agent Lightning在文本转SQL、检索增强生成、数学工具使用等多个任务上验证了稳定的性能提升效果。

ChatGPT-5如何加速人类认知能力的衰退

ChatGPT-5如何加速人类认知能力的衰退

ChatGPT-5的统一架构消除了用户选择模型的认知摩擦,自动路由查询到快速或深度思考模式,使用户失去问题分类和框架构建的基本技能。这种无形的认知外包加上商业订阅模式,创造了"认知供应商锁定"效应。专家面临技能衰退和能力错觉的双重威胁,需要通过意识、理解、接受、问责四个维度建立认知抵抗力,主动维护人类独特的思维能力。