最新文章第15页

2025-08-14

阿里巴巴团队发布突破性研究：揭开大语言模型强化学习的"黑盒子"，两种技术组合竟能超越复杂算法

阿里巴巴联合多所知名院校的研究团队，通过系统性实验揭开了大语言模型强化学习技术选择的迷雾。他们发现仅用两种核心技术组合的Lite PPO方法，就能超越使用多种复杂技术的主流算法，证明了在AI训练中"极简主义"的有效性，为业界提供了清晰的技术选择指南。

电大数据竟然阻碍了机器人学习？中科大团队揭秘数据集的"暗黑面"

中科大研究团队发现大型机器人数据集存在"捷径学习"问题：机器人虽然数据量庞大，但因数据内部多样性不足和碎片化严重，容易依赖表面特征而非真正理解任务。研究通过理论分析和实验验证了这一现象，并提出视角增强和物体替换等数据增强解决方案，为机器人学习领域提供重要指导原则。

蚂蚁集团携手西湖大学等机构：如何让万亿参数AI大模型瘦身30%却依然强大如初？

蚂蚁集团联合西湖大学推出MoBE技术，通过创建共享基础知识库的方式，成功将万亿参数AI模型压缩30%，性能损失仅为2%。该技术突破了传统压缩方法7%-14%性能损失的瓶颈，有望大幅降低AI部署成本，推动强大AI能力的普及应用。研究团队已开源相关代码。

GLiClass：轻量级文本分类的全能新秀，从乌克兰基辅走向世界的AI突破

GLiClass是由乌克兰基辅Knowledgator工程公司开发的创新文本分类模型，基于GLiNER架构改进而成。该模型通过联合编码文本和标签，在单次前向传递中完成多标签分类，实现了准确性与效率的完美平衡。测试显示，GLiClass不仅在准确性上超越强基准模型5.5%，处理速度更是比传统交叉编码器快2.3-16倍，特别是在大标签集场景下优势明显。模型已开源并提供多个规模版本以适应不同应用需求。

UNC研究团队推出Bifrost-1：用"补丁级CLIP"让AI既能看又能画，训练成本骤降90%！

北卡大学研究团队推出Bifrost-1系统，通过创新的"补丁级CLIP潜在变量"技术，成功让多模态大语言模型和扩散模型高效协作，实现了既能理解又能创作图像的AI助手。该方法避免了传统技术的高成本训练问题，在保持原有理解能力的同时，以90%的成本降幅实现了与顶级方法相当的图像生成质量，为多模态AI发展提供了全新的"桥接"思路。

人工智能学会说数学：AIRI研究院首次让机器听懂方程式并转换为LaTeX格式

俄罗斯AIRI研究院联合斯科尔科沃理工学院首次系统性解决了语音数学表达式转换问题，开发出能将口述数学公式准确转换为LaTeX格式的AI系统。研究团队构建了包含66,000个人工标注样本的大规模多语种数据集，采用语音识别后处理和端到端多模态两种方法，在数学表达式转换任务上取得了27-30%的字符错误率，显著优于现有技术，为自动化数学教育和学术交流提供了重要技术基础。

AI测试比人类更难的搜索任务：ByteDance研究揭示搜索代理的致命弱点

ByteDance研究团队通过WideSearch基准测试发现，当前最先进的AI搜索代理在大规模信息收集任务上表现极差，成功率普遍低于5%。研究揭示了AI在任务规划、反思调整、证据验证和知识幻觉等方面的根本缺陷，为未来发展多代理协作系统和改进AI搜索能力提供了重要指导。

人工智能界的"评委"进阶记：中国人民大学等机构如何让AI重新学会"看懂"文本的含金量

这项由中国人民大学、百度和卡内基梅隆大学合作的研究开发出ReasonRank系统，通过创新的数据合成和两阶段训练方法，让AI具备了真正的推理能力进行文本排序。该系统在复杂推理任务中比现有最强系统高出3-5个百分点，同时运行速度提升2-2.7倍，为推理式信息检索开辟了新方向。

快手科技团队推出Klear-Reasoner：让AI像人类一样深度思考的革命性突破

快手科技团队开发的Klear-Reasoner在AI推理领域取得重大突破，在数学竞赛AIME2024中获得90.5%高分。该研究完全公开训练细节，提出创新的GPPO方法解决传统强化学习局限，证明精选高质量数据比大量普通数据更有效，为AI推理能力提升提供了新的技术路径。

当AI聊天助手遇上挑剔用户：Salesforce如何让机器真正理解你的心思

Salesforce AI Research联合伊利诺伊大学开发的UserBench研究揭示了当前AI助手的重大缺陷：尽管技术上表现出色，但在理解用户真实需求方面表现糟糕。最先进的AI模型完全满足用户需求的成功率仅20%，发现隐性偏好的能力不足30%。这项研究创建了专门的用户中心评估环境，为开发真正理解用户、能够成为人类理解型伙伴的AI助手指明了方向，标志着AI发展从"任务执行者"向"用户协作者"的重要转变。

人工智能

深度搜索

评测基准

2025-08-14

AI搜索智能体遭遇新挑战：滑铁卢大学团队提出更公平透明的评测新标准

滑铁卢大学团队发布BrowseComp-Plus基准测试，解决AI搜索智能体评测中的公平性、透明度和可及性问题。通过构建包含830个问题和10万文档的固定数据集，研究发现检索系统质量是影响AI搜索表现的关键因素，开源与闭源模型在工具使用能力上存在巨大差距。

是德科技

2025-08-14

AI的隐藏瓶颈：网络如何影响企业LLM战略

长期以来，对AI网络进行基准测试和优化都需要在昂贵、耗电的GPU上运行实时工作负载。但GPU的可用性有限，而且大规模测试环境的配置需要时间和资金。因此，网络验证往往要推迟到实际工作负载运行时才能进行——这对于发现设计缺陷或性能瓶颈来说已经太迟了。

人工智能

自然语言处理

群聊优化

2025-08-14

Continua获800万美元融资，让智能体在群聊中大显神威

前谷歌资深工程师David Petrou创立的AI初创公司Continua宣布完成800万美元种子轮融资，由GV领投。该公司开发AI智能体技术，可加入SMS、iMessage和Discord等群聊平台，为用户协作提供智能支持。Continua能够在群聊中自动设置提醒、发起投票、添加日历邀请或生成待办清单，解决群聊混乱问题。公司通过微调技术让AI理解群聊动态，具备社交智能，只在需要时提供帮助。

人工智能

自然语言处理

模型优化

2025-08-14

Anthropic的Claude AI模型现可处理更长的提示内容

Anthropic宣布为企业客户增加Claude单次提示词的信息处理量，以吸引更多开发者使用其AI编程模型。Claude Sonnet 4现支持100万token上下文窗口，可处理75万词或7.5万行代码的请求，是此前限制的5倍，超过OpenAI GPT-5的40万token。该功能也将通过Amazon Bedrock和Google Cloud等云合作伙伴提供。更大的上下文窗口有助于AI模型更好地处理软件工程问题和长期自主编程任务。

人工智能

自然语言处理

市场增长

2025-08-14

AI陪伴应用收入激增，2025年有望突破1.2亿美元

根据应用情报公司Appfigures数据，全球337款活跃且盈利的AI伴侣应用中，128款于2025年发布。这类应用通过让用户与定制角色对话来拟人化AI交互，包括朋友、恋人、幻想角色等。2025年上半年该市场已产生8200万美元收入，预计年底将超1.2亿美元。热门应用包括Replika、Character.AI等。截至7月，全球下载量达2.2亿次，上半年同比增长88%。数据显示17%的应用名称包含"女友"一词。

2025-08-14

SIGGRAPH｜智能体认知体系“跃迁” NVIDIA Nemotron、Cosmos Reason“双轨” 定义信息与物理边界“推理范式”

NVIDIA于SIGGRAPH上宣布扩展两类面向推理任务的模型体系

人工智能

搜索引擎

市场竞争

2025-08-14

Perplexity出价345亿美元欲收购Chrome浏览器

AI搜索公司Perplexity提出以345亿美元收购谷歌Chrome浏览器，这一报价约为其自身估值的两倍。这家成立近三年、估值180亿美元的初创公司刚推出基于Chromium的浏览器Comet。Chrome拥有全球67.9%的市场份额，约38亿用户。美国法官正在考虑是否强制谷歌剥离Chrome以恢复搜索市场竞争，OpenAI等AI公司也对此表示兴趣并准备推出自己的浏览器。

人工智能

网络基础设施

业绩增长

2025-08-14

思科AI基础设施订单激增推动强劲财报表现

思科系统公司第四财季业绩超预期，营收147亿美元同比增长8%，净利润40亿美元。AI基础设施订单本季度达8亿美元，全年达20亿美元，是原定目标的两倍以上。网络业务增长12%，安全产品增长9%。云业务同比增长49%，连续四个季度在大规模网络客户中实现三位数订单增长。公司预计下季度营收146.5-148.5亿美元。

人工智能

自然语言处理

新型算法

2025-08-14

SEO已死，大语言模型时代企业如何重塑营销策略？

随着ChatGPT等AI聊天机器人成为"互联网入口"，传统SEO面临颠覆。企业开始关注如何在AI生成的答案中获得更好展示。Evertune等初创公司应运而生，通过每月运行数百万次提示来帮助企业监测品牌在AI回答中的表现。同时，Perplexity出价345亿美元收购Chrome浏览器，OpenAI发布GPT-5模型，显示AI搜索领域竞争加剧。

人工智能

大语言模型

用户体验优化

2025-08-14

OpenAI的GPT-5表现不佳，被迫重新添加模型选择开关

OpenAI在GPT-5发布后遭遇用户强烈反对，被迫进行调整。CEO阿尔特曼宣布为GPT-5增加"自动"、"快速"和"思考"三种模式选择，并恢复4o模型。付费用户可通过"显示其他模型"开关访问o3、4.1等模型。阿尔特曼承认突然弃用旧模型是错误决定，并表示正在优化GPT-5的个性化设置，让其比当前版本更温和但不像GPT-4o那样令人烦恼。

于游的碎碎念

技术分享，生活分享，基本上想发啥就发啥

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: