最新文章
KAIST团队打造全能AI检索助手:一个系统搞定文字、图片、视频所有问题

KAIST团队打造全能AI检索助手:一个系统搞定文字、图片、视频所有问题

KAIST研究团队开发出革命性AI检索系统UniversalRAG,首次实现跨文字、图片、视频的智能信息路由。该系统能根据问题特点自动选择最合适的信息类型和详细程度,在8个基准测试中显著优于传统方法,平均性能提升15-20%,同时将计算开销降低50-75%。

从零起步也能做推理大模型?StepFun和清华大学揭秘超高效训练的神奇配方

从零起步也能做推理大模型?StepFun和清华大学揭秘超高效训练的神奇配方

StepFun和清华大学联合提出Open-Reasoner-Zero,这是首个开源的大规模推理导向强化学习训练框架。该方法采用极简的vanilla PPO算法直接在基础模型上训练,无需复杂预处理,仅用十分之一训练时间就在多个数学推理基准上超越了DeepSeek-R1-Zero。研究证明了简单方法在AI推理训练中的强大潜力。

NVIDIA团队突破性成果:让AI精准描述图片和视频中的任何细节

NVIDIA团队突破性成果:让AI精准描述图片和视频中的任何细节

这项NVIDIA团队的突破性研究解决了AI视觉理解中的精确局部描述难题。通过创新的聚焦提示技术和本地化视觉架构,DAM模型能够准确描述图片和视频中任何指定区域的详细内容,性能显著超越现有方法,为医疗诊断、教育辅助、无障碍技术等领域开辟了新的应用前景。

从保护到攻击:卡内基梅隆大学团队让AI模型学会"藏私"的巧妙方法

从保护到攻击:卡内基梅隆大学团队让AI模型学会"藏私"的巧妙方法

卡内基梅隆大学研究团队开发出"反蒸馏采样"技术,能让AI模型在保持正常性能的同时,阻止竞争对手通过观察推理过程来复制模型能力。这种方法巧妙地在模型输出中加入"毒性"内容,对人类用户无害但会干扰机器学习过程,为AI公司提供了新的知识产权保护手段。

大学新突破:让AI专家系统"更聪明"的秘密配方——约翰斯·霍普金斯大学团队发现如何让机器在考试时临场发挥

大学新突破:让AI专家系统"更聪明"的秘密配方——约翰斯·霍普金斯大学团队发现如何让机器在考试时临场发挥

约翰斯·霍普金斯大学团队发现AI专家混合系统存在10-20%的性能损失,开发出C3PO方法通过测试时动态优化专家选择策略,让1-3亿参数的小模型超越7-9亿参数大模型,在六个基准测试上提升7-15%准确率,为资源受限环境下部署高性能AI系统提供新方案。

新加坡国立大学最新突破:让AI当法官,推理能力决定评判准确性

新加坡国立大学最新突破:让AI当法官,推理能力决定评判准确性

新加坡国立大学研究团队开发了JudgeLRM,一个专门用于评判AI系统表现的模型。研究发现传统训练方法在需要复杂推理的评判任务上效果较差,因此采用强化学习训练JudgeLRM,使其具备真正的推理能力。JudgeLRM-3B甚至超越GPT-4,JudgeLRM-7B击败DeepSeek-R1,在推理密集型任务上表现尤为突出,为AI评估领域带来范式转变。

人工智能在数学奥赛中的巅峰突破:ByteDance团队让AI学会了使用代码工具

人工智能在数学奥赛中的巅峰突破:ByteDance团队让AI学会了使用代码工具

ByteDance研究团队提出ReTool框架,通过强化学习让大型语言模型学会在数学推理中战略性使用代码工具。该方法在AIME数学竞赛中达到67%准确率,比传统文本推理方法提升27个百分点,训练效率提高近3倍,展现了工具增强推理的巨大潜力。

SailGP英国赛事部署私有和公共5G SA网络切片技术

SailGP英国赛事部署私有和公共5G SA网络切片技术

全球帆船锦标赛SailGP与BT集团和爱立信合作,在英国朴茨茅斯赛事中部署5G独立组网切片技术。该技术为时速100公里的F50双体帆船提供实时数据传输,支持裁判通过5G直播摄像头执法,并为12支参赛队伍提供战术分析。爱立信私有5G网络覆盖赛事场地,BT提供专用网络切片支持船只连接、支付终端和媒体上传,并试验360度增强现实体验。

Anthropic推出专为金融服务设计的Claude专业版

Anthropic推出专为金融服务设计的Claude专业版

Anthropic推出首个行业定制版AI产品Claude for Financial Services,专为金融行业打造。该服务基于Claude企业版,提供更高使用限制、内置数据连接器以及提示词库。新版本预装了连接FactSet、PitchBook等金融数据提供商的MCP连接器,并包含实施支持。针对金融分析师工作负载大的特点,该服务显著提升了速率限制,同时提供提示词库帮助用户更好地构建查询。

AI编程工具正向终端转移:生成式AI的新趋势

AI编程工具正向终端转移:生成式AI的新趋势

多年来,Cursor、Windsurf和GitHub Copilot等代码编辑工具一直是AI编程的标准。但随着代理AI能力增强,AI系统正从处理代码转向直接与系统终端交互。Anthropic、DeepMind和OpenAI都推出了命令行编程工具。终端工具采用更广阔视角,不仅关注代码,还涉及整个程序运行环境,包括DevOps任务。研究显示传统代码助手可能降低效率,而Warp等终端工具在TerminalBench基准测试中表现出色,能够自主处理开发者的非编码工作。

研究领导者呼吁科技行业监控AI的"思维"过程

研究领导者呼吁科技行业监控AI的"思维"过程

来自OpenAI、谷歌DeepMind、Anthropic等公司的AI研究人员发表联合立场文件,呼吁深入研究监控AI推理模型"思维链"的技术。思维链是AI模型解决问题的外化过程,类似人类使用草稿纸解题。研究人员认为思维链监控可能是控制AI智能体的核心方法,但这种透明度可能是脆弱的,需要更多研究来保持其可监控性。

特斯拉终于进入印度市场 九年磨一剑首家展厅开业

特斯拉终于进入印度市场 九年磨一剑首家展厅开业

特斯拉在孟买开设首家体验中心,正式进入印度市场,距离马斯克2016年首次预告已过去九年。该体验中心位于孟买中央商务区,展示从上海进口的Model Y车型。后驱版售价约68000美元,长续航版约79000美元。印度客户今日起可预订,三季度开始交付。特斯拉计划在孟买和德里建设四个充电站,本月晚些时候将在德里开设第二家门店。

Broadcom推出Tomahawk Ultra:以太网能否取代UALink?

Broadcom推出Tomahawk Ultra:以太网能否取代UALink?

博通推出Tomahawk Ultra交换芯片,主张以太网技术可替代新兴的UALink协议。该51.2 Tbps交换ASIC专门针对高性能网络调优,延迟低至250纳秒,支持1024个加速器的扩展系统。博通认为以太网在监控、遥测和调试工具方面具有优势,无需等待UALink硬件开发完成。相比之下,AMD等厂商仍在推进UALink协议,目前通过以太网隧道传输UALink来实现机架级系统部署。

自主性、服务区域、通用性 - 真正机器人出租车的核心要素

自主性、服务区域、通用性 - 真正机器人出租车的核心要素

随着多家公司进入机器人出租车领域,如何判断其技术成熟度成为关键问题。真正的机器人出租车需要满足五个基本要求:无需人工监督的安全自主驾驶、在公共道路运营、商业可行的服务区域、向公众开放服务,以及提供点对点的通用出行服务。其中最关键的是实现"押注生命"级别的安全自主驾驶,这要求系统能连续完成10万次驾驶而无重大事故。

C-Gen.AI推出GPU编排平台,旨在提升AI数据中心效率

C-Gen.AI推出GPU编排平台,旨在提升AI数据中心效率

人工智能基础设施初创公司C-Gen.AI推出新平台,帮助数据中心运营商自动化部署并最大化利用昂贵的AI硬件资源。该GPU编排平台能够在几分钟内自动部署AI集群,实时监控并确保最高效率运行。通过动态重新分配闲置GPU资源处理推理任务,平台确保资源零浪费,为AI初创企业、数据中心运营商和大型企业提供可扩展的成本效益解决方案。

Nextdoor推出AI推荐功能重新设计应用界面

Nextdoor推出AI推荐功能重新设计应用界面

邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。

英国生物银行完成NHS全身成像项目创纪录成就

英国生物银行完成NHS全身成像项目创纪录成就

英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。

2025-07-15

关税凸显了韧性供应链的必要性

一些投资分析师提到,由于高价格和供应短缺,短期和中期内消费者对相关产品的需求将持续疲软。美国制造商已报告,由于对未来关税发展的不确定性,销售和全球业务都受到了抑制。

首款推理型智能体来了!微软研究助手+分析助手,帮你更聪明地工作
2025-07-15

首款推理型智能体来了!微软研究助手+分析助手,帮你更聪明地工作

微软全新推出的研究助手( Researcher)与分析助手(Analyst ),让多步骤调研和深度数据分析变得像对话一样简单。无论是关键商业谈判,还是从海量数据中发现规律,这两款专为工作场景设计的推理助手,助你分钟级解锁专业级洞察力。

F5推出后量子密码学解决方案,助力企业应对新一代安全威胁
2025-07-15

F5推出后量子密码学解决方案,助力企业应对新一代安全威胁

企业亟需部署PQC 就绪策略,以保障资产安全、维护客户信任并满足合规性要求。