最新文章第18页

2025-09-25

这个AI"学霸"掌握了万物规律：清华团队让大语言模型变身超级数据分析师

中科院大学等机构联合开发的MachineLearningLM突破了大语言模型在数据分析方面的局限。该系统通过300万个合成任务的训练，能够在看到数百个例子后自动掌握各种数据预测规律。测试显示，它在金融、医疗等领域的分析准确率显著超越传统模型，同时保持了优秀的语言理解能力，为实现真正的通用人工智能分析系统开辟了新路径。

人工智能

语音识别

评估框架

2025-09-25

ServiceNow推出音频大模型评估神器：AI语音助手测评从此不再头疼

ServiceNow团队开发的AU-Harness是首个专门针对AI语音助手的综合评估工具包。该工具通过创新的并行处理和标准化测试协议，将评估效率提升127%，涵盖19项测试任务。研究引入了两个全新测试类别：时间感知的对话分离和复杂的口语推理能力。通过380多项测试揭示，当前AI语音模型在基础识别方面表现良好，但在复杂推理和时间理解上仍存在显著差距，为未来技术改进指明了方向。

人工智能

自然语言处理

多语言模型

2025-09-25

约翰霍普金斯大学推出MMBERT：一个会说1800多种语言的AI模型

约翰霍普金斯大学研究团队开发了MMBERT多语言AI模型，采用渐进式学习策略训练超过1800种语言。该模型通过逆向掩码调度和温度采样等创新技术，在多项基准测试中超越XLM-R等现有模型，甚至在部分小语种任务上超过OpenAI o3和Google Gemini。模型运行速度比同类产品快2-4倍，已开源发布。

人工智能

3D空间理解

自动驾驶技术

2025-09-25

华为研究团队首创3D空间理解基准测试：让AI像人类一样理解多视角世界

华为科技团队开发出首个多视角3D空间理解基准测试Ego3D-Bench，包含8600个测试样本，覆盖距离测量、定位、运动推理等任务。同时推出Ego3D-VLM解决方案，通过构建文字版认知地图显著提升AI空间理解能力，多选题准确率提升12%，距离估算误差减少56%，为自动驾驶和机器人应用提供关键技术支撑。

人工智能

牙科影像分析

专业数据集

2025-09-25

香港大学团队打造首个牙科全景X光智能分析系统，AI医生能看懂你的口腔健康吗？

香港大学团队构建了全球首个大规模牙科全景X光AI数据集MMOral，包含2万余张影像和130万条指令数据。研究发现现有AI模型在牙科诊断上表现不佳，最强的GPT-4o仅达41%准确率。团队开发的专业模型OralGPT经训练后准确率提升24.73%，为AI在牙科医学的应用奠定基础。

软件安全

深度学习

跨域泛化

2025-09-25

博尔扎诺自由大学团队首创跨领域AI代码漏洞检测：工业软件安全防护新突破

意大利博尔扎诺自由大学团队开发了首个跨领域AI代码漏洞检测系统AI-DO，成功将学术研究转化为工业实践。研究证明用开源数据训练的AI模型能够有效检测工业软件漏洞，性能下降仅约10%。该系统已在真实企业环境中部署测试，为软件安全防护提供了新的解决方案，标志着AI安全检测技术从实验室走向实际应用的重要突破。

人工智能

网络安全

自动化漏洞检测

2025-09-25

德州农工大学开发的"模糊大脑"系统：用AI在网络安全竞赛中找出软件漏洞并自动修复

德州农工大学研究团队开发的FuzzingBrain系统，结合大语言模型和传统模糊测试技术，能够自动发现软件安全漏洞并生成修复补丁。在DARPA人工智能网络挑战赛中获得第四名，成功发现28个漏洞包括6个零日漏洞。系统采用大规模并行架构，实现了智能化的漏洞检测和修复流程，为网络安全防护提供了新的技术路径。

机器人也能像人类一样通过物体导航了？阿德莱德大学的新突破让机器人告别"老眼昏花"

机器人导航

物体识别

空间感知

2025-09-25

机器人也能像人类一样通过物体导航了？阿德莱德大学的新突破让机器人告别"老眼昏花"

阿德莱德大学研究团队开发了ObjectReact系统，让机器人能像人类一样通过物体关系而非图像匹配进行导航。该方法构建三维物体关系地图，使用WayObject代价地图引导机器人朝低代价区域移动。实验显示这种方法在复杂导航任务中显著优于传统方法，且对机器人身高变化具有强鲁棒性，真实环境测试证明了其实用性。

机器人控制技术

视觉-语言-动作模型

轻量级人工智能

2025-09-25

0.5B参数也能超越7B模型？西湖大学团队让机器人操控成本狂降38倍

西湖大学团队开发出VLA-Adapter机器人控制系统，仅用0.5B参数就超越了7B参数的传统系统。该系统通过Bridge Attention机制实现视觉-语言-动作的高效转换，训练成本降低38倍，推理速度快3倍，在LIBERO测试中达到97.3%成功率。创新点在于设计专门的信息桥接机制而非单纯扩大模型规模，为机器人控制技术普及提供了新路径。

人工智能

智能体

2025-09-25

阿里云瓴羊发布企业级AI智能体服务平台AgentOne，成就AI时代的“超级公司”

有越来越多的“超级公司”已在现实中初现雏形。

人工智能

模型上下文协议

数据访问优化

2025-09-25

谷歌让AI更易获取真实世界数据

谷歌发布数据共享模型上下文协议服务器，使开发者和AI智能体能够通过自然语言访问真实世界统计数据。该服务整合了政府调查、行政数据和联合国等全球机构的公共数据集。新服务旨在解决AI系统训练中常见的数据噪声和幻觉问题，为AI提供可验证的结构化信息。谷歌还与ONE Campaign合作推出数据智能体工具，该开源服务器兼容任何大语言模型。

人工智能

大语言模型

多模型集成

2025-09-25

微软为Copilot引入Anthropic AI模型

微软宣布从周三开始将Anthropic的AI模型集成到其Copilot助手中，此前该助手主要依赖OpenAI技术。企业用户可在OpenAI的深度推理模型和Anthropic的Claude Opus 4.1、Claude Sonnet 4之间选择，用于复杂研究和构建定制AI工具等任务。此举标志着微软与OpenAI这对曾经独家合作伙伴关系的进一步松动。

AI训练新模式：群体智慧让小型语言模型变得更聪明——Gensyn团队的分布式协作训练突破

人工智能

分布式训练

协作学习

2025-09-25

AI训练新模式：群体智慧让小型语言模型变得更聪明——Gensyn团队的分布式协作训练突破

Gensyn团队提出SAPO分布式AI训练方法，让普通设备通过分享学习经验协作训练语言模型。实验显示，采用50%本地和50%外部经验的均衡策略，小型AI模型性能提升94%。该方法避免了传统分布式训练的同步瓶颈，为AI训练民主化开辟新路径。

人工智能

自然语言处理

语用理解

2025-09-25

英国曼彻斯特大学研究团队发现：AI语言模型竟然无法理解"高深的废话"

曼彻斯特大学研究团队发现，尽管AI语言模型在多数任务中表现优异，但在理解"Drivelology"（一种表面荒诞但蕴含深意的语言现象）时却频频失误。研究团队构建了涵盖六种语言的1200多个样本数据库，通过四项测试发现AI模型难以掌握这类文本的讽刺意图和文化内涵，揭示了当前AI在语用理解方面的根本局限。

人工智能

蛋白质折叠预测

轻量级模型

2025-09-25

苹果推出SimpleFold：轻量级蛋白质折叠预测AI模型

苹果研究人员开发出SimpleFold，这是一个轻量级的蛋白质折叠预测AI模型。与谷歌DeepMind的AlphaFold等需要极其昂贵计算资源的模型不同，SimpleFold采用流匹配模型技术，跳过多个去噪步骤，降低计算成本并提升生成速度。研究团队训练了从1亿到30亿参数的多个版本，在CAMEO22和CASP14基准测试中表现出色，且模型规模越大性能越好。

新能源技术

燃料电池

现场发电

2025-09-25

燃料电池能否成为数据中心现场供电的下一个重大突破？

数据中心现场发电能力可提升可靠性并满足不断增长的能源需求，但传统发电厂建设复杂昂贵。燃料电池提供了替代方案，能以更简单、可扩展的方式现场发电。微软、Equinix和亚马逊等公司已开始试用燃料电池作为主备电源。燃料电池具有可扩展性、可持续性和现场部署优势，但成本较高且燃料获取困难。

医疗技术

医学影像

轻量级设备

2025-09-25

Chipiron如何重新定义MRI技术的未来

医疗设备融资达到2021年以来最高水平，但MRI设备仍面临成本高昂、仅限大医院使用的问题。巴黎初创公司Chipiron创始人兼CEO Evan Kervella分享了解决方案。传统MRI依赖超导磁体和液氦，难以规模化。Chipiron正开发轻量级MRI技术，注重安装便利性和患者体验，不与传统设备竞争，而是让MRI技术在更多场所普及应用。

人工智能

软件开发

统一平台

2025-09-25

Modular获2.5亿美元融资，简化AI硬件部署

AI初创公司Modular完成2.5亿美元C轮融资，估值达16亿美元。该公司提供统一平台，让开发者无需重写代码即可在不同芯片上运行AI应用，包括CPU、GPU、ASIC和定制芯片。公司旨在打破英伟达CUDA的垄断局面，为企业提供更多硬件选择自由。其平台已支持英伟达、AMD和苹果架构，在新一代加速器上性能提升20%-50%。

人工智能

自然语言处理

标准化接口

2025-09-25

Google推出数据公地MCP服务器，为AI智能体提供可信数据支撑

谷歌发布Data Commons模型上下文协议服务器，为AI开发者提供标准化访问公共数据集的新工具。该服务器连接谷歌2018年推出的开放知识库Data Commons，整合经济、健康、人口和环境等领域的公共数据集。通过标准化接口，AI系统可直接查询数据而无需管理复杂API，有效减少模型幻觉问题，为构建数据驱动的智能体应用奠定基础，提升AI输出的准确性和可信度。

操作系统

桌面环境

用户体验优化

2025-09-25

Zorin OS 18 测试版让Linux看起来不像Linux

Zorin OS 18测试版基于Ubuntu 24.04构建，采用GNOME 46桌面环境但进行了大量定制修改。新版本增加了浮动任务栏、改进的窗口平铺功能和多种桌面布局选项，旨在帮助Windows用户更轻松地迁移到Linux。该系统提供免费的Core版本和付费的Pro版本，后者包含更多软件和桌面布局。虽然发布时间较长，但Zorin注重完善用户体验和易用性改进。

Linkloud

GO global, BE global.

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: