最新文章 - 至顶网

西云数据助力航旅智变，实现“运营智能+体验升级+管理提效”三维革新

宁夏西云数据科技有限公司（以下简称“西云数据”）深度参与行业变革进程，深度融合全球前沿技术与中国本土化实践场景，积极支持航旅企业以“运营智能、体验升级、管理提效”为目标，推进业务模式重塑与服务体系革新，加速推进面向未来的智能化重塑。

OnePlus 13将获得专属AI"心智空间"功能

一加正式推出AI功能Plus Mind和Mind Space，将率先在一加13和13R上线。Plus Mind可保存、建议、存储和搜索屏幕内容，并将信息整理到Mind Space应用中。该功能可通过专用按键或手势激活，能自动创建日历条目并提供AI搜索功能。一加还计划推出三阶段AI战略，包括集成大语言模型和个人助手功能，同时将推出AI语音转录、通话助手和照片优化等工具。

电机效率：数据中心AI转型的关键功率分配策略

预计到2035年，数据中心用电需求将增长一倍以上，达到440TWh，相当于整个加利福尼亚州的用电量。AI工作负载预计将占2030年数据中心需求的50-70%。传统冷却系统电机存在功率浪费问题，通常在30-50%负载下运行时效率急剧下降。采用高效率曲线平坦的适配电机可显著降低冷却系统功耗，某大型数据中心通过优化电机配置减少了近4MW冷却功耗，为13500台AI服务器腾出空间，年增收入900万美元。

大型企业AI岗位成IT从业者高薪就业首选

美国薪资调查数据显示，大型企业（员工超过1000人或年收入超过5亿美元）的IT专业人员薪资更高，福利更好，离职率更低。大企业高管级IT职位薪资比小企业高13%，三个层级员工平均年薪多5119美元。科技公司员工薪资比其他行业高5.7%，且差距在扩大。AI需求持续旺盛，首席AI官平均薪资达225945美元，仅次于CIO。然而整体IT薪资增长疲软，仅0.88%，低于通胀率。

Mistral发布首个开源AI音频模型Voxtral

法国AI初创公司Mistral发布首个音频模型家族Voxtral，旨在为企业提供真正可用的语音智能解决方案。该模型可转录30分钟音频，理解40分钟内容，支持问答、摘要生成和语音命令执行。Voxtral支持英语、西班牙语、法语等8种语言，提供24B参数的Small版本和3B参数的Mini版本。定价从每分钟0.001美元起，声称成本不到同类方案的一半。

Google Discover新增AI摘要功能，出版商流量或进一步下滑

Google在其搜索应用的Discover新闻推送中开始推出AI摘要功能，用户将看到多个新闻发布商的标识和AI生成的摘要，而非传统的新闻标题。该功能目前仍在测试阶段，尚未覆盖所有新闻故事。此举引发出版业担忧，因为AI概览等功能已导致网站流量大幅下降。数据显示，全球搜索流量同比下降15%，无点击新闻搜索比例从56%增至69%。尽管Google推出了Offerwall等工具帮助发布商创收，但对许多发布商而言已为时过晚。

北航大学团队推出Easy Dataset：让普通人也能制作AI训练数据的神奇工具

人工智能

数据合成

大语言模型

2025-07-16

北航大学团队推出Easy Dataset：让普通人也能制作AI训练数据的神奇工具

北航团队推出Easy Dataset框架，通过直观的图形界面和角色驱动的生成方法，让普通用户能够轻松将各种格式文档转换为高质量的AI训练数据。该工具集成了智能文档解析、混合分块策略和个性化问答生成功能，在金融领域实验中显著提升了AI模型的专业表现，同时保持通用能力。项目已开源并获得超过9000颗GitHub星标。

人工智能

自然语言处理

网络安全

2025-07-16

网络安全AI助手：让电脑漏洞危险等级一秒识别的RoBERTa智能系统

卢森堡计算机事件响应中心开发的VLAI系统，基于RoBERTa模型，能够通过阅读漏洞描述自动判断危险等级。该系统在60万个真实漏洞数据上训练，准确率达82.8%，已集成到实际安全服务中。研究采用开源方式，为网络安全专家提供快速漏洞风险评估工具，有效解决了官方评分发布前的安全决策难题。

人工智能

推理模型评估

xVerify系统

2025-07-16

人工智能评判官：xVerify如何解决复杂推理模型的评估难题

中国电信研究院等机构联合开发的xVerify系统，专门解决复杂AI推理模型的评估难题。该系统能够准确判断包含多步推理过程的AI输出，在准确率和效率方面均超越现有方法，为AI评估领域提供了重要突破。

只需输入音频就能生成说话人视频？昆仑集团推出的Skywork R1V让AI同时看懂图片和推理数学

多模态推理

视觉语言模型

深度学习

2025-07-16

只需输入音频就能生成说话人视频？昆仑集团推出的Skywork R1V让AI同时看懂图片和推理数学

昆仑公司Skywork AI团队开发的Skywork R1V模型，成功将文本推理能力扩展到视觉领域。该模型仅用380亿参数就实现了与大型闭源模型相媲美的多模态推理性能，在MMMU测试中达到69.0分，在MathVista获得67.5分，同时保持了优秀的文本推理能力。研究团队采用高效的多模态迁移、混合优化框架和自适应推理链蒸馏三项核心技术，成功实现了视觉理解与逻辑推理的完美结合，并将所有代码和权重完全开源。

AI也能学会"反思"？Essential AI发现预训练就能让大模型学会自我纠错

反思能力

预训练模型

自我纠错

2025-07-16

AI也能学会"反思"？Essential AI发现预训练就能让大模型学会自我纠错

Essential AI团队通过系统研究发现，大语言模型的反思能力在预训练阶段就开始萌芽，而非传统认为的仅在强化学习后出现。研究团队对OLMo-2等模型的240个检查点进行测试，发现简单的"Wait,"触发词就能激发模型识别和纠正推理错误的能力。这种反思能力随预训练规模增长而提升，在数学、编程、逻辑推理等六个领域都有体现，为AI系统的高效开发提供了新思路。

人工智能

视频生成

多模态理解

2025-07-16

任何条件都能变成视频：国立新加坡大学联合快手发布Any2Caption，让AI视频生成更懂你的心思

这项研究首次提出了"任意条件到文字描述"的视频生成新模式，通过多模态大语言模型将用户的各种创意输入转化为结构化描述，再驱动现有视频生成系统。研究团队构建了包含33.7万实例的大规模数据集，并设计了创新的渐进式训练策略，实现了对图像、人体姿态、摄像机轨迹等多种条件的统一理解，显著提升了视频生成的可控性和质量。

人工智能

扩散模型

图像生成

2025-07-16

南京大学团队破解AI绘画效率难题：全新"分工合作"让图像生成快4倍

南京大学团队提出DDT（解耦扩散变换器）架构，通过"分工合作"方式将AI绘画中的语义理解和细节生成任务分离。该方法在ImageNet数据集上创下1.31 FID的新纪录，训练效率提升4倍，推理速度提升3倍，为AI图像生成领域带来突破性进展。

视觉推理

多模态大语言模型

强化学习

2025-07-16

机器也要"察言观色"：上海人工智能实验室推出视觉推理新挑战，揭开AI视觉理解的最后一块面纱

上海人工智能实验室等机构联合发布VisuLogic基准测试，专门评估AI的纯视觉推理能力。测试包含1000道人工验证题目，涵盖数量、空间、位置等六类推理任务。结果显示，包括GPT-4o在内的顶级AI模型准确率仅26-28%，远低于人类51.4%的表现，揭示了当前AI在视觉逻辑推理方面的严重不足。研究通过强化学习训练实现了显著提升。

人工智能

模型量化

资源优化

2025-07-16

微软推出史上最高效AI模型：2GB内存跑2千亿参数大模型成为现实

微软研究院开发出革命性的1位大语言模型BitNet b1.58 2B4T，仅需0.4GB内存就能运行2千亿参数规模的AI模型，相比传统模型内存消耗降低90%以上，能耗降低95%，推理速度提升40%，在保持相当性能的同时让AI技术真正实现普及化。

AI侦探诞生记：Allen Institute打造首个能追溯大模型"记忆"的神奇工具

AI行为分析

文本匹配算法

实时追溯系统

2025-07-16

AI侦探诞生记：Allen Institute打造首个能追溯大模型"记忆"的神奇工具

Allen Institute for AI推出首个能实时追溯大语言模型输出到万亿训练数据来源的系统OLMOTRACE。该系统通过创新的并行算法，可在几秒内找到AI回答中与训练数据完全匹配的文本片段，为AI行为分析开创了新范式。支持事实核查、创意溯源等应用，已在AI2 Playground开放使用。

Gartner

AI

2025-07-16

Gartner预测到2027年末，超过40%的代理型AI项目将被取消

Gartner预测到2027年末，超过40%的代理型AI项目将因成本不断攀升、商业价值不明确或风险控制不足而被取消。

人工智能

视觉推理

基准测试

2025-07-16

让AI真正"看懂"并编辑图片：上海交大团队开创视觉推理新基准

上海交大团队首次建立AI视觉推理评估标准RISEBench，测试发现即使最先进的GPT-4o-Image在推理驱动的图像编辑任务中准确率仅28.8%。研究涵盖时间、因果、空间、逻辑四大推理维度，揭示当前AI缺乏真正理解物理规律和逻辑关系的能力，为AI发展指明了从模式识别向深层推理转变的重要方向。

视觉语言模型

长视频理解

轻量级AI模型

2025-07-16

NVIDIA发布Eagle 2.5：小模型也能看懂电影级长视频的突破性技术

NVIDIA研究团队发布了Eagle 2.5，这是一个突破性的视觉语言模型，专门用于长视频理解任务。该模型仅使用80亿参数就在Video-MME等基准测试中达到72.4%的准确率，与GPT-4o等顶级商业模型相当。Eagle 2.5采用了信息优先采样、渐进式训练和专门构建的Eagle-Video-110K数据集，能够处理数小时的长视频内容，为AI视频理解技术的普及化开辟了新路径。

多语言评测

人工智能

大语言模型

2025-07-16

阿里巴巴团队深度解剖2000+多语言评测基准：为什么花费千万美元的AI评测体系仍然"看不懂"人类的真实需求？

阿里巴巴等机构联合研究团队通过分析2021-2024年间148个国家发布的2000多个多语言AI评测基准，发现尽管全球已投入超过1100万美元，但现有评测体系与人类真实判断仍存在巨大鸿沟，特别是在语言理解任务上关联度仅11-30%，远低于数学推理任务的70-85%。

新硅NewGeek

追踪每一个硅基生命的动向

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: