最新文章第28页

2025-08-05

AI天气预报新突破：成都这所大学让多变量气象预测准确率飙升28%

这项来自成都信息工程大学的研究提出了Met2Net模型，通过创新的隐式两阶段训练策略解决了多变量气象预测中的关键难题。该方法为每个气象变量配备独立的编码器-解码器，并采用自注意力机制实现变量间智能融合，在温度和湿度预测上分别实现了28.82%和23.39%的误差降低，为气象预报准确性提升开辟了新路径。

清华大学团队开发"场景画家"：让AI画出前所未有的3D世界之旅

清华大学研究团队开发出ScenePainter系统，能从单张照片生成连续一致的3D场景序列。该技术通过构建"场景概念图"解决了传统AI场景生成中的语义漂移问题，在保持视觉一致性的同时实现内容多样化。系统采用两阶段训练策略，用户测试显示其在质量、多样性和一致性方面均优于现有方法，为游戏、影视等领域提供了新的内容创作工具。

MIT研究团队首创新方法：让AI学会"不确定"，从此告别盲目自信

MIT研究团队首创RLCR方法，通过结合正确性奖励和布里尔评分，训练AI学会表达不确定性。实验显示该方法在保持准确性的同时显著提升校准性能，让AI从盲目自信转向诚实表达，为高风险领域AI应用提供新的可能性，代表AI发展从性能最大化向可靠性转变的重要里程碑。

基因表达分析遇上AI团队：伊利诺伊大学研究团队让电脑自动解读生命密码

伊利诺伊大学研究团队开发了GenoMAS，一个由6个专业AI智能体组成的基因表达分析系统，能像科研团队一样协作编程解决复杂生物信息学问题。该系统通过引导式规划框架平衡结构与灵活性，在GenoTEX基准测试中实现89.13%预处理准确率和60.48%基因识别F1分数，分别比先前最佳方法提升10.61%和16.85%，同时降低44.7%计算成本，代表了科学计算自动化的重要突破。

腾讯PCG推出ARC-Hunyuan-Video-7B：让AI真正"看懂"短视频的魔法

腾讯PCG推出的ARC-Hunyuan-Video-7B是一个专门理解短视频内容的AI模型，能同时处理视频画面、声音和文字，准确把握创作者意图和内容精髓。该模型通过创新的音视频同步技术和时间戳叠加机制，实现了对短视频的结构化理解，在商业应用中显著提升了视频检索和推荐的用户体验。

人工智能学会"边走边想"：中美联合研究团队让AI工具使用更聪明

中美研究团队发现AI使用工具后会出现"思维混乱"现象，提出ARPO训练方法，让AI学会在困惑时智能探索、清晰时高效执行。该方法在13个复杂任务上全面胜出，工具使用效率提升一倍，为构建更智能的AI助手奠定基础。

南洋理工与得州农工团队重磅合作：打破4D空间重建瓶颈，为虚拟世界构建全新智能系统

新加坡南洋理工大学联合国际团队首次提出4D空间智能重建的五层级分类体系，从基础空间感知到物理规律融合，为从视频构建三维动态世界技术发展提供完整路线图，有望革命性改变虚拟现实、机器人和数字内容创作领域。

香港科技大学重磅突破：让AI同时掌握多项技能，就像培养全能学霸一样高效

香港科技大学研究团队开发了Rep-MTL方法，解决AI多任务学习中的相互干扰问题。该方法通过优化AI内部表征空间，既保护各任务独特性又促进跨任务协作，在多个数据集上实现显著性能提升，为培养"全能型"AI系统提供了新思路。

上海交大团队推出SmallThinker：让AI大模型在普通电脑上飞奔的神奇技术

上海交通大学团队开发了SmallThinker AI模型家族，专为本地设备优化。通过创新的稀疏化架构和预注意力路由器，模型在普通CPU上可达20+词/秒生成速度，仅需1-8GB内存。在MMLU等标准测试中表现优异，证明了高效本地AI部署的可能性，为AI技术普及提供了新路径。

RICE：DeepGlint推出让AI能像人类一样精准"看懂"图片细节的新方法

DeepGlint等机构联合发布RICE方法，通过区域感知聚类判别技术显著提升AI的图像细节理解能力。该方法构建了包含20亿区域的大规模数据集，设计了统一的物体识别和文字识别学习框架，在多项任务上超越现有主流模型，特别是在OCR和精细视觉理解方面表现突出，为多模态AI应用提供了更强大的视觉基础。

大语言模型的几何平均策略优化：微软研究院让AI推理更稳定更聪明

微软研究院等机构提出GMPO方法，通过几何平均替代算术平均处理强化学习中的词元级奖励，解决GRPO训练不稳定问题。该方法在数学推理任务上平均提升4.1%准确率，在多模态推理中提升1.4%，同时保持更稳定的重要性采样比率和更高的探索能力，为大语言模型训练提供了更可靠的优化策略。

ChatGPT周活跃用户激增至7亿，GPT-5即将发布

OpenAI宣布ChatGPT周活跃用户将达到7亿，较3月末的5亿用户增长40%，同比增长4倍。公司计划8月初发布GPT-5，该模型将整合o3系列的推理能力，创建统一的AI系统。商业客户增至500万，年收入达130亿美元。面对谷歌、Meta等竞争对手的激烈竞争，OpenAI正通过技术升级和用户体验优化来巩固市场领先地位。

ChatGPT将开始提醒用户休息，但可能还不足以改变不良使用习惯

OpenAI宣布将在ChatGPT中添加"休息提醒"功能，当用户与AI聊天机器人交互时间过长时会弹出提示询问是否需要休息。此举旨在防止成瘾行为，类似于流媒体平台的观看提醒。同时OpenAI还改进了模型以更好地识别用户的心理困扰迹象，并在重大人生决策建议方面更加谨慎。专家建议用户主动设置使用时间限制，避免过度依赖AI工具。

OpenAI取消ChatGPT对话搜索索引功能

OpenAI已移除允许搜索引擎索引ChatGPT对话的功能，以防用户无意中暴露敏感信息。此前有报告显示ChatGPT对话出现在搜索结果中。OpenAI首席信息安全官表示，该功能引入了太多用户意外分享不当内容的风险。尽管有明确警告不要分享敏感内容，用户仍然这样做了。目前OpenAI正努力从搜索引擎中移除已索引的内容，但清理工作尚未完全完成。

Anthropic深入研究AI系统"人格"特质及其"恶性"形成机制

Anthropic公司进行了一项关于人工智能系统个性形成机制的研究，探索了AI系统获得特定"个性"特征的原因，以及导致其产生"恶意"行为的潜在因素。该研究旨在深入理解AI系统的行为模式和决策机制，为开发更安全、更可控的人工智能技术提供理论基础。

苹果CEO库克：AI是必须攻克的技术，公司将全力投资发展

苹果首席执行官蒂姆·库克在最新表态中强调，苹果公司"必须"在人工智能领域取得突破，并承诺将为此进行必要的投资。库克的这一表态显示了苹果对AI技术发展的重视程度，以及公司在人工智能赛道上追赶竞争对手的决心。

MinIO融合对象存储与表格数据为生成式AI工作负载提供统一存储

MinIO正成为AI多模态数据存储平台，为AI提供数据访问和使用工具。该公司意识到自己本质上是键值数据库公司，键值存储可同时容纳非结构化对象数据和结构化表格数据。对于结构化数据，MinIO通过AI生成代码来理解表格数据结构，而非传统的向量化方式。MinIO支持KV缓存卸载，并提供promptObject API，让用户可像与LLM对话一样查询非结构化对象，桥接了对象存储、向量数据库和SQL数据库访问。

云计算

人工智能

平台业务

2025-08-05

AI推动云计算三巨头增长，微软优势最明显

在截至6月的季度中，微软、亚马逊AWS和谷歌云三大云服务提供商都受益于AI技术的推动。微软凭借其庞大的平台和应用客户基础，在AI功能集成方面表现突出，核心系统业务收入达222.7亿美元，同比增长36.8%。AWS在AI基础设施上投入巨大，资本支出达331亿美元。谷歌云收入136.2亿美元，营业收入同比增长2.4倍。微软目前拥有全球最大且最具盈利能力的平台业务。

人工智能

操作系统

产品迭代

2025-08-05

OpenMind要做人形机器人的安卓操作系统

硅谷初创公司OpenMind正在开发名为OM1的机器人软件层，旨在成为人形机器人的操作系统。该公司将自己比作机器人领域的安卓系统，因其软件开源且硬件无关。公司还推出了FABRIC协议，允许机器人验证身份并与其他机器人共享信息。OpenMind计划9月前交付首批10台搭载OM1系统的机器狗，并已完成由Pantera Capital领投的2000万美元融资。

操作系统

不可变发行版

KDE桌面

2025-08-05

KDE Linux从香蕉项目演进为预览版，现已开放测试

原名"Project Banana"的KDE Linux是一个全新的桌面Linux发行版，旨在展示KDE桌面项目。该项目目前处于预览测试阶段，已在KDE官网公开发布。KDE Linux采用不可变设计，基于Arch Linux构建，使用双只读Btrfs根分区交替更新。与演示用途的KDE Neon不同，KDE Linux定位为超稳定的日常使用系统，仅支持沙盒化应用安装，系统更新采用完整镜像方式。

Linkloud

GO global, BE global.

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: