最新文章第18页

AI再次突破视觉评价：一个能像人类一样"品鉴"图片质量的智能系统 —— 香港中文大学最新研究

香港中文大学研究团队开发出HPSv3图片质量评价系统，能像人类一样准确判断图片美观度和质量。该系统基于108万张图片的HPDv3数据集训练，涵盖AI生成图片到真实摄影作品的完整质量范围。团队还提出CoHP优化方法，通过智能选择和迭代改进显著提升图片生成质量，在用户测试中获得87%偏好率，为AI图片生成领域提供了重要突破。

华中科大团队破解AI网页设计痛点：让机器像人类一样"分块思考"生成代码

华中科技大学研究团队开发的LaTCoder通过"分而治之"策略解决AI网页代码生成中的布局保持难题。该方法将复杂网页设计分割为小块，逐块生成代码后智能拼接，在多个评估指标上显著优于现有方法。团队还构建了更具挑战性的CC-HARD数据集，为行业提供了新的测试标准。这项技术有望大幅降低网页开发门槛，推动设计到代码的自动化转换。

让AI大模型"减肥"：清华大学和微软联手解决对话机器人内存爆炸问题

清华大学和微软联合开发的LeanK技术通过智能识别AI记忆系统中的重要性模式，实现了70%的内存节省和30%以上的速度提升，同时几乎不影响对话质量。该技术采用两阶段训练方法学习静态重要性分布，可与其他优化方法组合使用，为长对话AI的普及应用奠定了基础。

清华等顶尖高校联手开发Web-CogReasoner：首个像人类一样"逐步学习"的智能网页助手

这项由11所知名高校联合完成的研究开发了Web-CogReasoner智能网页助手，创新性地采用类似人类学习的三阶段训练方法：记忆、理解、探索。通过17万个样例的系统化训练，该AI助手在复杂网页操作中表现卓越，整体准确率达84.4%，在知识密集型网站上成功率超过55%，为AI助手的发展提供了全新思路。

清华大学团队创新AI工具：让机器人学会主动"忘记"无关信息，像人类一样聪明思考

清华大学团队开发了Sculptor认知管理框架，解决AI处理长文本时的"主动干扰"问题。通过信息分解、动态隐藏、智能搜索等工具，让AI学会主动管理工作记忆，像人类一样筛选重要信息。实验显示在复杂推理任务中性能显著提升，为AI认知智能发展开辟新方向。

微软研究院：用一段视频就能制作出动态3D物体，比传统方法快了几百倍！

微软研究院与中国科技大学合作开发的高斯变化场扩散模型，实现了从单个视频快速生成高质量动态3D内容的突破。该技术将传统需要数小时的3D动画制作过程缩短至4.5秒，通过创新的变分自编码器和扩散模型设计，有效解决了4D内容生成中的数据构建困难和高维度建模挑战，在多项评估指标上显著超越现有方法，为电影制作、游戏开发、虚拟现实等领域提供了革命性的内容生成工具。

新加坡国立大学重磅报告：AI学术会议正走向崩溃边缘！

新加坡国立大学研究团队通过数据分析揭示，当前AI学术会议面临四大危机：研究人员年均发表超过4.5篇论文、会议碳排放超过主办城市日排放量、71%相关讨论呈负面情绪、会场容量不足需抽签限制参与。研究提出社区联邦会议模式，将传统集中式会议分解为全球评议系统、地区小型中心和数字协作平台三层架构，以实现可持续的学术交流。

ChatGPT重新将4o作为选项带回，因为用户对其念念不忘

由于用户对ChatGPT 4o模型的强烈需求和怀念，OpenAI决定重新将4o作为可选项推出。这一决定反映了用户对该模型性能和功能的认可，以及市场对多样化AI模型选择的需求。此举表明OpenAI正在积极响应用户反馈，调整产品策略以更好地满足不同用户的使用偏好和需求。

大语言模型智能体成本降低28%！OPPO团队首次揭秘高效Agent系统设计

OPPO AI团队首次系统性研究了大语言模型智能体的效率优化问题，提出了高效智能体框架。通过对基础模型选择、规划复杂度、工具配置和记忆机制的深入分析，他们在GAIA基准测试中实现了96.7%性能保持的同时，运营成本降低28.4%。研究发现简单设计往往更有效，为智能体系统的实用化部署提供了重要指导。

上海交大携手华为推出EvoC2Rust：让老旧C语言项目秒变安全Rust代码的神奇工具

上海交通大学和华为联合开发的EvoC2Rust框架，能够自动将C语言项目转换为安全的Rust项目。该系统采用"骨架先行"策略，先构建项目框架再逐步翻译函数，并通过七大类安全映射确保翻译质量。在工业项目测试中达到93.84%编译通过率和89.53%功能测试通过率，为解决C语言内存安全问题提供了实用解决方案。

Meta牵手Pimco和Blue Owl完成290亿美元数据中心融资

Meta平台公司选定太平洋投资管理公司和Blue Owl资本为其在路易斯安那州农村地区的数据中心扩建项目提供290亿美元融资。其中，太平洋投资管理公司将主导260亿美元的债务融资部分，Blue Owl提供30亿美元股权投资。该项目将加速Meta的人工智能开发，预计到2030年全球数据中心将需要6.7万亿美元投资以满足计算需求。

浙江大学团队突破自动驾驶语言理解：机器也能读懂"前面那辆蓝色轿车"了

浙江大学研究团队首次将3D占用预测引入视觉定位，开发出GroundingOcc模型和Talk2Occ数据集。该技术能让自动驾驶汽车精确理解"前面那辆蓝色轿车"等自然语言指令，并以体素级精度定位目标物体，定位准确率达32.68%，相比传统方法提升18.13%，为智能交通人机交互提供新突破。

哥伦比亚大学团队揭秘：AI购物助手竟然比人类更加"偏心"？

这项由哥伦比亚大学等机构研究团队完成的研究，通过ACES测试环境深入分析了AI购物助手的行为特征。研究发现不同AI模型存在显著购物偏好差异，对商品位置异常敏感但偏好各异，对营销标签反应独特，在理性购物测试中仍存在缺陷。研究揭示了AI购物时代将重构电商生态系统，带来新的商业机遇与监管挑战。

蒙特利尔大学团队用AI"强化学习"让图像编辑变得像聊天一样简单

蒙特利尔大学研究团队开发出EARL图像编辑系统，通过强化学习训练让AI能够理解自然语言指令并完成复杂图像编辑。该系统采用"教练式"训练方法，AI在智能评价系统指导下持续改进编辑能力，最终在综合测试中以4.80分超越了包括商业系统Omnigen在内的所有对比方法。EARL不仅能处理简单的颜色修改，还能完成空间关系调整、数量变化等复杂任务，代表了人机交互方式的重要变革，有望让图像编辑变得像聊天一样简单。

机器人技术

自适应学习

多模态融合

2025-08-11

机器人学会"自我反思"：上海交大团队让机器人像人一样从错误中学习

上海交通大学等机构联合开发了HyCodePolicy机器人系统，让机器人首次具备"自我反思"学习能力。该系统通过视觉观察和程序监控双重诊断，能让机器人自动分析失败原因并改进策略。实验显示任务成功率从47.4%提升至71.3%，学习效率显著提高。这项技术将广泛应用于制造业、服务机器人等领域，标志着机器人从被动执行向主动学习的重要转变。

人工智能

医疗诊断

空间医学

2025-08-11

NASA联手谷歌开发AI医疗助手保障火星宇航员健康

随着人类太空任务时间延长和距离地球更远，保持宇航员健康面临挑战。NASA与谷歌正在开发名为CMO-DA的AI医疗助手，帮助宇航员在无法联系地球或医生不在场时诊断和治疗症状。该工具运行在谷歌云Vertex AI环境中，支持语音、文本和图像多模态交互。经过三种医疗场景测试，诊断准确率在74%-88%之间。未来计划增加更多数据源并训练模型适应微重力等太空医学条件。

人工智能

数据处理

成本优化

2025-08-11

OpenAI采用新数据类型MXFP4，推理成本降低75%

OpenAI在其开源模型中采用MXFP4数据类型，这是一种4位浮点格式，通过微缩放块技术实现更高精度。相比传统BF16格式，MXFP4可将计算和内存需求降低约75%，使1200亿参数模型仅需80GB显存即可运行。该技术不仅大幅减少硬件资源占用，还能将推理速度提升4倍，为云服务商和企业大幅降低AI部署成本。

人工智能

大语言模型

模型升级

2025-08-11

苹果将在iOS和macOS中集成OpenAI GPT-5模型

OpenAI的GPT-5模型本周向大多数ChatGPT用户开放。据9to5Mac报道，苹果将在iOS 26、iPadOS 26和macOS Tahoe 26中从GPT-4o升级至GPT-5。这些系统更新通常在9月发布。GPT-5声称减少80%的幻觉问题，并会根据用户提示自动选择推理优化模型。目前尚不清楚iOS中的具体实现方式，以及付费用户是否能手动选择模型。

1
2
...
17
18
19
...
1773
1774

数源AI

AI源于数据，数源AI专注于AI领域入门及提升，让大家能够更加快速高效的完成相关专业知识的学习！学AI就来数源！

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: