最新文章
斯坦福大学AI实验室新突破:让计算机像人一样理解世界的三步循环法

斯坦福大学AI实验室新突破:让计算机像人一样理解世界的三步循环法

斯坦福大学NeuroAI实验室提出概率结构整合(PSI)系统,通过概率预测、结构提取、整合三步循环让AI像人类一样理解世界。系统在1.4万亿视频数据上训练,能零样本提取光流、深度、分割等视觉特征,实现视频预测、物体操控等应用,在多项测试中达到业界领先水平,展现了AI自我进化的新路径。

Utrecht大学团队首创AI"换位思考"技术:让机器像人类一样理解不同观点

Utrecht大学团队首创AI"换位思考"技术:让机器像人类一样理解不同观点

Utrecht大学研究团队开发出让AI具备"换位思考"能力的创新技术,通过情境学习和标签分布学习两种方法,使AI系统能够理解和模拟不同人的思维模式与判断习惯。该技术在LeWiDi-2025国际竞赛中获得第二名,为开发更人性化的AI系统提供了新路径。

华威大学突破:首个教育对话中"有趣度"预测模型,AI终于懂得如何让学习更吸引人

华威大学突破:首个教育对话中"有趣度"预测模型,AI终于懂得如何让学习更吸引人

华威大学研究团队首次创建了教育对话"有趣度"预测数据集IntrEx,通过100多名二语学习者标注5801个对话片段,发现经专门训练的小型AI模型在预测学习兴趣方面超越GPT-4。研究揭示对话需要"适度挑战"和新颖性平衡才能最大化吸引力,为个性化教育和智能教学系统开发提供了科学基础,标志着教育吸引力评估从主观判断向科学测量的重要转变。

腾讯混元:AI也能成为3D"解构大师",一个模型让3D物体智能分解成有意义的零件

腾讯混元:AI也能成为3D"解构大师",一个模型让3D物体智能分解成有意义的零件

腾讯混元团队开发的X-Part技术实现了高质量的3D物体智能分解,能够将复杂3D模型分解成语义清晰、几何完整的零件。该技术通过边界框指导、语义特征注入和同步多部件生成,在几何精度和语义一致性方面显著超越现有方法,为3D打印、游戏开发、工业设计等领域提供了强大的工具支持。

当小机器人学会了十八般武艺:卡尔斯鲁厄理工学院开发出超高效机器人大脑

当小机器人学会了十八般武艺:卡尔斯鲁厄理工学院开发出超高效机器人大脑

德国卡尔斯鲁厄理工学院开发出FLOWER机器人控制系统,这个仅有950M参数的"机器人大脑"能让不同类型机器人理解语言指令完成190种复杂任务,训练成本仅为传统方法的1%,在真实环境测试中成功率达61%,并能处理未见过的物体和环境,为通用机器人智能的实用化部署开辟了新道路。

字节跳动发布Lynx:一张照片就能生成逼真个人视频的AI新突破

字节跳动发布Lynx:一张照片就能生成逼真个人视频的AI新突破

字节跳动推出Lynx个性化视频生成系统,仅需一张照片即可生成高保真度个人视频。该技术采用双适配器架构,通过ID-adapter处理身份特征,Ref-adapter注入视觉细节,在800个测试案例中展现出卓越的面部相似度和视频质量,超越现有同类方法,为个性化内容创作开辟新路径。

香港科技大学团队打造室内设计新神器:一句话就能生成逼真3D房间

香港科技大学团队打造室内设计新神器:一句话就能生成逼真3D房间

香港科技大学研究团队开发了SpatialGen技术,这是一个革命性的3D室内场景生成系统。该技术能够根据简单的文字描述或参考图片,在几分钟内生成逼真的3D房间场景。研究团队构建了包含470万张图像的大规模数据集,并采用创新的多视角多模态扩散模型,实现了在真实感、多样性和用户控制之间的完美平衡,为室内设计、VR/AR和机器人仿真等领域带来了新的可能性。

开源AI生态中的"版权炸弹":加拿大女王大学揭示364万项目的许可证混乱真相

开源AI生态中的"版权炸弹":加拿大女王大学揭示364万项目的许可证混乱真相

加拿大女王大学研究团队对开源AI生态系统进行了首次全面审计,覆盖364万个数字资产,发现35.5%的AI模型在集成到应用时存在许可证违规。研究开发的LicenseRec工具能自动检测冲突并推荐解决方案,成功修复86.4%的问题。这项研究揭示了开源AI供应链中系统性的合规风险,为行业提供了重要的法律合规指导。

ChatGPT推出个性化晨间新闻推送功能Pulse

ChatGPT推出个性化晨间新闻推送功能Pulse

OpenAI发布ChatGPT脉冲功能,这一推送特性可根据用户聊天历史自动生成个性化每日更新。该功能目前向Pro订阅用户开放,通过分析用户聊天记录、偏好设置以及Gmail和谷歌日历连接,AI模型在夜间进行研究,次日清晨以卡片形式推送相关信息。用户可通过点赞或踩的方式提供反馈。这标志着OpenAI向主动式AI助手转变的重要一步。

Google DeepMind新AI模型让机器人能够搜索网络完成任务

Google DeepMind新AI模型让机器人能够搜索网络完成任务

谷歌DeepMind发布了新型人工智能模型,该模型具备网络搜索能力,能够帮助机器人更好地完成各种任务。这一突破性技术使机器人能够实时获取网络信息,提升任务执行的准确性和效率,为机器人智能化发展开辟了新路径。

Meta AI应用推出专门的AI生成内容信息流

Meta AI应用推出专门的AI生成内容信息流

Meta AI应用推出名为Vibes的新功能,专门展示AI生成的短视频内容。用户可以浏览他人创作的AI视频,也能从零开始制作或改编现有视频。创建的视频支持私信分享或转发至Instagram和Facebook。CEO扎克伯格表示这是新产品方向的早期探索,Meta超级智能实验室将与Midjourney等公司合作开展AI项目。

谷歌宣布2026年合并Android与ChromeOS操作系统

谷歌宣布2026年合并Android与ChromeOS操作系统

谷歌正式宣布将在2026年合并Chrome OS和Android操作系统,Android将成为主导系统。谷歌Android生态系统总裁萨马特表示,此举旨在加速AI技术在笔记本电脑上的应用,并实现笔记本与Android生态系统的无缝协作。通过迁移到Android代码库,谷歌可以在更多设备上部署Gemini AI服务。萨马特指出,Android在平板电脑上的成功证明了其在笔记本电脑上的可行性,同时Android还能为XR技术提供更广泛的平台支持。

HANRAG:让AI问答更聪明的新武器——蚂蚁集团重磅发布多跳问答"大脑"

HANRAG:让AI问答更聪明的新武器——蚂蚁集团重磅发布多跳问答"大脑"

蚂蚁集团研发的HANRAG系统通过智能调度模块"Revelator",能根据问题类型选择最优处理策略:直接回答、单步搜索、并行处理或逐步推理。系统具备强大噪音过滤能力,在单跳和多跳问答测试中全面超越现有方法,准确率提升6-20%,搜索效率显著改善,为智能问答系统发展开启新篇章。

Meta研究团队推出IGPO算法:让AI大模型学会"填空推理"的新方法

Meta研究团队推出IGPO算法:让AI大模型学会"填空推理"的新方法

Meta研究团队开发IGPO算法,创新性地解决了AI大模型学习复杂推理时的"零优势困境"。该算法利用扩散大语言模型的填空能力,在AI模型陷入困境时提供战略性提示引导探索。实验显示在数学推理任务中性能显著提升:GSM8K提升4.9%,Math500提升8.4%,AMC提升9.9%,同时将无效训练情况减少60%,为AI学习方法带来重要突破。

Box CEO谈企业软件长期发展策略与AI变革

Box CEO谈企业软件长期发展策略与AI变革

在2025年TechCrunch Disrupt大会上,Box首席执行官兼联合创始人Aaron Levie将登台分享企业软件领域的深度见解。他将探讨上市公司内部创新的真实面貌、AI对企业软件的影响与变革,以及为何保持敏锐需要质疑一切。作为云原生企业的先驱者,Levie将反思最艰难的转型、最大的惊喜,以及在技术快速发展中持续进化所需的思维模式。

语音识别遇上扩散模型:清华、剑桥、伊利诺伊大学联手探索AI听写的新可能

清华大学、剑桥大学和伊利诺伊大学联合研究团队首次将扩散大语言模型LLaDA应用于自动语音识别,开发出Whisper-LLaDA系统。该系统采用双向注意力机制和并行处理方式,既可直接进行语音识别,也可作为精细修正模块提升现有系统准确性。在LibriSpeech测试中表现优异,推理速度比传统方法快1.3-2.4倍,为语音识别技术开辟了新路径。

韩国UNIST团队首创会"读心"的AI聊天机器人:不仅听懂你说什么,还能感受你的情绪并用最合适的语调回应

韩国UNIST团队首创会"读心"的AI聊天机器人:不仅听懂你说什么,还能感受你的情绪并用最合适的语调回应

韩国UNIST团队开发出全球首个能同时理解视觉、听觉和文字信息的情感AI系统,不仅能听懂对话内容,还能感知用户的真实情绪状态并用合适的语调回应。该系统基于包含31000句真实对话的MSenC数据集训练,在情感适宜性、对话自然性等方面显著优于现有技术,为人机交互带来革命性改变。

OpenAI推出ChatGPT Pulse 主动生成个性化晨报

OpenAI推出ChatGPT Pulse 主动生成个性化晨报

OpenAI发布ChatGPT新功能Pulse,可在用户睡眠期间生成个性化报告,提供5-10条简报帮助用户快速了解当日重要信息。该功能旨在让用户像查看社交媒体一样优先使用ChatGPT。Pulse首先向每月200美元的Pro订阅用户开放,未来计划扩展至所有用户。功能支持连接Gmail、日历等应用,可解析邮件、生成日程安排。报告以卡片形式展示,包含AI生成的图像和文本,涵盖新闻摘要、个性化建议等内容。

Clarifai新推理引擎让AI模型运行速度翻倍成本降低40%

Clarifai新推理引擎让AI模型运行速度翻倍成本降低40%

AI平台公司Clarifai发布新推理引擎,声称能让AI模型运行速度提升一倍,成本降低40%。该系统采用多种优化技术,从CUDA内核到高级推测解码,能在相同硬件上获得更强推理性能。第三方测试显示其在吞吐量和延迟方面创下行业最佳记录。该产品专门针对推理过程优化,特别适用于需要多步骤响应的智能体和推理模型。