最新文章
上海AI实验室团队让GPT-4o数学推理能力飞跃4.6%:一种让AI在解题时"边做边学"的革命性方法

上海AI实验室团队让GPT-4o数学推理能力飞跃4.6%:一种让AI在解题时"边做边学"的革命性方法

上海AI实验室团队提出BoostStep方法,通过步骤级情境学习显著提升大语言模型数学推理能力。该方法在AI解题过程中实时提供精准指导,而非传统的完整例题参考,在GPT-4o上实现4.6%性能提升,超越传统方法的1.2%。研究发现99.2%的数学错误源于单步推理失误,验证了细粒度指导的重要性。

Spotify将允许免费用户挑选和播放指定歌曲

Spotify将允许免费用户挑选和播放指定歌曲

Spotify宣布为全球免费用户推出新功能,允许他们搜索并播放任意歌曲,或播放朋友和关注艺人分享的音乐。新功能包括"Pick & Play"、"Search & Play"和"Share & Play"。尽管如此,免费用户仍有每日点播时长限制,超出后将受到跳过次数限制。此举旨在提升免费用户参与度并增加广告收入,目前Spotify的6.96亿月活用户中有4.33亿为免费用户。

清华大学发现:当前顶级AI视频模型连"跳跃"都看不懂!MotionBench揭示视频理解盲区

清华大学发现:当前顶级AI视频模型连"跳跃"都看不懂!MotionBench揭示视频理解盲区

清华大学研究团队通过MotionBench发现,当前最先进的AI视频理解模型在精细动作理解方面存在严重不足,准确率不足60%。他们提出的通过编码器融合技术TE Fusion有效改进了这一问题。这项研究揭示了视频AI理解的基础能力缺陷,为该领域发展指明了新方向。

上海人工智能实验室重磅发布:视频AI距离理解真实世界的在线视频还有多远?

上海人工智能实验室重磅发布:视频AI距离理解真实世界的在线视频还有多远?

上海人工智能实验室联合多家机构推出OVO-Bench评测体系,首次系统评估视频AI的在线理解能力。研究发现当前最先进的模型如GPT-4o在实时视频理解任务中表现远不如人类,缺乏时间感知、实时记忆和主动响应能力。该研究为智能家居、在线教育、医疗监护等实际应用场景的AI升级指明方向。

华中科技大学团队破解AI绘画难题:让图像生成模型既快又好的秘密武器

华中科技大学团队破解AI绘画难题:让图像生成模型既快又好的秘密武器

华中科技大学团队破解了AI绘画系统中长期存在的优化困境:高质量图像重建与高效图像生成之间的矛盾。他们提出的VA-VAE技术通过视觉基础模型对齐,让图像压缩器在保持高精度的同时为生成器提供更易学习的环境。结合LightningDiT优化框架,该系统实现了21倍训练加速,在ImageNet数据集上创造了FID=1.35的最佳记录,为AI图像生成领域带来了突破性进展。

香港中文大学团队首次让AI绘画也能像人类一样"边画边思考"

香港中文大学团队首次让AI绘画也能像人类一样"边画边思考"

香港中文大学团队首次将"链式思维推理"技术应用于AI绘画领域,教会AI像人类画家一样"边画边思考"。通过开发专门的PARM评估模型和多种训练策略,让AI绘画在复杂场景描述上提升24%,超越知名的Stable Diffusion 3模型15%。这项突破为AI创作工具带来更智能的"自我反思"能力。

从看电视到AI眼中的世界:Meta和UC Berkeley如何让机器像人类一样"看"视频

从看电视到AI眼中的世界:Meta和UC Berkeley如何让机器像人类一样"看"视频

Meta和UC Berkeley联合研究团队开发了名为Toto的AI模型,通过"看前猜后"的方式学习理解视频。该模型观看了超过十万小时视频内容,在图像分类、视频理解、物体跟踪和机器人操作等多个任务中表现出色,甚至自然涌现了"物体永恒性"理解能力。研究发现视觉AI也遵循类似语言模型的缩放定律,但效率略低于语言模型。这项工作为构建通用视觉AI系统提供了新思路。

清华大学联合团队发布重磅报告:大语言模型如何学会推理,距离真正的AI思考还有多远?

清华大学联合团队发布重磅报告:大语言模型如何学会推理,距离真正的AI思考还有多远?

清华大学联合多所知校发布的这项重磅研究全面分析了大语言模型推理能力发展现状,深入探讨了强化学习如何让AI学会思考。研究涵盖了从数据构建到模型训练、从测试时增强到开源项目的完整技术图景,特别分析了OpenAI o1系列的突破性进展,为AI推理能力的未来发展提供了宝贵指引。

微软亚洲研究院重磅突破:让大模型用上4位浮点数训练,算力压缩四分之三

微软亚洲研究院重磅突破:让大模型用上4位浮点数训练,算力压缩四分之三

微软亚洲研究院提出首个FP4量化训练框架,通过可微分梯度估计器和离群值处理技术,在保持模型性能的同时实现接近4倍的计算加速。该技术在130亿参数模型上验证有效,为降低大模型训练成本、促进AI技术普及提供了新路径。

哈佛与浙江大学联手突破:AI绘画新技术让多物体精准放置成为现实

哈佛与浙江大学联手突破:AI绘画新技术让多物体精准放置成为现实

这项由哈佛医学院和浙江大学联合开发的3DIS-FLUX技术,成功解决了AI绘画中多物体精确控制的难题。通过将复杂任务分解为布局规划和精细渲染两个阶段,并采用创新的注意力控制机制,该技术实现了比现有方法高出41%的成功率。其免训练的设计让技术能够快速适配新模型,为数字创作领域带来了更可控、更高效的AI绘画解决方案。

Meta团队突破视觉压缩极限:让AI用更少算力生成更好的图像和视频

Meta团队突破视觉压缩极限:让AI用更少算力生成更好的图像和视频

Meta团队开发的ViTok突破了视觉AI压缩技术的瓶颈,发现压缩质量的关键在于存储的浮点数总量而非模型复杂度。该方法在保持图像和视频重建及生成质量的同时,计算效率提升2-5倍,在多个基准数据集上创造新纪录,为高效视觉AI应用提供了重要技术基础。

让AI成为科学研究的"超级助手":德州大学团队全面盘点大语言模型如何重塑整个研究生命周期

让AI成为科学研究的"超级助手":德州大学团队全面盘点大语言模型如何重塑整个研究生命周期

这项由德州大学达拉斯分校主导的研究是首个全面梳理大语言模型在科学研究全生命周期应用的综合调研。研究团队系统分析了AI在假设发现、实验实施、论文写作和同行评议四个关键环节的作用,展现了从"AI副驾驶"到"全自动驾驶"的技术演进。研究发现AI不仅能提高研究效率,还能激发跨学科创新,但也面临技术局限、评估标准和伦理挑战。

Luminary Cloud完成7200万美元融资,推进AI驱动物理产品设计

Luminary Cloud完成7200万美元融资,推进AI驱动物理产品设计

Luminary Cloud宣布完成7200万美元B轮融资,专注开发"物理AI"技术。该公司云原生平台可将仿真速度提升100倍,利用物理信息模型实时预测汽车、飞机等产品性能。公司推出针对特定行业的预训练模型,包括与本田合作的汽车设计模型和与Otto航空合作的飞机开发模型。融资由西门子风投领投,将用于扩大研发团队和市场销售。

量子运动公司推出首台硅基量子计算机

量子运动公司推出首台硅基量子计算机

伦敦量子动态科技公司宣布交付业界首台采用传统半导体制造工艺的量子计算机。该系统已安装在英国国家量子计算中心,使用标准化300毫米硅晶圆,是首台自旋量子比特计算机。系统采用CMOS技术,占地约三个19英寸服务器机架,具备数据中心友好特性。公司开发的可扩展瓦片架构支持大规模生产,未来可扩展至每个量子处理单元数百万量子比特,为商业化应用奠定基础。

Google发布首个隐私保护大语言模型VaultGemma

Google发布首个隐私保护大语言模型VaultGemma

谷歌研究团队推出VaultGemma,这是其首个采用差分隐私技术的大语言模型。该模型基于Gemma 2构建,拥有10亿参数,通过在训练阶段引入校准噪声来防止模型"记忆"敏感用户数据。研究团队建立了差分隐私缩放定律,平衡计算预算、隐私预算和数据预算。尽管添加差分隐私会影响准确性,但VaultGemma在性能上与同规模非私有模型相当。该模型现已在Hugging Face和Kaggle平台开放下载。

Olilo推出英国多千兆宽带服务,专为技术专家设计

Olilo推出英国多千兆宽带服务,专为技术专家设计

英国宽带服务商Olilo正式推出多千兆宽带服务,专门面向技术人员、工程师、系统管理员和家庭实验室爱好者。该公司自建Layer 2网络基础设施,提供对称多千兆宽带,支持静态IPv4地址和原生IPv6。Olilo与伦敦三大互联网交换中心建立对等连接,在英国对等网络中排名第24位。服务经过150多名技术用户的付费封闭测试,并通过Discord社区持续收集用户反馈优化服务。

OpenAI发布GPT-5-Codex升级版本提升编程智能体性能

OpenAI发布GPT-5-Codex升级版本提升编程智能体性能

OpenAI发布了面向AI编程助手Codex的GPT-5新版本。新模型GPT-5-Codex采用动态"思考"机制,可根据编程任务复杂度灵活调整处理时间,从几秒到七小时不等。该模型已向ChatGPT Plus等付费用户推出,在代码重构和审查基准测试中表现优异。相比传统路由器预设计算资源的方式,GPT-5-Codex能实时调整工作时长,这有助于OpenAI在竞争激烈的AI编程工具市场中提升竞争力。

Space42与Viasat成立合资公司推出D2D 5G移动卫星服务

Space42与Viasat成立合资公司推出D2D 5G移动卫星服务

阿联酋太空技术公司Space42与全球通信公司Viasat宣布成立合资企业Equatys Venture,旨在创建业界首个太空塔公司模式。该合资公司将实施共享太空和地面非地面网络基础设施,降低资本成本并提高频谱利用率。合资企业预计将使用符合3GPP非地面网络标准的平台,连接卫星和地面网络,支持标准智能手机和物联网设备,为全球数十亿人和设备提供服务,商业推广目标在三年内实现。

预装式存储设备消除企业AI扩展瓶颈

预装式存储设备消除企业AI扩展瓶颈

企业IT领导者面临前所未有的挑战,需要快速部署AI基础设施以满足业务需求并抓住市场机遇。传统存储协议正被更适合AI工作负载的新方法替代,对象存储因其水平扩展性和性能特性成为首选。MinIO推出基于Supermicro的AIStor存储舱,这一即开即用的AI就绪对象存储解决方案结合了规模、简便性和经济性,专为企业AI工作负载的快速部署而设计,有望加速企业AI基础设施的成熟发展。

HPE时隔7年再破90亿美元季度营收创新高

HPE时隔7年再破90亿美元季度营收创新高

HPE第三财季营收创纪录达到91亿美元,同比增长19%。AI服务器销售大幅增长,新收购的Juniper推动网络业务增长54%。Alletra存储销售实现三位数增长。服务器业务营收49亿美元,AI系统营收达到16亿美元创历史新高。该公司连续四个季度实现营收增长,GreenLake订阅客户增至4.4万,年化营收运行率达31亿美元。