最新文章
Pure Storage谈AI数据挑战超越硬件层面

Pure Storage谈AI数据挑战超越硬件层面

Pure Storage AI基础设施副总裁Par Botes强调,成功应对AI工作负载不仅需要足够的计算和存储资源,更关键的是确保AI训练数据的质量。企业需要捕获、组织、准备和对齐数据,因为数据往往不完整或不适合AI要解决的问题。他建议企业思考数据工程流程,利用数据湖仓对数据进行清理和准备,并建立持续的数据管理discipline。

全球5G用户2025年底将接近30亿,FWA业务快速增长

全球5G用户2025年底将接近30亿,FWA业务快速增长

爱立信2025年移动性报告显示,5G通信正加速走向成熟,商业服务发展为复杂套餐。预计2025年底全球5G用户数将超过29亿,约占移动用户总数三分之一。2024年底5G网络承载35%全球移动流量,预计2030年将达80%。固定无线接入成为关键增长领域,51%提供该服务的运营商采用5G增强的基于速度的资费方案。

机器人团队协作新突破:上海人工智能实验室让多个机器人像人类团队一样高效合作

机器人团队协作新突破:上海人工智能实验室让多个机器人像人类团队一样高效合作

上海人工智能实验室的研究团队开发了VIKI-R框架,首次实现了让不同类型机器人像人类团队一样协作。该研究建立了全球首个多机器人视觉协作评估平台VIKI-Bench,通过队员选择、任务规划、轨迹感知三层测试体系全面评估协作能力。VIKI-R采用监督学习预热加强化学习优化的两阶段训练方法,在所有测试层级都取得显著性能提升,为智能制造、医疗服务等领域的机器人应用提供了重要技术突破。

告别文档分块难题:Yellow.ai如何用AI"眼睛"让机器真正看懂PDF文件

告别文档分块难题:Yellow.ai如何用AI"眼睛"让机器真正看懂PDF文件

Yellow.ai研究团队开发了革命性的多模态文档分块技术,让AI系统能像人类一样"看"PDF文档,而非仅仅"读"文字。该方法采用批量视觉处理和上下文保持机制,解决了传统固定长度分块导致的表格分割、内容破碎等问题。在RAG系统测试中,准确率从78%提升至89%,显著改善了文档理解质量。

DreamCube:香港大学团队突破传统,让AI从一张照片"脑补"出整个360度世界

DreamCube:香港大学团队突破传统,让AI从一张照片"脑补"出整个360度世界

香港大学团队突破性地解决了AI全景图生成中的拼接难题,提出DreamCube系统,能从单张照片生成包含深度信息的完整360度场景。该研究创新性地引入"多平面同步"技术,让AI同时协调处理立方体六个面,避免传统方法的色差和断裂问题,实现从2D图像到3D场景的快速转换,为VR/AR、游戏开发、建筑设计等领域提供了全新的内容创作工具。

腾讯推出"游戏制造器":AI让你用键盘鼠标就能创造真实游戏世界

腾讯推出"游戏制造器":AI让你用键盘鼠标就能创造真实游戏世界

腾讯混元团队推出革命性AI系统Hunyuan-GameCraft,能根据键盘鼠标操作实时生成对应游戏画面。该系统统一处理各种输入信号,采用混合历史条件训练保持长期一致性,通过模型蒸馏实现近实时响应。基于100多款3A游戏数据训练,在控制精度和视觉质量上显著超越现有方法,为交互式内容创作开辟新路径。

腾讯混元3D 2.5:让3D模型生成进入"极致细节"时代

腾讯混元3D 2.5:让3D模型生成进入"极致细节"时代

腾讯混元3D团队发布的最新版本2.5在3D资产生成领域实现重大突破。新系统引入100亿参数的LATTICE形状模型,能生成极其精细的3D形状细节,并首次支持PBR物理渲染材质生成。通过双阶段分辨率提升和多通道协同机制,实现了形状精度和材质真实感的完美结合,在多项评测中全面超越现有开源和商业模型,为游戏开发、影视制作等行业带来革命性效率提升。

清华大学推出革命性视频生成技术:让AI看懂"注意力"背后的秘密

清华大学推出革命性视频生成技术:让AI看懂"注意力"背后的秘密

清华大学团队通过创新的"模式感知重排序"技术,解决了AI视频生成中注意力机制计算效率低下的问题。该技术将复杂分散的注意力模式重新整理成规整的块状结构,结合专门设计的稀疏化和量化策略,在保持生成质量的同时将计算速度提升1.9-2.7倍,为AI视频生成的普及应用铺平道路。

哥伦比亚大学研究团队破解AI偏见难题:如何让人工智能在政治立场总结中保持公正

哥伦比亚大学研究团队破解AI偏见难题:如何让人工智能在政治立场总结中保持公正

哥伦比亚大学研究团队开发出新的AI偏见纠正技术,通过"重排序"方法让人工智能在总结政治观点时保持公正。该方法让AI生成多个版本后择优选择,结合偏好调优训练,显著提升了观点覆盖度和内容准确性,为构建更可信赖的AI系统提供了实用解决方案。

Show-o2:新加坡国立大学新突破,一个AI大脑同时掌握看图说话和画图创作

Show-o2:新加坡国立大学新突破,一个AI大脑同时掌握看图说话和画图创作

新加坡国立大学Show Lab团队发布Show-o2统一多模态AI模型,首次实现单一系统内文字、图像、视频的理解与生成能力。该研究采用3D因果VAE和双路径融合机制,通过创新的两阶段训练策略,在多项基准测试中超越现有技术,为通用人工智能发展奠定重要基础。

微软研究院揭示AI推理真相:当智能模型遇上变化题目会怎样?

微软研究院揭示AI推理真相:当智能模型遇上变化题目会怎样?

微软研究院开发的RE-IMAGINE框架通过创新的三层次测试体系(观察、变化、想象),系统评估大型语言模型的真实推理能力。研究发现,即使最先进的AI模型在面对题目变化时表现也会显著下降,揭示了当前AI系统过度依赖统计记忆而非真正逻辑推理的局限性,为AI安全部署和未来发展提供重要指导。

让大模型像人一样思考:AI推理能力跨领域训练的突破性进展——加州大学圣地亚哥分校等多机构合作成果

让大模型像人一样思考:AI推理能力跨领域训练的突破性进展——加州大学圣地亚哥分校等多机构合作成果

加州大学圣地亚哥分校等多机构研究团队通过创建GURU数据集,系统研究了强化学习在AI推理能力跨领域迁移中的作用机制。研究发现,AI在熟悉领域主要激发已有知识,在陌生领域则能学习新技能,开发的GURU模型在17项推理任务中表现显著提升,为通用AI发展提供重要启示。

当AI学会倾听人类情感:LAION团队打造史上最精细的语音情感识别基准测试

当AI学会倾听人类情感:LAION团队打造史上最精细的语音情感识别基准测试

LAION团队联合多个顶尖研究机构推出EMONET-VOICE语音情感识别基准,包含4500小时多语言合成语音数据和40种精细情感分类。该项目通过心理学专家标注创建高质量测试集,开发出性能领先的EMPATHICINSIGHT-VOICE模型,发现AI系统对高唤醒度情感识别效果好但低唤醒度情感识别困难,为语音AI向人性化发展奠定重要基础。

新加坡科技设计大学SonicVerse:让AI像音乐专家一样"听"懂音乐并用语言完美描述

新加坡科技设计大学SonicVerse:让AI像音乐专家一样"听"懂音乐并用语言完美描述

新加坡科技设计大学团队开发了SonicVerse音乐描述AI系统,通过多任务学习架构同时进行音乐特征识别和自然语言生成,能够像专业音乐评论家一样准确描述音乐的技术特征和艺术内容。该系统不仅在短片段描述上表现出色,还能通过AI链式处理为完整歌曲生成详细的时序化描述,为音乐产业的内容标注、教育培训和智能推荐等应用提供了新的技术路径。

ChartIR:教机器人看懂图表然后写代码的新方法——上海交通大学团队的创新突破

ChartIR:教机器人看懂图表然后写代码的新方法——上海交通大学团队的创新突破

上海交通大学研究团队开发了ChartIR方法,通过结构化指导让AI能准确理解图表并生成相应代码。该方法分两阶段:先让AI详细描述图表内容,再通过迭代改进逐步完善代码。实验显示,相比现有方法,ChartIR在图表转代码任务上取得显著提升,为多模态AI应用提供了新思路。

大模型训练途中机器突然坏了怎么办?研究人员找到了无需备份的神奇恢复方法

大模型训练途中机器突然坏了怎么办?研究人员找到了无需备份的神奇恢复方法

这项由Gensyn、纳沙泰尔大学和代尔夫特理工大学联合研究的突破性成果,解决了大型AI模型训练中机器故障导致的巨大损失问题。研究团队开发的CheckFree方法无需备份即可快速恢复故障阶段,利用相邻层参数的加权平均重建丢失部分。升级版CheckFree+通过乱序管道执行技术还能处理边界层故障。实验显示该方法在低中故障率下比传统方案快12%以上,为AI训练民主化提供了重要技术支撑。

ADM首席信息官Kristy Folkwein如何构建数字化转型IT团队

ADM首席信息官Kristy Folkwein如何构建数字化转型IT团队

ADM高级副总裁兼CIO Kristy Folkwein分享了她在三家不同公司的职业发展历程,以及如何通过收购建立的ADM公司进行数字化转型。她在ADM九年间构建了一支致力于公司发展的IT团队,专注于ERP系统转型、遗留系统现代化和网络安全挑战。团队正在探索生成式AI在创造风味、提高生产力等方面的应用,强调数据作为AI燃料的重要性。

Zopa银行提前推出活期账户服务

Zopa银行提前推出活期账户服务

Zopa银行正式推出可在几分钟内开户的活期账户服务,面向其150万储蓄和贷款客户以外的更广泛用户群体。该账户此前已有6万名现有客户参与测试,正式发布时间比预期提前。作为金融科技先驱,Zopa在2020年获得完整银行牌照后推出首款储蓄产品,目前拥有140万客户,年收入超过3亿英镑,存款规模超过50亿英镑。

Mozilla发布Firefox 140扩展支持版本并引入多项新功能

Mozilla发布Firefox 140扩展支持版本并引入多项新功能

Mozilla正式推出Firefox 140浏览器,作为扩展支持版本(ESR)发布。新版本增加了标签页卸载功能,可清理内存并在需要时重新加载。垂直标签页用户可调整固定标签区域大小,隐私翻译功能现可跟随滚动位置优先翻译当前查看区域。Android版本支持批量选择标签页,私人标签可通过密码或指纹保护。该版本同时更新ESR 128用户,为下游项目如Waterfox和Thunderbird提供新版本基础。

英国监管机构拟授予谷歌"战略市场地位"新反垄断法案生效

英国监管机构拟授予谷歌"战略市场地位"新反垄断法案生效

英国竞争与市场管理局(CMA)提议将谷歌认定为具有"战略市场地位"的公司,这意味着谷歌将面临更严格的监管审查。根据今年生效的DMCC法案,获得此地位的公司若违反反垄断规则,可被处以年收入10%的罚款。CMA的调查重点关注谷歌在搜索引擎和搜索广告市场的活动。如果认定最终确立,谷歌可能需要提供选择界面、确保网站排名公平、增加内容透明度,并与竞争对手分享用户搜索数据。