最新文章

人形机器人百人会会议暨人工智能赋能新型工业化深度行(无锡站)活动成功举办

活动现场还围绕“人形机器人关键技术”“人形机器人应用场景”两大方向开展了热烈讨论,来自相关政府部门、行业企业、科研院所、投资机构的近200位代表参加活动。

首届具身智能机器人运动会圆满落幕

首届具身智能机器人运动会圆满落幕

运动会期间,100余家科研团队、知名企业及高校代表参与,机器人数量超过150台。

Nvidia 发布 NeMo 微服务 助力简化 AI 代理开发

Nvidia 发布 NeMo 微服务 助力简化 AI 代理开发

英伟达发布 NeMo 微服务,帮助企业构建自主学习、持续优化的 AI 代理,实现数据驱动的业务升级。

VAST 的 VUA 闪存缓存几乎扩展 GPU 服务器内存以供 AI token 生成

VAST 的 VUA 闪存缓存几乎扩展 GPU 服务器内存以供 AI token 生成

VAST Data 开源其 VUA KVCache 软件,通过在 NVMe SSD 上存储 AI 模型推理过程中生成的令牌,避免重复计算,加快多步生成和对话续接。

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

研究显示,现有模拟推理 AI 模型能解决常规数学题,但在面对竞赛级证明题时因缺乏深层逻辑推理能力而屡屡失手,暴露了其数学证明上的局限。

AI 工作负载如何重塑数据中心设计

AI 工作负载如何重塑数据中心设计

随着人工智能普及,数据中心因功率、散热与网络需求的剧增正经历设计革新,推动高密度电源与新型冷却技术应用。

微软在宣布近一年后推出 Windows Recall 功能面向公众

微软在宣布近一年后推出 Windows Recall 功能面向公众

微软近期正式推出了 Windows Recall 功能,该功能在 Copilot+ PC 上持续截屏并提取文本,经过严格测试及安全优化后支持自选启用与删除,同时新增基于自然语言的搜索及 "Click to Do" 功能。

DiMeR:让普通图像转3D更简单,香港科技大学发布全新"解构式"网格重建模型
2025-04-27

DiMeR:让普通图像转3D更简单,香港科技大学发布全新"解构式"网格重建模型

DiMeR是由香港科技大学研究团队开发的创新3D网格重建模型,通过解构式设计将形状和纹理分离处理。模型使用法线图专门重建几何形状,再用RGB图像生成纹理,成功解决了传统方法中的训练歧义问题。实验表明,它在重建精度上比现有方法提升超过30%,并在多视图重建、单图像转3D和文本到3D生成等多任务中表现出色。这一突破性工作大幅降低了3D内容创作的门槛,为游戏开发、虚拟现实和电影制作等领域提供了强大工具。

2025-04-27

夸克AI超级框上新“拍照问夸克” 加码多模态能力

夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。

Step1X-Edit:突破性图像编辑框架,让AI轻松实现你的创意
2025-04-27

Step1X-Edit:突破性图像编辑框架,让AI轻松实现你的创意

想象一下,你有一张自己特别喜欢的照片,但照片中有些地方不太完美——也许背景有些单调,或者你希望将照片中的猫咪变成一只狗,又或者你想改变照片的整体风格。过去,这些编辑工作需要你具备专业的Photoshop技能,或者花费大量时间手动修改。

Google研究团队突破性成果:REFVNLI让文本生成图像评估更精准
2025-04-27

Google研究团队突破性成果:REFVNLI让文本生成图像评估更精准

一、为什么我们需要更好的图像生成评估方法? 想象一下《小王子》中的一个场景:叙述者试图安慰悲伤的王子,说道:"我会为你的花画一个围栏。"这个简单的描述实际上隐藏着一个复杂的挑战。要画出一幅合适的图,不仅需要准确地遵循文字描述(画一朵花周围的围栏),还需要确保画中的花就是王子心爱的那朵特定的花——拥有独特外观和历史的花。

打破模态屏障:使用多模态大语言模型实现通用嵌入学习
2025-04-27

打破模态屏障:使用多模态大语言模型实现通用嵌入学习

想象一下,你正在使用一个智能助手,希望它能根据你的文字描述找到相似的图片,或者通过一张图片找到相关的文本信息。这就像是你在和一个不懂你语言的人沟通,你们之间存在着一道"模态屏障"。为了让计算机理解并连接不同类型的信息(如图像和文本),研究人员需要开发能够将这些不同类型数据转化为通用"语言"的方法。

透过不同视角看世界:KAIST研究团队如何让AI理解多视角空间推理
2025-04-27

透过不同视角看世界:KAIST研究团队如何让AI理解多视角空间推理

想象一下,当你和朋友在公园里散步时,你指着远处说:"从那个长椅的角度看,那只狗在喷泉的左边还是右边?"这个看似简单的问题对人类来说轻而易举,因为我们自然而然地能够想象自己站在长椅的位置,并从那个视角"看"世界。但对于人工智能来说,这种换位思考的能力却是一项极具挑战的任务。

PaperCoder:机器学习论文代码自动生成的突破性框架
2025-04-27

PaperCoder:机器学习论文代码自动生成的突破性框架

想象一下,你是一名机器学习研究者,发现了一篇非常有趣的论文,但作者没有提供源代码。如果你想验证论文结果或在此基础上进行改进,你必须从头开始实现整个方法。这就像看到一道美食的菜谱,但没有详细的烹饪步骤,你只能靠自己的理解去尝试复现。

QuaDMix:为高效大语言模型预训练而生的质量-多样性平衡数据选择方法
2025-04-27

QuaDMix:为高效大语言模型预训练而生的质量-多样性平衡数据选择方法

想象一下你在制作一道美食。你需要什么?当然是优质的食材,但同时也需要各种不同类型的食材来确保菜肴丰富多样。大语言模型的训练也面临着类似的挑战。

Cohesity 推出 RecoveryAgent 简化事故响应

Cohesity 推出 RecoveryAgent 简化事故响应

RecoveryAgent 是 Cohesity 与 Veritas 合作推出的首款 AI 驱动恢复编排软件,通过自动化恢复蓝图和智能推荐恢复点,帮助用户高效应对网络安全事件,提升数据恢复能力。

Fedora 42找到了答案,但 Ubuntu 的 Plucky Puffin 也不甘落后

Fedora 42找到了答案,但 Ubuntu 的 Plucky Puffin 也不甘落后

Fedora 42 于4月15日发布,Ubuntu 25.04 随后登场;两者均基于 kernel 6.14 和 GNOME 48,各具优势,安装器、驱动支持等均有显著改进。

开发者们发出警报: Microsoft 从 VS Code 分支中移除了 C/C++ 扩展

开发者们发出警报: Microsoft 从 VS Code 分支中移除了 C/C++ 扩展

微软的 Visual Studio Code 的 C/C++ 扩展不再支持 VS Codium、Cursor 等派生产品,这破坏了开发者工作流程并引发不公平竞争的疑虑。

VMware 补丁凸显支持问题

VMware 补丁凸显支持问题

本文探讨了 VMware 推出安全补丁后,用户为应对关键零日漏洞和系统风险,不得不转向按核计费的订阅模式,以及这种模式下升级和支持优化带来的整体优势。

M&S 系统在网络安全事件发生数日后仍处于离线状态

M&S 系统在网络安全事件发生数日后仍处于离线状态

英国零售商 M&S 因网络安全事件暂停部分线上支付及自提服务,调整运营保障客户安全,并提醒用户警惕诈骗风险。