最新文章
韩国大学和KAIST联手揭秘:给AI"老师"量身定制的视频推理训练新方法!

韩国大学和KAIST联手揭秘:给AI"老师"量身定制的视频推理训练新方法!

韩国大学和KAIST研究团队提出了DeepVideo-R1,一种革新性的AI视频理解训练方法。该方法通过回归式GRPO和难度感知数据增强两大创新,解决了传统方法中的梯度消失和训练信号稀疏问题。在多个权威测试中显著提升了AI的视频推理能力,特别是在处理未见过的新任务时表现出色,为AI视频理解技术发展开辟了新方向。

IT领导者应掌握的四大杠杆:用更少资源创造更大价值

IT领导者应掌握的四大杠杆:用更少资源创造更大价值

在资源有限、客户期望高涨和新技术快速涌现的环境下,IT领导者需要以更少资源实现更大影响。本文介绍四个核心策略:消除浪费、简化工作流程、标准化运营模式和有目的地应用自动化。通过重新评估软件许可、闲置基础设施和定制解决方案来消除浪费;将复杂流程文档简化为一页摘要;建立标准化运营模式提高团队协作效率;战略性地实施自动化解决关键瓶颈。这些策略能够在不增加人员或预算的情况下扩展IT能力,改善服务质量,并与业务目标保持一致。

2025-06-19

Creo 12 助您在更短时间内打造最佳设计

Creo 12 中我最喜欢的组件之一是功能预设。它们听起来可能很简单——保存您上次使用的设置——但它们的价值还远不止于此。

如何成为高效首席数据官

如何成为高效首席数据官

首席数据官需要从企业数据中获得最大价值,负责数据管理、战略制定、治理和安全等职能。成为高效CDO需要深入理解业务需求,掌握数据如何驱动竞争优势。面对GenAI等新兴技术快速发展,CDO必须具备适应变化的韧性,专注业务目标而非完美数据。成功关键在于建立跨部门协作关系,获得高管支持推动组织变革,同时赢得员工认同。CDO应保持成长思维,将变化视为机遇,避免过度追求完美技术而忽视实际进展和客户价值。

KDE Plasma 6.4发布:重大可用性和Wayland改进

KDE Plasma 6.4发布:重大可用性和Wayland改进

KDE Plasma 6.4.0正式发布,这是2025年计划发布的三个KDE版本中的第二个。新版本在窗口平铺处理、深色模式优化、小部件和通知调整、内置搜索工具Krunner结果排序改进,以及截图工具Spectacle重新设计等方面带来显著提升。完整更新日志长达近3500行,是一个重大更新版本。该版本还增强了无障碍功能,特别是在Wayland环境下的键盘导航,并改进了图形平板和显示器色彩配置文件管理。

2025-06-19

Qorvo推出全新紧凑型解决方案QPQ3550和QPA9862,以优化射频尺寸与散热性能简化5G基础设施部署

近日,全球领先的连接和电源解决方案供应商Qorvo(R)(纳斯达克代码:QRVO)推出两款先进的射频组件,专为满足5G大规模多输入多输出(mMIMO)和固定无线接入(FWA)部署中对更高性能、更高集成度和更紧凑射频设计的需求而量身定制。

台湾大学联合MediaTek和Nvidia突破性成果:让AI自己教自己说话识别,语音识别准确率提升55%

台湾大学联合MediaTek和Nvidia突破性成果:让AI自己教自己说话识别,语音识别准确率提升55%

台湾大学联合MediaTek和Nvidia的研究团队开发了一种突破性的语音识别自我改进框架,无需大量人工标注数据即可显著提升AI语音识别准确率。该方法通过让AI生成伪标签训练语音合成系统,再用合成语音反向训练识别模型,形成自我强化循环。在台湾国语测试中,新模型Twister比原版Whisper错误率降低20-55%,数据效率提升10倍以上,为低资源语言AI应用提供了新路径。

微信AI团队发现:强大的AI搜索引擎竟然在简单问题上"翻车"了!

微信AI团队发现:强大的AI搜索引擎竟然在简单问题上"翻车"了!

微信AI团队发现当前先进的搜索系统存在"粒度困境":虽能处理复杂任务,但在简单的细节识别上却常出错。研究团队构建了专门测试平台,发现无论大小模型都在基础搜索任务上表现不佳。他们提出了新的训练方法,让小模型超越大模型,但同时发现了新挑战:过度关注细节会损害整体理解能力。

蒙彼利埃大学团队破解AI视觉模型"看错重点"难题:让机器真正学会专注于正确区域

蒙彼利埃大学团队破解AI视觉模型"看错重点"难题:让机器真正学会专注于正确区域

这项由法国蒙彼利埃大学团队开发的iFAM系统,通过创新的两阶段设计解决了AI视觉模型"看错重点"的问题。系统第一阶段识别图像中的关键区域,第二阶段只处理被选中的区域,完全屏蔽背景干扰。在多个挑战性数据集上的实验表明,该方法显著提升了模型对虚假关联的抗性,为医疗诊断、自动驾驶等高风险应用提供了更可靠的技术基础。

NAVER AI Lab团队突破性解决3D图像合成难题:让AI同时"看"和"画"出完整的三维世界

NAVER AI Lab团队突破性解决3D图像合成难题:让AI同时"看"和"画"出完整的三维世界

这是一项由NAVER AI Lab、韩国科学技术院和首尔大学联合完成的突破性研究,提出了通过跨模态注意力注入技术同时生成新视角图像和对齐几何结构的方法。该技术基于扭曲与修补思路,使用双并行扩散网络处理图像和几何,通过创新的注意力共享机制确保两种模态完美对齐,克服了传统方法需要大量标定图像或无法外推的局限性,在多个数据集上验证了其在外推场景下的卓越性能,为VR/AR、游戏开发等领域开辟了新的应用可能。

南开大学联合团队:让AI如厨师般巧妙搭配文字和图片,构建首个大规模多模态对话数据集

南开大学联合团队:让AI如厨师般巧妙搭配文字和图片,构建首个大规模多模态对话数据集

南开大学研究团队创建了InterSyn——首个大规模多模态对话数据集,包含180万单轮和5万多轮样本,覆盖3500个话题。通过创新的SEIR迭代优化方法,显著提升了AI生成文图结合内容的质量。同时开发的SynJudge评价工具能从四个维度评估文图协调性,与人类判断偏差仅5%。实验证明该方法在文图协调性上提升52.1%,为构建更智能的多模态AI系统奠定了基础。

伊利诺伊大学团队突破:让AI同时看懂和画出图像,速度提升6倍的革命性架构

伊利诺伊大学团队突破:让AI同时看懂和画出图像,速度提升6倍的革命性架构

伊利诺伊大学研究团队提出LaTtE-Flow架构,创新性地将多模态理解和图像生成统一在单一模型中。通过层级时间步专家和时间步条件残差注意力两大技术突破,实现6倍推理加速和4倍参数效率提升,同时保持高质量的图像生成和理解性能,为高效多模态AI应用奠定基础。

大语言模型训练新突破:Gensyn公司让AI训练摆脱昂贵数据中心的束缚

大语言模型训练新突破:Gensyn公司让AI训练摆脱昂贵数据中心的束缚

Gensyn公司研究团队提出了名为NoLoCo的新型大语言模型训练方法,该方法通过避免传统的全归约通信模式,显著降低了分布式训练的通信开销。研究采用随机配对同步和动态流水线路由策略,不仅减少了对高带宽网络的依赖,还在多种模型规模(125M-6.8B参数)上实现了比现有低通信方法最多4%的收敛速度提升,为大规模AI训练提供了更经济高效的解决方案。

微软宣布进入逻辑量子比特时代

微软宣布进入逻辑量子比特时代

微软宣布结束噪声量子机器时代,专注构建容错量子计算机与AI和高性能计算集成。公司推出Majorana 1芯片,采用分割电子形成天然抗噪声的量子比特技术。微软将量子处理器视为经典计算的加速器,通过AI简化量子编程,让用户用自然语言设计量子电路。Azure Quantum平台支持多种量子技术,应用涵盖化学、制药、金融等领域,并推进后量子密码学保护数据安全。

思科在2025年美国Cisco Live大会上展示其代理式AI发展路径

思科在2025年美国Cisco Live大会上展示其代理式AI发展路径

在圣地亚哥举办的思科大会上,这家IT基础设施巨头展示了其在网络、网络安全和可观测性产品组合中深度集成智能AI的发展成果,重点关注客户体验提升。会议发布了AgenticOps平台作为AI基础设施的核心,包含AI Canvas管理控制台和深度网络模型,旨在简化网络和安全运营。此外还宣布了智能交换机产品线扩展、思科实时保护安全功能、统一架构体验等多项创新。思科正通过平台化策略构建完整的AI技术栈,为企业提供计算、网络和安全一体化解决方案。

Voltron Data力推AMD,为GPU加速SQL注入新动力

Voltron Data力推AMD,为GPU加速SQL注入新动力

Voltron Data宣布其加速SQL引擎Theseus将支持AMD Instinct GPU,这标志着英伟达CUDA护城河正在变浅。Theseus使用GPU加速SQL查询,能高速处理大量数据。随着企业寻求利用AI,快速处理大量数据变得越来越重要。AMD投入大量资源构建开源软件栈以缩小与英伟达的差距,最新版本基于AMD的hipDF库。早期基准测试显示AMD平台性能表现良好,生产支持预计今年底推出。

诺基亚与澳洲电信合作开发网络API平台

诺基亚与澳洲电信合作开发网络API平台

澳洲电信与诺基亚达成合作,为开发者提供安全的网络API访问权限,助力构建智能应用并集成到企业级用例中。合作重点关注跨行业实际应用场景,如大型活动期间的网络流量管理、提升网络可观测性和关键服务优先级处理。双方将通过Telstra的Muru-D实验室提供网络API访问,并计划在2025年举办黑客马拉松活动。

Asana前沿AI功能出现数据泄露漏洞现已修复

Asana前沿AI功能出现数据泄露漏洞现已修复

Asana修复了其模型上下文协议服务器中的一个漏洞,该漏洞可能允许用户查看其他组织的数据。这项实验性功能在近两周的停机维护后重新上线。MCP是Anthropic于2024年11月推出的开源协议,允许AI代理连接外部数据源。Asana在6月4日发现漏洞后立即下线该功能进行修复。虽然没有证据表明该漏洞被恶意利用,但这提醒企业在集成前沿AI技术时需要注意新的安全风险。

ScyllaDB发布基于Raft算法的新数据库服务,提升规模化能力

ScyllaDB发布基于Raft算法的新数据库服务,提升规模化能力

ScyllaDB发布了基于Raft共识算法的新数据库服务ScyllaDB X,采用全新的tablets架构以提高扩展性并降低成本。该服务支持近乎即时的节点启动和并行添加,能在几分钟内将性能从10万OPS扩展到200万OPS,同时保持个位数毫秒延迟。公司同时宣布许可证变更,从AGPL转向源码可用许可证。ScyllaDB声称其系统相比Apache Cassandra具有性能优势,正吸引用户迁移。

MIT研究显示使用AI聊天机器人显著降低大脑活动

MIT研究显示使用AI聊天机器人显著降低大脑活动

MIT媒体实验室研究团队通过脑电图实验发现,使用AI聊天机器人完成写作任务时,大脑活动水平比独立完成相同任务时降低多达55%。研究将学生分为三组:纯大脑思考组、搜索引擎辅助组和GPT-4o辅助组。结果显示AI辅助组的神经连接最弱,事实记忆能力也最差。当移除AI支持后,原AI依赖组表现明显下降。研究建议教育应延迟AI集成,让学习者首先进行充分的自主认知努力,以促进长期认知自主性和避免产生智力依赖。