最新文章
CISO 影响力上升,但安全预算依然紧张

CISO 影响力上升,但安全预算依然紧张

大型企业的CISO薪酬和职责不断提升,涵盖业务风险、产品安全及数字战略,但预算紧缩使得安全投入必须直接与业务增长挂钩,进而带来角色定位及满意度的不确定性。

词汇偏向技术:通过词汇偏向为自回归图像生成模型打造抗重生成攻击的水印方案

词汇偏向技术:通过词汇偏向为自回归图像生成模型打造抗重生成攻击的水印方案

这项研究提出了一种名为"词汇偏向水印"(LBW)的新方法,专为自回归图像生成模型设计,能够抵抗传统水印技术容易被删除的重生成攻击。研究团队将代币库分为绿色和红色列表,通过软硬两种偏向策略鼓励模型在生成过程中选择绿色列表中的代币,并采用多绿色列表策略增强安全性。实验表明,LBW在多种攻击下展现出卓越的稳健性,尤其是在面对重生成攻击时表现突出,为AI生成内容的可追溯性提供了更可靠的技术保障。

视频数学问答:突破性基准测试,通过视频理解检验模型数学推理能力

这项研究推出了VideoMathQA,一个创新基准测试,专门评估人工智能模型在视频中的数学推理能力。不同于静态图像或文本基准,它要求模型在时间轴上整合视觉、音频和文本信息,模拟真实教学场景中的"多模态大海捞针"挑战。基准测试涵盖10个数学领域,视频长度从10秒到1小时以上,设计了三种推理挑战:直接问题解决、概念迁移和深度理解。对30个模型的评估显示,专有与开源系统的差距正在缩小,而模型成功不仅取决于规模,还受架构和训练质量影响。

解锁物体组合的新时代:南方科技大学团队开创几何可编辑与外观保持双重平衡的对象组合技术

解锁物体组合的新时代:南方科技大学团队开创几何可编辑与外观保持双重平衡的对象组合技术

南方科技大学林剑满团队开创性提出DGAD模型,解决通用物体组合中几何编辑与外观保持的双重挑战。该方法首先利用语义嵌入隐式捕捉物体几何特性,再通过密集交叉注意力机制精确对齐外观特征,成功实现物体在任意场景中的灵活编辑同时保持细节不变。实验表明,DGAD在编辑灵活性和外观保真度上均优于现有技术,为AR/VR内容创建等应用提供了强大工具。

矫正点流:斯坦福大学和英伟达联合打造的通用点云姿态估计新方法

斯坦福大学和英伟达研究院联合开发的"矫正点流"为点云姿态估计提供了全新解决方案,将成对配准和多部件组装统一为条件生成问题。该方法学习连续点流场,将点从随机噪声引导至目标位置,并通过自监督重叠预测增强几何理解。实验证明,矫正点流在六个基准测试中均超越现有技术,特别是在处理部件对称性和互换性方面表现出色。联合训练策略使单一模型能从不同数据集中学习共享几何先验,大幅提升性能。

Micro-Act:用自主推理解决问答中的知识冲突

Micro-Act:用自主推理解决问答中的知识冲突

这篇研究介绍了Micro-Act,一种创新框架,旨在解决问答系统中的知识冲突问题。由香港大学等机构研发的这一方法能够自动感知上下文复杂度,并将知识源分解成一系列细粒度比较,有效克服了传统方法在处理复杂冲突时的局限性。实验表明,Micro-Act在五个基准数据集上显著超越了现有技术,并在无冲突场景中保持稳健性能,为构建更可靠的检索增强生成系统提供了新思路。

评估真相大揭秘:DeepSeek推理模型在基准测试中的浮动陷阱

评估真相大揭秘:DeepSeek推理模型在基准测试中的浮动陷阱

这项研究揭示了评估大语言模型推理能力时的一个重要问题:微小的评估条件变化可能导致基准测试结果大幅波动。研究者发现,DeepSeek-R1-Distill系列等模型的评估结果极易受到种子初始化方法、数据集版本等因素影响,波动幅度甚至超过模型训练带来的性能提升。研究团队提出了一个基于透明性和稳定性原则的严格评估范式,建议使用统计学方法确定适当的测试次数,并详细披露所有评估条件,以提高评估的公平性和可靠性。

什么是 Agentic AI?关于人工智能代理的一切须知

什么是 Agentic AI?关于人工智能代理的一切须知

本文介绍了 Agentic AI 的概念、特点及应用,强调其自主决策、分解任务与执行复杂目标的能力,并探讨了应用场景与潜在风险。

人工智能是关于关系的吗?

人工智能是关于关系的吗?

本篇文章以 Navin Chaddha 的采访为主线,阐述了 AI 技术背后人际伙伴关系和早期合作的重要性,以及“协同智能即服务”的理念,强调未来创新依旧由人类主导,技术只是辅助工具。

CapSpeech:开创风格提示语音合成的下游应用新纪元

CapSpeech:开创风格提示语音合成的下游应用新纪元

CapSpeech是约翰·霍普金斯大学等机构联合提出的风格描述文本转语音合成基准,包含超过1000万机器标注和36万人工标注的语音-描述配对。它支持五大下游任务:基础风格描述、带音效的语音合成、口音控制、情感表达和表现力丰富的虚拟代理。研究团队开发了自回归和非自回归两种模型,并通过客观和主观评估证明了该基准的有效性。CapSpeech不仅丰富了语音合成的表现力和可控性,还为实际应用如有声读物、对话代理和跨文化语音合成铺平了道路。

引领AI安全新时代 Accelerate 2025北亚巡展·北京站成功举办

6月5日,"Accelerate 2025北亚巡展·北京站"圆满落幕!来自智库、产业界、Fortinet管理层及技术团队的权威专家,与来自各行业的企业客户代表齐聚一堂,围绕"AI智御全球·引领安全新时代"主题,就AI技术驱动的安全防御体系重构、网络与安全的原生融合实践、全球化场景下的SASE技术落地三大核心议题展开深入研讨。

桑迪亚启用类脑无存储超算

桑迪亚启用类脑无存储超算

Sandia国家实验室与SpiNNcloud合作推出的SpiNNaker2类脑超级计算机,依靠48芯片高并行架构及高速SRAM/DRAM通信,无需GPU或内置存储,适用于国防及前沿计算任务。

2025 年将成为 Meta 增强与虚拟现实的关键之年,CTO 表示

2025 年将成为 Meta 增强与虚拟现实的关键之年,CTO 表示

Meta首席技术官博兹预测2025年将成为Reality Labs转折点,Ray-Ban AI眼镜的突破和激烈市场竞争将决定未来成败。

AI电影节与多元宇宙引擎

AI电影节与多元宇宙引擎

第三届Runway AI电影节展示了利用Runway、Midjourney等AI工具生成全新视听作品,颠覆传统电影制作,赋能无限创意。

基于代理的计算正在超越我们所认知的互联网

基于代理的计算正在超越我们所认知的互联网

文章探讨了互联网从以人为核心向为AI代理优化转型,未来网络将以高速、透明、可验证的机器接口为主。

像人类一样,AI 迫使各机构重新思考其使命

像人类一样,AI 迫使各机构重新思考其使命

文章剖析了在AI浪潮中,传统机构如何应对认知迁移的挑战,通过重构结构与人机协同,探索全新使命定位。

位置专家模型:为推测性解码打造更优质草稿的突破技术——华盛顿大学和卡内基梅隆大学联手研发

位置专家模型:为推测性解码打造更优质草稿的突破技术——华盛顿大学和卡内基梅隆大学联手研发

华盛顿大学和卡内基梅隆大学的研究团队开发了"位置专家"(PosS)技术,解决了推测性解码中的关键挑战。传统方法使用单一草稿模型预测多个位置的词汇,导致预测质量随位置深入而急剧下降。PosS创新性地引入多个专业化层,每层负责特定位置的预测,有效缓解了特征偏差累积问题。实验表明,在Llama系列模型上,PosS比基线方法提高了接受长度达4.5%,加速比提升最多5.7%,而仅带来微小的计算开销。这一技术为大型语言模型的高效推理提供了新思路。

分段优化:让大语言模型通过段级信用分配更高效地学习推理能力

分段优化:让大语言模型通过段级信用分配更高效地学习推理能力

这篇研究论文《段级策略优化》提出了一种介于词元级和轨迹级之间的新型强化学习框架SPO,用于提升大语言模型的推理能力。研究者将生成序列划分为连续段落,并在段级粒度上估计优势,实现了更精确的信用分配和更准确的优势估计。SPO框架包含灵活段落划分、基于蒙特卡洛的段落优势估计和段落优势策略优化三个核心组件。研究团队基于此框架设计了SPO-chain和SPO-tree两个特定实例,分别针对短链思维和长链思维场景。

小语言模型将成为AI智能代理的未来:NVIDIA研究团队揭示更高效的AI架构

小语言模型将成为AI智能代理的未来:NVIDIA研究团队揭示更高效的AI架构

NVIDIA研究团队在最新研究中指出,小语言模型(SLM)将成为AI智能代理的未来。他们论证了SLM不仅足够强大,还在操作上更适合且经济性更高。研究显示现代SLM已可媲美更大模型的性能,同时推理成本降低10-30倍,微调更快捷。论文提出了从大型模型向小型模型转换的算法,并通过案例研究证明在实际智能代理中40-70%的LLM调用可被SLM替代。这一转变将大幅降低AI运营成本,推动更可持续的AI发展。

RiOSWorld:突破性评测揭示多模态电脑使用代理的安全风险隐患

RiOSWorld:突破性评测揭示多模态电脑使用代理的安全风险隐患

RiOSWorld是一项开创性研究,评估多模态计算机使用代理在真实环境中的安全风险。由上海人工智能实验室团队开发的这个基准测试包含492个风险任务,涵盖网页浏览、社交媒体、操作系统等多种应用场景。研究将风险分为环境源和用户源两大类,通过风险目标意图和完成两个维度进行评估。对十个代表性MLLM代理的测试结果表明,当前代理在风险目标意图上的不安全率高达84.93%,在风险目标完成上达59.64%,揭示了AI代理在计算机使用安全性方面存在的严重隐患,为未来可信AI系统的开发提供了重要参考。