最新文章
东南亚文化"被遗忘"?新加坡等高校首次大规模收集1.28M张东南亚文化图像,揭示AI视觉模型的文化盲区

东南亚文化"被遗忘"?新加坡等高校首次大规模收集1.28M张东南亚文化图像,揭示AI视觉模型的文化盲区

新加坡国立大学等机构首次构建包含128万张图像的东南亚文化视觉数据集SEA-VL,解决AI系统文化认知偏见问题。研究采用人工众包、自动筛选、AI生成三种方法收集数据,发现自动筛选效率最高且质量可靠,而AI生成图像质量较差。该数据集覆盖东南亚全部11国文化元素,将为开发更公平包容的AI系统提供重要基础。

NVIDIA发布STORM系统:让AI看懂长视频的神奇技术突破

NVIDIA发布STORM系统:让AI看懂长视频的神奇技术突破

NVIDIA研究团队开发的STORM系统实现了AI长视频理解的重大突破。该系统采用Mamba时间编码技术,能够像人类一样理解视频的时间脉络和内容关联,而非孤立分析每帧画面。通过创新的三种压缩策略,STORM在大幅提升处理效率的同时保持了理解准确性,在多项基准测试中超越现有系统5%以上,为教育、医疗、安防等领域的智能化应用奠定了技术基础。

大语言模型智能代理评估大全:全球顶尖研究机构首次绘制AI代理能力地图

大语言模型智能代理评估大全:全球顶尖研究机构首次绘制AI代理能力地图

这项由希伯来大学、IBM研究院和耶鲁大学联合完成的综合性研究,首次系统梳理了大语言模型智能代理评估领域的完整现状,涵盖基础能力评估、应用场景测试、通用能力考量和开发框架四大维度,为这个快速发展的领域绘制了详细地图,并指出了向现实化、动态化、细粒度评估发展的重要趋势。

视频生成的"考试时间"延长术:清华大学团队让AI在生成时"多想想"就能拍出更好的视频

视频生成的"考试时间"延长术:清华大学团队让AI在生成时"多想想"就能拍出更好的视频

清华大学研究团队提出测试时扩展技术,让AI视频生成如同延长考试时间的学生,通过生成多个候选视频并智能选择最优结果,显著提升视频质量。该方法无需重训模型,在六个主流模型上均实现稳定改进,部分维度提升超35%,为AI视频生成的实用化应用开辟新路径。

3B小模型也能拥有强大推理能力:东南大学团队用两阶段强化学习让小体量AI模型变身思维高手

3B小模型也能拥有强大推理能力:东南大学团队用两阶段强化学习让小体量AI模型变身思维高手

东南大学团队提出LMM-R1框架,通过两阶段强化学习训练策略,让30亿参数的小型多模态AI模型在推理任务上实现显著性能提升。该方法先用纯文本数据强化基础推理能力,再迁移到多模态任务,避免了直接多模态训练导致的性能下降问题,为资源受限环境下的AI应用部署提供了经济高效的解决方案。

AI对齐与控制技术的现状与挑战探析

AI对齐与控制技术的现状与挑战探析

随着AI系统复杂性不断增加,AI对齐技术成为确保系统安全可靠的关键。研究人员正通过人类反馈强化学习、合成数据训练、红队测试等技术手段,以及AI治理、伦理委员会等管理方法来引导AI行为。然而,价值观的多样性和AI系统的"迎合性"行为带来了新挑战。最新研究表明,我们可以理解并调整AI内部表征参数来控制系统输出。控制AI不仅是技术挑战,更是道德和政治选择问题。

谷歌推出强大创造性问题解决AI模型Gemini 2.5 Deep Think

谷歌推出强大创造性问题解决AI模型Gemini 2.5 Deep Think

谷歌DeepMind发布Gemini 2.5 Deep Think,这是一款新的创意问题解决AI模型。该模型能够同时考虑多个想法并选择最佳答案来解决复杂问题。Deep Think通过延长"思考时间",探索不同假设以找到创意解决方案。新模型在编程、科学知识和推理能力基准测试中表现优异,特别擅长迭代开发、数学研究和复杂编程问题。该工具将在Gemini应用中向Ultra订阅用户提供,月费250美元。

Google发布Gemini 2.5 Deep Think仅供AI Ultra订阅用户使用

Google发布Gemini 2.5 Deep Think仅供AI Ultra订阅用户使用

谷歌正式推出其最强大的Gemini 2.5深度思考AI模型,但仅向每月250美元的AI Ultra订阅用户开放。该模型基于Gemini 2.5 Pro,通过增加"思考时间"和并行分析来处理复杂查询。深度思考模型在多个基准测试中表现优异,在人类最终考试中得分34.8%,远超其他模型的20-25%。该模型特别擅长数学推理、科学分析和编程,响应时间需要数分钟,每日使用次数有限制。

Anthropic切断OpenAI访问Claude模型的权限

Anthropic切断OpenAI访问Claude模型的权限

据Wired报道,Anthropic已撤销OpenAI对其Claude系列AI模型的访问权限。消息人士称,OpenAI将Claude连接到内部工具,用于在编程、写作和安全等方面与自家模型进行性能对比。Anthropic发言人表示,OpenAI技术人员在GPT-5发布前使用其编程工具,直接违反了服务条款。不过Anthropic仍将为基准测试和安全评估提供访问权限。OpenAI则回应称其使用方式符合行业标准。

库克强调苹果"必须"在AI领域获胜

库克强调苹果"必须"在AI领域获胜

据报道,苹果CEO蒂姆·库克召开了一小时的全员会议,告诉员工公司必须在AI领域获胜。这次会议是在财报电话会议之后举行的,库克在财报会上表示苹果将"大幅"增加AI投资。尽管苹果在过去一年推出了Apple Intelligence系列AI功能,但语音助手Siri的升级却严重延迟。库克承认公司已落后于竞争对手,但强调苹果虽然很少率先推出产品,却能发明这些产品的"现代"版本。

微软发布Phi-4-Mini:3.8B参数的"小钢炮",多模态表现堪比大模型两倍体量

微软发布Phi-4-Mini:3.8B参数的"小钢炮",多模态表现堪比大模型两倍体量

微软发布Phi-4-Mini多模态语言模型,仅3.8亿参数却能媲美两倍规模模型性能。该模型采用创新"混合LoRA"技术,支持文本、图像、语音多模态输入,在数学推理、编程、语音识别等任务中表现出色,在OpenASR榜单排名第一。这种"小而精"设计理念为AI普及化提供新思路,使强大AI功能可在消费级设备运行。

IBM研究院突破性新工具:让AI自己找出"哪里做错了",告别人工排错时代

IBM研究院突破性新工具:让AI自己找出"哪里做错了",告别人工排错时代

IBM研究院推出革命性AI诊断工具CLEAR,能够自动分析AI系统错误并生成详细报告。该工具采用"AI评判AI"的创新方法,将复杂的错误分析过程自动化,帮助开发者快速发现问题模式。用户研究显示75%的开发者认为该工具比传统手工分析更高效,已开源供全球开发者使用。

百万模型的失踪与重生:希伯来大学科学家如何绘制全球AI模型的完整地图

百万模型的失踪与重生:希伯来大学科学家如何绘制全球AI模型的完整地图

希伯来大学研究团队提出"模型地图集"概念,系统性解决AI领域模型管理混乱问题。当前150万公开模型中超过60%缺乏文档,研究者难以找到合适模型,造成重复训练和资源浪费。团队开发出绕过权重对称性难题的新方法,能够自动推断模型血统关系和功能属性,已在真实数据上达到80%以上准确率,为构建有序AI生态系统奠定基础。

PLADIS:三星研究院用稀疏注意力机制让AI画图更懂你说的话

PLADIS:三星研究院用稀疏注意力机制让AI画图更懂你说的话

三星研究院提出PLADIS技术,通过稀疏注意力机制显著提升AI绘画的文字理解准确性。该方法无需重训练模型,仅在推理阶段替换注意力计算函数,就能让AI更精准理解用户描述,生成更符合要求的图像。实验显示图像质量提升20%,文字匹配度大幅改善,且兼容各种现有AI绘画系统。

如何让AI更聪明地理解多种语言?法国、葡萄牙等欧洲研究机构联合发布语言AI突破性成果

如何让AI更聪明地理解多种语言?法国、葡萄牙等欧洲研究机构联合发布语言AI突破性成果

这项由法国CentraleSupélec大学领导的国际研究成果发布了EuroBERT多语言AI模型家族,该模型支持15种语言处理,具备数学和编程理解能力,支持长达8192token的文本处理,在多项任务上超越现有模型,为跨语言AI应用提供了新的技术基础。

Palo Alto斥资250亿美元收购CyberArk,专注保护智能体身份安全

Palo Alto斥资250亿美元收购CyberArk,专注保护智能体身份安全

Palo Alto Networks宣布以250亿美元收购身份安全专家CyberArk,正式进入身份安全领域。此次收购旨在将CyberArk的身份和特权访问管理专业技术整合到其AI支持的网络平台中,不仅保护人类和机器身份,还要保护自主人工智能代理。两家公司希望通过合并产品来创建新型综合网络平台,消除安全缺口并简化操作,同时应对智能体AI带来的安全挑战。

AI时代为何迫使整个计算基础架构重新设计

AI时代为何迫使整个计算基础架构重新设计

过去几十年,摩尔定律推动了计算性能的巨大进步,但AI革命需要远超互联网时代的能力提升。生成式AI的需求正在逆转传统趋势,推动从通用硬件向专用计算单元转变,包括ASIC、GPU和TPU等。这要求重新设计整个技术栈:采用专用互连网络突破通信瓶颈、使用高带宽内存解决内存墙问题、构建超高密度系统支持大规模同步计算。同时需要新的容错策略、可持续的功耗管理和内置的安全隐私保护,以及快速部署能力来跟上硬件创新节奏。

OpenAI智能体背后的推理技术研发历程

OpenAI智能体背后的推理技术研发历程

OpenAI正致力于打造能够执行复杂任务的AI智能体,这一努力源于其数学推理团队MathGen的突破性工作。通过结合大语言模型、强化学习和测试时计算技术,OpenAI开发出了o1推理模型,该模型在国际数学奥林匹克竞赛中获得金牌。尽管当前AI智能体在主观性任务上仍有局限,但OpenAI相信推理能力的提升将最终实现通用智能体的目标。

Reddit凭借人类原创内容在AI时代获得新机遇

Reddit凭借人类原创内容在AI时代获得新机遇

Reddit凭借人工创作内容在AI时代获得丰厚回报。公司第二季度收入达5亿美元,同比增长78%,净利润8900万美元。CEO胡夫曼表示,Reddit为当前时代而生,人类对话和知识价值凸显。公司数据授权业务收入3500万美元,与OpenAI和谷歌建立合作伙伴关系。Reddit将搜索视为机遇,本地搜索产品拥有7000万周活用户,Reddit Answers用户从100万增至600万。

雀巢如何用数字孪生和AI重塑创意营销未来

雀巢如何用数字孪生和AI重塑创意营销未来

在快节奏的零售环境中,消费者偏好瞬息万变,品牌需要脱颖而出。英伟达和微软正帮助雀巢等企业利用AI和3D数字孪生技术变革创意工作流程,推动营销创新。基于微软Azure平台上的英伟达Omniverse库,雀巢已建立4000个3D数字产品库,计划两年内将10000个产品转换为数字孪生。该技术能够实现高质量内容规模化创建、预测分析、产品配置和沉浸式客户体验,帮助企业降低成本、提升营销效率。