最新文章
多语言视觉AI的新突破:让人工智能真正懂得全球文化差异

多语言视觉AI的新突破:让人工智能真正懂得全球文化差异

这项由13家国际研究机构联合开发的研究介绍了Maya——一个突破性的多语言视觉AI模型。Maya能够用8种语言理解和描述图片内容,包括理解不同文化背景的视觉概念。研究团队通过创新的数据构建方法,将55万个英文样本扩展为440万个高质量多语言样本,并采用两阶段训练策略。Maya在多语言基准测试中表现优异,特别是在阿拉伯语等复杂语言上超越了同类模型,为教育、医疗、旅游等领域的全球化应用开辟了新路径。

让AI"眼睛"更干净:印第安纳大学团队为视觉语言模型清理"有毒"训练数据

让AI"眼睛"更干净:印第安纳大学团队为视觉语言模型清理"有毒"训练数据

这项研究首次系统性地检测和清理了视觉语言模型训练数据中的有害内容,从LLaVA数据集的558,000对图片-文字数据中识别并移除了7,531个有毒样本。研究团队开发了结合图像和文本检测的多模态毒性过滤系统,为AI安全建立了新标准,并开源了清理后的数据集供学术界使用。

德州大学团队将3D场景表示"减肥"50%:让手机也能流畅渲染高质量3D世界

德州大学团队将3D场景表示"减肥"50%:让手机也能流畅渲染高质量3D世界

德州大学研究团队通过数学优化理论,成功将3D高斯点云渲染技术的点数量减少50%,在保持渲染质量的同时大幅降低内存占用。该技术通过"分裂矩阵"精确识别需要优化的区域,有望让高质量3D渲染在手机等移动设备上普及,为VR/AR应用带来突破。

这样也能教会机器人?延世大学团队用看视频的方式让机器人学会人类动作

这样也能教会机器人?延世大学团队用看视频的方式让机器人学会人类动作

延世大学研究团队开发的UniSkill系统实现了机器人跨身体形态学习的重大突破。该系统让机器人能够通过观看人类演示视频学习技能,无需配对训练数据,在真实环境测试中达到87%的成功率。系统采用逆向和前向技能动力学模型,通过图像编辑框架提取动作本质,展现出强大的泛化能力和跨平台适用性,为机器人技能获取开辟了新路径。

伊利诺伊大学香槟分校团队推出SWERANK:用聪明排序替代昂贵AI助手,让软件调试变得又快又省钱

伊利诺伊大学香槟分校团队推出SWERANK:用聪明排序替代昂贵AI助手,让软件调试变得又快又省钱

伊利诺伊大学香槟分校团队推出SWERANK软件问题定位框架,通过"先筛选再精排"的两阶段策略,以极低成本实现了超越昂贵AI助手的问题定位准确性。团队构建的SWELOC数据集为训练提供了高质量的真实案例,实验证明该方法在成本效益比上比现有方案高出57倍,为软件开发行业提供了实用且经济的调试解决方案。

爱丁堡大学突破性成果:让AI像人类一样"思考"并解释视觉问题的推理过程

爱丁堡大学突破性成果:让AI像人类一样"思考"并解释视觉问题的推理过程

爱丁堡大学联合英伟达开发的VISTAR系统首次让AI能够像人类一样展示视觉问答的完整推理过程。该系统通过创新的"子任务思维链"方法,将复杂问题分解为多个简单步骤,不仅提供准确答案,还能在图片上精确标注相关物体位置,让AI推理过程变得透明可解释,为构建更可信的AI系统奠定重要基础。

让AI像人一样思考:DeCLIP为机器视觉带来"语境理解"的重大突破

让AI像人一样思考:DeCLIP为机器视觉带来"语境理解"的重大突破

这项由哈尔滨工业大学等机构联合开展的研究提出了DeCLIP方法,通过"解耦"策略解决了CLIP模型在精细视觉任务上的局限性。该方法将模型的注意力机制分为内容和上下文两个分支,分别优化物体识别和空间理解能力,在多个开放词汇视觉任务上取得显著性能提升,为AI视觉理解带来重要突破。

检索增强生成(RAG)为何在今天如此流行?

检索增强生成(RAG)为何在今天如此流行?

检索增强生成(RAG)正成为AI领域的关键技术,通过结合外部信息检索与大语言模型的生成能力,解决传统模型仅依赖训练数据的局限性。RAG允许模型实时访问外部数据库或文档,提供更准确、更新的信息。该技术可应用于企业文档查询、个人化AI助手等场景,通过向模型提供特定领域知识来获得精准结果。微软专家指出,RAG有助于结合知识与推理、提高模型使用效率,并支持多模态应用。

iMerit公司:高质量数据而非数据量是AI未来发展关键

iMerit公司:高质量数据而非数据量是AI未来发展关键

AI数据平台iMerit认为企业级AI工具集成的下一步不是更多数据,而是更好的数据。该公司正式推出学者计划,旨在建立专家团队来微调生成式AI模型。与Scale AI的高吞吐量方法不同,iMerit专注于专家主导的高质量数据标注,需要深度人工判断和领域专业监督。公司目前与超过4000名学者合作,客户包括三家大型生成式AI公司、八家顶级自动驾驶公司等。

Anubis守护网站抵御大语言模型爬虫攻击

Anubis守护网站抵御大语言模型爬虫攻击

Anubis是一种反向验证码系统,通过工作量证明机制让AI爬虫的网站抓取成本变得极其昂贵。该系统以古埃及胡狼头神命名,当人类访问者浏览网站时只需短暂等待,而大规模爬虫则需消耗大量计算资源。面对LLM训练数据需求激增导致的重复抓取问题,Anubis已被联合国教科文组织等多个知名项目采用,有效保护网站免受AI爬虫骚扰。

IBM watsonx平台推出v2.2版本,全面增强AI智能体开发能力

IBM watsonx平台推出v2.2版本,全面增强AI智能体开发能力

IBM开发者正在为其watsonx.data和watsonx AI软件平台添加新功能,帮助客户构建和运营AI代理,提升数据存储请求响应速度并符合治理监控要求。最新的v2.2版本包含三个核心组件的更新:watsonx.ai企业级AI工作室、watsonx.data开放混合数据存储以及watsonx.governance AI活动管理。更新内容涵盖AutoAI RAG功能增强、多语言模型支持、新的文档格式处理能力、向量数据库引擎优化等多项改进。

CIO将运用AI和低代码技术应对SaaS应用泛滥

CIO将运用AI和低代码技术应对SaaS应用泛滥

企业平均使用100-300个SaaS应用,导致流程分散、数据孤岛和成本激增。Nintex CEO认为,低代码开发、AI和自动化平台的融合正推动CIO从"购买"转向"构建"思维。企业可创建定制应用解决特定问题,整合技术栈。AI代理成为产品战略核心,能改善构建体验并实现流程互联。随着AI技术发展,采购决策权重新回归CIO,通过统一平台实现更好的治理模式。

国产大模型“狂禅式”的训练范式急需变革
2025-07-10

国产大模型“狂禅式”的训练范式急需变革

作者按:人工智能的浪潮正以前所未有的势头席卷全球,国产大模型在这一波澜壮阔的变革中,展现出了令人瞩目的雄心与活力。然而近期国产大模型暴露出的问题不可忽视,甚至到了不味不快的程度。本文力图揭露国产大模型的训练范式上的缺陷,希望对业界有所裨益。

Commvault提升合作伙伴主管职位并与Platform9达成集成合作

Commvault提升合作伙伴主管职位并与Platform9达成集成合作

Commvault调整领导团队并与私有云供应商Platform9达成新合作。Alan Atkinson从首席合作伙伴官晋升为首席业务发展官,负责构建战略技术和安全合作伙伴关系。Michelle Graff被聘为全球合作伙伴和渠道高级副总裁。Platform9将Commvault的虚拟机和Kubernetes工作负载保护功能集成到其私有云解决方案中,提供无代理虚拟机备份恢复、应用一致性备份和容器保护等功能。

Google Cloud正式推出基于DDN技术的托管式Lustre文件系统

Google Cloud正式推出基于DDN技术的托管式Lustre文件系统

谷歌云正式发布基于DDN EXAScaler软件的托管Lustre服务,专为AI、生成式AI和高性能计算应用提供高速文件存储。该服务支持高达1TBps的读取吞吐量,延迟低于1毫秒,存储容量可从18TiB扩展至8PiB以上。具备POSIX兼容性,与谷歌云计算引擎、Kubernetes引擎和Vertex AI平台原生集成,提供99.9%可用性保障。

BigQuery如何结合数据与AI实现企业转型

BigQuery如何结合数据与AI实现企业转型

AI具有变革企业洞察力的巨大潜力,但成功取决于数据质量。多数AI项目失败并非算法限制,而是数据混乱、分散和准备不足。Google BigQuery云数据AI平台专为打破数据孤岛、简化治理和加速企业AI应用而构建。通过AI自动化处理大规模数据集,实现实时处理和智能数据管道,BigQuery与Vertex AI的原生集成消除了数据迁移需求,让更多用户能够直接使用AI功能,将数据到AI洞察的承诺变为现实。

数据中心干式冷却器的优缺点分析

数据中心干式冷却器的优缺点分析

传统数据中心冷却需要大量水和电力,干式冷却器提供了新的替代方案。通过利用环境空气进行热交换,干式冷却器几乎不消耗水资源且能耗更低,有助解决行业可持续发展挑战。然而,干式冷却器初期投资成本高,在高温或高湿环境下效果不佳,且需要更大物理空间。混合冷却方案结合干式冷却和传统冷却塔,可根据环境温度灵活切换,为追求节水的数据中心运营商提供了可行选择。

“GPU闲置过半,器件逼近物理极限”?是德科技如何应对AI基础设施之困

“GPU闲置过半,器件逼近物理极限”?是德科技如何应对AI基础设施之困

是德科技高级副总裁兼通信解决方案事业部总裁Kailash Narayanan现场指出,算力固然重要,但如果能耗过高,技术的实用性将大打折扣,因此,所有的高速、高性能计算,都必须在极低的功耗下实现,这是AI等技术能否大规模落地的核心前提。

中国研究人员发布MemOS,首个让AI拥有人类般记忆的"内存操作系统"

中国研究人员发布MemOS,首个让AI拥有人类般记忆的"内存操作系统"

来自上海交通大学和浙江大学等机构的研究团队开发出首个AI"记忆操作系统"MemOS,解决了AI系统无法实现人类般持久记忆和学习的根本限制。该系统将记忆视为核心计算资源进行调度、共享和演化,在时间推理任务中相比OpenAI记忆系统性能提升159%。MemOS采用三层架构设计,通过标准化记忆单元实现跨平台记忆迁移,有望改变企业AI部署模式。

存力觉醒、AI未来!2025全球闪存峰会在南京盛大召开

存力觉醒、AI未来!2025全球闪存峰会在南京盛大召开

本次峰会以“存力觉醒、AI未来”为主题,由DOIT传媒主办,算力豹、CXL技术应用俱乐部、南京计算机学会、JEDEC等单位支持,旨在汇聚全球存储领域精英,深入探讨在人工智能浪潮中,闪存技术如何赋能数字化转型,推动产业发展迈向新高度。