最新文章
阿里达摩院推出RynnEC:让机器人像人类一样"看懂"世界的革命性技术

阿里达摩院推出RynnEC:让机器人像人类一样"看懂"世界的革命性技术

阿里达摩院推出RynnEC,这是一个专为机器人设计的视频理解AI模型。它能让机器人像人类一样理解物理空间,准确识别物体位置、判断距离关系,甚至预测行动后果。该技术在认知测试中超越现有AI模型10.7个百分点,并提供轻量版本便于实际部署,为未来智能机器人的普及铺平道路。

NVIDIA发布Nemotron Nano 2:小身材大智慧,让AI推理速度飞跃6倍

NVIDIA发布Nemotron Nano 2:小身材大智慧,让AI推理速度飞跃6倍

NVIDIA发布Nemotron Nano 2混合AI模型,采用创新的Mamba-Transformer架构,在保持90亿参数规模的同时,实现了比同类模型3-6倍的推理速度提升。该模型在数学、科学、编程等复杂推理任务上表现出色,支持15种语言,能在单GPU上处理12.8万字符长文本,为高效AI应用开辟了新路径。

ByteDance Seed和南京大学联手破解AI训练难题:无需人工标注的"双向学习"让机器自己当老师

ByteDance Seed和南京大学联手破解AI训练难题:无需人工标注的"双向学习"让机器自己当老师

ByteDance Seed和南京大学研究团队提出DuPO双向学习训练法,让AI模型通过"出题-验证"的方式自我提升,无需人工标注。该方法在多语言翻译和数学推理上效果显著,让7B模型达到GPT-4o水平,数学推理提升6.4个百分点。这一突破为AI自主学习开辟新路径,大幅降低训练成本。

俄勒冈大学研究团队推出mSCoRe:让AI学会全球常识推理的"多语言考场"

俄勒冈大学研究团队推出mSCoRe:让AI学会全球常识推理的"多语言考场"

俄勒冈大学和Adobe研究团队开发了mSCoRe基准系统,专门测评AI在多语言环境下的常识推理能力。该系统首次将推理过程细分为十种基本技能,涵盖逻辑、情境和社会伦理三大类别,并创新性地引入动态复杂度扩展机制。通过对八个顶级大语言模型的全面测试,研究发现现有AI系统过度依赖单一推理模式,在文化敏感的社会常识判断上仍有显著不足。

AI将在2030年前渗透所有IT工作——但不会取代所有IT岗位

AI将在2030年前渗透所有IT工作——但不会取代所有IT岗位

Gartner预测,到2030年所有IT工作都将涉及AI技术的使用,这与目前81%的IT工作不使用AI形成鲜明对比。届时25%的IT工作将完全由机器人执行,75%由人类在AI辅助下完成。尽管AI将取代部分入门级IT职位,但Gartner认为不会出现大规模失业潮,目前仅1%的失业由AI造成。研究显示65%的公司在AI投资上亏损,而世界经济论坛预计AI到2030年创造的就业机会将比消除的多7800万个。

AI工厂引领产业变革:芯片巨头如何重塑计算基础设施

AI工厂引领产业变革:芯片巨头如何重塑计算基础设施

人工智能正从软件故事转向AI工厂基础,芯片、数据管道和网络协同工作形成数字化生产系统。这种新兴模式重新定义了性能衡量标准和跨行业价值创造方式。AI工厂将定制半导体、低延迟结构和大规模数据仪器整合为实时反馈循环,产生竞争优势。博通、英伟达和IBM正在引领这一转变,通过长期定制芯片合同和企业遥测技术,将传统体验转化为活跃的数字生态系统。

谷歌法庭文件承认开放网络正"快速衰落"

谷歌法庭文件承认开放网络正"快速衰落"

谷歌在反垄断案的法庭文件中声称"开放网络正在快速衰落",试图阻止法院强制其分拆广告业务。该公司败诉后,现在面临补救措施裁决。谷歌辩称强制剥离AdX市场将加速依赖广告收入的网站灭亡。然而这与其此前声称AI搜索仍为网站带来大量流量的说法矛盾。分析显示AI概览功能实际导致网站流量大幅下降,而应用内广告成为最大增长领域,传统网页展示广告收入停滞。

d-Matrix推出IO加速器,宣称AI推理延迟将达到全新低点

d-Matrix推出IO加速器,宣称AI推理延迟将达到全新低点

d-Matrix在AI基础设施峰会上发布JetStream IO加速卡,这款定制PCI卡可提供400Gbps带宽和2微秒延迟。该产品基于FPGA技术,可与去年发布的Corsair推理加速平台配合使用,支持在服务器内部和多节点间扩展。CEO表示,随着行业重点从大模型训练转向商业化推理,该产品旨在解决内存计算瓶颈后的IO瓶颈问题。JetStream采用标准以太网协议,可直接部署到现有数据中心。

Vidu推出参考图转图功能,用生成式AI重塑摄影创作

Vidu推出参考图转图功能,用生成式AI重塑摄影创作

中国生数科技旗下AI产品Vidu发布新版本更新,推出"参考图像生成"功能,用户可上传最多7张参考图片,通过AI模型的语义理解技术将多张图像合成为高度一致的新图像。该功能支持快速编辑照片、替换物体、调整光照等操作,为摄影师、营销人员提供便捷的AI图像编辑工具,在保持视觉一致性方面与谷歌等竞品形成竞争。

SiFive推出面向AI设备的全新处理器核心设计

SiFive推出面向AI设备的全新处理器核心设计

芯片初创公司SiFive推出四款专为运行人工智能模型优化的CPU核心。这些基于开源RISC-V架构的新核心增加了矢量扩展功能,能够更高效地并行处理多个数据点,显著加速AI模型运算。其中X160和X180是主打产品,具备加速卷积运算的矢量处理功能,可用于工业设备、消费电子和数据中心。公司预计客户将于2026年第二季度开始基于新核心设计生产芯片。

神经形态计算与边缘AI的未来发展

神经形态计算与边缘AI的未来发展

随着AI硬件面临功耗、散热和延迟等挑战,神经形态计算正成为下一代AI的关键技术。中科院最新发布的达尔文猴3芯片展现了这一技术的突破性进展。神经形态系统模仿人脑的事件驱动机制,在边缘环境中实现超低功耗和实时处理。该技术在医疗诊断、工业控制、网络安全和物流等领域显示出巨大潜力,有望解决传统GPU架构的能耗和基础设施限制问题。

CIO未来职业发展的五个关键策略

CIO未来职业发展的五个关键策略

随着AI等新兴技术重塑商业环境,CIO角色持续扩展,需要承担更多战略责任。研究显示94%的CIO需要向董事会汇报技术投资回报率,85%面临技术价值证明压力。专家建议CIO采用五大策略确保职业发展:主导而非仅参与战略制定;拥抱技术专家身份,深入了解新兴技术;以敏捷性和同理心推动变革;保持好奇心和持续学习;提升领导力技能。这些能力将帮助CIO在快速变化的技术环境中保持竞争优势。

无技术学位转行网络安全:实用指南

无技术学位转行网络安全:实用指南

全球网络安全岗位缺口超过350万个,网络犯罪损失预计到2025年将达10.5万亿美元。传统门槛如计算机学位、编程技能等阻碍了大量人才进入该领域。本文作者从人力资源顾问成功转型为GRC专业人士,证明了非技术背景人员可通过治理、风险和合规(GRC)角色进入网络安全领域。GRC需要的是商业思维和沟通技能,而非深度技术知识。文章提供了认证路径、网络建设和避免常见陷阱的策略建议。

IDC发布乐观AI支出预测:2029年将达1.3万亿美元

IDC发布乐观AI支出预测:2029年将达1.3万亿美元

IDC发布最新预测报告,预计到2029年AI支出将达到1.3万亿美元,2025至2029年复合年增长率为31.9%。服务提供商将占基础设施支出的80%,主要用于构建智能代理AI平台。报告指出,基础设施建设将持续到2029年,智能代理AI将推动应用软件领域的重大变革。这一预测与英伟达CEO黄仁勋提出的未来十年AI支出3-4万亿美元的判断相呼应。

2025-09-08

Cloudera:企业如何掌控专有数据

随着数据量激增,新的数据源不断涌现,企业越来越难以从分散在云端、边缘计算、数据中心、大型主机和终端设备的关键信息中挖掘价值。

揭秘"CORA":微软与谷歌联手打造的突破性多模态AI模型,让计算机真正"看懂"世界

揭秘"CORA":微软与谷歌联手打造的突破性多模态AI模型,让计算机真正"看懂"世界

CORA是微软研究院与谷歌研究团队联合开发的突破性AI视觉模型,发表于2023年CVPR会议。它通过创新的"区域提示"和"锚点预匹配"技术,成功解决了计算机视觉领域的一大挑战——开放词汇目标检测。CORA能够识别训练数据中从未出现过的物体类别,就像人类能够举一反三一样。在LVIS数据集测试中,CORA的性能比现有最佳方法提高了4.6个百分点,尤其在稀有类别识别上表现突出。这一技术有望广泛应用于自动驾驶、零售、安防和辅助技术等多个领域。

中国电信研究院首发T2R-bench基准:让AI从表格数据生成专业报告有多难?

中国电信研究院首发T2R-bench基准:让AI从表格数据生成专业报告有多难?

中国电信研究院联合重庆大学、北航发布T2R-bench基准,首次系统评估AI从工业表格生成专业报告的能力。研究涵盖457个真实工业表格,测试25个主流AI模型,发现最强模型得分仅62.71%,远低于人类专家96.52%。揭示AI在处理复杂结构表格、超大规模数据时存在数字计算错误、信息遗漏等关键缺陷,为AI数据分析技术改进指明方向。

ALLaM-34B阿拉伯语AI大模型实测:沙特AI局如何让机器说出地道阿拉伯话

ALLaM-34B阿拉伯语AI大模型实测:沙特AI局如何让机器说出地道阿拉伯话

这项研究对沙特数据与AI管理局开发的ALLaM-34B阿拉伯语大模型进行了全面的用户界面评测。研究团队使用23个测试提示,每个重复5次,收集115个回答样本,并用三个前沿AI模型作为评委进行多维度打分。结果显示ALLaM-34B在代码转换和创意生成方面表现优秀(均4.92分),现代标准阿拉伯语和知识问答能力强劲,安全防护可靠,但在方言处理上存在不均衡,为阿拉伯语AI发展提供了重要参考。

卢布尔雅那大学开发出"全能型"表面缺陷检测神器:一个模型搞定所有标注场景的工业检测难题

卢布尔雅那大学开发出"全能型"表面缺陷检测神器:一个模型搞定所有标注场景的工业检测难题

卢布尔雅那大学研究团队开发出SuperSimpleNet统一缺陷检测系统,能够适应无监督、弱监督、混合监督和完全监督四种学习场景。该系统在多个数据集上达到98%以上检测准确率,推理时间仅9.5毫秒,通过创新的合成异常生成技术和双分支架构设计,解决了传统方法只能处理特定标注类型的局限性,为工业质量检测提供了灵活高效的解决方案。

亚利桑那州立大学团队破解AI工具使用难题:让智能助手在复杂环境下准确率飙升19.1%

亚利桑那州立大学团队破解AI工具使用难题:让智能助手在复杂环境下准确率飙升19.1%

亚利桑那州立大学研究团队开发出IRMA框架,通过输入重构技术显著提升AI助手在复杂环境下的工具使用准确率。该系统采用记忆、约束和工具建议三模块协同工作,相比传统方法准确率最高提升19.1%,在航空和零售领域测试中表现卓越,为智能客服等实际应用提供了实用解决方案。