最新文章
Broadcom将私有AI整合入VCF平台并增强安全自动化

Broadcom将私有AI整合入VCF平台并增强安全自动化

博通宣布对VMware Cloud Foundation平台进行重大升级,将私有AI服务集成到核心订阅中,并为vSAN存储虚拟化软件添加云原生对象存储支持。此举旨在满足企业对简化基础设施、高效AI采用和网络安全的需求。升级包括与英伟达合作的VMware Private AI Foundation服务、支持AMD GPU、Amazon S3兼容对象存储、与Canonical合作的Ubuntu容器镜像,以及新的四阶段自动化安全流程。博通还推出了面向高监管行业的VCF网络合规高级服务。

Gemini 2.5 Flash Image企业级图像编辑一致性与精准控制升级

Gemini 2.5 Flash Image企业级图像编辑一致性与精准控制升级

Google正式发布Gemini 2.5 Flash Image模型,该模型此前在测试版中被称为nanobanana。新模型为企业创意项目提供更多选择,能够快速修改图像外观并提供比以往模型更强的控制能力。该模型在保持人物相似度和编辑一致性方面表现出色,支持多轮编辑、照片融合等功能,并已集成到Gemini应用中供付费和免费用户使用。

华为将推出AI SSD缓解GPU内存瓶颈问题

华为将推出AI SSD缓解GPU内存瓶颈问题

华为即将发布AI固态硬盘,配合统一缓存管理软件,将键值缓存数据从GPU高带宽内存中转移到SSD存储,避免重复计算以提升AI处理速度。该方案采用分层缓存架构,整合GPU内存、CPU内存和SSD存储。华为还将运用XtremeLink技术和SpeedFlex印刷电路板技术。此举旨在解决GPU服务器内存墙问题,帮助中国构建新的AI生态系统。

谷歌发布新版图像生成AI挑战Photoshop地位

谷歌发布新版图像生成AI挑战Photoshop地位

谷歌发布Gemini 2.5 Flash Image升级版,支持语音和文本提示生成图像,可替换照片中的人物、更改服装或合并真实图像与新背景。该工具目前仅在Gemini移动应用中提供。测试显示其处理速度极快,能在几秒内完成复杂的图像编辑任务,包括自动补全缺失的身体部位和衣物细节。谷歌集成了SynthID水印技术识别AI生成图像,并设置了内容安全防护措施。

Anthropic推出Chrome浏览器AI智能体Claude

Anthropic推出Chrome浏览器AI智能体Claude

Anthropic发布基于Claude AI模型的浏览器智能体研究预览版,目前向1000名Max计划订阅用户开放。用户可通过Chrome扩展与Claude在侧边栏窗口中交互,Claude能够理解浏览器上下文并代表用户执行任务。随着谷歌反垄断案临近,浏览器正成为AI实验室的新战场。Anthropic已实施多项安全防护措施,将提示注入攻击成功率从23.6%降至11.2%,并限制访问金融、成人内容等敏感网站。

滑铁卢大学科学家发明神奇AI:仅凭声音就能生成开口说话的逼真视频

滑铁卢大学科学家发明神奇AI:仅凭声音就能生成开口说话的逼真视频

这项研究展示了一种革命性的AI技术,能够仅通过音频生成高度逼真的说话视频。滑铁卢大学研究团队开发的Audio2Photoreal系统巧妙结合了深度学习、扩散模型等先进技术,实现了声音到面部动作的精准转换。该技术在影视制作、在线教育、新闻媒体等领域具有广阔应用前景,将大幅降低视频制作成本和门槛。虽然仍面临计算资源需求高、隐私安全等挑战,但其突破性创新为未来视频内容创作开辟了全新路径。

腾讯深圳大学革命性突破:让电脑理解语言的秘密武器终于诞生

腾讯深圳大学革命性突破:让电脑理解语言的秘密武器终于诞生

腾讯和深圳大学联合开发的多视角语言理解技术取得重大突破,通过创新的训练方法让人工智能具备接近人类水平的语言理解能力。系统能准确识别讽刺、情感变化等复杂语言现象,在多项测试中表现优异,已在客服、教育、医疗等领域开始应用,未来有望广泛改善人机交互体验。

当AI模型遇到"转个身"的挑战:UNC Chapel Hill揭示多模态大语言模型的方向感困惑

当AI模型遇到"转个身"的挑战:UNC Chapel Hill揭示多模态大语言模型的方向感困惑

UNC Chapel Hill研究团队发现,即使是GPT-5、o3等顶级多模态大语言模型也无法可靠识别图像旋转。通过RotBench基准测试,研究揭示这些AI模型虽能识别正常朝向和倒置图片,却完全无法区分90度与270度旋转,暴露出当前AI在基础空间推理方面的重大缺陷。

腾讯等机构联手揭秘:AI大模型的"幻觉"问题终于有解了

腾讯等机构联手揭秘:AI大模型的"幻觉"问题终于有解了

腾讯AI Lab等机构联合研究解决了AI大语言模型的"幻觉"问题。他们开发的"迭代自调优"方法教会AI诚实承认不确定性,而非编造错误信息。实验证明该方法显著提升了AI的诚实度和可靠性,同时保持了有用性。这项突破将让AI助手在医疗、教育、法律等关键领域变得更加可信,为构建可靠的人工智能系统奠定基础。

AI在虚拟世界中的"英雄之旅":AIRI研究团队如何打造测试智能规划能力的全新战场

AI在虚拟世界中的"英雄之旅":AIRI研究团队如何打造测试智能规划能力的全新战场

AIRI研究团队开发了HeroBench测试平台,在RPG风格虚拟世界中评估25个大型语言模型的长期规划能力。研究发现AI在复杂多步骤规划任务中表现差异巨大,顶级模型Grok-4达到91.7%成功率,但加入升级机制和干扰因素后性能显著下降。该研究揭示了传统学术测试无法反映的AI规划能力真实水平,为改进AI长期规划提供了重要基准。

数学AI也会"装懂"?清华和川大团队发现大模型不会主动求助的惊人真相

数学AI也会"装懂"?清华和川大团队发现大模型不会主动求助的惊人真相

四川大学和北京智源人工智能研究院研究团队发现,当前最先进的大语言推理模型存在"装懂"问题:面对信息不完整的数学题时,只有25%会主动询问缺失信息,大部分选择猜测答案。研究构建CRITIC-math数据集系统测试了这一现象,发现AI表现出思维背叛、过度思考、幻觉填空三种典型行为,揭示了当前AI训练中忽视求助意识培养的根本缺陷。

阿里巴巴推出Ovis2.5:能看图思考的AI聊天机器人有了"火眼金睛"

阿里巴巴推出Ovis2.5:能看图思考的AI聊天机器人有了"火眼金睛"

阿里巴巴推出的Ovis2.5是一个革命性的多模态AI模型,具备原生分辨率图像处理和深度推理能力。它采用五阶段训练体系,在OpenCompass评测中创造了开源模型新纪录。其突破性的思考模式让AI能够进行类人推理和自我纠错,在数学推理、图表分析、文字识别等方面表现卓越,为教育、医疗、商业等领域提供了强大的AI助手解决方案。

南洋理工大学团队革命性突破:让AI绘画像艺术家一样从粗到细,一步步创作精美图像

南洋理工大学团队革命性突破:让AI绘画像艺术家一样从粗到细,一步步创作精美图像

南洋理工大学研究团队开发的NVG技术革新了AI图像生成方式,让AI学会像画家一样分层创作。该技术将图像分解为9个粒度层次,从整体构图到精细细节逐步生成,不仅提高了图像质量,还提供了前所未有的结构控制能力。在多项评测中NVG均优于现有方法,仅需9步即可生成高质量图像,为数字艺术创作和AI可控生成开辟了新路径。

数据中心分类方法全解:等级制度与多元化标准体系

数据中心分类方法全解:等级制度与多元化标准体系

数据中心分类对企业选择合适设施至关重要。不同类型数据中心在可用性、运行时间和特殊服务方面存在显著差异。主要分类方法包括:层级系统(Tier I-IV)评估可靠性和冗余度;功率容量以兆瓦为单位衡量规模;可持续性认证如LEED标准;服务模式区分私有和托管设施;规模分类涵盖超大规模、传统、模块化和微型数据中心。理解这些分类体系有助于企业根据业务需求、性能期望和预算约束做出明智决策。

企业数据平台迎来生成式AI与开源格局双重重构

企业数据平台迎来生成式AI与开源格局双重重构

2025年,企业数据平台已成为业务运营的核心支撑,随着AI深度融入日常工作流程,企业对清洁、易用的实时数据需求激增。Apache Iceberg和Delta Lake等开放格式正在打破供应商锁定,统一平台将编排、治理和元数据管理集成一体。主要厂商纷纷推出AI原生功能,支持混合云和边缘部署。预测显示,企业数据平台市场将从2025年的1113亿美元增长至2032年的2435亿美元,年复合增长率达11.8%。

HPE通过增强Mist智能体AI技术推进自驱动网络运营

HPE通过增强Mist智能体AI技术推进自驱动网络运营

HPE对其Juniper网络平台进行重大创新,通过增强Mist AI平台的智能体AI功能,实现更自主、智能和主动的网络运营。新功能包括AI驱动的故障排除、扩展的自驱动操作可视性控制、通用大型体验模型和数据中心AIOps功能。Marvis AI引擎获得增强对话能力,可进行实时故障排除和自主修复网络问题。该平台能分析数十亿数据点,预测应用性能问题并提前优化,助力IT团队从被动转向主动管理模式。

Okta收购Axiom Security加强AI身份安全防护

Okta收购Axiom Security加强AI身份安全防护

身份技术供应商Okta将收购特权访问管理厂商Axiom Security,以增强其在云、数据库、SaaS等关键资源访问控制方面的能力。Axiom的核心技术将集成到Okta特权访问服务中,扩展对敏感资源的访问控制。随着AI项目融入企业工作流程,Okta认为特权访问控制将成为缓解AI相关风险的关键防御层。调查显示,仅10%的高管制定了管理非人类身份的完善策略。

高通发布全球首款集成RFID功能的企业移动处理器

高通发布全球首款集成RFID功能的企业移动处理器

高通科技推出Dragonwing Q-6690处理器,声称这是全球首款完全集成超高频射频识别功能的企业移动处理器。该处理器支持多种设备形态,内置5G、Wi-Fi 7、蓝牙6.0等连接技术,集成RFID功能可免除外部读取模块,实现更小巧高效的设备设计。产品采用软件可配置功能包,支持空中升级,主要面向零售、物流和工业应用的门禁控制、资产跟踪、库存管理等场景。

Gemini 2.5 Flash Image发布,图像编辑精度大幅提升

Gemini 2.5 Flash Image发布,图像编辑精度大幅提升

谷歌升级Gemini聊天机器人,推出新的AI图像模型Gemini 2.5 Flash Image,让用户能更精确地控制照片编辑。该模型基于自然语言请求进行图像编辑,同时保持面部、动物等细节的一致性,解决了竞争对手工具的常见问题。新工具在LMArena等基准测试中表现出色,专为消费者使用场景设计,支持多轮对话和多参考融合功能,并配备安全防护措施防止不当内容生成。