阿里巴巴等机构联合发布LLaSO框架,这是首个完全开放的端到端语音理解系统。该框架包含2550万训练样本、20种语音任务,支持多模态交互,在标准化评估中获得0.72分,超越同类系统。LLaSO不仅提供完整数据和代码,还建立了统一评估标准,为语音AI研究提供了重要基础设施,推动了从语音识别向全面语音理解的技术跃升。
杜克大学与Zoom合作研究揭示,即使最先进的AI模型在复杂多步骤任务中成功率也不足60%。研究团队通过LiveMCP-101测试平台的101个真实任务,发现AI智能体存在七种主要失误模式,其中语义错误最为普遍。该研究采用创新的实时对比评估方法,为改进AI系统指明了方向。
阿里巴巴团队发布了GUI-Owl智能助手,这是一个能够像人类一样操作电脑和手机界面的AI系统。该系统通过自进化数据生产、多样化能力构建和强化学习训练,在多项测试中超越现有模型,配合Mobile-Agent-v3多智能体框架可达到73.3%的任务成功率,为GUI自动化领域带来重大突破。
字节跳动发布Waver AI视频生成模型,可根据文字描述生成5-10秒的1080p高清视频,支持文本生成视频、图片生成视频等多种任务。在权威测试中位列全球前三,特别擅长处理复杂运动场景如体育比赛等。团队采用创新的两阶段生成策略和统一架构设计,训练使用超过2亿视频片段,并将完整技术方案开源分享。
华盛顿大学等顶尖机构联合推出地理视觉代理概念,让AI能够分析街景、用户照片等视觉数据,回答"咖啡店门在哪里、是否无障碍"等具体问题。团队开发了三个原型:帮助盲人探索街景的StreetViewAI、为残障人士评估环境的Accessibility Scout,以及个性化骑行路线规划的BikeButler,展现了AI与地理信息结合的巨大潜力。
Anthropic对用户数据处理政策进行重大调整,要求所有Claude用户在9月28日前决定是否允许其对话数据用于AI模型训练。此前该公司不使用消费者聊天数据进行模型训练,现在希望利用用户对话和编程会话来训练AI系统,未选择退出的用户数据保留期将延长至五年。新政策适用于Claude免费版、专业版和最高版用户,但不影响企业客户。
OpenAI和微软发布了两款新的语音人工智能模型。OpenAI的gpt-realtime被称为其最强语音模型,可生成更自然的语音并能在句中改变语调和语言。微软推出的MAI-Voice-1模型已集成到Copilot助手中,具有高硬件效率,单个GPU即可在一秒内生成一分钟音频。两家公司还发布了MAI-1-preview模型,采用专家混合架构提高效率。
AmigaKit推出的AmiBrowser解决了20世纪复古计算机在现代使用的关键需求:现代化网络浏览器。该浏览器搭载于新款A1200 NG主板上,采用Orange Pi Zero 3和ARM处理器,通过Linux系统运行定制的Amiga模拟器。用户通过原生68K AmigaOS应用界面操作,底层调用运行在Linux上的Chromium框架处理现代网络标准,实现了复古外观与现代功能的完美结合。
谷歌和代码编辑器公司Zed Industries推出了代理客户端协议(ACP),作为AI代理与IDE集成的标准方式,旨在防止开发者被锁定在VS Code中。该协议通过JSON-RPC标准化代理-编辑器通信,重用模型上下文协议规范。目前Zed是唯一直接支持的编辑器,Gemini CLI是唯一的ACP代理。谷歌表示这体现了"自带IDE"理念,为用户提供选择而非锁定。
诺基亚发布专为全球铁路运营商设计的5G无线电服务,提供高容量、高性能的实时通信。未来铁路移动通信系统(FRMCS)将在未来十年内升级现有2G GSM-R系统,成为新一代全球铁路标准。该5G解决方案具备内置安全性和高可靠性,支持自动化列车运行、乘客信息系统和关键语音通信等功能。诺基亚还推出业界首个1900MHz频段商用5G无线电设备。研究预测2024-2027年期间FRMCS相关支出将达12亿美元。
NetApp在2026财年第一季度仅实现1%的微弱增长,但在2025年第一季度赢得了全闪存阵列市场第一的份额。季度收入为15.6亿美元,GAAP利润2.33亿美元,同比下降6%。CEO表示公司在AI基础设施领域表现强劲,全闪存业务增长33%,AI相关订单从去年50个增至125个以上。
总部位于阿姆斯特丹的专业网站设计平台Framer宣布完成1亿美元D轮融资,估值达20亿美元。本轮融资由现有投资者Meritech和Atomico领投。Framer提供超越原型设计的网站创建工具,让设计师、开发者和营销人员能够创建并即时发布带有动画、SEO优化、内置数据库的实时网站。平台集成强大AI功能,支持创建交互式响应网站。公司专注企业客户,拥有数十万活跃网站和50万月访问量。
英伟达发布Jetson AGX Thor,这是面向机器人和物理设备的最强嵌入式AI计算机。新"机器人大脑"的AI性能比当前Jetson AGX Orin模块提升7.5倍,能效提升3.5倍。Thor采用最新Blackwell GPU架构和14核Arm CPU,在130W功耗内提供2070 FP4 TOPS算力。亚马逊仓储机器人部门和波士顿动力等早期采用者已开始集成Thor,旨在实现更智能独立的机器人应用。
Community Fibre和Hey!Broadband两家英国独立宽带提供商宣布重要发展成果。Community Fibre推出首个国际数据漫游eSIM服务,覆盖160多个国家,可为用户节省高达96%的漫游费用,成为首家推出此类服务的宽带替代网络供应商。同时,Hey!Broadband客户数突破4万,较去年同期的2.5万实现大幅增长,巩固了其在英国替代网络市场的领先地位。
亚太地区企业IT工作负载正在重新平衡,在经历多年公有云热潮后,企业开始重新投资私有云基础设施。博通高管在VMware Explore 2025大会期间表示,将以VMware Cloud Foundation为核心制定战略。该解决方案提供完整的软件定义私有云堆栈,旨在实现企业和服务提供商的标准化部署,帮助客户在云采用成熟过程中重新思考工作负载配置。
作为辅助驾驶这一新兴赛道的领先企业,知行科技在数智化转型与全球化拓展的关键阶段,携手SAP实现运营效率与管理能力双重提升,为企业高速增长注入强劲动能。
8月27日,全球领先的连接和电源解决方案供应商Qorvo重磅亮相2025 IOTE国际物联网博览会,聚焦 “智能家居、工业、汽车” 三大核心领域,携一系列突破性创新解决方案登场。