字节跳动发布Waver AI视频生成模型,可根据文字描述生成5-10秒的1080p高清视频,支持文本生成视频、图片生成视频等多种任务。在权威测试中位列全球前三,特别擅长处理复杂运动场景如体育比赛等。团队采用创新的两阶段生成策略和统一架构设计,训练使用超过2亿视频片段,并将完整技术方案开源分享。
华盛顿大学等顶尖机构联合推出地理视觉代理概念,让AI能够分析街景、用户照片等视觉数据,回答"咖啡店门在哪里、是否无障碍"等具体问题。团队开发了三个原型:帮助盲人探索街景的StreetViewAI、为残障人士评估环境的Accessibility Scout,以及个性化骑行路线规划的BikeButler,展现了AI与地理信息结合的巨大潜力。
Anthropic对用户数据处理政策进行重大调整,要求所有Claude用户在9月28日前决定是否允许其对话数据用于AI模型训练。此前该公司不使用消费者聊天数据进行模型训练,现在希望利用用户对话和编程会话来训练AI系统,未选择退出的用户数据保留期将延长至五年。新政策适用于Claude免费版、专业版和最高版用户,但不影响企业客户。
OpenAI和微软发布了两款新的语音人工智能模型。OpenAI的gpt-realtime被称为其最强语音模型,可生成更自然的语音并能在句中改变语调和语言。微软推出的MAI-Voice-1模型已集成到Copilot助手中,具有高硬件效率,单个GPU即可在一秒内生成一分钟音频。两家公司还发布了MAI-1-preview模型,采用专家混合架构提高效率。
AmigaKit推出的AmiBrowser解决了20世纪复古计算机在现代使用的关键需求:现代化网络浏览器。该浏览器搭载于新款A1200 NG主板上,采用Orange Pi Zero 3和ARM处理器,通过Linux系统运行定制的Amiga模拟器。用户通过原生68K AmigaOS应用界面操作,底层调用运行在Linux上的Chromium框架处理现代网络标准,实现了复古外观与现代功能的完美结合。
谷歌和代码编辑器公司Zed Industries推出了代理客户端协议(ACP),作为AI代理与IDE集成的标准方式,旨在防止开发者被锁定在VS Code中。该协议通过JSON-RPC标准化代理-编辑器通信,重用模型上下文协议规范。目前Zed是唯一直接支持的编辑器,Gemini CLI是唯一的ACP代理。谷歌表示这体现了"自带IDE"理念,为用户提供选择而非锁定。
诺基亚发布专为全球铁路运营商设计的5G无线电服务,提供高容量、高性能的实时通信。未来铁路移动通信系统(FRMCS)将在未来十年内升级现有2G GSM-R系统,成为新一代全球铁路标准。该5G解决方案具备内置安全性和高可靠性,支持自动化列车运行、乘客信息系统和关键语音通信等功能。诺基亚还推出业界首个1900MHz频段商用5G无线电设备。研究预测2024-2027年期间FRMCS相关支出将达12亿美元。
NetApp在2026财年第一季度仅实现1%的微弱增长,但在2025年第一季度赢得了全闪存阵列市场第一的份额。季度收入为15.6亿美元,GAAP利润2.33亿美元,同比下降6%。CEO表示公司在AI基础设施领域表现强劲,全闪存业务增长33%,AI相关订单从去年50个增至125个以上。
总部位于阿姆斯特丹的专业网站设计平台Framer宣布完成1亿美元D轮融资,估值达20亿美元。本轮融资由现有投资者Meritech和Atomico领投。Framer提供超越原型设计的网站创建工具,让设计师、开发者和营销人员能够创建并即时发布带有动画、SEO优化、内置数据库的实时网站。平台集成强大AI功能,支持创建交互式响应网站。公司专注企业客户,拥有数十万活跃网站和50万月访问量。
英伟达发布Jetson AGX Thor,这是面向机器人和物理设备的最强嵌入式AI计算机。新"机器人大脑"的AI性能比当前Jetson AGX Orin模块提升7.5倍,能效提升3.5倍。Thor采用最新Blackwell GPU架构和14核Arm CPU,在130W功耗内提供2070 FP4 TOPS算力。亚马逊仓储机器人部门和波士顿动力等早期采用者已开始集成Thor,旨在实现更智能独立的机器人应用。
Community Fibre和Hey!Broadband两家英国独立宽带提供商宣布重要发展成果。Community Fibre推出首个国际数据漫游eSIM服务,覆盖160多个国家,可为用户节省高达96%的漫游费用,成为首家推出此类服务的宽带替代网络供应商。同时,Hey!Broadband客户数突破4万,较去年同期的2.5万实现大幅增长,巩固了其在英国替代网络市场的领先地位。
亚太地区企业IT工作负载正在重新平衡,在经历多年公有云热潮后,企业开始重新投资私有云基础设施。博通高管在VMware Explore 2025大会期间表示,将以VMware Cloud Foundation为核心制定战略。该解决方案提供完整的软件定义私有云堆栈,旨在实现企业和服务提供商的标准化部署,帮助客户在云采用成熟过程中重新思考工作负载配置。
作为辅助驾驶这一新兴赛道的领先企业,知行科技在数智化转型与全球化拓展的关键阶段,携手SAP实现运营效率与管理能力双重提升,为企业高速增长注入强劲动能。
8月27日,全球领先的连接和电源解决方案供应商Qorvo重磅亮相2025 IOTE国际物联网博览会,聚焦 “智能家居、工业、汽车” 三大核心领域,携一系列突破性创新解决方案登场。
华南理工大学研究团队开发出Grounded-VideoDiT系统,突破了AI长视频理解的关键技术瓶颈。该系统通过扩散时间潜在编码器、实体感知分割跟踪和混合标记策略三大创新,让AI具备了精确的时间定位、物体跟踪和多模态推理能力。在多项测试中表现优异,为教育、安防、医疗、体育分析等领域的视频应用开辟了广阔前景。
谷歌DeepMind团队开发出符号回归神经网络,能在无先验知识下从观测数据中自主发现物理定律。该AI系统成功重现牛顿第二定律、胡克定律等经典物理定律,展示了数据驱动科学发现的新范式。研究证明AI可通过模式识别和数学推理系统性发现科学规律,为材料科学、生物医学等领域提供新的研究工具,开启人机协作科学探索的新时代。
清华大学团队开发出多模态感知推理网络,这是首个能从人类表情、动作等外在表现准确推断内在情感状态的AI系统。该系统综合分析面部表情、语音语调、肢体动作等多维信息,在复杂情感识别中达到87.3%准确率,已在医疗、教育等领域试点应用。这项技术突破了传统单一感知模式限制,具备动态权重分配和时序建模能力,为构建更智能人性化的人机交互奠定基础。