最新文章
人工智能终于学会说话了?阿里巴巴等机构突破语音理解技术壁垒!

人工智能终于学会说话了?阿里巴巴等机构突破语音理解技术壁垒!

阿里巴巴等机构联合发布LLaSO框架,这是首个完全开放的端到端语音理解系统。该框架包含2550万训练样本、20种语音任务,支持多模态交互,在标准化评估中获得0.72分,超越同类系统。LLaSO不仅提供完整数据和代码,还建立了统一评估标准,为语音AI研究提供了重要基础设施,推动了从语音识别向全面语音理解的技术跃升。

AI智能体的"压力测试":杜克大学与Zoom揭示最强AI模型在复杂任务中的惊人弱点

AI智能体的"压力测试":杜克大学与Zoom揭示最强AI模型在复杂任务中的惊人弱点

杜克大学与Zoom合作研究揭示,即使最先进的AI模型在复杂多步骤任务中成功率也不足60%。研究团队通过LiveMCP-101测试平台的101个真实任务,发现AI智能体存在七种主要失误模式,其中语义错误最为普遍。该研究采用创新的实时对比评估方法,为改进AI系统指明了方向。

阿里巴巴团队发布GUI-Owl:让AI像人类一样操作电脑和手机的智能助手

阿里巴巴团队发布GUI-Owl:让AI像人类一样操作电脑和手机的智能助手

阿里巴巴团队发布了GUI-Owl智能助手,这是一个能够像人类一样操作电脑和手机界面的AI系统。该系统通过自进化数据生产、多样化能力构建和强化学习训练,在多项测试中超越现有模型,配合Mobile-Agent-v3多智能体框架可达到73.3%的任务成功率,为GUI自动化领域带来重大突破。

字节跳动发布Waver:让AI视频生成进入"专业级"时代,5-10秒1080p视频随心而动

字节跳动发布Waver:让AI视频生成进入"专业级"时代,5-10秒1080p视频随心而动

字节跳动发布Waver AI视频生成模型,可根据文字描述生成5-10秒的1080p高清视频,支持文本生成视频、图片生成视频等多种任务。在权威测试中位列全球前三,特别擅长处理复杂运动场景如体育比赛等。团队采用创新的两阶段生成策略和统一架构设计,训练使用超过2亿视频片段,并将完整技术方案开源分享。

华盛顿大学团队推出"AI城市向导":让街景图像开口说话,用双眼带你看遍世界每个角落

华盛顿大学团队推出"AI城市向导":让街景图像开口说话,用双眼带你看遍世界每个角落

华盛顿大学等顶尖机构联合推出地理视觉代理概念,让AI能够分析街景、用户照片等视觉数据,回答"咖啡店门在哪里、是否无障碍"等具体问题。团队开发了三个原型:帮助盲人探索街景的StreetViewAI、为残障人士评估环境的Accessibility Scout,以及个性化骑行路线规划的BikeButler,展现了AI与地理信息结合的巨大潜力。

Anthropic用户面临新选择:退出或同意共享数据用于AI训练

Anthropic用户面临新选择:退出或同意共享数据用于AI训练

Anthropic对用户数据处理政策进行重大调整,要求所有Claude用户在9月28日前决定是否允许其对话数据用于AI模型训练。此前该公司不使用消费者聊天数据进行模型训练,现在希望利用用户对话和编程会话来训练AI系统,未选择退出的用户数据保留期将延长至五年。新政策适用于Claude免费版、专业版和最高版用户,但不影响企业客户。

OpenAI与微软发布全新语音生成模型

OpenAI与微软发布全新语音生成模型

OpenAI和微软发布了两款新的语音人工智能模型。OpenAI的gpt-realtime被称为其最强语音模型,可生成更自然的语音并能在句中改变语调和语言。微软推出的MAI-Voice-1模型已集成到Copilot助手中,具有高硬件效率,单个GPU即可在一秒内生成一分钟音频。两家公司还发布了MAI-1-preview模型,采用专家混合架构提高效率。

AmiBrowser为20世纪的Amiga电脑带来21世纪网页体验

AmiBrowser为20世纪的Amiga电脑带来21世纪网页体验

AmigaKit推出的AmiBrowser解决了20世纪复古计算机在现代使用的关键需求:现代化网络浏览器。该浏览器搭载于新款A1200 NG主板上,采用Orange Pi Zero 3和ARM处理器,通过Linux系统运行定制的Amiga模拟器。用户通过原生68K AmigaOS应用界面操作,底层调用运行在Linux上的Chromium框架处理现代网络标准,实现了复古外观与现代功能的完美结合。

谷歌联合Zed推出智能体客户端协议,挑战VS Code垄断地位

谷歌联合Zed推出智能体客户端协议,挑战VS Code垄断地位

谷歌和代码编辑器公司Zed Industries推出了代理客户端协议(ACP),作为AI代理与IDE集成的标准方式,旨在防止开发者被锁定在VS Code中。该协议通过JSON-RPC标准化代理-编辑器通信,重用模型上下文协议规范。目前Zed是唯一直接支持的编辑器,Gemini CLI是唯一的ACP代理。谷歌表示这体现了"自带IDE"理念,为用户提供选择而非锁定。

诺基亚推出面向下一代数字化铁路的商用5G服务

诺基亚推出面向下一代数字化铁路的商用5G服务

诺基亚发布专为全球铁路运营商设计的5G无线电服务,提供高容量、高性能的实时通信。未来铁路移动通信系统(FRMCS)将在未来十年内升级现有2G GSM-R系统,成为新一代全球铁路标准。该5G解决方案具备内置安全性和高可靠性,支持自动化列车运行、乘客信息系统和关键语音通信等功能。诺基亚还推出业界首个1900MHz频段商用5G无线电设备。研究预测2024-2027年期间FRMCS相关支出将达12亿美元。

NetApp增长疲软但前景看好,获全闪存阵列市场第一

NetApp增长疲软但前景看好,获全闪存阵列市场第一

NetApp在2026财年第一季度仅实现1%的微弱增长,但在2025年第一季度赢得了全闪存阵列市场第一的份额。季度收入为15.6亿美元,GAAP利润2.33亿美元,同比下降6%。CEO表示公司在AI基础设施领域表现强劲,全闪存业务增长33%,AI相关订单从去年50个增至125个以上。

专业网站设计平台Framer获1亿美元融资,估值达20亿美元

专业网站设计平台Framer获1亿美元融资,估值达20亿美元

总部位于阿姆斯特丹的专业网站设计平台Framer宣布完成1亿美元D轮融资,估值达20亿美元。本轮融资由现有投资者Meritech和Atomico领投。Framer提供超越原型设计的网站创建工具,让设计师、开发者和营销人员能够创建并即时发布带有动画、SEO优化、内置数据库的实时网站。平台集成强大AI功能,支持创建交互式响应网站。公司专注企业客户,拥有数十万活跃网站和50万月访问量。

英伟达Jetson Thor打造机器人新时代算力引擎

英伟达Jetson Thor打造机器人新时代算力引擎

英伟达发布Jetson AGX Thor,这是面向机器人和物理设备的最强嵌入式AI计算机。新"机器人大脑"的AI性能比当前Jetson AGX Orin模块提升7.5倍,能效提升3.5倍。Thor采用最新Blackwell GPU架构和14核Arm CPU,在130W功耗内提供2070 FP4 TOPS算力。亚马逊仓储机器人部门和波士顿动力等早期采用者已开始集成Thor,旨在实现更智能独立的机器人应用。

英国两大独立宽带服务商取得重大发展里程碑

英国两大独立宽带服务商取得重大发展里程碑

Community Fibre和Hey!Broadband两家英国独立宽带提供商宣布重要发展成果。Community Fibre推出首个国际数据漫游eSIM服务,覆盖160多个国家,可为用户节省高达96%的漫游费用,成为首家推出此类服务的宽带替代网络供应商。同时,Hey!Broadband客户数突破4万,较去年同期的2.5万实现大幅增长,巩固了其在英国替代网络市场的领先地位。

VMware乘亚太私有云复兴东风重塑市场战略

VMware乘亚太私有云复兴东风重塑市场战略

亚太地区企业IT工作负载正在重新平衡,在经历多年公有云热潮后,企业开始重新投资私有云基础设施。博通高管在VMware Explore 2025大会期间表示,将以VMware Cloud Foundation为核心制定战略。该解决方案提供完整的软件定义私有云堆栈,旨在实现企业和服务提供商的标准化部署,帮助客户在云采用成熟过程中重新思考工作负载配置。

用友的AI方法论,是帮企业搞定上下文工程?

用友的AI方法论,是帮企业搞定上下文工程?

在深圳的2025全球商业创新大会上,用友试图正在基于新的BIP5平台解决上下文工程的问题。

2025-08-28

SAP Cloud ERP高效支撑知行科技驶入辅助驾驶量产与全球化快车道

作为辅助驾驶这一新兴赛道的领先企业,知行科技在数智化转型与全球化拓展的关键阶段,携手SAP实现运营效率与管理能力双重提升,为企业高速增长注入强劲动能。

2025-08-28

Qorvo 亮相 IOTE 展会:以 “连接黑科技” 破解智能家居、工业与汽车三大场景互联痛点

8月27日,全球领先的连接和电源解决方案供应商Qorvo重磅亮相2025 IOTE国际物联网博览会,聚焦 “智能家居、工业、汽车” 三大核心领域,携一系列突破性创新解决方案登场。

上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵
2025-08-28

上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵

上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵

对话多点数智倪艳军:仓储物流先行,全面布局AI零售

对话多点数智倪艳军:仓储物流先行,全面布局AI零售

“我们很关注技术成本,什么时候人工智能技术成熟了、成本降下来了,我们就会应用到产业中。”