代理式AI是继生成式AI后的新兴技术趋势,通过软件"代理"自动化复杂任务执行。与生成内容的生成式AI不同,代理式AI专注于执行操作。该技术将在两个方面影响数据中心:首先,随着48%的技术领导者已在使用代理式AI,这将增加LLM推理需求,进一步推动数据中心容量需求;其次,AI代理可能革新数据中心管理,自动化工作负载重新部署、性能优化和网络流量路由等任务,提升运营效率。
韩国SK电信发布了A.X 3.1 Lite,这是一个70亿参数的韩语大语言模型,完全从零开始自主开发。该模型在1.65万亿多语言标记上训练,重点关注韩语内容,可在智能手机上运行且无需云端支持。模型在韩语多任务推理基准测试中表现优异,响应时使用的标记数比同类GPT模型少三分之一。已开源并应用于SK电信的A.dot语音助手,支持实时通话摘要等功能。
希捷宣布其28TB和30TB Exos M数据中心硬盘和IronWolf Pro NAS硬盘全球上市,均采用HAMR热辅助磁记录技术。HAMR技术通过激光临时加热实现更高存储密度。希捷将这些新硬盘定位为边缘AI数据存储设备,支持实时边缘分析。30TB版本售价599.99美元,28TB版本售价569.99美元,现已通过官方商店和授权经销商全球发售。
语音AI解决方案提供商Krisp发布了VIVA语音隔离AI模型和软件开发工具包,专为语音AI智能体设计。VIVA每月处理超过10亿分钟的语音音频,能在20毫秒内处理音频,将对话轮转准确性提升3.5倍,减少50%的通话中断。该工具可过滤背景噪音和笑声,避免AI误判,提升转录准确性和用户体验。
StepFun公司推出的Step1X-Edit是首个能够媲美GPT-4o和Gemini2 Flash等商业模型的开源图像编辑AI。该模型通过整合多模态语言理解和扩散图像生成技术,能够处理11种编辑任务,在新构建的GEdit-Bench基准测试中表现优异,为图像编辑技术的民主化开辟了新道路。
BluOrion公司开发的ZClip是一种智能梯度裁剪算法,解决了大型语言模型训练中的梯度爆炸和损失飙升问题。通过Z分数统计检测和动态调整策略,ZClip能够自适应地控制梯度幅度,相比传统固定阈值方法提升训练效率35%以上,同时显著降低训练失败风险,为大模型训练提供了更稳定、高效的解决方案。
上海AI实验室联合西湖大学提出LUFFY框架,通过"混合策略学习"让弱AI模型向强模型学习,突破传统强化学习只能自我摸索的限制。该框架在数学推理任务上平均提升6.4分,能成功训练传统方法完全无法提升的弱模型,为AI训练提供了"站在巨人肩膀上"的新思路,相关代码已开源。
这项由法国中央理工大学等欧洲多所知名机构联合开展的大规模研究,通过训练38个模型和超过15000次实验,深入比较了两种主流语言模型训练方法的优劣。研究发现传统的掩码语言建模仍占优势,但提出了创新的双阶段训练策略,为大语言模型训练提供了重要指导。
VMware宣布将终止现有渠道合作伙伴计划,新计划采用邀请制,大幅减少授权合作伙伴数量。未受邀合作伙伴将于2025年7月15日收到不续约通知,可继续交易至10月31日。白标计划也将同时终止。此举是18个月内VMware第二次重大合作伙伴调整,旨在专注与少数核心云服务提供商深度合作。客户可能面临续约困难、服务质量下降和成本上升等影响。
谷歌DeepMind和伦敦大学学院研究发现,大语言模型在面对反驳时会迅速失去信心并改变答案,即使反驳是错误的。研究显示LLM既会对自己的答案过度自信,又对批评异常敏感,表现出与人类相似但又独特的认知偏差。这种行为对多轮对话AI系统构成威胁,最新信息可能对LLM推理产生不成比例的影响。
亚马逊云科技在2025纽约峰会期间,正式发布了Agentic IDE工具Kiro,聚焦工程生产全流程,重新定义AI与开发者的协作方式。
在“数字科技链”展区,SAP聚焦中国企业在全球化发展新阶段的多样化需求,全面展示了如何通过一体化解决方案与商业AI,助力构建系统性运营能力,打造韧性供应链,灵活应对不确定性,把握全球化发展的新机遇。
宁夏西云数据科技有限公司(以下简称“西云数据”)深度参与行业变革进程,深度融合全球前沿技术与中国本土化实践场景,积极支持航旅企业以“运营智能、体验升级、管理提效”为目标,推进业务模式重塑与服务体系革新,加速推进面向未来的智能化重塑。
一加正式推出AI功能Plus Mind和Mind Space,将率先在一加13和13R上线。Plus Mind可保存、建议、存储和搜索屏幕内容,并将信息整理到Mind Space应用中。该功能可通过专用按键或手势激活,能自动创建日历条目并提供AI搜索功能。一加还计划推出三阶段AI战略,包括集成大语言模型和个人助手功能,同时将推出AI语音转录、通话助手和照片优化等工具。
预计到2035年,数据中心用电需求将增长一倍以上,达到440TWh,相当于整个加利福尼亚州的用电量。AI工作负载预计将占2030年数据中心需求的50-70%。传统冷却系统电机存在功率浪费问题,通常在30-50%负载下运行时效率急剧下降。采用高效率曲线平坦的适配电机可显著降低冷却系统功耗,某大型数据中心通过优化电机配置减少了近4MW冷却功耗,为13500台AI服务器腾出空间,年增收入900万美元。
美国薪资调查数据显示,大型企业(员工超过1000人或年收入超过5亿美元)的IT专业人员薪资更高,福利更好,离职率更低。大企业高管级IT职位薪资比小企业高13%,三个层级员工平均年薪多5119美元。科技公司员工薪资比其他行业高5.7%,且差距在扩大。AI需求持续旺盛,首席AI官平均薪资达225945美元,仅次于CIO。然而整体IT薪资增长疲软,仅0.88%,低于通胀率。
法国AI初创公司Mistral发布首个音频模型家族Voxtral,旨在为企业提供真正可用的语音智能解决方案。该模型可转录30分钟音频,理解40分钟内容,支持问答、摘要生成和语音命令执行。Voxtral支持英语、西班牙语、法语等8种语言,提供24B参数的Small版本和3B参数的Mini版本。定价从每分钟0.001美元起,声称成本不到同类方案的一半。
Google在其搜索应用的Discover新闻推送中开始推出AI摘要功能,用户将看到多个新闻发布商的标识和AI生成的摘要,而非传统的新闻标题。该功能目前仍在测试阶段,尚未覆盖所有新闻故事。此举引发出版业担忧,因为AI概览等功能已导致网站流量大幅下降。数据显示,全球搜索流量同比下降15%,无点击新闻搜索比例从56%增至69%。尽管Google推出了Offerwall等工具帮助发布商创收,但对许多发布商而言已为时过晚。