RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
Pine64宣布停产面向开发者的高端智能手机PinePhone Pro,转而专注RISC-V架构产品开发。该产品规格四年未升级,在2025年显得配置过低。令人意外的是,低端PinePhone将继续销售两年。公司同时推出多款RISC-V单板机,包括12.99美元的入门级Oz64和249.99美元的高端StarPro64。此外,PineNote电子墨水平板和PineTab2平板电脑也获得系统更新,支持更多Linux发行版。
日立万达宣布其VSP One SDS软件定义存储现已在微软Azure市场上线,继AWS和谷歌云之后进一步扩展云原生块存储服务。该解决方案支持跨Azure和本地系统的数据管理与保护,具备内置配置、压缩和双向异步复制功能,通过VSP 360软件实现集中化自动管理。此举使DevOps团队能够在多云环境间无缝迁移和扩展工作负载,目标实现99.999%的系统正常运行时间。
光学分组交换机面临的根本问题是光信号无法存储,使得读取光数据包头信息几乎不可能。初创公司Finchetto通过创新方案解决了这一难题:在传输数据包的同时,用不同波长的光信号携带目的地信息,实现光控制光的交换机制。该技术将交换时间从微秒级降至纳秒级,支持协议无关和速度无关的数据传输,预计12-18个月内推出可供客户实验室测试的产品。
Python软件基金会联合JetBrains发布第八次Python开发者调查,超3万人参与。调查显示Python使用率持续增长,50%受访者编程经验不足两年,39%在近两年开始使用Python。Web开发占46%,数据分析占48%。FastAPI框架使用率从29%跃升至38%,uv包管理工具增至11%使用率。尽管Python使用激增,但基金会因资金短缺暂停资助项目,2024年净亏损146万美元,急需企业支持。
对于拥有多个站点的组织,VMware成本上升威胁着远程办公室的独立运营能力。将工作负载推向云端虽能抵消许可费用,但增加了对持续连接的依赖和风险。组织应借此机会重新审视整个基础设施,寻找能够整合虚拟化、存储、网络和数据保护功能的平台。理想的替代方案应支持从核心到边缘的统一软件栈,在断网时保持站点独立运营,并为AI工作负载做好准备,同时降低硬件成本和运营复杂性。
戴尔将AI数据平台与Elasticsearch集成,同时PowerEdge R7725服务器配备英伟达RTX Pro 6000 Blackwell GPU。新平台包含非结构化数据引擎,具备向量搜索、语义检索和混合关键词搜索功能,可为推理分析和智能搜索提供实时安全访问。RTX Pro 6000提供3753万亿次稀疏FP4计算性能,配备96GB GDDR7内存。该更新将增强数据处理性能,简化AI开发部署流程。
Confluent公司在其Confluent Cloud for Apache Flink平台中推出流式代理新功能,旨在帮助金融、医疗、广告等行业构建基于实时数据的智能体AI应用。该功能将实时数据引入处理管道,使AI智能体能够根据业务变化自主推理、适应并采取行动。通过整合Flink流处理与智能体框架,支持事件驱动的连续响应机制,并采用模型上下文协议安全调用外部工具。
数字化转型项目往往以高期望开始,但现实却让许多CIO备受打击。原本有望实现产品、流程、运营和技术栈现代化的计划突然偏离轨道。文章总结了六个关键征象:缺乏实际商业价值、目标错位、业务领导者漠不关心、领导力不足、最终用户冷漠以及执行失误。这些征象包括新工具采用率停滞、团队对转型目的感到困惑、高管缺乏积极参与、用户使用率大幅下降等。及早识别这些警告信号有助于CIO采取必要措施,让转型项目重回正轨。
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
据Android Police报道,谷歌翻译即将迎来重大AI升级。最新版本9.15.114显示新增模型选择器,包含"快速"和"高级"两种模式。快速模式适用于菜单翻译等简单任务,高级模式将使用Gemini技术提供更准确的上下文理解。更新还将加入类似多邻国的练习模式,通过游戏化方式辅助语言学习。这一升级体现了谷歌持续推进语言翻译技术创新的努力。
随着AI和生成式AI的快速普及,组织在数据处理和应用架构方面面临新挑战。传统集中式架构难以满足现代AI应用的性能需求,推动AI能力向数据生成和决策制定的边缘位置转移。边缘AI部署面临带宽限制、GPU资源需求和运营复杂性等挑战。F5应用交付和安全平台等解决方案通过统一控制和可视化管理,为分布式AI环境提供一致的安全策略和流量管理能力。
企业普遍认为AI模型需要大量算力,但Hugging Face专家认为应该更智能地使用AI。五个关键策略包括:为特定任务选择合适规模的模型而非通用大模型;将效率设为默认选项,避免不必要的高成本计算模式;通过批处理和精度调整优化硬件利用;推广能耗透明度评级系统;重新思考"更多算力更好"的观念,专注于智能架构和优质数据而非简单扩大GPU集群规模。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。
法国地理院团队开发的MAESTRO模型通过创新的数据融合策略,成功解决了多源卫星数据协调难题。该模型如指挥家般智能编排不同类型地球观测数据,在树种识别和农作物分割等任务中显著提升准确率,为环境监测、农业生产和城市规划提供强有力技术支撑,展现了AI协调异构数据的巨大潜力。
在谷歌亚太区全球商务拓展副总裁Karen Teo看来,这股创新脉搏,也能从过去一年中国开发者在全球市场两条最醒目的增长曲线看出:一条是“短剧”,另一条是“AI应用”。
帝国理工学院开发的X-Node框架首次实现图神经网络的自我解释功能,让AI系统中的每个节点都能像医生一样解释自己的诊断思路。该技术通过内置推理模块和自然语言生成,为医疗AI的"黑匣子"问题提供了革命性解决方案,在保持诊断准确性的同时大幅提升了系统的可信度和透明度。