自云计算蔚然成风之后,大型机经常被笑称是上个世纪的“老古董”。5年前,日立公司决定停止开发自有大型机产品;今年2月,富士通又宣布将在2030年放弃大型机业务——近些年来,大型机市场的“玩家”正在肉眼可见地减少。
于是,又有人开始揣摩,大型机是否将就此退出历史舞台?如果把这个问题抛给大型机的缔造者IBM,其一定会果断回复一个大写的“NO!”。
我们看到,作为大型机市场的绝对玩家,无论经历多少次时代的更迭起伏,IBM始终维持着对IBM Z大型机产品线的投入和创新。在IBM看来,大型机由于高稳定、高可用和高安全,有着不可替代性。比如,仅100%加密这一个特点,就让包括银行在内的诸多机构对它无法拒绝。
正是因为如此,公有云时至今日也没能如很多人最初预想的那样,做到“一统天下”,混合环境与多云架构反倒成了主流。换言之,即便是在2022年的今天,大型机也与1960年代诞生之初一样重要。只不过,它必须适应新时代的需求。就像我们不会认为汽车是上个世纪的“老古董”,很大的原因也在于汽车的设计与功能变迁,总能与人们的出行需求保持着同样的步调。
历经百年的IBM比很多人都更懂得这种应势而变的重要性。就大型机产品而言,其第一代大型机System 360的命名,取的就是“一圈360度”之意,意思是为满足每个用户的需要而设计。而此后的每一次大型机产品迭代升级,同样遵循着这一理念。
比如,2019年发布的IBM z15,笔者称之为“为云而生”的主机,其一大亮点是帮助企业实现跨混合多云环境管理客户数据隐私,支持企业的云迁移和混合多云环境下的业务创新;而本月,IBM又发布了最新一代的主机产品——IBM z16——按照同样的定义模式,笔者认为,它将是为AI与量子计算而生的。
集成AI加速器,时延仅1毫秒
身处如今充满不确定的环境中,企业必须具备探寻确定性的能力,要能从纷乱嘈杂的因素中找出规律,进而做出预测性决策。日趋成熟的AI技术成为企业加速技能升级的“精良装备”,但与此同时,计算压力也如“排山倒海”般涌向后端。
以金融欺诈场景为例,根据IBM 和Morning Consult的一项题为《2022 年 IBM全球金融欺诈影响报告》的最新调研显示,由于计算延迟问题,大规模实时运行深度学习模型难以实现,金融应用中的欺诈检测模型只在不到10%的大批量交易中运行。也就是说,还有大量的欺诈无法被检测到。
为了帮助客户实现对实时交易的规模化分析,IBM在最新的IBM z16芯片之上集成了Telum处理器。这是IBM首款具有芯片上AI加速功能的处理器,采用7nm工艺,具有225亿颗晶体管。它的特长是支持AI预测等高计算量的工作,帮助企业处理深度学习模型,对关键业务进行大规模的实时推理——放在金融欺诈场景中,这意味着,机构可以从欺诈检测转变为欺诈预防。
根据 IBM的内部基准测试,借助Telum处理器,IBM z16 每天可以处理 3000亿个推理请求,延迟时间仅为1毫秒。“当你发现,全球85%到90%的信用卡交易都可能涉及大型机,就会看到AI加速器对于金融欺诈的价值,”IBM系统人工智能首席技术官Elpida Tzortzatos 在接受媒体采访时表示,在此之前,美国某银行已经基于IBM zSystem ,将AI的欺诈检测引入其信用卡授权流程中。
“他们曾经试图在平台外执行类似的操作,但基本最快的响应速度也需要超过80毫秒,”她介绍说,“而引入AI加速器之后,效果立竿见影。不仅响应时间缩短到单毫秒延迟,并且交易处理量还从每秒1200笔,扩展到了每秒15000 -20000笔。这意味着他们可以分析每一笔交易。”
当然,金融欺诈检测和预防并不是Telum处理器的唯一应用场景,包括贷款审核、加密货币的清算、结算、逃税及零售业联盟式学习(Federated learning)防范欺诈及盗窃等在内的各类业务挑战也同理。比如,它可以加快金融机构对企业或消费贷款的审批,也可以帮助确定结算前哪些贸易和/或交易可能存在高风险。
首款量子安全系统,并非为时过早
除了首次集成AI加速器之外,IBM z16的另一个标签是“业内首个量子安全(Quantum-safe)系统”。
对于静态和实时数据进行普遍加密,是IBM在2017年推出的z14的关键特性之一。但是,即便是如此高级别的加密算法技术,也被认为将在未来的量子计算领域失效。
为此,IBM z16基于格密码(Lattice-based)理论研发并优化了其加密算法和数字签名技术,这将帮助企业有效防范未来量子计算机的破解,保护企业数据和系统免受当下和未来的安全威胁;此外,IBM还配备了Crypto Express 8S(CEX8S)硬件安全模块,这些模块所提供的量子安全API可以帮助企业对现有应用程序进行现代化改造或保护新应用程序免受量子攻击。
据IBM杰出工程师Anne Dames介绍,量子安全可以进一步得到扩展,具体来说,每天可以支持多达19B的加密交易。这对于zSystems大型机的核心客户,譬如金融、政府等对数据安全级别有着极高要求的机构而言非常重要。
然而,量子计算听起来比AI要遥远得多。IDC预测,复杂到足以破解当今加密系统的量子计算机至少还需要5年的时间才能问世。所以,现在考虑量子安全是否还为时过早?
在网络安全领域,有一种“犯罪模式”叫做“先收获、后解密”。IBM zSystems高级架构师邓练成对此做了一个形象比喻:好比有小偷潜入有钱人家里作案,现场的工具一时半会还无法撬开保险箱,干脆把保险箱先搬回家,然后慢慢想办法。网络犯罪分子也一样,也许他们正在通过各种渠道非法窃取流量,悄悄地收集客户敏感信息。即便是已经加密的信息也没关系,等到也许5年或10年后的某天,量子计算机足够强大了才来破译。到那时,客户的敏感数据将面临重大的安全隐患。
也就是说,如果要避免这种 “被守株待兔”的状况出现,企业必须及早入手、未雨绸缪。而IBM作为高度安全交易处理的黄金标准代表,基于IBM z16超前的技术,目的即是为企业扫清业务创新途中的一切后顾之忧。
加速混合云现代化,z16不失其职
不过话说回来,假使企业既不使用AI,也不担心量子计算机的攻击,那么IBM z16也并非大材小用。如前文所说,IBM z15已经在帮助企业实现混合云现代化方面做了很多的努力,z16同样如此。
据了解,IBM在过去三年中进行了大量投资,以实现在IBM zSystems平台上拥抱开源技术和在跨混合云环境中建立一致的开发人员体验。这些解决方案旨在帮助其客户以无缝的方式利用其现有在IT基础架构、云和应用上的投资和优势,同时使他们能够灵活地在其选择的架构上运行、构建、管理和现代化云原生工作负载。
具体来说,IBM还做了以下几项重要的宣布:
所以,如果有人再问“大型机过时了吗?”我们或许就能够给出一个比较肯定的回答——在眼下及未来相当长的一段时间里,大型机还将继续作为许多机构和企业的关键业务数据“掌管者”,继续大行其道。
所以,虽然总有人说“百岁”的IBM在新时代已经掉队,但笔者其实更愿意称其为“拓荒者”——常常先人N步开垦出一片“荒地”,然后“不合群”地着急赶往下一场——十几年前提出“智慧地球”是如此,如今力推“量子安全”又何尝不是如此。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。