5月16-19日,2019第三届世界智能大会在天津召开。来自全球不同国家和地区的智能科技领域中外知名学者、院士专家、著名企业家齐聚津门,共襄智能科技产业盛会。大会由国家发展和改革委员会、科学技术部、工业和信息化部、中国科学院、天津市人民政府等共同主办。16日,习近平致信祝贺本次大会开幕,向出席会议的国际知名企业家、业界领军人物等各界人士表示诚挚欢迎。天云数据创始人雷涛受邀出席并发表主题演讲。
针对聚焦的数据智能与数据湖生态话题,雷涛表示,现代企业的业务模式正在经历从流程驱动到数据驱动转变的商业重构,从BI向AI升级。数据不再是业务系统的副产品,而成为业务系统的核心资产,成为企业运营决策和业务发展的驱动力。数据中台从诞生至今,经历了数据资产化、数据融合与流动、数据价值化的三部曲。
数据中台的第一步是发现识别和标识度量数据资产,传统方法是通过人工咨询的方式实现数据治理,回答数据在哪里,从而解决新的应用升级和应用的上云容灾等等数据关联等问题。但传统上基于业务咨询执行的主数据治理MDM技术很难满足快速多变的数据治理结构,现在出现的复杂网络(比如天云数据Hilbert)等知识表示的前沿技术应用的ADG(Auto Digital Government),加速和自动化数据治理工作,可以建立统一的关系视图,建立数据自治的数字资产网络。
比如天云数据在某能源公司分局将十几个业务系统数据库、8000多张表、 十几万个字段的元数据和主数据提取出来,建立了统?的关系视图, 代替了20人/年的人工治理的工作。
传统架构中,TP\AP\ML分属不同的应用系统,数据无法融合应用,只能进行数据搬家。而在新的分布式HTAP架构中,可以实现三者的无缝融合:同一个数据计算平台,同时面向联机事务处理,进行密集分析和数据挖掘,TP\AP\ML融合计算场景,对核心Oracle数据库等关键计算组件实现替代,从而不需要每日跑批ETL。
比如天云数据研发的HTAP数据库在某大型股份制银行上线全量数据在线实时交易系统,面向柜面系统提供7*8小时A类实时核心交易,面向手机网银系统可提供7*24小时A类实时核心交易。 成功实现了对公同业,对公活期,对公定期,对私活期,对私定期,贷款,欠息,投资贴现,内部账,表外账等10大业务分户及交易明细的全量线下数据线上化,提供实时服务应用。目前400亿条交易数据, 500ms交易服务响应的A类核心系统支撑要求,每天在线交易量超过200万,占整个银行核心交易量的10%。“ 四双架构”满足金融行业A类核心系统灾备要求 天云HTAP数据库Hubble在生产和灾备两中心采用“双中心 双集群 双活 双服务应用”的四双架构。在系统上线期间,总共已完成10次以上的人工主动模拟切换演练,并成功完成了2次故障自动切换。
通过数据中台可以提升数据价值,并使数据资产变现,催生新的盈利模式。数据中台赋能行业人员快速实现模型孵化训练,实时上线运行,即AI PaaS。天云数据的AI PaaS平台MaximAI提供全面的深度学习、机器学习和自动化机器学习算法,通过MaximAI这一平台,即可完成从原始数据处理到预测模型生产、评估的全流程。
在证券行业,天云数据基于资管数据利用模型算法生产的风险传导模型,服务管理10000亿资产规模的风险传导,最大化体现数据资产价值。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。