5月16-19日,2019第三届世界智能大会在天津召开。来自全球不同国家和地区的智能科技领域中外知名学者、院士专家、著名企业家齐聚津门,共襄智能科技产业盛会。大会由国家发展和改革委员会、科学技术部、工业和信息化部、中国科学院、天津市人民政府等共同主办。16日,习近平致信祝贺本次大会开幕,向出席会议的国际知名企业家、业界领军人物等各界人士表示诚挚欢迎。天云数据创始人雷涛受邀出席并发表主题演讲。
针对聚焦的数据智能与数据湖生态话题,雷涛表示,现代企业的业务模式正在经历从流程驱动到数据驱动转变的商业重构,从BI向AI升级。数据不再是业务系统的副产品,而成为业务系统的核心资产,成为企业运营决策和业务发展的驱动力。数据中台从诞生至今,经历了数据资产化、数据融合与流动、数据价值化的三部曲。
数据中台的第一步是发现识别和标识度量数据资产,传统方法是通过人工咨询的方式实现数据治理,回答数据在哪里,从而解决新的应用升级和应用的上云容灾等等数据关联等问题。但传统上基于业务咨询执行的主数据治理MDM技术很难满足快速多变的数据治理结构,现在出现的复杂网络(比如天云数据Hilbert)等知识表示的前沿技术应用的ADG(Auto Digital Government),加速和自动化数据治理工作,可以建立统一的关系视图,建立数据自治的数字资产网络。
比如天云数据在某能源公司分局将十几个业务系统数据库、8000多张表、 十几万个字段的元数据和主数据提取出来,建立了统?的关系视图, 代替了20人/年的人工治理的工作。
传统架构中,TP\AP\ML分属不同的应用系统,数据无法融合应用,只能进行数据搬家。而在新的分布式HTAP架构中,可以实现三者的无缝融合:同一个数据计算平台,同时面向联机事务处理,进行密集分析和数据挖掘,TP\AP\ML融合计算场景,对核心Oracle数据库等关键计算组件实现替代,从而不需要每日跑批ETL。
比如天云数据研发的HTAP数据库在某大型股份制银行上线全量数据在线实时交易系统,面向柜面系统提供7*8小时A类实时核心交易,面向手机网银系统可提供7*24小时A类实时核心交易。 成功实现了对公同业,对公活期,对公定期,对私活期,对私定期,贷款,欠息,投资贴现,内部账,表外账等10大业务分户及交易明细的全量线下数据线上化,提供实时服务应用。目前400亿条交易数据, 500ms交易服务响应的A类核心系统支撑要求,每天在线交易量超过200万,占整个银行核心交易量的10%。“ 四双架构”满足金融行业A类核心系统灾备要求 天云HTAP数据库Hubble在生产和灾备两中心采用“双中心 双集群 双活 双服务应用”的四双架构。在系统上线期间,总共已完成10次以上的人工主动模拟切换演练,并成功完成了2次故障自动切换。
通过数据中台可以提升数据价值,并使数据资产变现,催生新的盈利模式。数据中台赋能行业人员快速实现模型孵化训练,实时上线运行,即AI PaaS。天云数据的AI PaaS平台MaximAI提供全面的深度学习、机器学习和自动化机器学习算法,通过MaximAI这一平台,即可完成从原始数据处理到预测模型生产、评估的全流程。
在证券行业,天云数据基于资管数据利用模型算法生产的风险传导模型,服务管理10000亿资产规模的风险传导,最大化体现数据资产价值。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。