天云大数据(以下简称“天云”)CEO雷涛是一位实打实的技术男。无论是访谈还是演讲,你总会从他的口中听到滔滔不绝的技术词汇。然而,与大多数技术男不同的是,他也总能举出最生动的例子和场景来解释这些生硬的术语。
让技术变得更接地气,降低技术门槛。这是雷涛一直在做的事情,当然,这不只是他一个人的执念,同时也是天云成立以来的初衷。
一年多前,在采访时与雷涛聊起人工智能,他就多次提及人工智能的普及化和民主化,并且强调:“AI不是少数人的专利。天云要做的就是把AI能力下沉到个体,让企业获取机器智能可以像读书一样简单,让更多的开发者、业务人员也能使用AI。”
天云大数据CEO 雷涛
MaximAI 3.0发布,实现自动化机器学习
在很多人眼里,人工智能就是人脸识别、语音交互、人机协同。但在雷涛看来,以上这些都只是应用场景,并非AI的核心。他认为, AI的核心支撑技术是围绕机器学习构建的技术框架。而这也是人工智能门槛最高的地方。
以某股份制银行为例,其官方APP的运行和维护,背后需要多达数千位的数据科学家团队,他们每年要生产600个机器学习模型,以供APP调用。对于大多数企业来说,这都是难以承受的巨额成本。
另一方面,随着企业在转型过程中逐步从规则流程驱动向数据驱动转变,这要求它们花费大量精力和成本,对以往的复杂业务流程进行梳理和改造,从而提高生产效率、节省时间。
为此,天云给出的解决方案是——规模化的AI工具。具体来说,即融合数据、计算、算法三方面的能力,结合具体商业实践,通过构建支持自动化机器学习(Auto Machine Learning)特性的PaaS化AI平台“MaximAI”,为客户做AI赋能,从而减少对数据科学家的依赖。
MaximAI是天云基于Hadoop/spark分布式底层架构搭建的人工智能平台,用于简化预测模型生命周期的可视化和模块化管理。其名字取自第一次世界大战中的“Maxim机枪”。这款“自动武器之王”的出现使得步兵完成了从“猎人”到士兵的转变,也使得人类兵器史完成了从瞄准到扫射的过渡演进。
而就如同Maxim的火药一样,天云赋予MaximAI的使命也是让AI变得更加接地气,让每一个个体都具有分析能力。
目前,MaximAI已经升级至3.0版本,能够实现算法的自动化优化和自我学习。同时,还可以实现notebook环境下的容器化部署,根据任务类型就能为用户自动确定算法,实现特征工程的自动化、自动衍生或合成特征、模型超参优化等多种任务。这意味着,用户只需要用很少的操作,就能获得高精度的机器学习模型。
据介绍,某大型股份制银行已经基于MaximAI构建了大数据挖掘平台,通过数据挖掘和分析,不仅实现了对内部管理缺陷的精准定位,降低了管理运营成本,还帮助银行确保了财务透明度,提高了计划和预算的准确性。与此同时,通过全量大数据的数据挖掘建模,还帮助该银行获得了更广阔的业务发展空间、更精准的决策判断能力和更优秀的经营管理能力。
国产HTAP数据库Hubble,低成本满足业务变化需求
然而,自动化机器学习在给企业带来AI使用便利的同时,也带来了新的挑战。过去,生产与离线分析各自独立,信息化结构复杂,异构数据库产品之间数据同步难度大。而如今,以数据驱动的创新业务要求企业必须构建一个面向生产交易等数据科学处理的核心计算框架。为此,以数据湖为代表的全新架构成为越来越多企业的选择。
针对于此,天云推出了百万原生代码规模的HTAP数据库产品——Hubble。
据天云研发总监乔旺龙介绍,Hubble对SQL进行了全面支持,并且提供多种交互接口,可以使用JAVA SDK、JDBC客户端、SQL等多种访问方式为前端应用提供数据的访问。同时,它还具备NoSQL的能力,通过采用高扩展、高可用的架构,以满足不同的业务应用,以及企业对实时、高性能的需求。
在底层技术层面,Hubble采用了HDFS作为数据的存储介质,不仅能够存储海量数据,还具备集群的横向动态扩展能力。此外,在安全性方面,Hubble还利用了HDFS的三副本机制来保证整个集群的稳定运行。
基于这样的技术支持,Hubble能够应用于历史数据查询、全量数据存储、统一格式查询等场景,从而实现对业务核心交易的减负,保障全量数据在线。
譬如,在游戏和电商行业,Hubble可以支持海量游戏和电商数据的存储,从而对用户进行画像,实现精准营销,并提供秒级的响应速度;在基础设施监控方面,Hubble可以提供准实时入库,对基础实时数据进行流处理,并提供对基础设施数据的监控;在IOT及传感器数据方面,Hubble也可以通过实时入库,对物联网数据进行存储、查询及挖掘。
“Hubble的目标是做国产的HTAP数据库。用户在使用Hubble时,无论业务规模大小,始终都与小型应用阶段相同,无需改变使用习惯。当业务规模扩大时,只需要添加新的节点,提升数据库的能力,就可以适应业务变化的需要,并且每个阶段都不需要付出额外的成本。”乔旺龙表示。
以技术为核心赋能合作伙伴,共建生态服务体系
与“浮躁”氛围浓厚的人工智能市场不同,成立5年多来我们甚少看到天云的高调发声,但是,其在技术研究层面的专注投入却是不遗余力的。
正因如此,天云一直有着非常扎实的技术功底。如今,它已经能够提供完整的人工智能产品和服务,除了底层的数据库Hubble和AI平台MaximAI之外,其产品线还包括了基于Hadoop生态体系的企业级大数据中间件平台BDP、专业数据处理引擎Hilbert,以及面向消费端的C2C智能营销SaaS平台。
针对于行业,除了最初涉足的金融领域外,天云人工智能平台在医疗、能源、艺术品交易所也得到了广泛应用。在医疗领域,天云利用机器学习算法准确识别出影响冠心病患病概率的重要性因子,并依此建立模型、进行预测,在临床实践中为专业医师提供参考和开拓诊疗思路;能源领域,天云通过对油井故障的示功图进行故障分类,将传统以月为单位的反馈分析效率提升到了日,并且大大减少了维护工人的数量;艺术品交易领域,通过聚类算法分析,为营销以及艺术品的甄选上线提供精确的数据指导和预测。
得益于这样的“兢兢业业”,在2017年中关村5000亿计划中,天云被列为大数据领域TOP10,并且上榜了中科院发布的人工智能企业排行榜百强。此外,在今年上半年天云还获得了由曦域资本、华映资本领投的1亿人民币增资。
“技术是天云获得这些荣誉的核心。”雷涛这样说。据他介绍,下一步天云还将从赋能于企业用户进阶到赋能于合作伙伴,与合作伙伴一起共建生态服务体系,其中主要包括以下四种合作方式:
一是技术转卖,合作伙伴在价值转移过程中获得附加价值;
二是帮助合作伙伴服务转型,由面向Java、DB流程型开发的服务团队,转型成DT时代的Machine Learning数据驱动团队;
三是面向已经进入数据科学的团队,天云提供支持容器化部署docker的微服务Micro service,将数据科学的模型生产过程沉淀、打包成标准可扩展形态的产品,帮助合作伙伴扩大规模;
四是面向拥有数据和场景的合作伙伴,提供数据变现的资本合作。
“未来人工智能发展趋势凸显的是规模化的生产能力,它会离我们的生活越来越近,而这需要的是更多合作伙伴相互赋能,共建生态服务体系,才能实现共赢,让更多人受益。”雷涛表示。
好文章,需要你的鼓励