昨日,OpenAI正式官宣发布了GPT-4,这将大模型之战再度推上一个新的高潮。
实际上,在上一波战斗中,ChatGPT已经陆续进入到了科技巨头的技术编队,甚至包括BAT在内的国内科技巨头,也开始尝试将ChatGPT与自身业务结合,寻求ChatGPT在应用侧的突破。
那么,在这次轰轰烈烈的技术颠覆战中,大厂在产业应用上都做了哪些探索呢?
阿里:AI如何赋能电商?
今年2月9日,有消息称,阿里巴巴达摩院正在研发类似ChatGPT的AI产品,目前已处于内测阶段。随后这一消息得到官方证实。据悉,阿里版ChatGPT是以2022年9月发布的“通义”大模型为基础进行的技术开发。
关于阿里ChatGPT的消息,官方消息仅此而已,再无更多。
不过,ChatGPT本质上是基于大模型训练形成的对话式AI,结合阿里自身业务和此前在AI领域的技术布局,我们不难看到,阿里很有可能在探索的几个应用方向。
首先是阿里核心业务电商中的搜索引擎。众所周知,淘宝中的搜索引擎加入了AI推荐机制,这种AI引擎会将你搜索过的同类产品经过筛选排序推荐给你,随着ChatGPT的研发和深入,将有可能以此提升搜索引擎的理解能力,通过更自然的对话模式、更精准地推送相关产品到你的App上。这也算是搜索引擎的一次调优和模式升级。
另一个较为明确的场景是AI客服,AI客服在各大电商平台、金融平台中应用已经颇为广泛,但人机交互体验并没有很好,也因此不少人还是习惯找人工客服进行沟通,从ChatGPT如今在交互过程中体现的自然度来看,可以对AI客服进行升级。
天猫精灵和AI虚拟主播是阿里此前力推的两类产品,前者主打个人智能助手,后又转向产业赋能,后者则是由于技术产出伸向直播带货场景的一个产品,不过二者均涉及到智能语音技术,现在大家普遍认为ChatGPT在智能语音技术上的创新模式会是ASR+LLM,这就会使得智能语音技术从根本上得到一次跨越式更新,改变生活服务类智能语音技术应用不够智能的问题。
不出意外的话,阿里版ChatGPT首先也会是先与这些场景结合,率先开展相关领域的业务升级和模式探索。
腾讯:AI优化广告投放
和至今仍没有太多消息流出的阿里不同,腾讯内部成立类ChatGPT项目的消息已经曝出,据36氪此前报道,腾讯内部已成立名为「混元助手(HunyuanAide)」项目组,由腾讯首席科学家张正友亲自挂帅。
混元助手发布之前,腾讯早在2022年就公布了混元AI大模型,这个基于腾讯太极机器学习平台的AI大模型彼时已经被应用于广告投放——通过混元AI大模型帮助广告系统理解广告内容,再以精排大模型提升广告和用户的匹配准确率。
腾讯混元AI大模型另一个应用领域是微信搜索——微信搜一搜,以及腾讯的现金牛——游戏领域。
“降本增效”是腾讯今年对内的一个重要政策,混元AI大模型在上述这些应用领域产生的效果都有可能在混元助手项目推进过程中得到再次优化和提升。
科大讯飞:医疗、教育两手抓
作为国内人工智能领域独角兽企业,科大讯飞在人工智能领域的布局一直较为高调,这次在ChatGPT上的部署也有不少已经对外公布。
科大讯飞副总裁、研究院执行院长刘聪在今年一篇公开分享中指出,ChatGPT的“智慧涌现”主要包括五个方面的能力:
海量高价值信息全量在线记忆、自然语言输入任意任务和多轮对话理解能力、复杂逻辑思维链推理能力、多角色多风格长文本生成能力、即时新知识学习应用与进化能力。
而科大讯飞则主要是针对长期关注的医疗、教育领域在进行部署,早在今年1月30日的科大讯飞投资者关系活动中,科大讯飞曾表示,ChatGPT应用在C端是有价值的,例如面向学生和老师的学习机,汽车,以及将来的家庭医疗设备。在对话系统提升中,相关预训练模型对教育C端和医疗C端都有很好的促进作用。
科大讯飞官方还指出,未来面向元宇宙和数字经济虚拟人的消费类产品中,科大讯飞已经推出了虚拟人交互平台。
小结
ChatGPT被誉为人工智能带来的一次价值跨越,国外微软、谷歌竞争激烈,国内各大科技巨头也纷纷立项、研发、抢占市场。
英伟达CEO黄仁勋此前在公开活动中甚至表示:“ChatGPT是人工智能领域的iPhone时刻。”
而就在前不久,百度高调官宣要做ChatGPT后,国内众多媒体纷纷宣布加入战队,成为百度文心一言的数据库和后花园,京东更是早早官宣了产业版ChatGPT ChatJD落地。
纵观这波自ChatGPT爆发,由引擎之战兴起的AI热,或将再度盘活整个科技产业,也为互联网再次进阶指明道路。
好文章,需要你的鼓励
CIO们正面临众多复杂挑战,其多样性值得关注。除了企业安全和成本控制等传统问题,人工智能快速发展和地缘政治环境正在颠覆常规业务模式。主要挑战包括:AI技术快速演进、IT部门AI应用、AI网络攻击威胁、AIOps智能运维、快速实现价值、地缘政治影响、成本控制、人才短缺、安全风险管理以及未来准备等十个方面。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
过去两年间,许多组织启动了大量AI概念验证项目,但失败率高且投资回报率令人失望。如今出现新趋势,组织开始重新评估AI实验的撒网策略。IT观察者发现,许多组织正在减少AI概念验证项目数量,IT领导转向商业AI工具,专注于有限的战略性目标用例。专家表示,组织正从大规模实验转向更专注、结果导向的AI部署,优先考虑能深度融入运营工作流程并产生可衡量结果的少数用例。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。