2020年3月28日,西班牙马德里的医护人员在Severo Ochoa医院的紧急入口外(来源:Getty Images)
人工智能的历史悠久,可以追溯到20世纪50年代的计算机行业。有趣的是,很多创新来自政府计划,而不是私营企业,例如人工智能技术帮助我们对抗冷战,使人类登上月球。
这些计划的影响是深远的,甚至可能引发了互联网和个人电脑的变革。
发展到今天,人工智能会对新型冠状病毒(COVID-19)的防疫产生类似的影响吗?这会不会是我们这一代的“太空竞赛”?
我认为是的,而且,这次的影响涉及到全球范围。
催化剂
数据的大规模可用性将是关键。美国白宫科学技术办公室已经创建了Covid-19 Open Research Dataset数据集,其中包含有24000多篇论文,而且正在不断更新,得到了美国国家医学图书馆(NLM)、美国国立卫生研究院(NIH)、微软和艾伦人工智能研究所的支持。
“该数据库可以帮助科学家和医生创建个性化的精选文章列表,帮助数据科学家能够使用文本挖掘技术,通过先进的AI方法有效地对如此庞大的信息量进行筛选。”本特利大学助理教授Noah Giansiracusa这样表示。
不过,这需要有一定的措施来激发AI专家采取行动。好消息是,已经有一些组织行动起来了,例如AI公司C3.ai Digital Transformation Institute,该公司和微软组成的新研究联盟,主要专注于利用AI对抗流行疾病。
甚至还有一些旨在激发创新的竞赛,其中之一就是Kaggle与NIH和美国白宫合作开展的COVID-19开放研究数据集挑战赛,这项赛事将调动起Kaggle超过四百多万名数据科学家群体,其目标是更好地预测COVID-19在世界范围内的传播。
此外还有Decentralized Artificial Intelligence Alliance联盟,这个联盟正在举办一场旨在对抗流性疾病的“Covidathon”人工智能黑客马拉松,协办方包括SingularityNET和Ocean Protocol。其成员包括50多家企业、实验室和非营利组织。
另外,还有麻省理工学院的MIT Solve项目,旨在激发社会影响力创新,近日发起了Global Health Security & Pandemics Challenge。实际上,该组织的成员Ada Health已经开发了AI驱动的COVID-19个性化筛查测试技术。
免费AI工具
人工智能工具和基础设施服务可能成本很高,针对诸如医学研究等复杂领域的模型尤其如此。
但是AI公司已经开始行动了,纷纷宣布开放免费工具:
- NVIDIA为Parabricks提供了90天免费许可,允许其利用AI技术用于基因组学,进而大幅缩短处理时间。该计划还得到了Oracle Cloud Infrastructure和Core Scientific(NVIDIA DGX系统和NetApp云连接存储提供商)的免费支持;
- DataRobot免费提供平台,可实现AI模型的大规模部署、监视和管理。此外DataRobot还向Kaggle竞赛提供了该技术;
- Run:AI免费提供软件以帮助构建深度学习模型的虚拟化层;
- DarwinAI与滑铁卢大学VIP Lab合作开发了COVID-Net,一个卷积神经网络,可以利用胸部X射线照相术检测COVID-19。此外,DarwinAI还宣布开源该技术(见下图)。
患者护理
患者护理是AI应用的一个重要领域。拿Biofourmis举例,两周时间内这家初创公司就创建了一个远程监控系统,其中包括用于患者手臂上的生物传感器和用于诊断的AI应用。该系统可以帮助降低医生和医疗支持人员的感染率。
Vital是另一个辅助患者护理的创新公司。创始人Aaron Patzer曾经创建了Mint.com。通过使用AI和NLP(自然语言处理)技术,Vital的产品可以那些超负荷的医院使用。
Vital现在正在投入所有资源创建C19check.com。该应用是与Emory急诊医学部的Health DesignED中心和Emory紧急事件准备与响应办公室合作开发的,可为公众在前往医院之前提供自我诊断指导。到目前为止,已经有40万人使用了该应用。
以下是一些有意思的患者护理成果:
- AliveCor:AliveCor推出了支持人工智能的KardiaMobile 6L平台,该平台可以检测新冠病毒患者的QTc(心率校正间隔),从而有助于检测心脏骤停的发生。它是基于FDA最新指南的,可针对新冠病毒大流行提供更多非侵入式的远程监控设备;
- CLEW:CLEW发布了TeleICU,可以利用AI提前识别呼吸恶化情况。
药物开发
尽管这些年来药物开发方面取得了很多进展,但药物开发流程仍然非常缓慢并且任务繁重。在这方面,人工智能可以提供一些帮助。
例如Gero Pte,一家使用AI加速药物开发的初创公司。Gero Pte通过测试已经用于人类患者的治疗方法,从而利用AI更好地分离出COVID-19化合物。
Nintex技术布道总监Vadim Tabakman表示:“自疫情爆发以来,分析病毒基因组的进展似乎非常迅速。在机器学习的辅助下,利用这些信息探索不同场景并从结果中进行学习,很可能扭转局面,找到找到能够对抗此类流行病大爆发的药物。目前全球比以往任何时候都需要更加紧密地联结在一起,因此拥有不同的让研究人员、医院和国家/地区将数据提供到数据集,经过处理,可以极大地加快结果的生成。”
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。