医生已经成为全球自杀率最高的职业。根据2018年由医师基金会发布的报告显示,有多达78%的受访医生表示偶尔会感到精神萎靡——这个数字比2016年的调查高出4%。此外,医生的自杀率已经达到普通群体的2倍。据估计,在美国每年有300到400名医生因此而失去生命。这是相当可怕的一个数字。
我们知道,引发医生产生焦虑的原因有很多,比如门诊压力、医疗事故问题、医患关系紧张等等,每个问题单独拿出来都是一个非常棘手的课题。尤其是在我国医疗资源分布不均的大环境下,所有的问题也被加倍放大。而近几年来,AI技术的引入确实为整个医疗健康行业带来了曙光。
具体地,AI在医疗健康行业中的应用包括了医疗机器人、智能药物研发、智能诊疗、智能影像识别、智能健康管理等方向。其中,智能诊疗和智能影像识别是最核心的两大应用场景,而后者也是AI与医疗结合最成熟的领域。
据《医疗影像的市场图谱和行业发展分析》报告指出,预计到2020年中国医学影像市场规模将达6000亿至8000亿左右。这样的市场机会引来了诸多科技企业的争相进入,包括腾讯、阿里巴巴以及一批又一批的医疗AI创业公司。医准智能正是其中的活跃者之一。
作为国内在AI医疗影像领域最早的实践者,医准智能的核心团队早在2014年就开始了相关研究,并在2017年正式成立公司。多年来,医准智能一直专注于AI辅助医疗影像诊断,并已经推出了两款产品——肺结节智能检测系统和乳腺钼靶智能检测系统。
据医准智能首席AI官王子腾日前在接受记者采访时介绍,医准智能肺结节智能检测系统在短短18秒的时间里就能智能检测300-500张CT,并且3mm以上的结节检出率达到了99%,假阳性率控制在平均每个患者2个以内;在磨玻璃结节检出上,精准率也达95%以上,结节定位能够精准到肺段。
医准智能肺结节智能检测系统界面示例
呼吸道及肺部病症如今成了普遍问题,而肺癌也是发病率最高的癌症。据统计,在我国三甲医院平均每天接诊的肺部患者有400人左右,由于肺部拍片是断层扫描,医生要检查一个完整的肺部,需要看数百张的成像数据,通过肉眼识别用时大概在半小时左右。“因为医生要观察和判断片子中的每一个点,定位每一个病灶的位置,并且测量大小、看良恶性,最终还要写成报告。”王子腾解释道。
而借助于肺结节智能检测系统,不仅可以帮助医生在10几秒时间里实现快速检测,同时还能直接输出一个电子报告供医生进行二次审核。不仅操作简单,还节省了大量的时间。
另一款产品,医准智能瞄准的仍然是医疗中的一个棘手难题——乳腺癌。其乳腺钼靶智能检测系统是我国首个乳腺智能检测系统,据了解,该系统的病灶检出率达到93%,在1个假阳性前提下,良恶性检测准确率达到94%。
医准智能乳腺钼靶智能检测系统界面示例
王子腾表示,目前,这两个系统已经在全国许多医院投入临床使用,并得到了CFDA(国家食品药品监督管理总局)的认证,极大提高了临床医生的阅片准确率和诊断水平。
与此同时,医准智能正在开发的还有数十个产品,不只是乳腺超声、DR胸片检测等临床辅助诊断系统,今年5月医准智能还与IBM一起合作发布了AI医学科研平台——达尔文智能科研平台。
随着近几年来技术的创新和设备的升级,据统计,医疗数据正在以接近100%的超高速增长,其中有80%的数据都是非结构化数据。相比较而言,医生的年增长却只有个位数,其中大部分还是基层医疗从业人员。因此,数据收集与处理正成为制约医疗与科研发展的瓶颈。AI与医疗的结合将有助于解决这一问题,从数据收集、组织、标注,到模型的构建、训练等端到端的全生命周期,帮助医生实现一边看病,一边搞科研。
达尔文智能科研平台正是这一背景下的产物。这是一个一站式医疗影像人工智能平台,内置了Watson Machine Learning Accelerator和医准智能影像组学双平台,以及医准智能在影像组学上的深度研究实践,支持包括CT/MR/DXR等多种类型的数据,具备标注工具、特征提取、模型训练以及模型实施一体化特征。通过Watson Machine Learning Accelerator平台,用户可以直接调用医准智能的肺部和乳腺智能检测结果,快速搭建高精度低假阳性率的肺结节和乳腺AI模型,同时,平台还允许用户根据具体需求进行研发和调整,并确保数据不出院,最大限度保证数据安全可控。
医准智能首席AI官
“过去医生自己做研究,因为缺少技术开发知识,就必须把数据交给第三方公司进行分析。但借助于达尔文智能科研平台,医生只要进行简单的拖拽和点击操作,就可以自主完成从数据标注到科研模型训练,再到应用的全部流程。”王子腾表示。
比如,在数据组织阶段,平台可以提供自动分割功能和标注工具,借助AI自动进行病灶分割和自定义病灶区域,帮助医生进行数据处理,提升效率;在影像导入到系统后,AI会自动对影像进行一次分割,医生可以选择其中的优质结果作为科研素材;此外,医生也可以选择通过标注工具对影像进行主动标注,或者修改AI的自动分割结果作为科研素材。
“当然,平台的产出不会只停留在科研阶段。根据医生的科研结果,平台还能帮助医生逐渐进行产品的迭代和升级,最后与产业中的企业合作,实现科研成果的产业化落地。”IBM中国系统开发中心技术解决方案总监崔玮强调说。
IBM中国系统开发中心技术解决方案总监崔玮
在IBM看来,随着AI进入规模化生产和应用,数据管理难题会越来越凸显,比如数据摄取和准备的周期太长,多元数据的难以聚合,如何将处在不同基础架构孤岛中的数据流动起来,以及如何安全地管理和保护数据,确保可追溯性,并实现全球可访问和协作等等。“在这背后,基础架构的支撑会变得越来越重要。”IBM大中华区系统部存储系统总经理吴磊表示。
IBM大中华区系统部存储系统总经理吴磊
举例来说,在此次医准智能与IBM的合作中,医准智能主要提供高效领先的AI算法驱动,而IBM提供的则是强大算力和数据管理的支持。如果分解开来看,达尔文智能科研平台实际上是IBM Power、Spectrum Scale、IBM Watson Machine Learning Accelerator的端到端IA组合——即由OpenPOWER服务器提供超强算力,与Distributed Deep Learning相结合提供强大的线性扩展能力;由Spectrum Scale为集群化的AI平台提供稳定、高效和安全的数据平台支持;由Watson Machine Learning Accelerator作为开放性AI平台的代表,为上层应用提供可靠的平台支持。
其中,Spectrum Scale虽然是个“新瓶”,装的却是“老酒”。据吴磊介绍,它之前的名字叫做GPFS(General Parallel File System)——通用并行文件系统。如果追溯的话,这个系统的发展历史已经有25年之久。此前,IBM打败国际象棋冠军卡斯帕罗夫的深蓝计算机和后来在智力竞赛节目Jeopardy中战胜了两名前人类冠军的Watson,它们基于的都是这个系统。
“随着AI进入规模化生产和应用,它就需要与企业业务进行融合,在这一过程中,数据成了核心。而每个数据都需要载体,包括计算力、存储性能、网络吞吐量等等,只有这样,数据流通才能完成。比如,IBM的创新存储产品可以帮助企业部署一个治理平台,把用于AI 模型的数据统一起来,让它们从离散到聚合,从离线到在线,从静止到流动,形成端到端的数据管道,实现企业数据随时随地存储,随时随地获取。“
“因此,IBM一直坚信‘无IA,不AI’,我们希望能够通过高效、可靠而开放的现代化架构,助推AI不断向企业、产业延伸和落地。”吴磊表示。
好文章,需要你的鼓励
OpenAI、Anthropic和Google的AI代码助手现在能够在人工监督下连续工作数小时,编写完整应用、运行测试并修复错误。但这些工具并非万能,可能会让软件项目变得复杂。AI代码助手的核心是大语言模型,通过多个LLM协作完成任务。由于存在上下文限制和"注意力预算"问题,系统采用上下文压缩和多代理架构来应对。使用时需要良好的软件开发实践,避免"氛围编程",确保代码质量和安全性。研究显示经验丰富的开发者使用AI工具可能反而效率降低。
香港大学研究团队发布GenieDrive技术,通过引入4D占用空间概念,让AI真正理解驾驶的物理规律。该系统能将复杂驾驶场景分解为物理预测和视频生成两步,解决了传统AI只会模仿、容易产生偏见的问题。测试显示其预测准确度提升7.2%,视频质量提升20.7%,且能准确响应各种驾驶指令,为开发更安全的自动驾驶系统提供了新范式。
英伟达与AI芯片竞争对手Groq达成非独家授权协议,将聘请Groq创始人乔纳森·罗斯、总裁桑尼·马德拉等员工。据CNBC报道,英伟达以200亿美元收购Groq资产,但英伟达澄清这并非公司收购。Groq开发的LPU语言处理单元声称运行大语言模型速度快10倍,能耗仅为十分之一。该公司今年9月融资7.5亿美元,估值69亿美元,为超200万开发者的AI应用提供支持。
这项由孟加拉国工程技术大学、澳大利亚莫纳什大学和卡塔尔计算研究所联合开展的研究,首次让网页机器人具备了"后悔能力"和"战略思维"。WebOperator系统通过树状搜索、安全回退和破坏性动作识别三大创新,在WebArena测试中达到54.6%成功率,显著超越以往记录。该技术有望革命性改变电子商务、办公自动化和内容管理等领域的效率和可靠性。