近两年,AI医疗领域备受资本市场关注,尤其是到今年下半年,推想科技、图玛深维、汇医慧影等企业都相继完成了B轮融资。国内高端医疗影像设备生产商联影今年也注资3亿人民币成立人工智能子公司进军医疗人工智能领域。此外,还有腾讯的“觅影”,阿里健康的“Doctor You”等都在医学影像的智能辅助诊断系统上有所布局。
今年8月,人工智能医疗行业中又添一名新成员,清影医疗科技有限公司正式成立。据了解,清影医疗团队主要由来自美国斯坦福大学、密歇根大学、芝加哥大学、以及国内清华大学的人工智能团队构成。虽然成立公司还不到半年时间,但此前团队中核心成员已经在医疗人工智能领域从事了两年左右的研发。
目前,清影医疗正在与国内多家三甲医院合作进行产品研发与测试,在医学影像、病理分析等方面推出了相关产品。其中对于乳腺癌、肺癌等病种的智能辅助诊断系统已经相对成熟。未来清影医疗还将进一步拓展AI在基因组学数据分析、药物挖掘等方面的应用。
多模态数据分析,从筛查、确诊到治疗方案推荐
清影医疗产品研发的路径和很多同类公司一样,都选择了从医学影像领域入手。临床诊断70%要依靠医学影像,随着人口增多、老龄化的加剧以及收入水平的提升,都驱动着医学影像市场的扩容。然而,需求的高涨相对应的却是医疗资源的短缺,医生由于疲劳或者水平的限制,容易在读片时产生漏诊、误诊。所以人工智能在其中就发挥了节省医生时间、提升效率的作用。
当然,仅仅是在筛查层面的提升并不能真正满足医院的需求,因此,除了CT、MRI等影像图片外,清影医疗加入病理、电子病历等数据形成多模态的数据分析,辅助临床科室诊断和治疗方案推荐,从而形成从筛查到肿瘤分级分期、再到治疗方案推荐的全流程智能辅助系统。
具体来看,目前清影医疗开发完成的系统中有几个典型代表:
1、清翼智能医疗分析平台
通过与中国医学科学院肿瘤医院合作,清影医疗开发了一套基于云的大规模医学图像信息与分析平台“清翼智能医疗分析平台”,将高分辨率病理切片,MRI,CT, 超声等多种医学图像整合,并提供完整的临床信息,诊断方案记录,以及病人随访跟踪信息,为乳腺癌精准治疗提供TB数量级的大范围多维度的医疗信息库。
2、清云智能病理分析系统
清影医疗联合斯坦福大学医院、北京协和医院、中国医学院肿瘤医院等医疗机构,通过对超大量临床乳腺病理片的深度学习和分析,开发一套乳腺癌病理切片图像的多层特征分析计算机辅助诊断系统“清云智能病理分析系统”。系统所带的病理诊断功能可以丰富当前病理诊断的结构,能够为病理医生提供快速与准确的病理量化信息反馈,精准定义疾病的多层信息。
3、清风3D超声智能诊断系统
以超大量的乳腺癌3D超声样本数据为基础,清影开发了“清风3D超声智能诊断系统”。待3D超声智能诊断软件测试通过后,将其加载在超声设备里,使3D超声设备在扫描检测时能自动分析出乳腺癌的诊断情况,进而开发出一体化3D超声智能诊断设备。3D超声乳腺癌自动诊断软件系统及3D超声智能设备将为患者提供提供乳腺癌早期、便捷、无创伤的筛查检测系统,以提高乳腺癌检测覆盖率和早期检出率。
除上述系统外,清影还有多项产品储备,在此就不一一列举。据介绍,清影目前已经与10家以上国内知名三甲医院进行深度合作,共同开发其系统,并共同拥有知识产权。相关的学术论文也将在近期发表。
应用数据增强技术,将AlphaGo Zero带到医学领域
目前从事医学影像智能辅助诊断系统开发的公司众多,从表面来看,技术路径大体相似。不过,清影医疗创始人邹昊表示,清影在技术上有着更独特的优势。
“大部分公司采用的技术是在AlphaGo阶段,需要用大规模的数据来训练系统,而用少量的数据做测试验证。这样获得的验证结果并不严谨。就像是无人车系统不能仅仅在小乡村的道路上验证过后,就以为可以应付全世界的各种路况一样。医学样本非常复杂,小规模验证并不能保证系统的稳定性。”邹昊称。
同时,要获得大量的高质量标注数据也不是件容易的事情。医疗中的现状是,大专家时间紧,很少有空余时间做数据标注,普通医生受自身水平、经验的所限,标注的数据可能不准确。所以采用大规模数据训练系统的方式,既耗费大量人力成本,也很难获得高质量数据,训练的系统也就无法做到精准。
而清影医疗采用的是“进阶版”的技术,只需要小规模数据集就可以训练出高灵敏性、高稳定性的系统,也就是走到了AlphaGo Zero的阶段。
这其中很重要的一项技术在于数据增强。因为由于不同医学影像设备型号、参数的差异、人为操作的差异等,影像数据很难统一,这对训练模型不可避免的会造成负面影响。而数据增强,可以将一份数据,加入各种噪声,比如将色度不均、光照不均、清晰度不均等等情况都考虑在内,不断对系统进行干扰,训练系统的灵敏度。这样也就是把一份数据样本衍生出了几万份乃至几十万份的样本。所以公司只要通过与专家医生合作,获得少量的高质量标注数据,就可以保证即使是小样本数据也能够训练出高准确度的系统。
虽然小样本数据就可以训练系统,但不代表清影医疗不需要获得大量数据。为了验证系统的稳定性,清影采用大规模数据来进行系统的测试校验。其数据来源主要包括美国、欧洲大学医疗数据库中开放或者封闭的数据集、美国医院以及中国合作医院中整理好的临床数据等等。通过这些数据来校验系统的各项指标,从而获得医学界对于系统的认可。
至于对公司商业化的考虑,清影医疗联合创始人朱一山表示,除了开发智能辅助诊断系统外,清影医疗还计划与医疗器械厂商合作开发智能化的医疗设备,以及开办第三方智慧病理诊断中心等。此外,与保险的合作也有望进一步推动。
“未来有很多种商业变现的细化路径,我们将一步步实现,具体还不便透露。清影医疗目前首要考虑的是如何为医院医生与患者创造价值,而未来实现商业变现将是自然而然实现的步骤。”朱一山表示。