迁移学习在医疗卫生领域的应用

时间:2022-01-14 11:35:04

迁移学习在医疗卫生领域的应用

摘要:迁移学习是一种新兴的机器学习技术,如果能够合理地将迁移学习技术应用在医疗卫生领域中,则可以有效解决传统机器学习和深度学习方法在医疗领域中所需数据标签不足的缺陷。笔者介绍了迁移学习的基本概念、迁移学习与传统机器学习方法之间的区别,同时从医学影像、医学文本、医学信息资源以及安全问题4个方面,介绍了近几年国内研究人员提出的几种将迁移学习应用在医疗卫生领域的方法,对于相关领域的研究人员有一定的借鉴价值。

关键词:迁移学习;智慧医疗;机器学习;深度学习

近年来,随着计算机科学、物联网、数据科学等的飞速发展,人工智能相关技术与相关产品也在各个领域有着广泛的应用,例如图像识别、文本分类以及语音识别技术等。此外,智慧医疗(WiseInformationTechnologyofMed,WITMED)也取得了重要成果。为了保证训练所得深度学习模型的性能,通常对数据有一些要求,即训练数据和测试数据的特征空间和分布必须相同[1]。然而在医疗领域,其产生的数据具有数据量大、数据类型繁杂、非结构化数据占比大的特点,而且对医疗数据的标注通常需要由拥有充实生物医学知识背景、熟悉诊疗过程的专业人士来完成或指导。若仍采用传统的深度学习方法,则标注任务的周期大大加长,且标注任务也较为繁重。如果在医疗卫生领域将其他场景中的知识迁移、复用到所需场景中,寻找源域和目标域的相似性,则可以有效解决跨域场景下多源异构数据的分析和建模问题,为工作人员带来极大的便利。在总结迁移学习方法的基本思想和类型的基础上,通过文献调研方法探讨了近年来迁移学习在医疗卫生领域的应用现状,旨在为信息时代构建智慧医疗模式提供参考,为科研和医务工作者提供相应思路。

1迁移学习简介

1.1迁移学习的概念

迁移学习是一种新兴、跨任务、跨领域的新型机器学习框架,能够从不同的领域中学习对目标领域有用的知识并将其应用到新的任务中,具有较高的理论研究价值。其主要思想是将源域中的知识迁移到目标域中,以提升学习模型的表现。在大数据时代,迁移学习技术可以在一定程度上解决传统机器学习模型训练过程中低效率的样本标记任务导致的人力和时间资源消耗过大等问题,同时还可以有效解决标注数据的稀缺问题。迁移学习可以从3个方面进行分类:①根据学习的情境,可将其分为直推式迁移学习、归纳式迁移学习以及无监督迁移学习;②根据数据的特征空间,可将其分为同构迁移学习和异构迁移学习;③根据学习方式的不同,可将其分为基于特征的迁移学习、基于实例的迁移学习、基于模型的迁移学习以及基于关系的迁移学习[2]。

1.2迁移学习与传统机器学习的区别

传统的机器学习和深度学习方法对数据的要求较高,其采用的数据必须服从独立同分布且来源于相同的特征空间,需要有足够多的训练样本。在医疗卫生领域中,由于医学数据如医学影像等难以获得,其数据专业性较强、标记成本较高,导致有效标记的数据样本十分有限,而且数据的分布也可能随着各种动态因素而变化,因此传统机器学习方法的数据要求往往难以得到满足。而迁移学习方法放宽了训练数据和测试数据需要服从独立同分布这一假设,使得参与学习的领域或任务可以服从不同的边缘概率分布或条件分布,同时也不需要足够多的数据标注,可以重用其他任务已经建立的模型,从而利用相关领域的知识来完成目标领域的任务。

2迁移学习技术在医疗卫生领域的应用现状

对于医疗卫生领域,其数据拥有专业性较强、非结构化数据较多、种类繁杂以及数据量大等特征。若在医疗卫生领域采用传统的机器学习或深度学习方法,由于数据特征和标签的专业性较强,因此会导致对医疗记录、数据的标注任务较为繁重,费时费力。而运用迁移学习技术,则可以较好地解决这一难题。

2.1迁移学习技术在医学影像诊断中的应用

医学影像中往往含有丰富的信息。近年来,随着人工智能技术和产业的发展,基于迁移学习的医学影像诊断也有了广泛的研究与应用,提高了传统医疗影像识别的准确率,帮助医生节省了大量的时间,可以辅助临床医务人员对患者的健康状况进行诊疗。党维涛等人利用迁移学习方法,通过构建上肢骨骼异常分类与定位的深度神经网络模型,实现对异常X射线片的快速分类和异常区域的自动定位[3]。该方法使用基于迁移学习的深度神经网络模型,通过引入经过预训练的DenseNet模型,针对上肢骨骼X射线片的分类进行再训练,从而提取骨骼X射线片的特定图像特征,获得多层特征图。基于梯度加权类激活映射图求得特征图的加权系数,构建类激活图,从而得到此图片中各个像素点对异常分类概率影响程度的大小,实现对图像的分类和对异常区域的精准定位。使用此方法对异常X射线片进行整体分类与异常定位的模型框架如图1所示,可为影像科医生提供辅助参考[4]。此外,杨沐泓等人提出一种基于卷积神经网络和迁移学习的COVID-19影像自动诊断方法[5]。该方法使用Kaggle的新冠肺炎数据集,通过使用已经初步训练好的模型,对少量样本进行迭代更新,利用多源迁移学习方法训练神经网络,将各个数据源训练的不同权重参数整理为权重参数集。得到预训练模型后,再使用医学影像数据对系统进行迭代更新,从而对图像进行诊断,在该数据集达到了较高的准确率。通过迁移学习方法进行中医诊疗的相关研究工作较少,随着迁移学习在其他医学影像领域分析研究的发展,也为其未来应用于中医诊疗领域提供了一个可关注的方向。目前,中医诊疗主要将其用于解决舌象分类问题。杨晶东等人提出一种基于迁移学习的全连接神经网络舌象分类方法,该方法使用训练好的Inception_v3,从小样本舌象训练集中提取特征,再利用特征微调全连接神经网络,较好地解决了深度学习方法小样本、多分类的难题[6]。宋超等人提出一种基于深度迁移学习的舌象特征分类方法,该方法先使用级联分类器对原始图像进行舌体定位,再将分割后的舌体图像在GoogleLeNet和ResNet上进行深度迁移学习训练,从而对齿痕、裂纹、舌苔薄厚3种主要的设想特征进行分类[7]。上述两种舌象分类方法,均达到了较高的准确率。

2.2迁移学习技术在医学文本中的应用

由于现代医学文本数据的非结构化特征,难以对医学文本进行有效利用,因此如何构建结构化医学文本成为一大研究热点。张博等人提出一种基于迁移学习和集成学习的临床试验筛选标准短文本分类方法[8]。该方法基于迁移学习理论,利用目标域的数据集对预训练的语言模型进行微调,从而得到具有丰富目标域语义信息的语言模型。同时将其与主流的神经网络模型相结合得到医学文本分类器,并针对医学文本分类任务对其进行微调,在集成学习过程中使用beamsearchensemble算法来提高整体性能,最终得到了较高的准确率。刘佳苪提出一种基于迁移学习的小规模医学领域文本摘要生成模型[9]。以医学领域专业型较强的小规模文本数据为研究对象,提出基于迁移学习的Seq2Seq模型,对文本内容进行摘要标题的生成。通过参数优化实现跨域模型同参的效果,并在预训练模型中加入嵌入位置层对长文本限制进行弱化,从而使所得模型的自适应性更强。

2.3迁移学习技术在医学信息资源中的应用

随着网络技术的进一步发展,网络上医学相关的新闻信息量过于庞大,且存在大量虚假、无效或重复的信息,使得没有专业知识背景的公众难以辨别其真伪和有效性。与浅层的机器学习方法相比,深度学习具有更强的数据识别能力和知识表示能力,更适合用于信息的挖掘、分析与处理。使用迁移学习技术,可以在一定程度上打破传统机器学习和深度学习方法对海量标注数据依赖的局限性[10]。赵梓博等人提出一种多任务环境下融合迁移学习的疫情新闻要素识别方法[11]。该方法结合命名实体识别与规则识别方法,通过多个任务对多类别的新闻要素进行识别,并采用模型迁移方法来解决新闻领域数据冷启动的问题,得到了识别效果较好的跨领域要素识别模型。

2.4迁移学习应用过程中的安全问题

虽然迁移学习、深度学习以及其他人工智能技术可以很方便地为医生的疾病诊疗提供参考依据,但在实际应用中,为了确保训练模型的真实性、有效性,训练所用的数据大部分是患者们的隐私数据。假如网络遭受恶意攻击,容易导致训练集中的患者隐私数据发生泄露。如果在数据传输的过程中被窃取,不法分子可能利用这些私有数据进行不法活动,危害用户的财产和人身安全,甚至威胁社会稳定。PAPERNOTN等人提出一种深度学习过程中的训练数据隐私保护方法[12]。该方法采用教师模型全体的隐私聚合(PrivateAggregationofTeacherEnsembles,PATE)模型,利用半监督学习和知识迁移方法对训练数据进行保护。PATE模型的网络分为教师和学生两部分,将隐私数据用于教师网络的独立训练,通过投票法将教师的知识传递给学生,并添加噪声以扰动教师信息,从而达到对整个网络的保护效果。以卷积神经网络为例,PATE模型的主要流程如图2所示。通过该模型,既可以将各个教师的网络聚合起来,又能够保护其隐私。若将这些教师视为各个医院等医疗机构,则可以理解为这些医疗机构试图提升其预测效果且不希望隐私数据被其他参与者获得。田啸天针对皮肤镜图像数据集,提出CNN卷积神经网络模型优化方法并改进了PATE模型,使用差分隐私保护基本思路对PATE模型的网络结构进行完善,进一步提高了患者隐私数据的保护效果[13]。

3结语

综上所述,迁移学习相关技术在当前医疗卫生领域起到了重要作用,极大程度地方便了医务人员对患者的诊断和治疗,优化医疗资源配置,简化患者的就医流程。随着数据量的进一步增加,人们对医疗卫生领域产生的数据进行处理和利用的需求也越来越大,迁移学习、深度学习等人工智能技术的应用前景将更加广阔。

作者:朱博文 李莲 姚建伟 单位:中南大学计算机学院 十堰市人民医院 医学检验与输血科

上一篇:SWI序列诊断胎儿脊柱发育畸形探讨 下一篇:小流域综合治理技术与效益探讨