大数据在健康医疗领域的应用发展研究

时间:2022-10-20 07:43:34

大数据在健康医疗领域的应用发展研究

【摘 要】随着医疗卫生信息系统和高通量测序等医学诊断技术的高速发展,医疗健康领域正逐步迈入“大数据时代”。医疗大数据包括居民行为健康等基本数据、电子病历、诊疗数据、检测报告、医学影像、医学管理、经济数据等。医疗大数据具有规模大、增速快、结构多样、应用价值高等特点。面对海量数据,如何以数据创新探索未来医学科学,提升人类医疗健康水平,已成为国内外关注热点。

【关键词】大数据;医疗健康;医疗信息化

1 国际大数据产业在健康医疗领域的应用发展现状

近年来,英、美、加拿大等国家先后投入巨资开展医疗健康信息化建设,引入大数据信息化技术使得医疗健康信息化系统能够辅助公民医疗质量和安全,提升整体医疗服务质量,提高医疗服务可及性,降低医疗费用,减少医疗风险。

1.1 美国:推动健康医疗大数据开放共享,重点发展精准医疗

美国在推动大数据研发和应用上最为迅速和积极。在健康医疗大数据方面,2014年6月,FDA公共数据开放项目openFDA正式上线,开放了2004至2013年间的300万份药物不良反应和医疗过失记录(经脱敏处理数据),鼓励企业和个人对数据价值进行挖掘与分析。2015年1月,美国前总统奥巴马宣布划拨2.15亿美元作为精准医疗计划经费,加快基因组研究。同时美国还制定一系列的标准和要求,以保护隐私和跨系统数据交换安全。

1.2 英国:积极发展个性化医疗,注重隐私保护

2013年6月,英国医疗保健当局宣布将建立世界最大的癌症患者数据库,收集来自英国各地医疗机构的病例和1100万份历史档案记录,保存和整理英国每年35万新确诊的肿瘤病例的全部数据。同年,英国启动了医疗健康大数据旗舰平台care.data,集中了全英国的家庭医生和医院记录的病历以及社会服务信息。由于该平台运作中发生数据被披露,2016年7月6日,为保护患者隐私,care.data计划被终止。

1.3 加拿大:建设互联互通平台,探索卫生经济和疗效研究

近年来,加拿大借助大数据和移动互联网技术建立了覆盖全国的电子健康档案、药品信息、实验室信息、影像系统、公共卫生信息和远程医疗系统,建立统一识别系统以及基础架构和标准的研究。同时,利用大数据开展基于卫生经济学和疗效研究的定价计划,开展了基于卫生经济学和疗效的药品定价试点项目,利用数据分析衡量医疗服务提供方的服务,并依据服务水平进行定价。

综上所述,国外政府高度重视医疗大数据产业发展,政策着力点主要在三个方面:一是开放数据,提供社会高质量数据资源;二是在前沿及共性基础技术上增加研发投入;三是积极推动政府和公共部门应用大数据技术。

2 我国医疗大数据应用发展现状

2.1 前期的医疗信息化建设为医疗大数据产业发展打下了坚实的基础

2006年开始,我国开始建设区域卫生信息平台,整合区域范围内医院、基层卫生机构、公共卫生的各类数据,形成以个人为中心的电子健康档案库。数据主要包括临床信息――处方、检验报告、检查报告、手术报告、病案首页、出院小结;公共卫生信息――疾病报告、疾病管理、生命统计、儿童保健、妇女保健、老年人保健等。通过十年多探索,在医疗健康大数据已经初步具备了基础和规模,并取得了一些标志性的成果:

一是,国家层面的顶层设计和总体框架:建设了人口健康信息化建设的指导意见“46312”工程,“全民健康保障信息化”工程一期数据总体架构。

二是,国家卫生标准制定和互联互通:围绕互联互通与信息共享,已研发形成了89个数据集、277项医疗卫生信息标准、3300个数据元。以公民身份证号码为唯一标识实现了医疗卫生数据与公安、教育、民政、人社等部门的信息协同,共计覆盖13.6亿人口,包含13项信息的国家人口基础库。

三是,卫生信息化基础能力建设:目前,全国有71%的省启动了省级卫生信息化平台建设,46%的地市启动了市级卫生信息化平台建设,29%的区县启动了区县级平台建设。2015年国家卫生计生委启动了十省互联互通项目,目前已经接入了上海、北京、湖南、湖北、江苏、浙江、福建、重庆、内蒙古、辽宁十个省级平台。在医院层面,目前我国约50%的委属医院,42%的省属医院和38%的市属医院已启动医院信息平台建设。

2.2 国家出台了一系列政策为医疗大数据产业发展提供了良好的发展环境

2015年起,国务院和国家卫生计生委等有关部门陆续了一系列指导性文件,提出加快医疗大数据相关技术和产业发展,推动医疗卫生服务模式和管理模式转变,提升我国医疗服务水平,从而为医疗大数据发展提供了良好的政策环境,相关政策如表1。

3 上海医疗大数据发展基础与现状

3.1 发展基础与优势

一是,构建了良好的医疗信息化和大数据基础。上海率先建设了国内规模最大的三级医院临床信息共享工程――上海医联工程。医联工程接入了全部市级以上38家三级甲等医院,数据涵盖医疗中的医疗业务、临床业务、医学影像、医疗运营、医疗管理等核心内容。在此基础上,上海市卫生计生委联合申康中心建设了覆盖全市16个区、所有600家公立医疗卫生机构的上海健康信息网。截至2015年底,上海市已累计为7175万名患者建立了诊疗档案,医嘱17.4亿条,各类检验检查报告2.3亿份;建立了国内最大的医学影像中心数据库,实现了医学影像数据的调阅共享,截至2015年底,累计采集影像资料9.8亿幅,数据量413T,月均跨院调阅影像数据约2万次。

二是,集聚了一批部级科研院所和创新平台。包括中科院上海生命科学研究院、药物所、复旦大学医学院、上海交通大学医W院、第二军医大学等大批部级科研院所及相关医院。建成和在建国家新药筛选中心、上海蛋白质科学设施、国家肝癌中心、国家转换医学中心等部级科学基础设施和创新平台。复旦大学建成“上海市数据科学重点实验室”,涉及医疗健康、智慧城市等多领域的大数据分析,并在国内率先成立大数据学院。

三是,拥有国际化创新产业集群。上海市已形成生物医药和软件大数据等产业集群,集聚了万达信息、金士达卫宁等国内医疗信息化领先企业以及上海医药、上海联影、上海微创等一批生物医药和医疗器械企业;成立了上海数据交易中心作为大数据“交易机构+创新基地+产业基金+发展联盟+研究中心”五位一体的重要功能性平台;汇聚IBM、Intel、微软、罗氏等跨国公司研发机构超过200家。

四是,具备创新改革多重叠加优势。上海正在推进张江国家自主创新示范区建设、深化中国(上海)自由贸易试验区改革开放。在国家的大力支持下,正探索科技金融、国际人才试验区、海外人才往来、国际合作研究等方面创新改革的先行先试,具备独特的创新改革优势。

3.2 存在的不足与瓶颈

上海市医疗健康行业中累积了大量的结构化和非结构化医疗健康数据。但是,由于存在医疗数据互联互通和标准化程度低等一系列问题,制约了医疗大数据产业发展,具体如下:

(1)缺少标准化规范,数据质量不高:各医疗服务机构在推进信息化建设过程中缺乏通用的数据标准、技术标准、管理标准和业务标准,难以形成标准化的公共服务体系。采集的数据由于缺乏统一标准,数据记录存在偏差和残缺等原因,总体数据质量不高。

(2)资源管理分散,大数据利用水平低:从医联工程建成至今,上海市积累了近PB级的包括诊疗记录、处方、医嘱、出院小结、检验检查报告、医学影像信息等在内的海量医疗数据,但由于存在数据结构化程度较低,电子病历标准不一致、大量医疗数据存储分散等问题,兼容性、可扩展性较差,给信息共享带来了困难。同时,由于缺乏获取知识级情报的技术手段、缺乏对医疗大数据资源的深入价值挖掘,还未形成数据驱动的科学研究模式与知识应用服务,实现医疗大数据的深度应用。

(3)医疗隐私保护难度增加:随着医疗卫生信息共享的开展,隐私保护的难度逐步增加,很大程度上限制了医疗卫生信息资源的利用程度。

(4)缺少医疗大数据专业人才:随着医疗大数据产业的快速发展,对专业技术人才的需求量激增,权威专家估算,我国未来五年相关专业人才缺口将高达130万左右,尤其是横跨生物医学和信息科学,具备扎实理论基础,又有业务实践经验的大数据人才非常紧缺。

(5)缺乏协同合作机制:医疗大数据关键产业环节之间还没有建立有序的协同合作机制,为技术研发、工程孵化、成果转化、行业应用、标准评估等关键环节提供合作渠道。

4 发展医疗大数据技术突破方向和重点

根据上海市医疗信息化和大数据产业基础,结合国际大数据在健康医疗应用的发展趋势,未来几年,上海市相关机构和部门应主要针对以下核心技术进行研究和突破。

4.1 医疗大数据互联互通技术

主要包括:互联互通技术开放架构和配套技术、异质多源数据的整合技术等。通过适合多层级、跨区域医疗信息系统共享协同的互联互通技术开放架构和配套技术,能够适应多种医疗信息系统接口,提高互联互通实施效率;研发支撑组学数据、医疗数据和健康数据等异质多源数据的整合技术,适应数据类型复杂、存储模式多样、语义标注体系各异、规模巨大等特点。

4.2 医疗大数据整合管理技术

主要包括:多源医疗大数据的语义关联技术、医疗数据质量修复技术及基于数据管控的医疗大数据共享利用技术等。建立基于统一患者身份的索引、疾病代码及药品代码规范等,在语义层实现多来源医疗数据与其他行业数据的融合,支持智能学习和语义理解;通过实现数据智能填充和补正,解决系统数据源头质量低、数据缺失、填写不规范的问题;在原始数据拥有方可管、可控、可溯源的前提下,允许第三方基于数据沙箱开展分析利用,促进医疗大数据利用水平。

4.3 医疗大数据分析检索技术

主要包括:医疗知识图谱智能构建技术、医疗影像分析技术等。基于临床数据、健康档案、人群队列、专病数据库等,在语义规范化和语义关联网络的基础上,构建出跨知识库融合的知识图谱;通过图像分割、图像配准、图像可视化、多时序图像分析、统计学分析和生理学模型分析等,有效支撑临床辅助诊断、疗效评估等。

4.4 医疗大数据集成应用技术

主要包括:医疗质量控制管理技术、临床精细诊疗决策支持技术、疾病经济负担分析评价技术、公共卫生决策支持技术、个性化智能健康服务推荐技术等。通过集成应用上述技术,实现相关技术的综合运用,开发医疗质量监管、临床辅助诊疗、卫生经济分析、公共卫生决策服务、健康管理、医保医药等软件产品,并进行示范应用。

4.5 医疗大数据隐私保护及安全风控技术

主要包括:隐私保护技术和访问控制技术,平衡隐私保护和数据挖掘需求的医疗大数据脱敏技术,基于访问行为安全审计的、风险自适应的医疗大数据访问控制技术等。通过上述技术的应用,实现针对不同数据共享方的数据按需脱敏,加强医疗大数据安全风险防控,构建基于安全多方计算的、医疗大数据隐私纵深保护体系。

5 相关政策建议

在开展技术研究突破的同时,为推进医疗大数据的应用和产业发展,建议从研发支撑平台、成果转化和工程应用、人才和能力建设等方面重点突破,创新建设体系与应用模式,全面引领和支撑我国医疗大数据领域的发展,形成完善的产业生态系统。

5.1 建设创新技术研发平台

通过建立医疗大数据应用技术的创新研发平台,组织开展医疗大数据互联互通、医疗大数据整合管理、医疗大数据分析检索、医疗大数据标准、医疗大数据隐私保护、医疗大数据行业应用等研究,进行P键技术的研发、产品化和工程化,快速提高我国医疗大数据应用技术水平。以居民健康档案、临床诊疗数据、生物组学数据、医保医药等数据为基础,着力探索医疗数据资源的统一标准,形成从区县、地市级、省级到部级别的数据资源全面整合共享和规范化,推动医疗数据的互联互通和融合共享。

5.2 培育医疗大数据行业自主创新能力

通过行业领先企业和科研单位的强强联合,发挥技术研发的导向作用,建设开放式、包容式技术研发创新平台和产业联盟,为国内外优势力量提供参与协同创新的沃土。面向限制医疗大数据行业应用存在的重大技术瓶颈,以国家的医疗卫生行业需求为导向,承担国家重大任务和企业提出的攻关研究项目,开展医疗大数据关键核心技术和新产品的战略性、前瞻性研发,发展一批具有创新技术路线的医疗大数据的技术模式。

5.3 构建产学研用协同创新联盟促进创新成果转化

联合医疗卫生管理部门、医疗卫生服务机构、医疗科研机构、互联网医疗企业和医保医药企业等产业链关键用户单位,构建产学研用协同创新联盟,积极探索医疗大数据应用技术的成果转化,支撑医疗信息化产业链企业开展数据互联互通、共享协同、分析利用等方面的产业链协作。建设技术成果应用示范基地,对接用户单位产业化应用需求,推进技术成果转化与实际应用,推动医疗大数据产业快速发展。

5.4 集聚和培育一批国际化优秀创新人才

充分利用上海市高校、研究机构及相关企业基础及资源,形成跨学科跨领域联合培养、多形式培训模式和系统,建立医疗大数据应用技术的人才培养平台,为医疗大数据创新工作提供源动力。充分发挥上海市建设科创中心的相关政策优势,集聚和吸引各类优秀人才,形成一支结构合理、紧密协作的专病研究、人群队列、公共卫生、生物组学、临床医学、计算机科学等多学科团队。

5.5 开展模式创新提升我国医疗全产业链服务能力

聚集全医疗医药科研创新资源,通过“众智、众包、众创”的模式促进医疗大数据的价值发现,面向行业共性问题和需求,研发一系列医疗大数据服务产品,形成数据驱动的医疗服务决策能力,提升医疗质量监管、临床辅助诊疗、卫生经济分析、公共卫生政策评价水平,并服务于健康、医药、医保、医疗、大数据多个上下游产业链,提升我国医疗相关产业整体水平。

【参考文献】

[1]张振,周毅,杜守洪,等.医疗大数据及其面临的机遇与挑战[J].医学信息学杂志,2014,35(6):1-8.

[2]周光华,辛英,张雅洁,等.医疗卫生领域大数据应用探讨[J].中国卫生信息管理杂志,2013(4):296-300.

[3]张彦瑾,滕悦,宣腾,等.上海市某医联预约服务平台应用效果分析[J].医学与社会,2015(2):47-48.

[4]母晓莉,徐俊,杨烨,等.基于医联平台的实时数据交换产品的设计与选型[J].中国数字医学,2016,11(3):64-68.

上一篇:自制“教学用直流电动机演示装置” 下一篇:浅析五位一体校园网安全运营管理方案