居民电子健康档案数据的采集工作分析

时间:2022-10-06 08:17:21

居民电子健康档案数据的采集工作分析

摘 要大数据时代带来了人们生活、工作、思维方式的大变革,随着数据处理技术的进步,人们对于海量数据的发掘、应用和分析也越来越成熟。大数据处理有关的技术也渗透到更多的行业中,我国卫生系统的信息处理技术发展迅速,但是由于卫生行业的特殊性以及数据采集的信息流动等问题,导致数据至今没有形成统一的标准。而大数据时代加强数据的一致性、可用性以及易获得性是必须要考虑的工作。

【关键词】大数据时代 居民电子健康档案数据 采集工作

大数据时代的最大特征就是实现了海量数据的分析、处理还有应用,本文所要讨论的居民电子健康档案数据采集中就应用到了大数据处理的很多思想。居民电子健康档案建设有着重要的社会价值,但是当前由于数据采集导致的“死档案”“旧数据”等问题严重影响了其实际效益,鉴于篇幅限制,本文主要讨论数据采集的标准化和统一化工作,提高数据在整个电子健康档案建设的有效垂直流动,对采集数据进行优化和改良。

1 数据采集标准化的基本思路

居民电子健康档案是以居民健康为核心的,包含了居民个人信息、卫生服务信息两个主要信息的电子档案。因此采集的数据除了基本信息外,还有复杂而且庞大的公共卫生信息。数据标准化的思路为,使用Rational Rosc建模工具对现有的数据进行改良,将现有的卫生数据进行分类划分,形成类的层次结构,规范其数据类型和形式,从而提高数据的规范化程度,提高大数据环境下数据的可利用性。其中数据的标准化方法采用“实体/属性/值三联体”的方法,而数据的规范化表示方法则借助于《卫生信息数据元标准化规则》中的标准。并结合我国当前的卫生服务特色,加入标准中没有的类以及类的基本属性,对类进行补充。

2 数据采集标准化的具体方法

2.1 构建标准数据模型

对原有的健康档案数据模型进行优化,并抽象出实体和活动两个主题类,将居民的卫生信息抽象成八个大类分别是:实体类(个人、卫生机构、药品与材料)和活动类(医学观察、计划与干预、卫生费用、诊断与评估、危险因素)。建立基本的数据模型,并结合中国居民的卫生信息对八个大类进行精细划分,从而形成类的层次结构,并参照HL7标准规范类的属性和特征,明确数据元的定义和取值。

2.2 类的属性和规范化描述

对数据模型中的对象类进行分析,结合我国卫生领域的政策以及应用现状设置每一个对象类的某一组属性或者属性对应的数据类型。随后根据数据类型的表示形式和语义,按照国际以及国内通用的编码标准,确定数据的属性以及取值范围。结合类的属性和属性取值形式,构建包含对象类、特性、表示形式三个内容的标准化数据元。最后结合本次研究中居民电子健康档案数据的项目进行数据的标准化定义。类的属性和规范化表述的主要思想是实现类的逐级细化和实例化,并通过数据元的标准化实现了在某一特定语境下的数据采集,参照居民电子健康档案数据来说,就是将居民的个人信息和健康信息逐级细化最后结合国家卫生信息数据标准进行实例化,从而提高了数据的标准性。

2.3 数据单元和健康档案数据项的标准化

结合我国目前的医疗政策和卫生服务现状,将居民信息标准化处理。上文中提到信息共有八个大类,按照上述2.2中方法进行信息细化,例如个人信息既包含了卫生服务人员例如医生、护士、医疗机构人员信息,同时也包含了服务对象的信息。八个大类包含的信息类型繁多而且非常的复杂,因此需要对信息形成的数据单元以及类型进行标准化,假设居民信息档案一共包含了1200个数据项,按照数据项的类型以及表示形式,将1200个数据项进行归类和整理,提炼成约200个标准化数据单元。例如服务机构信息包含了50个数据项,那么按照数据类型和表示形式可以简化成20个标准化数据元。

2.4 卫生信息标准化数据元的规范

接下来就是对数据元进行规范化处理,按照概念数据模型的方法和思想,对上文中凝练出来的200个数据单元进行标准化,使用(数据元、数据元概念、特性、对象、值遇)五个元数据项对其进行标准化。具体的操作过程为:

(1)对象类的规范化,对象类为现实世界中某种事物或者规则的集合,有着明确的定义和界限,其行为以及特性遵循着相同的规则,能够加以识别并有显著的标识;

(2)特性规范化描述,是描述对象类全部个体的某种特性,从而使得对象能够被区别对待;

(3)数据元概念规范化描述,数据元概念包含了类以及类的属性,并建立两者之前的关联;

(4)值域的规范化描述,值域是关于允许值的集合;

(5)数据元则是由一个类以及特性、表示形式构成。这里以对象类中的卫生服务对象类的规范化描述为例,一个“卫生服务对象类”包含了名称、英文名称、定义、元数据类型、元数据标识符等多个元数据项目,其规范化描述则参照卫生服务标准进行约束,并给出约束的类型。

3 结语

大数据时代是数据的革命,而数据的规范化、标准化是数据采集、分析和利用的基础。当前我国卫生数据的采集多是满足小范围内的,例如单位或者部门的应用,但是大数据要求更高的数据分析和处理能力,为此我们讨论了我国居民电子健康档案数据的规范化和标准化方法。数据采集的标准化也为跨平台、快地区、跨系统的信息处理提供了基础,是实现我国卫生管理工作信息化的重要措施。本文仅从数据规范化角度分析也有着很大的局限性性,而数据采集的过程中还与数据通信、采集方式、数据采集接口、网络拓扑等等有关,各方面工作还有很多需要完善和改进的地方。

参考文献

[1]杨鹏.居民电子健康档案文档架构与数据元组的研究与实践[D].第四军医大学,2012.

[2]孙兰.基于居民电子健康档案的社区高血压管理模式研究[D].复旦大学,2013.

[3]马国强.指纹密钥及其在居民健康档案隐私保护中的应用研究[D].武汉大学,2011.

[4]孙兰.基于居民电子健康档案的社区高血压管理模式研究[D].复旦大学,2013.

[5]肖伟.山东省卫生信息化建设现状与发展对策研究[D].山东大学,2013.

上一篇:微波烹饪的技巧 下一篇:山西刀削面馆将亮相美国洛杉矶