中风病证候诊断与治法的相关性研究

时间:2022-05-26 09:39:09

中风病证候诊断与治法的相关性研究

[关键词]中风病;证候;治法;关联挖掘

[中图分类号]R255.2[文献标识码]C[文章编号]1673-7210(2007)02(b)-081-03

目前中医中风病的证候诊断,是根据医生对患者望、闻、问、切的四诊信息,按照国家中医药管理局全国中医脑病急症科研协作组制定的《中风病辨证诊断标准》(1994年)所规定的中风病证候诊断标准量化评分表(以下简称证候量表)给以评分,给出包括风证、火热证、痰证、血瘀证、气虚证、阴虚阳亢证6个主要证候的分值进行判断的。而对每个患者的施治原则则根据医生的经验对患者整体的症状进行判断后给出[1]。

近年来,数据挖掘技术在医疗领域得到广泛应用。关联分析是数据挖掘研究的一个十分重要的方面,对关联规则进行挖掘能够发现大量数据属性之间有趣的关联关系,例如,在医疗数据分析中,使用关联挖掘可以发现心脏疾病诊断数据集中的规则[4];在中医疾病证候诊断中,使用关联挖掘可以实现对隐含在《伤寒论》等文献中的诊断知识的学习[5];在中药方剂的研究中,使用关联规则可以确定方剂中的药对药组[6]。但是就作者所掌握的资料而言,关联挖掘用于中医中风病证候的诊断与治法相关性的研究,尚未见报道。

本文使用关联挖掘的方法,发现了大量有趣的中医中风病证候与治法之间的关联规则,得出了某些证候和治法之间相关性的评价,且结论与临床情况相符,可为中风病的中医诊疗规律的研究及治疗方案的形成提供数据支持。

1 问题描述

1.1 一般资料

数据来源于2003年11月~2006年3月在北京中医药大学东直门医院、中国中医科学院西苑医院、广安门医院、首都医科大学朝阳医院住院治疗的急性缺血性中风患者的数据库资料。选取在发病72 h内入院的423例患者的数据,并分别提取这些患者在入院0~1 d、2~3 d、6~8 d、12~16 d四个时间段中记录完整的中医六证证候量表分值和治法类别的数据,共621例次。

表1为中风病中医证候诊疗数据库中的数据实例片段。其中,各证候列为患者的证候得分;治法ID列为医生记录的治法大类,如11代表理血法、14代表补益法、17为治风法、18为祛痰法等。

表1中医中风病证候诊疗数据实例片段

1.2 问题提出

若视一个患者某一天的记录为一个交易样本,而患者的各证候量表分值或治法类别为此样本的一个数据项,包含621例次患者数据的数据库即可视为一个包含621次交易的交易数据库,那么证候和治法之间的相关性问题,就等同于数据挖掘中经典的购物篮分析问题,可根据每个患者各项的数据记录而发现不同项之间所存在的关联知识,用以帮助分析其规律性。

2 相关性研究

2.1 关联挖掘介绍[2]

关联规则挖掘就是从大量数据中挖掘出有价值的描述数据项之间相互联系的有关知识。

设I={i1,i2,…,im}为数据项集合;设D为与任务相关的数据集合,也就是一个交易数据库;其中的每个交易T是一个数据项子集,即 。设A为一个数据项集合,当且仅当时就称交易T包含A。一个关联规则就是具有“A=>B”形式的蕴含式;其中有A I,B I且A∩B=Φ。规则“A=>B”在交易数据集D中成立,且具有s支持度和c信任度。这也就意味着交易数据集D中有s比例的交易T包含A∪B数据项;且交易数据集D中有c比例的交易T满足“若包含A就包含B条件”。具体描述就是:

Support(A=>B)=P(AB)

Confidence(A=>B)=P(B/A)

关联规则的支持度(support)和信任度(confidence)是两个度量有关规则趣味性的方法。它们分别描述了一个被挖掘出的关联规则的有用性和确定性。满足最小支持度阈值和最小信任度阈值的关联规则就称为强规则。

一个数据项的集合就称为项集;一个包含k个数据项的项集就称为k-项集。满足最小支持阈值的项集就称为频繁项集(frequent itemset)。那么挖掘关联规则主要包含以下两个步骤:①发现所有的频繁项集,根据定义这些项集至少满足最小支持度阈值;②根据所获得的频繁项集,产生相应的强关联规则。根据定义,这些规则必须满足最小信任度阈值。

但是,上述基于“支持度-信任度”框架理论的关联规则挖掘方法存在这样的情况,对于某些规则,从数据库中直接取A的时候,概率可能大于在规则中取到A的概率。为了略去这样的规则,引入兴趣度(correlation, 或称相关度)的概念,具体的公式如下:

兴趣度反映了规则“A=>B”中A和B的密切程度。只有当兴趣度大于1时,A和B才是正相关的,规则是有趣的强规则;兴趣度等于1或小于1时,则A和B是相互独立或者负相关的,规则无趣,应丢弃。

若在中风病中医证候诊断数据中,挖掘出类似于“火热证=>清热法 [support=s%, confidence=c%, correlation>1]”的关联规则,表示在此次分析的患者数据中有s%的患者存在火热证且同时使用了清热法,而在有火热证的患者中使用清热法的占了c%,且此规则是有价值的强规则。挖掘关联规则的意义如下所述:

①找出所有以“清热法”为后件的关联规则,将有助于研究者发现何种证候出现时常使用清热法;②找出所有以“清热法”为前件的关联规则,将有助于研究者发现清热法适用于存在何种证候的患者。

本文采用的是关联挖掘中的经典算法――Apriori算法,该算法是挖掘产生布尔关联规则所需频繁项集的基本算法,利用了一个层次顺序搜索的循环方法来完成频繁项集的挖掘工作,具有较高的处理效率。

2.2 实验及结果

2.2.1 数据处理数据在关联规则挖掘前要经过选择和转换以适合挖掘的形式。根据医疗数据的特点,医疗数据集要转换成包含项的事务数据格式。同时,为了减少对事务数据库的扫描、提高挖掘效率,本文把事务数据库转化成0~1矩阵进行关联挖掘,即当某一事务存在某一属性项时,此项为1,否则此项为0。

证候量表的分值为数值类型的数据,要发现它们之间的关联规则,必须把它分成不同的区间,即将数量关联规则转换为布尔型关联规则。而对数值类型数据的区间的划分,与医疗专业知识有很大关系,往往有一些已经约定俗成的分割点一直被采用。根据传统观点,把中医六证证候量表分值的7分作为评判此证候存在与否的标准。即证候量表的分值高于7分,表示证候存在,转换后的事务数据表中对应此项为1,否则此项为0。

对于治法数据,根据初步统计,包含治法的患者数据中,使用祛痰法的占35.9%,治风法占22.7%,补益法占22.4%,理血法占9.6%,其他均低于5%,所以仅研究这四种主要治法,直接将每种治法视为一个项,使用该治法此项为1,否则为0。

下面举例说明。表2为根据表1的原始数据进行转换后的0~1矩阵示例。

表2使用7分标准转换的事务数据0-1矩阵

2.2.2 关联挖掘结果在本文中,选取的最小支持度min_sup=0.05,最小信任度min_conf=0.6。这是因为治法中使用理血法的数据仅占9.6%,为了出现包含“理血法”一项的关联规则,将支持度阈值设得比较小。得到的关联规则如表3所示。

表3以7分标准进行数据处理后的关联挖掘结果

“祛痰=>痰”规则说明,存在“使用祛痰法的患者存在痰证”这样的关联模式,这与医学常识显然是相符合的。

2.3 改进

以上是根据《中风病辨证诊断标准》中有关证候诊断成立的7分标准进行数据处理后所做的关联分析,可以看到其挖掘到的规则很少。而根据医生经验,中医六证证候量表的分值普遍偏低,按照7分标准判断证候的存在与否时会出现无证可辨的情况。为解决这个问题,我们考虑采用基于支持度的部分k度完全方法[8],使用聚类方法按照样本的本性对对象进行分类,即将证候量表分值的聚类结果作为其区间划分的依据。其优越之处在于:所得到的区间支持度大于最小支持度,不会因为此项的支持度过小,达不到最小支持度阈值,而挖掘不出包含此项的关联模式。

因此,根据北京交通大学ACSL实验室的研究报告[9],其聚类分析得出了良好的中医六证的轻中重的三类划分点,我们将轻、中的分界点视为证候存在与否的边界点。这些划分点分别为:风证5分,火证4分,痰证6分,瘀证3分,气虚证3分,阴虚阳亢证4分。据此将中风病中医证候诊疗数据转换为0~1数据,并同样选定最小支持度min_sup=0.05、最小信任度min_conf=0.6进行挖掘,得到的关联规则如表4所示。

表4以聚类结果为依据的划分区间进行数据处理后的关联挖掘结果

通过改进,挖掘出了更多有趣的关联规则。因为祛痰法使用得最为普遍,所以挖掘出来的关于祛痰法的规则也最多,且发现了前面实验未挖掘出的关于治风法的关联规则,改进效果明显。

3 结论

综上,祛痰法和风证、火热证、痰证、瘀证都具有很好的关联性,与痰证的相关性尤其好;治风法与血瘀证、气虚证也有一定的相关性;理血法与血瘀证存在相关性。分析原因,主

要有:从治法库中可以看到,祛风化痰、清火化痰、化痰通络均属于祛痰法的范畴,这可能是上述结果出现的主要原因。另外,从中医理论来说,痰的性质黏着难以祛除,常与其他病邪胶结,从而加重疾病。因此中医有“无痰不作眩”、“怪病多由痰作祟”的说法。如风痰胶结,则加重眩晕发生的可能性,痰火相互纠缠则使痰和火均难以祛除。因此,祛痰治疗之后,其他病邪无处可以依附,随之好转,这也是应用关联规则进行挖掘后,发现祛痰法和风证、火热证关联性较好的可能原因。祛痰法和痰证的关联性较好,符合临床实际。痰证作为气血津液代谢异常所产生的病理产物时,可以阻滞血液的运行,从而导致血瘀证的产生。应用祛痰法对于血瘀证的改善有一定治疗作用,这与此次挖掘所得祛痰法和血瘀证关联性较好相符。另外,在中风病的临床上,多种证候常常合并出现,风证、火热证、血瘀证常常和痰证同时出现,我们进行关联规则的挖掘时,只是对常用治法和证候进行了单维的挖掘,因此出现了祛痰法和风证、火热证、痰证、瘀证都具有很好的相关性。如果对常用治法和证候组合进行多维关联分析,可能结果会更加贴近临床实际。常用治法和证候组合的多维关联规则挖掘有待进一步研究。从以上结果我们还可以看出:治风法对于血瘀证和气虚证都有较好的相关性。在治法库中疏风通络、祛风通络法都归于治风法。这可能是上述结果产生的主要原因。临床上风证和血瘀证同时存在的比例较高,这也是治风法和血瘀证有较好关联性的原因。理血法和血瘀证的关联性较好,符合中医理血以化瘀的理论。

本文使用关联挖掘研究了中风病中医证候和治疗法则之间的关系,发现了大量有意义的中风病中医证候与治法之间的关联规则。此结果能对中风病的中医诊疗提供较好的辅助手段;同时,本文使用的方法,也为中风病中医证候诊断的研究提供了良好的研究思路。

使用关联规则挖掘中风病中医证候和治疗法则之间的关系是可行的,但是因为所采用的数据是临床实时采集的开放性临床资料,还存在一定的噪声干扰;同时,治疗法则在数据库中的分类不够科学细致,也对挖掘带来一定的影响。下一步的工作,是要进一步考虑数据清洗问题,以及事务属性项的分组问题,同时采用大型数据集进行测试,以得到更为准确的医疗规则。

致谢:本文课题来源于北京市科委重大项目“中医药防治重大疾病临床个体诊疗评价体系的研究”。北京中医药大学东直门医院承担其中的课题“中风病个体诊疗规律与综合治疗方案的研究”(课题编号:H020920010220),合作单位有中国中医科学院西苑医院、广安门医院、首都医科大学朝阳医院、北京中医药大学东方医院,共同完成信息的采集、录入等工作。

[参考文献]

[1]“中风病证候学与临床诊断的研究”科研协作组. 《中风病证候诊断标准》的临床验证研究[J].北京中医药大学学报,1994,l6:41-43.

[2]Jiawei Han,Micheline Kamber著.范明,孟小峰译. 数据挖掘:概念与技术[M].北京:机械工业出版社,2001.8.

[3]朱明.数据挖掘[M].合肥:中国科学技术大学出版社,2005.5.

[4]李虹,蔡之华. 关联规则在医疗数据分析中的应用[J].微机发展,2003,13(6):94-96.

[5]陈明,张书河. 关联规则在中医疾病证候诊断中的应用[J]. 中华医学丛刊,2004,l5:14-16.

[6]曾令明,唐常杰,阴小雄,等. 双向关联规则挖掘及其相关性分析[J]. 计

算机工程与设计,2005,10:2585-2588.

[7]R Srikant,R Agrawal.Mining quantitative association rules in large relational tables[C].In Proceedings of the 1996 ACM SIGMOD Conference on Management of Data,Montreal,Canada,1996,25:1-12.

[8]姚美村,袁月梅,艾路,等.数据挖掘及其在中医药现代化研究中的应

用[J].北京中医药大学学报,2002,25(3):20-23.

[9]王振华.基于中风病中医量表聚类分析的中医证候评判标准[R].北京交通大学先进控制系统研究所研究报告,ACSL_06001,www.acsl.

bjtu.省略.

(收稿日期:2007-01-08)

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。

上一篇:针刀药物手法推拿治疗足跟痛 下一篇:末梢血糖检测在妊娠期糖尿病筛查方式中的可行...