基于GBM倾向评分法对疏血通注射液导致谷丙转氨酶异常变化的影响分析

时间：2022-03-30 05:18:00

[摘要] 该文通过估计使用疏血通注射液对肝功能指标谷丙转氨酶（ALT）异常变化的处理效应，探讨临床真实世界中使用疏血通注射液是否可能对人体的肝功能有损害，为疏血通注射液安全应用于临床提供指导。根据选取的全国18家大型三甲医院信息管理系统（hospital information system， HIS）中的中药注射剂临床使用信息，该文采用回顾性研究，以ALT异常变化为结局指标，基于generalized boosted models（gbm）倾向评分加权法，平衡大量混杂因素的偏倚，利用多元Logistic回归估计使用疏血通注射液对ALT指标异常变化的处理效应，并探讨导致ALT指标异常变化的可能影响因素。该研究以疏血通注射液为实例，阐述GBM倾向评分加权法的优势及应用过程，并利用其估计消除了大多数混杂变量在组间的差异，并本质上修改了使用疏血通注射液对ALT指标异常变化的处理效应估计，使结果更加贴近临床真实情况。研究结果显示基于HIS数据库的大样本临床观察性数据，使用疏血通注射液对ALT的异常变化没有显著影响。

[关键词] 疏血通注射液；HIS安全性再评价；倾向评分加权；ALT；临床真实世界

中药注射液具有作用迅速、疗效提高等特点，但是近年来，对应用中药注射剂时出现毒副作用的报道逐渐增多，某些中药注射剂引起的肝损害已引起了国内外学者的高度重视[1-2]。因此，对中药上市后的安全性再评价（safety re-evaluation of post-marketing traditional Chinese medicine patent prescription， SRPTCM）已刻不容缓。疏血通注射液具有活血化瘀、通经活络以及明显的抗凝、促进纤溶且改善血液流变的作用，广泛用于脑动脉粥样硬化、脑血栓、心绞痛、心肌梗死、冠状动脉硬化、急性脑梗死等疾病。随着上市后时间的延长和用药人群的扩大，相关不良反应和新的不良反应逐步地被报道和发现，但关于它可能对肝功能的损害目前还没有文献报道[3-4]。本研究选取全国18家大型三甲医院信息管理系统（hospital information system，HIS）中的中药注射剂临床使用信息，旨在对临床真实世界使用疏血通注射液是否可能对患者肝功能造成损害，以及哪些因素可能导致患者肝功能损害进行相关研究，为疏血通注射液安全应用于临床提供指导。

本研究以谷丙转氨酶（ALT）为肝功能评价指标，用实例阐述generalized boosted models（GBM）倾向评分加权法的优势及应用过程，基于GBM倾向评分加权法，对提取的非随机观察性数据中存在的大量混杂因素进行偏倚平衡，利用多元Logistic回归估计使用疏血通注射液对ALT指标异常变化的处理效应，即探讨临床真实世界中使用疏血通注射液是否对人体的肝功能有损害，以及导致ALT指标异常变化的可能影响因素，为临床安全使用疏血通注射液提供指导。本研究的观察性数据中存在大量混杂因素（也称协变量），其在使用疏血通注射液（下面简称“用疏血通”）和未使用疏血通注射液（下面简称“未用疏血通”）的患者间的基线分布差异会影响研究的真实性，但是GBM倾向评分加权估计可以减少或消除大多数协变量在组间的差异，同时，“用疏血通”组和倾向评分加权后的“未用疏血通”组的比较结果提供了“用疏血通”相对于“未用疏血通”对ALT指标异常变化的处理效应，并在几乎没有混杂的情况下本质上修改了“用疏血通”对ALT指标异常变化的影响即处理效应，使结果更加贴近于临床真实情况。

1 材料与方法

1.1 数据来源

本研究数据来源于北京市18家大型三甲医院HIS数据库中的部分“用疏血通”和“未用疏血通”的住院患者信息，共包括5个部分信息表：患者一般信息、西医诊断、中医诊断、医嘱记录、实验室理化指标检查[实验室指标信息系统（laboratory information management system， LIS）]。其中“用疏血通”的患者共54 254位，“未用疏血通”患者共40 472位，筛选其中至少具有2次ALT检测指标的患者，并根据下面数据分析的提取标准，从中提取ALT指标发生指定变化的患者作为研究对象，与相同条件下“未用疏血通”的患者进行对比分析。

1.2 数据提取原则

1.2.1 数据规范化在提取分析数据之前，需要对HIS和LIS数据库进行标准化，标准化的流程主要涉及剔除患者一般信息中的重复数据、信息表不一致的数据、无用医嘱记录、医嘱名称的标准化、中西医诊断名称的标准化、用药剂量单位的标准化以及理化指标检测值的标准化等[5]。目的是确保被研究患者的唯一性；确保各信息表之间具有相关性；确保医嘱和诊断名称的一致性；确保用药剂量单位和理化指标结果的有效性。基于这4个方面的原则，对数据库的信息进行统一标准化，形成完整有效的分析数据。

1.2.2 病例入选标准及排除标准依据数据规划化的准则，纳入HIS和LIS数据库中所有“用疏血通”和“未用疏血通”的住院患者，且在LIS数据库中至少有2次ALT检测指标的患者。排除不符合数据规范化的住院患者。

1.2.3 数据提取标准及安全性结局由于HIS数据库收集和存储的数据非常庞大和结构复杂，而且没有直接对不良事件的记录，故需要对数据进行整合、清理、转换和标准化之后，才能提取研究所需要分析的指标[5-6]。本研究需要提取2类人群①在所有“用疏血通”的住院患者中，提取具有ALT检测指标的患者，将其“用疏血通”前7 d内的最近1次指标值定义为“用药前ALT值”。然后考虑用药后的ALT检测指标值，若当次用药期间及用药停止后7 d内的所有ALT指标观测都正常，则记录该患者为“ALT用药后正常变化”；若这段时间只要有1次指标观测异常，则记录该患者为“ALT用药后异常变化”，并记录第1次异常前患者的所有混杂因素情况。需要注意的是：①若患者在医嘱开始前没有做ALT指标检测，则将医嘱开始当天的检测值定义为“用药前ALT值”，若当天也没有检测，此患者不属分析对象；②在所有“未用疏血通”的患者中，提取具有ALT检测指标的患者，将其入院后的第1次ALT检测值定义为“用药前ALT值”，其他情况和①的提取原则一样。但必须确保第一次异常值出现在使用了某种用药之后。从而得到分组变量“是否用疏血通”，“用疏血通”组记为1，“未用疏血通”组记为0；安全性结局变量为“用药后ALT是否异常变化”，用药后异常变化记为1，用药后正常变化记为0。

由于不同医院ALT指标的正常范围不同，因此，需要搜集各家医院ALT指标范围并根据不同医院分别考虑异常值情况。首先，把ALT指标达到正常范围上限的200%（即高于正常值上限2倍）定义为临床异常；然后，再根据用药前后是否临床异常的变化，来定义本研究的安全性结局。按照数据提取的原则，最终提取的ALT指标的人群分布见表1。

1.3 数据提取结果

在“用疏血通”的54 254位患者中，有4 991位患者（约9.20%）满足上述ALT指标的数据提取原则，其中用药前后ALT指标发生异常变化的人数为358人（约7.17%）；在“未用疏血通”的40 472位患者中，有2 678位患者（约6.62%）满足ALT指标的数据提取原则，用药前后ALT未发生异常变化的人数为158人（约5.60%）。最终得到符合数据分析条件的2组人群分布如表1所示。

1.4 混杂因素

根据提取的HIS数据的实际情况以及医学背景，考虑57个与分组变量和安全性结局（用药后ALT是否异常变化）可能有关的所有混杂因素。具体变量包括性别、年龄（分段处理）、职业、医院、住院科室、医疗费用类别（医疗保险、公费、地方普通、新农合、自费、医疗照顾）、入院方式、入院病情（危、急、一般）、出院方式、住院费用（万元）（分段处理）、病危天数、ICU天数、病重天数、住院天数（分段处理）、合并疾病、合并用药（共41种）等，见表2。由于合并用药的数量及名称类别太多，需要对其进行清理合并与标准化，选取频数最多的前41种合并用药。

1.5 数据分析方法

依据文献Rosenbaum和Rubin[7]以及Hirano和Imbens[8]，本研究利用虚拟事实（counterfactuals）定义观察性研究中接受处理和未接受处理（即对照）间的处理效应。假定总体人群中每个个体都有2个潜在的结局值（potential values for any outcome）；一个是个体被分配或接受处理条件时的结局值y1，一个是个体被分配或接受对照条件时的结局值y0。对每个个体而言，这2个值仅有1个被观察到，另一个虚拟结局是不可能被观察到的。那么，处理组的平均处理效应（average treatment effect on the treated），记为ATE1[9]。令z为处理分配指标；如果个体接受处理，则z=1，否则z=0。从而，E（y1|z=1）就是处理组个体接受处理条件后的平均结局值，E（y0|z=1）就是处理组个体接受对照条件后的平均结局值。那么，处理组平均处理效应ATE1=E（y1|z=1）-E（y0|z=1），它的估计在本研究中很有意义，因为笔者特别关注在使用了疏血通注射液的患者中“用疏血通”的处理效应，即理想上期望“用疏血通”的处理相对于“未用疏血通”的对照对ALT指标异常变化的影响更小或影响不显著。本研究关键是估计ATE1[9]。结局值y0对每个接受处理的个体而言是无法观测到的，所以E（y0|z=1）必须从对照组的数据中估计得到。然而，Rosenbaum和Rubin[7]讨论过，如果多个协变量在处理组和对照组之间存在差异的话，则此估计值是有偏的，从而ATE1的估计也会有偏，因此可以考虑利用倾向评分来调节这些差异[10]。

倾向评分法将多个混杂变量综合为一个变量即倾向评分，通过平衡两对比组的倾向评分而有效地均衡混杂变量的分布，从而达到控制混杂偏倚的目的[7，11]。由于经典的倾向评分方法缺乏灵活性，需要进行协变量选择，即都是使用带参数的Logistic回归线性模型或通过变量选择技术挑选出交互项或非线性项来估计倾向评分，这样很可能会遗漏对处理选择很重要的协变量或者错误指定了模型中协变量与处理选择之间关系的函数形式[12-14]。因此，需要更加灵活的方法，本研究利用一种多元非参数回归技术GBM估计倾向评分，它可以自动的根据数据利用自适应算法去估计所关注的处理变量和大量混杂变量（或协变量）之间的非线性关系，特别是当模型中协变量很多、协变量与处理变量之间线性、非线性或交互效应等函数形式无法确定时，此方法最具优势[10]。

GBM估计倾向评分的过程中，通过使K-S统计量达到最小，不断加权调整模型，使得“用疏血通组”和加权的“未用疏血通组”的混杂因素达到很好的平衡。为了找到使K-S统计量达到最小的迭代次数，理论上需采用很大的迭代次数，但迭代次数越多，模型估计的时间越长，所以实际应用中可以只选择较大的迭代次数，如果无法使得K-S统计量达到最小，再加大迭代次数，或考虑其他的估计方法。本研究设定迭代次数为2万。为确保模型形式的正确识别和模型的精确估计，取一个折中的4阶交互项，即在每次迭代中，考虑所有协变量的4阶交互项来最优化对数似然函数。一般来说，除非研究样本足够的大，一般不太可能去考虑5阶或更高阶的交互项。另外，在GBM估计倾向评分过程中还需要考虑一个足够小的收缩系数λ（本研究取值0.000 5），它用于排除模型中大多数不相关的协变量、产生一个仅体现最重要作用的协变量和交互项的稀疏模型[15]。另外，处理效应估计的标准差利用leave-one-out刀切法（jackknife）进行估计。算法的实现利用R统计软件中的gbm，survey和Twang等[16]编程实现。

2 实例结果分析

2.1 GBM估计倾向评分的非线性特点

根据GBM估计的过程，算法迭代直到7 322次时使得K-S统计量达到最小。算法自动的根据57个协变量对模型对数似然度整体改善的贡献，来测量并排序每个协变量对处理分配的重要程度。可以用偏依赖图（partial dependence plots）[17]来探索每个变量的边际分布。当对其他56个协变量分布边际积分以后，患者被分配到“用疏血通”组的对数优势比与每个协变量之间的关系为非线性的，见图1。这种非线性体现了GBM方法的优势。而且，从图1可以直观看出，在对其他协变量边际化后，使用奥拉西坦或入院病情危险等患者被分配到“用疏血通”组的可能性更大。

D102.奥拉西坦；V18.入院病情（1.缺失，2.急，3.危，4.一般）；V12.住院科室（1.缺失，2.CCU，3.ICU，4.儿科，5.耳鼻喉科，6.放射治疗科，7.风湿病科，8.干部病房，9.骨科，10.呼吸内科，11.急诊科，12.老年病科，13.理疗科，14.内分泌科，15.其他科室，16.神经科，17.肾脏病科，18.外科，19.消化内科，20.心血管内科，21.血液病科，22.眼科，23.中医科，24.肿瘤科）；V31.住院总费用。

2.2 混杂因素的平衡

在对照组个体进行倾向评分加权之前，协变量之间的均值差可以直接被观测到。从表2“ALT未加权”栏下的第1列百分比中可以查看“用疏血通”组的患者人群的特征，比如，年龄在18～45岁段（占28.60%）和46～65岁（占36.00%）的患者比例要明显更高。从表2“ALT倾向评分加权”栏下的第1列百分比中可以发现，在利用倾向评分给对照组个体进行加权之后，2组协变量之间的差异被大大减小。K-S统计量平均值由0.037减小到0.019，减小了50%。2组具体协变量的差异情况可查看表2。笔者只在表2中列出影响模型似然度变化比较大且2组间差异明显的协变量分布情况。

经过倾向评分加权后，2组间57个协变量的差异接近于随机分配的结果，见图2。给定原假设：“用疏血通”组与“未用疏血通”组之间协变量的均值无差异。P为原假设成立的独立性检验的值，它服从[0，1]均匀分布。图2显示了加权前后的P与均匀分布值的比较图。加权前（红色的实心圈），许多协变量在2组间有显著的差异，故拒绝原假设，从而，许多P接近于0。加权后（白色的空心圈），大多数协变量在2组间的差异不显著，故P都沿着45度的直线即[0，1]均匀变量的累积分布分散开，这就如在1个随机试验中通过检验接受2组协变量的无差异的P服从[0，1]均匀分布一样。加权前后每个协变量均值无差异检验的具体P见表2。

多分类变量都经过哑变量编码处理，P依赖于协变量的属性，若是连续变量，则它为t检验值，若是分类变量，则它为卡方检验值。

2.3 安全性结局分析

本研究重点探讨“用疏血通”对肝功能ALT指标异常变化的处理效应。即分析“用疏血通”的处理相对于“未用疏血通”的对照对ALT指标异常变化的影响。笔者建立ALT指标异常变化关于分组变量“是否用疏血通”的Logistic回归模型，则分组变量的系数值即为处理组平均处理效应的估计值，见表3。未加权Logistic回归分析表明“用疏血通”导致ALT发生异常变化的对数优势比大于0（0.013），即“用疏血通”比“未用疏血通”导致ALT发生异常变化的可能性要大，且具有统计显著性（P=0.034）；但经过GBM倾向评分加权后，虽然Logistic回归分析也表明“用疏血通”导致ALT发生异常变化的对数优势比大于0（0.011），即“用疏血通”比“未用疏血通”导致ALT发生异常变化的可能性要大，但估计的处理效应减小且不具有统计显著性（P=0.104）。说明“用疏血通”对ALT异常变化的影响分析结论需要谨慎对待。

为了获得双稳健（doubly robust）的处理效应估计，有专家推荐利用倾向评分加权和协变量调节相结合的方法来估计处理效应会更加有效[18-20]。如果倾向评分估计正确或回归模型指定正确，则它们的估计是一致的。例如，在对ALT指标分析时，注意到倾向评分加权后，虽然使得患者年龄、入院病情、住院总费用以及个别合并用药等协变量分布在2组间更接近，但还是存在很明显的差异，如“用疏血通”组中28.60%的患者处在18～45岁，而“未用疏血通”组中只有20.60%的患者处在18～45岁。所以，把“患者年龄”等协变量加入到估计处理效应的Logistic回归模型中，可以适当调节存在的组间差异，从而得到更稳健的处理效应估计。协变量调节后的处理效应减小到0.008，且更不具有统计显著性（P=0.273）。

一般来说，处理效应的估计对倾向评分模型以及回归模型形式很敏感，但对很强的处理效应，其估计的结果应该是一致的。上面对ALT指标的分析出现不一致的情况，说明本研究中“用疏血通”的处理效应并不是很强。综合上面的结论，笔者保守的认为使用了疏血通注射液的患者中“用疏血通”的处理相对于“未用疏血通”的对照对肝功能ALT指标异常变化的影响不显著。

McCaffrey等[10]用实例说明GBM能提供更精确的倾向评分的估计；GBM对2组协变量均值平衡的更好；估计出来的处理效应要更小且具有更小的标准误差。

2.4 敏感性分析

倾向评分加权可以调节可观测到的变量，但不能调节未观测到的因素即潜在偏倚。潜在偏倚的存在会导致这样1种现象的发生：具有相同协变量观测值的个体却具有不同的处理分配概率，即处理分配依赖于未观测到的协变量。例如，2个研究个体具有相同协变量观测值，但是由于存在一些潜在的协变量没有被观测到，即在这些潜在变量上的取值可能是不同的，那么研究个体被分配到处理组的概率也不同。从而，估计出来的权重和平均处理效应就会有误差。潜在偏倚是无法从数据中估计的，但是可以通过敏感性分析[19-20]来检验或评估研究结果对潜在偏倚的敏感程度。

潜在偏倚的存在意味着：研究个体被分配到处理组的真实优势比（即真实权重）不是wi=w（Xi），而是w′i=w（Xi，Hi），这里H表示无法观测到的因素即潜在偏倚。为了检验ATE1对潜在偏倚的敏感性，需要检验：随着倾向评分加权wi的变化，ATE1变化的敏感性。令αi=w（Xi，Hi）/w（Xi），用不同的αi值改变倾向评分加权αiw（Xi），来测量ATE1的变化。由于模型中的变量太多，在不影响分析结果的情况下，部分重要变量的敏感性分析结果见表4。第1列Var表示从倾向评分模型中移除的协变量名称；第2列E0表示排除Var后由倾向评分模型估计的E（y0|z=1）；第3列range（αi）表示排除Var中对应变量后得到的1组αi值的范围（最小值和最大值）；第4列observed（ρ）表示第3列αi的值与结局yi计算的相关系数cor（αi，yi）=ρ；第5列range（ρ）表示从第3列αi值的经验分布中找到的尽可能最大的和最小的ρ；第6列range（E0）表示使得ρ尽可能最大和最小的多组αi值，代入估计得到E（y0|z=1）的最大值和最小值。第7列为bread even（ρ）。

表4的结果表明，大多数协变量的range（E0）与E0比较，变化都不大，且它们对应的bread even（ρ）都很小，则说明ATE1对潜在偏倚不敏感，即表4暗示着本研究可能不存在没有观测到的变量。

3 讨论

3.1 GBM倾向评分法的优势与劣势

由于中药注射剂上市后数据难以收集且存在众多的混杂因素，分析困难，因此在现有研究中鲜有涉及，尤其很少见到利用HIS数据库信息对上市后中药注射剂进行安全性评价。基于HIS数据库中非随机化的观察性数据特点：存在大量混杂因素（也称协变量），患者间的基线分布差异会影响研究的真实性。本研究利用倾向评分调整相关混杂因素，使得“用疏血通”与“未用疏血通”的分配接近随机分配试验设计的效果，从而，可以有效的分析“用疏血通”对肝功能ALT指标异常变化的影响。GBM倾向评分估计方法非常具有吸引力，它提供一种自适应、自动的估计倾向评分的方法，特别适合带有很多协变量和多种类型变量（连续的、名义的或有序的）的数据。虽然，GBM提供了很多相对于其他模型的优势，但分析者在分析的过程中必须适当的调整模型。比如，4阶交互项的限制说明模型中不能包含更高阶的交互项；又如，迭代次数和收缩系数，都会影响模型的拟合，虽然，足够大的迭代次数（本研究为2万）和足够小的收缩系数（本研究为0.000 5）能够提供更好的模型，但是却大大增加了计算复杂度，且同时减小协变量对模型的边际改善，可能导致算法不收敛。而且需要严格的假设条件，即尽可能地纳入所有与预测变量和结局变量都有关的所有混杂因素，无法消除未知混杂因素的影响。

随着中药上市后临床再评价的开展，观察性数据无论是数量还是准确性都在不断增加。因此，倾向评分法在观察性研究中具有广阔的应用前景。但与此同时，作为中药上市后临床再评价的一种新方法，还需要在今后的研究中得到进一步验证和探索。

3.2 基于现有数据分析未发现“用疏血通”对ALT异常变化有显著影响

本研究数据中包含大量的协变量且它们和处理变量的关系存在非线性的情况，见图1，体现了GBM用于倾向评分估计的优势。虽然处理组和对照组的多数协变量在加权前存在较大差异，但经过加权平衡以后，几乎模型中所有协变量组间均值差异被消除（表2），这些协变量的组间差异会影响处理效应的估计。GBM提供更精确的倾向评分估计，对2组协变量均值平衡的更好。

本研究重点探讨“用疏血通”对肝功能ALT指标异常变化的处理效应。即分析“用疏血通”的处理相对于“未用疏血通”的对照对ALT指标异常变化的影响。GBM倾向评分加权后，Logistic回归分析表明：“用疏血通”导致ALT发生异常变化的对数优势比大于0（0.011），即“用疏血通”比“未用疏血通”导致ALT发生异常变化的可能性要大，但不具有统计显著性（P=0.104），这在本质上修改了“用疏血通”对ALT指标异常变化的处理效应估计，使结果更加贴近临床真实情况。但本研究发现，通过GBM倾向评分加权并不能移除数据中每个协变量在2组间的差异，即使存在的差异并不大，且它们在2组的分布基本接近，但为了获得双稳健的处理效应估计，笔者利用倾向评分加权结合线性回归调节的方法对估计处理效应再进行估计，结果表明，在ALT指标的分析中，协变量调节后得到的处理效应减小到0.008，却不具有统计显著性（P=0.273），且患者年龄、入院病情、住院总费用以及个别合并用药等依然可能是影响ALT指标异常变化的因素。一般如果存在很强的处理效应，其估计的结果应该是一致的，本研究对ALT指标的分析的不一致性说明“用疏血通”的处理效应并不是很强。因此，笔者保守认为在使用了疏血通注射液的患者中“用疏血通”的处理相对于“未用疏血通”的对照对肝功能指标异常变化的影响不显著。

本研究是基于北京市18家大型三甲医院HIS数据库中的部分数据得出的结论，未纳入其他地区和其他等级医疗机构的数据，具有一定的局限性，仅能作为参考，需要通过对更多临床医疗机构数据收集做更进一步的分析。

[参考文献]

[1] 魏定基. 鱼腥草注射液静脉给药不良反应分析[J]. 临床合理用药杂志， 2010， 3（4）： 60.

[2] 陈裕盛，韩启光.再论天然药物的肾毒性及诊治[J]，中国中西医结合肾病杂志， 2003， 4（4）：236.

[3] 郭新峰，温泽淮，谢雁鸣，等. 疏血通注射液临床安全性的系统分析[J]. 中国中医杂志， 2012， 37（17）：2782.

[4] 李百强，鲁仲平，方洪壮，等. 疏血通注射液大样本临床使用安全性分析[J]. 中国药物警戒， 2011， 8（10）：592.

[5] 庄严，谢邦铁，翁盛鑫，等. 中药上市后再评价HIS“真实世界”集成数据仓库的构建与实现[J]. 中国中药杂志， 2011， 36（20）：2883.

[6] 杨薇，谢雁鸣，庄严. 基于HIS“真实世界”数据仓库探索上市后中成药安全性评价方法[J]. 中国中药杂志， 2011， 36（20）：2779.

[7] Rosenbaum P R， Rubin D B. The central role of the propensity score in observational studies for causal effects[J]. Biometrika， 1983， 70（1）： 41.

[8] Hirano K， Imbens G. Estimation of causal effects using propensity score weighting： an application to data on right heart catheterization[J]. Health Services Outcomes Res Methodol， 2001，70（2）： 259.

[9] Wooldridge J. Econometric analysis of cross section and panel data[M]. Cambridge： MIT Press， 2001.

[10] McCaffrey D F， Ridgeway G， Morral A R. Propensity score estimation with boosted regression for evaluating causal effects in observational studies[J].Psychol Methods， 2004， 9（4）： 403.

[11] Alex ZFu. 倾向得分法综述[J]. 中国药物经济学， 2008， 15（2）： 259.

[12] Shadish W R， Cook T D， Campbell D T. Experimental and quasi-experimental designs for generalized causal inference[M]. Boston： Houghton-Mifflin， 2002.

[13] Harder V S， Stuart E A， Anthony J. Propensity score techniques and the assessment of measured covariate balance to test causal associationsin psychological research[J]. Psychol Methods， 2010， 15（3）： 234.

[14] Stuart E A. Matching methods for causal inference： a review and a look forward[J]. Stat Sci， 2010， 25（1）： 1.

[15] Friedman J H， Hastie T， Tibshirani R. Additive logistic regression： a statistical view of Boosting[J]. Annals Stat， 2000， 28： 337.

[16] GRidgeway D， McCaffrey A， Morral. Toolkit for weighting and analysis of nonequivalent groups： a tutorial for the twang package. package manual[EB/OL]. 2010-01.http： ///src/contrib/Archive/twang.

[17] Friedman J H. Greedy function approximation： A gradient Boosting machine[J]. Annals Stat， 2001， 29： 1189.

[18] Huppler-Hullsiek K， Louis T A. Propensity score modeling strategies for the causal analysis of observational data[J]. Biostatistics， 2002， 2： 1.

[19] Rosenbaum P. Observational studies [M] .2nd. New York： Springer-Verlag， 2002.

[20] Bang H， J Robins. Doubly robust estimation in missing data and causal inference models[J]. Biometrics， 2005， 61：692.

Impact analysis of Shuxuetong injection on abnormal changes of

ALT based on generalized boosted models propensity score weighting

YANG Wei1， YI Dan-hui2， XIE Yan-ming1*， YANG Wei1， DAI Yi2， ZHI Ying-jie1， ZHUANG Yan3， YANG Hu2

（1.Institute of Basic Research in Clinical Medicine， China Academy of Chinese Medical Sciences， Beijing 100700， China；

2. Statistical Institute of Renmin University， Beijing 100872， China； 3.The PLA Navy General Hospital， Beijing 100048， China）

[Abstract] Objective： To estimate treatment effects of Shuxuetong injection on abnormal changes on ALT index， that is， to explore whether the Shuxuetong injection harms liver function in clinical settings and to provide clinical guidance for its safe application. Method： Clinical information of traditional Chinese medicine（TCM） injections is gathered from hospital information system （HIS） of eighteen general hospitals. This is a retrospective cohort study， using abnormal changes in ALT index as an outcome. A large number of confounding biases are taken into account through the generalized boosted models （GBM） and multiple logistic regression model （MLRM） to estimate the treatment effects of Shuxuetong injections on abnormal changes in ALT index and to explore possible influencing factors. Result： The advantages and process of application of GBM has been demonstrated with examples which eliminate the biases from most confounding variables between groups. This serves to modify the estimation of treatment effects of Shuxuetong injection on ALT index making the results more reliable. Conclusion： Based on large scale clinical observational data from HIS database， significant effects of Shuxuetong injection on abnormal changes in ALT have not been found.

[Key words] Shuxuetong injection； hospital information system safety surveillance； weighted propensity score； ALT； real world clinical research

doi：10.4268/cjcmm20131824

基于GBM倾向评分法对疏血通注射液导致谷丙转氨酶异常变化的影响分析

文档上传者

热门推荐更多>

精品范文更多>

基于GBM倾向评分法对疏血通注射液导致谷丙转氨酶异常变化的影响分析

文档上传者

热门推荐 更多>

精品范文更多>

热门推荐更多>