GERD症侯评价的诊断价值比较

时间:2022-09-02 04:02:31

GERD症侯评价的诊断价值比较

胃食管反流病( GERD) 诊断主要依靠症状、并 发症评估及反流证据检查[1]。反流性疾病问卷( RDQ) 是国内常用问卷之一。2006 年,蒙特利尔定义发表,与 RDQ 相比,其诊断标准相对放宽[1],不适症状包括食管及食管外症状均可,国内已有根据该定义诊断的相关研究[2 -3]。此外,我们注意到症状程度与频率对 GERD 的作用不仅仅是相加关系,例如发生频率低、但程度较重的患者,也可能 是GERD,是否其他评价方式对诊断具有更大价值,例如将频率及程度评分乘积后再作评价? 因此,本研究对比前述几种问卷评价方式,同时评价问卷诊断GERD 的价值。

1 资料与方法

1. 1 病例选择 选取 2007 年 3 月至 2010 年 12 月于北京大学人民医院消化科就诊、疑诊 GERD 后行RDQ 问卷、胃镜及动态食管 pH 监测的患者。排除标准: ( 1) 贲门失弛缓症、消化道梗阻或胃肠手术史; ( 2) 合并消化性溃疡、消化道肿瘤; ( 3) 持续服用质子泵抑制剂、H2受体拮抗剂、促胃肠动力药物;( 4) 理解、表达能力障碍; ( 6) 问卷不完整。共 961例患者至胃肠动力室检查并参与问卷调查,问卷完整 944 例,534 例行有效 pH 监测( 时间 >22 h) ,367例同时行胃镜检查,其中 67 例纳入排除标准。故300 例患者符合上述条件,女 162 例( 54% ) ,男 138例( 46%) ,男女比例 1∶ 1. 17; 年龄 24 ~ 83 岁,平均( 53. 2 ±12. 8) 岁。

1. 2 GERD 诊断“金标准” 患者接受 OlympusGIF-H260 型电子胃镜检查,镜下见反流性食管炎时,采用洛杉矶标准进行分级; 并同时进行食管24 hpH 监测( 瑞典 Medtronic Asia 公司生产) ,收集反流次数、长反流次数、酸暴露时间百分比、DeMeester 评分及反流面积指数等指标,DeMeester 评分大于12. 7 时认为存在病理性酸反流。反流性食管炎或病理性酸反流一项阳性即诊断 GERD[4]。本研究共诊断 GERD 165 例( 55%) 。

1. 3 症状问卷诊断 GERD 的不同方法 中文版RDQ 问卷调查过去 4 周内烧心、胸痛、反酸、反食的情况。频率计分: 无症状 0 分,症状出现频度 <1 d/周、1 d/周、2 ~3 d/周、4 ~5 d/周及 6 ~7 d/周分别计为 1、2、3、4、5 分。症状程度计分: 无症状 0 分; 症状不明显,在医生提醒下发现为 1 分; 症状明显,影响日常生活,偶尔服药为 3 分; 症状非常明显,影响日常生活,需长期服药治疗为 5 分。症状介于 1 分和 3 分之间为 2 分,介于 3 分和 5 分之间为 4 分。采取以下方式评价问卷: ( 1) RDQ 总分评价方式: 采用“症状频率计分加程度计分总分”诊断 GERD,问卷总分最高可达 40 分; ( 2) 蒙特利尔定义[1]为: 以烧心( RDQ 问卷中定义为胸骨后火辣辣烧灼感) 、反流[RDQ 问卷中定义为口中酸和( 或) 苦味或胃内容物向上涌动引起的不舒服感觉]为主要症状,1 周中2 ~ 3 d 有轻度症状( 程度评分≤2) 、或者 1 周至少有 1 d 有中 - 重度症状( 程度评分 >2) ,可高度提示GERD; ( 3) 各症状频率 × 程度积分之和评价问卷:以某个症状的“频率积分( EF) × 程度积分( ED) ”作为单个症状的症状评分,计算烧心、胸痛、反酸、反食症状的总分。1 个月内单个症状评分大于 0 认为该症状阳性。

1. 4 统计学分析 应用 SPSS 17. 0 统计软件对数据进行分析。制作工作者受试曲线( ROC 曲线) ,确定不同诊断方法的最佳临界点,计算敏感度、特异度、阳性预测值或阴性预测值。不同诊断方法之间采用 Kappa 检验比较结果的一致性。非正态分布数据以中位数( 最小值 - 最大值) 表示,并采用非参数检验进行比较。RDQ 总分与 pH 监测各指标的相关性采用 Spearman 等级相关分析。P < 0. 05 时差异有统计学意义。

2 结果

2. 1 症状定义 GERD 不同的问卷评价方式比较以“RDQ 总分”作为标准诊断 GERD 时,ROC 曲线下面积 0. 523,取 14 分为临界值时,Youden 指数最大。以“各症状频率 × 程度积分之和”作为标准,则ROC 曲线下面积 0. 525,取 22 分 为 临 界 值 时,Youden 指数最大。不同问卷评价方式诊断 GERD的特异度、敏感度、对 GERD、食管炎及病理性酸反流的阳性预测值、阴性预测值见表 1。3 种评价方法分别与“金标准”行 Kappa 一致性检验( 结果见表 1) ,一致性差,两两比较后差异亦无统计学意义( Kappa 值 0. 573 ~0. 73) 。

2. 2 RDQ≥12 分与食管黏膜损伤程度、酸反流指标关系分析 以 RDQ≥12 分作为阳性标准,可诊断GERD 167 例。问卷阳性的患者中 28. 7% 为 RE,问卷阴性时有 24. 1% 为 RE。RDQ 问卷( + / - ) 患者食管黏膜损伤程度差异无统计学意义( P =0. 479) 。RDQ 问卷( + ) 患者总反流次数( P = 0. 03) 、餐后反流次数( P = 0. 03) 、餐后长反流次数( P = 0. 047) 、pH < 4 总时间( P = 0. 037) 及立位时间( P = 0. 013)百分比、DeMeester 评分( P = 0. 043) 及反流面积指数( P =0. 023) 均较阴性患者增加。以“RDQ≥14 分”为阳性标准时,可诊断 GERD147 例,重复上述检验,结论相同。

2. 3 RDQ 总分与食管 pH 监测各指标的相关性分析 总反流次数、餐后反流次数、立位 pH < 4 时间百分比、反流面积指数与问卷总分呈正相关。

3 讨论

本研究对比 RDQ、蒙特利尔定义及“各症状频率 × 程度积分之和”三种不同评价方法的优劣,结果显示: “蒙特利尔定义”敏感度最高( 67. 4%) ,“各症状频率 × 程度积分之和”特异度最高( 61. 2%) ,而“RDQ 总分≥12 分”介于中间; 当取“RDQ 总分≥14 分”时,Youden 指数最大( 敏感度 52. 8% ,特异度55. 4% ) 。该结果与 2003 年的研究( 建议 RDQ12 分为临界值[5]) 差异较大,考虑与不同的病例入选标准有关。2003 年的研究只入选 RDQ 评分≥6 分的病例,而我们的调查,65 例问卷 0 ~5 分,占 21. 7%,其中38 例可诊断 GERD( 占 GERD 23. 0%) ,致诊断敏感度下降。前述提到的以“蒙特利尔定义”筛查GERD 的多个研究,均将“胸痛”定义为“烧心”的另一种表述,但胸痛与 GERD 的关系尚有待进一步确定,因此不建议将烧心与胸痛混淆,且即使只评价烧心、反流,蒙特利尔定义在敏感度方面仍具优势。但总的来说,3 种评价方式对 GERD 的预测价值基本一致,两两比较后差异无统计学意义。因 RDQ 问卷常用于患者自评,它对疾病的预测能力可影响患者诊疗行为。本研究采用“RDQ 总分≥12 分”进行初筛,比较问卷阳性或阴性时食管黏膜损伤、病理性酸反流的情况,发现 RDQ 问卷对食管炎的阳性预测值为 28. 7%,阴性预测值为75. 4% ,故问卷阴性时除外 RE 的意义较大,阳性预测率低。这与 GERD 本身包含 NERD 有关; 此外部分患者以非典型或食管外症状为主,若增加其他症状的评分,对诊断更有意义,曾有研究评估烧心、反流、吞咽困难、胸痛、夜间咳嗽、发声困难、哮喘等症状并制定相应评分系统,发现其对食管炎的阳性及阴性预测值为 77. 7%、67. 6%[6]。本研究还发现问卷阳性时,总反流及餐后反流次数、餐后长反流次数、pH <4 总时间及立位时间、DeMeester 评分及反流面积指数均较阴性者增加,总分也与总反流及餐后反流次数、立位 pH <4 时间及反流面积指数正相关。由此可见,虽然问卷对根据DeMeester 评分诊断的酸反流预测一般,但与酸反流相关指标密切相关,问卷评分较高,而 DeMeester 评分 <12. 7 时,需注意各指标的变化; 立位反流症状明显,可能与日间非睡眠状态时更能感受到症状有关。

上一篇:都市农业规模效果分析 下一篇:低碳工业区环境绩效研讨