经济学论文：倾向值分析对药物经济学评价的应用

来源：长理培训发布时间：2017-09-25 13:52:36

传统的药物经济学评价多是基于随机对照试验（RCTs）来获得干预的效果和成本数据。RCTs的设计原则保证了不同组间可观测的和不可观测的影响因素在基线时的可比性。因此，能够保证获得对干预效果的无偏估计。但在很多情况下，RCTs是无法实施的，或不能反映真实的治疗效果和成本，而基于真实世界研究的药物经济学评价越来越多。在真实世界研究的观察性数据中，经常面临着患者基线不可比的情况，其产出结果往往受到各种混杂因素和偏倚的影响，因而无法得到对干预效果的无偏估计。为了消除混杂因素的影响，传统上会采用多变量配对、多因素回归和分层分析等方法。但是，这些方法都有其各自的局限性。如当需要匹配的变量很多时，多变量配对通常是不可行的；当混杂因素很多或有多个亚组时，分层分析也是不可行的；多因素回归则要求不同组间的协变量具有一致的分布。因此，当可以获得患者的个人数据时，通过特定的统计学方法，如回归、匹配和工具变量等都可以对混杂因素导致的选择偏倚进行纠正。在使用这些方法时要注意其相应的假设条件，回归和匹配的方法需要不存在不可观测的混杂因素的假定，匹配还需要假定通过匹配后各组间的基线特征能够得以平衡。倾向值分析是分析观察性数据常用的一类方法，目前也越来越多地用于采用观察性数据开展的药物经济学评价。

1倾向值分析简介

在评价干预效应时，很多情况下要利用观察性数据而不是随机试验得到的数据。在观察性数据的分析中，总是希望能够重建被打破的随机试验的分配原则。倾向值（propensityscore）是在控制其他混杂因素的条件下个体接受干预的概率，对其在干预组和控制组间进行控制或匹配以估计干预效果，可以用来控制大量的混杂因素变量。Rosenbaum和Rubin在1983年发表了一篇关于倾向值原理和分析方法的文章[1]，之后倾向值分析开始用于劳动经济学和发展经济学，用来分析通过非随机试验方法取得的数据，近年来越来越多的用于医学研究和药物经济学评价中。在观察性数据中，观察个体是被分配到试验组还是控制组并不是随机的，因而对处理效应的估计会因为混杂因素的存在而产生偏倚。倾向值分析就是用于纠正这一偏倚的方法。通过控制存在的混杂因素，使得试验组和控制组中的个体在各个维度上尽可能相似，因而减少混杂因素对干预效果估计产生的影响。传统的配对方法是根据关键变量对个体进行匹配，对观测个体在n维变量上进行匹配时，如果n很大，其难度是可想而知的。倾向得分法是将n维变量的信息综合为一个处理前的单一变量（倾向得分值），从而使匹配更加可行。倾向值分析一般分为两步，首先是计算一个倾向值得分，然后是根据这一得分进行匹配（Matching）或分析。对于未采取随机分组试验方法得到的数据，倾向值分析提供了一种近似实验的方法，产生尽可能随机分组的效果，以控制观测变量。如果有两阶段及以上的数据，还可与双重差分法（differenceindifferences,DID）合用，控制不随时间变化的不可观测变量。

2倾向值分析

用于药物经济学评价的相关研究通过对相关文献进行综述发现，倾向值分析已广泛应用于基于观察性数据的药物经济学研究中。这些研究所关注的结果变量有的只考察成本或效果，或分开检验混杂因素对成本和效果的影响。如Manca等[2]应用倾向值分析对不同手术方案的成本和效果进行研究，通过加拿大安大略湖省的心肌梗死数据库（OMID），对经皮腔内冠状动脉成形术（PTCA）和冠状动脉旁路移植手术（CABG）对因急性心肌梗死（AMI）入院患者的成本和效果进行评价。该研究中用到的混杂因素包括患者年龄、性别、心源性休克、急性和慢性肾衰竭、有并发症的糖尿病、充血性心力衰竭、脑血管疾病、恶性肿瘤、肺水肿、心律失常、Charlson合并症指数和家庭中位收入。对两组基线协变量的比较发现，大多数协变量存在显著性差异，即两组患者的基线信息不平衡。比较的效果是接受治疗后1年内的生存率，成本是所有疾病相关的医疗成本，研究分别对成本和效果未经过调整的结果、多元回归结果、基于倾向值匹配的结果和基于倾向值分层的结果进行了比较。也有研究将倾向值分析与其他控制混杂因素的方法进行比较。如Stukel等[3]对使用倾向值与工具变量方法的分析结果进行了比较。该研究对加拿大1994-1995年全国65～84岁因AMI入院的老年患者是否实施心脏导管介入术对长期（7年）死亡率的影响。对基线信息分析发现，实施心脏导管介入术的患者比未实施的患者更加年轻，并且AMI严重程度更低。研究分别使用多元回归、加入倾向值的回归、倾向值匹配和工具变量的方法进行分析，得到的结论是多元回归的结果与其他方法的结果相差较大，加入倾向值的回归和倾向值匹配所得结果相近，使用工具变量得到的结果最接近于RCTs的结果。在该研究中，使用的工具变量是各地区心脏导管介入手术的比例，在其他研究中也有使用地区工具变量的例子，如对AMI患者进行强化治疗是否降低死亡率的研究[4-5]。但是，使用工具变量的分析方法通常更适用于对某项政策实施效果的评价，用于分析特定临床干预时一般并不容易找到合适的工具变量。随着成本-效果比的统计学评估方法越来越多地应用于药物经济学研究中，其中净收益的方法[6]将成本-效果比转化为线性形式，从而提供了可以在回归模型中估计成本-效果置信区间的统计学假设检验方法。Mitra等[7]将净效益模型与倾向值分析相结合，提出了对通过观察性数据对医疗干预措施进行成本-效果分析的方法。净效益模型将成本-效果比转化为线性模型，在该线性框架内应用倾向值分析可以对基线不平衡的各组间混杂因素进行控制，从而得到干预无偏的估计，但是使用净效益模型的一个困难是如何确定对λ的取值（也就是每单位效果所对应的意愿支付最大值）。该研究就肌层浸润性膀胱癌是否行膀胱切除术的成本-效果进行了分析，将延长的生命时间转化为货币单位构建净效益指标，将倾向值对净效益进行调整，计算λ取不同值时膀胱切除术为患者带来的净收益，并将该结果与未经调整的及普通多元回归调整的结果进行比较。研究发现，倾向值调整的结果与普通多元回归调整的结果相近，但远小于未经调整的结果。

3倾向值分析用于药物经济学评价的步骤

3.1发现可能的混杂因素并估计倾向值

倾向值分析的第一步是找出既影响干预分组又影响结果的混杂因素，将混杂因素作为协变量估计倾向值。在估计倾向值之前，需要选取合适混杂因素的协变量。一般协变量是根据已有经验或理论依据来选取的。通过双变量检验，与干预分组变量和结果变量都相关的协变量均应包含在估计倾向值的模型中；与结果变量相关的协变量也应包含在估计倾向值的模型中（不管其与分组变量是否相关），这样有助于降低估计结果的方差；而只与干预分组相关，但与结果变量无关的协变量不应包含在估计倾向值的模型中[8]。得到倾向值后，需要对匹配后的数据进行协变量平衡的检验（以干预作为分组进行双变量检验），如果匹配后双变量检验差异无统计学意义，则可得出成功消除观测协变量组间差异的结论；如果协变量仍不平衡则需要对回归模型进行重构或调整，常见的调整方法有加入协变量的高阶项或交叉项，调整后再次运行倾向值模型以检验匹配的平衡效果；也可通过逐步回归的方法，在确定的统计学显著水平下决定纳入或排除协变量。

3.2根据倾向值进行分析

得到倾向值后，可以利用倾向值作匹配或直接使用倾向值作分析。根据倾向值进行匹配是将倾向值尽可能相似的干预组成员和控制组成员进行匹配，根据匹配方法的不同，分为贪婪匹配、采用或不采用倾向值的马氏距离匹配以及最佳匹配；对于匹配后构成的匹配样本可以进行特定类型的分析，包括基于匹配样本的分层分析、多元分析及非参数统计分析。另外，得到倾向值后还可以直接利用倾向值作分析，如将倾向值作为权重直接做多元分析，或者是基于内核的加权均值差进行分析。3.2.1使用倾向值进行匹配得到估计的倾向值后可以根据倾向值进行匹配，根据匹配算法的不同，主要分为贪婪匹配和最佳匹配两种。使用倾向值做匹配时必须满足共同支撑架设：两组在整体上要有相似的特征；两组倾向得分的重叠区域成为共同支撑区域（commonsupportregion），其大小直接影响到匹配的效果。极端情况下，如果两组没有共同支撑区域，说明两组不具有可比性，在这种情况下，倾向得分匹配的方法就不适用。共同支撑区域越大，匹配方法的选择对结果就不敏感，而共同支撑区域越小，采用不同的匹配方法所得到的结果差异就比较大[9]。贪婪匹配是最常用的一种匹配算法，所谓"贪婪"是指这一类匹配都有一个共同特征，每一次匹配的决策都是对当前需要匹配个体而言最优的匹配决策，而不考虑总体的匹配效率。因此，这一类匹配通常采用无放回的匹配，每一对最相近的干预组成员和控制组成员在匹配成功后被移出数据池，其他成员继续重复匹配过程。贪婪匹配的代表有最近邻匹配（nearestneighbormatching）、卡钳匹配（calipermatching）、卡钳内的最近邻匹配（nearestavailableneighbormatchingwithinacaliper）以及马氏距离匹配（mahalanobismetricdistancematching）。最佳匹配的匹配思想是使得倾向值总体样本距离最小，要达到的目的是使得匹配的效率达到最高。最佳匹配从总体角度出发，匹配完成后每一个干预组成员与一个或多个控制组成员匹配，按照权重计算得到干预组与控制组倾向值的绝对值，最佳匹配使得这些绝对值之和最小。3.2.2匹配后进行分析匹配后首先需要对协变量的平衡情况进行检查。有研究[10]对1995-2003年采用倾向值匹配方法进行分析的医学文献的研究质量进行了系统综述，发现在47篇文献中只有2篇文献正确报道了匹配前和匹配后不同组间基线变量的平衡情况，并正确衡量了不平衡的程度。协变量的平衡可通过均值上的绝对标准化差值来衡量。进行贪婪匹配后可进行多元分析和分层分析。可以在匹配后的样本中能够多元回归分析，以表明干预条件二分类变量的回归系数作为干预效果的估计；进行贪婪匹配后，需根据倾向值进行分层，比较层内干预组和控制组的结果，再根据各层的结果均值差和差值的方差估计整个样本的均值差，并能检验其是否统计显著；进行最佳匹配后可以通过Hodges-Lehmann有序秩检验对结果进行分析，也可通过特殊的回归调整来估计[11]。3.2.3不匹配的使用倾向值加权以上方法是得到倾向值后进行匹配再分析；还可在不匹配的情况下使用倾向值，将倾向值作为抽样权重进行多元分析。倾向值加权的目的在于对干预组和控制组的成员分配权重，使其能够代表研究总体。可以对加权后的总体直接进行多元分析，也可用于非参数回归的倾向值分析，进行基于内核的匹配。

3.3对不可观测的混杂因素做敏感性分析

由于倾向值分析的只能对可观测的混杂因素进行控制和平衡，而对于不可观测的混杂因素的影响则无法识别，因此倾向值匹配通常需要通过敏感性分析（sensitivityanalysis）来检验是否会存在关键的不可观测的混杂因素对结果产生严重影响。敏感性分析通过假设存在一个或多个无法控制的不可观测的混杂因素的存在，假设无法控制的变量对结果影响在很大范围内的变动都无法改变所得结论，则认为此研究通过了敏感性检验，所得结论是稳健的。倾向值匹配的敏感性分析方法比较常用的是Rosen-baum界限[12]，该方法通过一个Г系数来表示不可观测混杂因素的可能取值，通过观察Г在一定水平变动时，结论不再显著来判断结论对不可观测混杂因素的敏感性。如果Г取值较小时结论就不显著，则所得结论的稳健性值得怀疑；如果Г取值较大时结论才开始变得不显著，则认为所得结论是站得住脚的。

4讨论

在对观察性数据进行分析时，倾向值分析是一类直观、实用的控制混杂因素的方法，已广泛应用于医学、社会学和经济学研究领域中，目前在药物经济学评价中的应用也越来越多。在开展基于观察性数据的药物经济学评价时，必须对各组间在基线时的可比性进行评价。对于基线不可比（即存在混杂因素影响）的情况下，需要采用合适的控制混杂因素方法。需要特别注意的是，倾向值分析只能尽量减少混杂因素产生的影响，并不能完全消除，其消除程度取决于可以被观测和控制的变量数量以及匹配的质量。此外，倾向值分析只能对可观测的混杂因素进行平衡和控制，并不能够控制不可观测的混杂因素，当有重要的混杂因素缺失或不可观测时，采用倾向值分析所得结果可能与真实值存在较大偏差，此时如果数据允许，应使用工具变量或面板数据模型等可以处理不可观测混杂因素的分析方法。

责编：杨盛昌

上一篇：经济学论文：计量经济学教学质量探讨

下一篇：经济学论文：教育经济学学科形成和发展探析

发表评论(共0条评论)