psm倾向得分匹配法
了解倾向得分匹配法(PSM)如同揭开一扇深入数据世界的窗户。这种方法,英文称之为Propensity Score Matching,简称PSM,是一种利用非实验或观测数据来进行干预效应分析的统计技术。其理论基础建立在“反事实推断模型”之上,主要用于处理观察性研究的数据。
反事实推断模型的核心思想是,任何因果分析的研究对象都会存在两种条件下的结果:我们观测到的和未观测到的。为了这隐秘的因果关系,倾向得分匹配法应运而生。
那么,PSM的具体步骤是怎样的呢?
关键的一步是计算倾向值。这一步通常通过Logistic回归来完成,挖掘数据中潜在的联系和规律。
紧接着,进行得分匹配。这一步包括三种主要方法:
1. 最邻近匹配(NNM):以倾向得分为依据,在控制组样本中寻找与干预组样本得分最接近的对象,形成配对。
2. 半径匹配:设定一个常数r,通常在倾向得分标准差的四分之一以内,寻找实验组和控制组得分值差异在r内的进行配对。
3. 核匹配:将干预组样本与由控制组所有样本计算出的一个估计效果进行配对。这个估计效果是通过对实验组个体得分值和控制组所有样本的得分值进行加权平均得到的,而权数则由核函数计算得出。
完成匹配后,我们需要评估匹配后的平衡性,确保数据的可比性和分析的准确性。随后,计算平均干预效果(ATT),即处理效应的平均值,这是评估干预成功与否的关键指标。
进行敏感性分析,以检验结果的稳定性和可靠性。
至此,我们已经大致了解了倾向得分匹配法的工作流程。希望这些信息能够帮助大家更深入地理解并应用这一统计方法。数据的世界深邃而广阔,PSM为我们提供了一把其中的钥匙。
以上就是本次的分享,希望对大家有所助益。