专栏名称: 生活统计学
平台致力于将统计学基础与生活实例联系起来,带大家走进生活统计学的世界。介绍统计软件SPSS/SAS/Minitab的生活统计运用技巧。
目录
相关文章推荐
笔吧评测室  ·  神舟战神 T12 Pro ... ·  9 小时前  
东四十条资本  ·  雷军看好的两兄弟,要IPO了 ·  9 小时前  
IPO早知道  ·  IPO周报 | ... ·  昨天  
51好读  ›  专栏  ›  生活统计学

数据分析方法:路径分析入门;数据分析需要剥丝抽茧的耐心!

生活统计学  · 公众号  ·  · 2017-05-18 18:00

正文

请到「今天看啥」查看全文



名词解释

在路径分析中,为了区分具有不同特点的变量,统计学家们分别给它们安上了能够反映它们特点的名字: 外生变量、内生变量和最终结果变量。外生变量指的是模型中那些只影响其它变量,而不受其它变量影响的变量。内生变量与外生变量正好相反,指的是在模型中既能影响其它变量又会受到其它变量影响的变量。如果内生变量只受其它变量影响,而完全不受其它变量影响,这样的内生变量称为最终结果变量,在上面的例子中,住院费用就是一个最终结果变量,最终结果变量往往是研究的真正目的,而其余内生变量的出现是为更加深入和细致的对最终结果变量进行研究。


递归模型和非递归模型

路径分析中任意两个变量A和B之间可能存在的关系包括以下4种方式:

  • A可能对B有影响,但B不会影响A。(A→B)

  • B可能对A有影响,但A不会影响B。(A←B)

  • A与B之间存在着双向的影响关系。(A←→B)

  • AB之间的具体影响方式不明,但是存在相关。

显然,如果模型中只存在前两种相关方式,则整个路径分析模型全部为单向链条关系,不会出现循环嵌套的路径,从而可以被写成若干个标准的多重线性回归方程所构成的方程组,这种模型就被称为递归模型;如果模型中存在后两种关系,那么模型被称为非递归模型。上面列举的关于住院费用的例子就是典型的递归模型,所有的变量间联系均为单向,不存在循环、自反馈、双向联系等复杂情况。


路径分析的基本步骤

作为一个比较复杂的模型,路径分析的建模工作往往不会一蹦而就,而应当是一个循序渐进的过程。

  • 模型设定。研究者应该根据前期研究的结果和专业背景知识来设定初始的理论模型,该模型应当包括各种可能的路径,可以通过路径图的形式将模型中的各种关系描述清楚,以便帮助研究者较好地理清各种关系。

  • 模型识别与模型估计。该步骤应当尝试对模型中的参数加以估计,如果模型设定有误,则可能会导致整个模型无法被估计,此时应当对模型加以修正,直至得到初步的估计值。

  • 模型评价。评价各路径的关联是否具有统计学意义,并且是否能够很好的与专业知识相吻合。如果无统计学意义,则可以考虑将该路径删除;如果拟合结果不符合专业知识,则需要考虑是否整个模型框架存在较大问题。

  • 模型修正。根据模型评价的结果对模型进行简化和改进,最终得到一个既符合专业知识,又与数据的特征相吻合,并非常简洁的路径分析模型。显然,一个最终的模型时需要经过多次尝试和修正才能够得到的。


路径分析的检验方法

如果路径分析模型中各系数都有统计学意义,那么问题会简单的多,这也许就是最终的结果了,但是当模型中存在无统计学意义的系数,需要对模型进行简化,那么该如何评价简化后模型的效果呢?在路径分析中,一个内生变量对应了一个回归方程,每个回归方程都会有一个决定系数R2,它表示相应内生变量的方差中能够被该方程所解释的比例,(1–R2)就表示剩余的方程无法解释的部分。对于包括多个内生变量的路径分析模型,它的决定系数是一个综合性的指标,计算公式如下:







请到「今天看啥」查看全文