SPSS广义线性模型



具体答疑展示请点击查看:论文统计指导服务,真免费,永久免费,超靠谱,快来加入吧
概述:
    广义线性模型(generalized linear model, GLM)扩展了线性模型的应用范围,其放松了对因变量的分布限制,将因变量的分布范围从正态分布扩展到二项分布、Poisson分布、负二项分布等指数分布,且通过连接函数,将因变量的取值变换到自变量线性预测的取值范围中,把指数分布族的变量统一到一个模型的框架中,因此具有较大灵活性。
GLM的一般形式为:
g(μi)=β0+β1xi1+⋯+βpxip
其中,g是联接函数,μi是第i个观测值对应的因变量的均值,β0, β1, ..., βp是待估计的参数,xi1,...xip是第i个观测值的自变量。
广义线性模型GLM需要满足一些特定假设:
    线性:GLM要求自变量与响应变量之间存在线性关系。
    独立性:GLM假设观测之间是相互独立的,即某个观测值的取值不受其他观测值的影响。
    分布:GLM允许对于因变量服从多种分布,包括连续型(如正态分布)、计数型(如泊松分布)、二项型(如二项分布)和其他分布。
    连接函数的选择:GLM需要选择适当的连接函数来将线性部分与因变量结合起来。连接函数的选择取决于因变量的性质和研究问题的要求。
下面介绍常见的广义线性模型的类型:
    线性回归模型:用于建模连续型数据,因变量符合正态分布,适用于描述正态分布的连续变量。
    Logistic/Probit回归模型:用于建模二分类问题,因变量符合二项分布,使用Logit或Probit连接函数。
    Poisson回归模型:用于建模计数型数据,因变量符合泊松分布,适用于描述计数事件发生的频率。
    负二项回归模型:用于建模计数型数据,因变量符合负二项分布,适用于描述在一定时间内发生的不规则事件的次数。
    Gamma回归模型:用于建模正偏态连续型数据,因变量符合伽马分布,适用于描述正偏的连续变量,如收入、保费等。
    GLM使用的分布不再仅是正态分布,因此GLM的参数估计使用加权最小二乘法(WLS)或使用最大似然法(MLE)对进行参数估计。GLM当中参数的假设检验通常用似然比检验(Likelihood Ratio Test,LRT)、Wald检验和Score检验。对于模型的比较通常使用似然比检验。
案例实操:
研究不同催化剂在不同温度下对某化合物转化率的影响,得到如下结果:

案例分析及统计策略分析
    本案例研究不同催化剂在不同温度下对某化合物转化率的影响,其中因素B(温度)嵌套在因素A(催化剂)中,因此模型有嵌套因素,可以用广义线性模型中的对话框直接拟合该模型。
SPSS实际操作(源数据sav,可在公众号扣1获取)
1、分析-广义线性模型-广义线性模型

2、在“响应”选项卡中,将“转化率”选入“因变量”框中。

3、在“预测变量”选项卡中,将“催化剂、温度、批次”选入“因子”框中。
 
4、在“模型”选项卡中,将“催化剂”选入右侧的“模型”框中,将“温度”选入下方的“构建嵌套项”框中,单击“内部(W)”。

5、然后将“催化剂”选入下方的“构建嵌套项”框中,单击“添加到模型”按钮,将生产的“温度(催化剂)”添加到“模型”框中。

 
6、将“批次”选入右侧的“模型”框中。最后单击“确定”。

分析结果描述
表1、Omnibus检验,即与不包括任何一个自变量的模型相比,当前模型是否对数据解释得更充分,两模型之间是否存在统计学差异,结果可见P值远小于0.05,因此当前模型比无效模型更有价值。

Omnibus 检验a

似然比卡方

自由度

显著性

70.094

9

<.001

因变量:转化率

模型:(截距), 催化剂, 温度(催化剂), 批次

 

a. 将拟合模型与截距模型相比较。


表2、模型效应检验提示催化剂和温度均有统计学意义,而批次无统计学意义。

模型效应检验

III 类

瓦尔德卡方

自由度

显著性

(截距)

36699.612

1

<.001

催化剂

718.531

2

<.001

温度(催化剂)

147.306

6

<.001

批次

.184

1

.668

因变量:转化率

模型:(截距), 催化剂, 温度(催化剂), 批次

 


总结及拓展衍生
   广义线性模型包含多种回归模型,后面章节将分别介绍几种常用的广义线性模型回归分析模型,包括Poisson回归分析、负二项回归分析等。


到顶部