logistic回归分析中多分类变量的类间比较方法

作者:白雪 | 创建时间: 2023-05-05
回归分析中,常常遇到自变量是多分类变量,该如何处理呢?①样本量少时,看做离散型定量变量;②样本量大时,设置哑变量,多分类变量有g个水平,则使用(g-1)个二分类变量表示该多分类变量。本正是要讲明logistic回归中设置哑变量后不同类间的多...
logistic回归分析中多分类变量的类间比较方法

操作方法

indicator-last:最后一个类别为参照类,其余每一类与参照类比较; 参数编码下的(1)(2)(3)(4)表示4个哑变量,(1)表示器官衰竭数为0的水平与参照类(最后一个水平4-)比较,其余类推,这里1-0=1(为何是这样呢,因为我们可以计算OR=EXP[βj(C1-C0)])

indicator-first:第一个类别为参照类,其余每一类与参照类比较; 参数编码下的(1)(2)(3)(4)表示4个哑变量,(1)表示器官衰竭数为1的水平与参照类(第一个水平0)比较,其余类推,这里1-0=1(为何是这样呢,因为我们可以计算OR=EXP[βj(C1-C0)])

simple-last:最后一个类别除外,每一类与其余各类的平均效应比较; 参数编码下的(1)(2)(3)(4)表示4个哑变量,(1)表示器官衰竭数为0的水平与水平"1"、"2"、"3"的平均效应比较,其余类推,这里0.8-(0.2*3/3)=1(为何是这样呢,因为我们可以计算OR=EXP[βj(C1-C0)])

simple-first:第一个类别除外,每一类与其余各类的平均效应比较; 参数编码下的(1)(2)(3)(4)表示4个哑变量,(1)表示器官衰竭数为1的水平与水平"2"、"3"、"4-"的平均效应比较,其余类推,这里0.8-(0.2*3/3)=1(为何是这样呢,因为我们可以计算OR=EXP[βj(C1-C0)])

difference:除第一类外,每一类与其前各类的平均效应比较; 参数编码下的(1)(2)(3)(4)表示4个哑变量,(2)表示器官衰竭数为2的水平与水平"0"、"1"的平均效应比较,其余类推,这里0.667-(-0.333*2/2)=1(为何是这样呢,因为我们可以计算OR=EXP[βj(C1-C0)])

helmert:除最后一类外,每一类与其后各类的平均效应比较; 参数编码下的(1)(2)(3)(4)表示4个哑变量,(2)表示器官衰竭数为1的水平与水平"2"、"3"、"4-"的平均效应比较,其余类推,这里0.75-(-0.25*3/3)=1(为何是这样呢,因为我们可以计算OR=EXP[βj(C1-C0)])

温馨提示

参照水平最好要有实际意义,不推荐使用"其他"作为参照;
参照水平组要有一定的频数作保证,应不少于30或50例。
点击展开全文

更多推荐