Think Outside the Box

自分のメモのために。

質的データに対する線形モデル

質的データに対する線形モデルとは?

  • プロビットモデル
  • ロジットモデル(ロジスティックモデル)

定式化

 y_i \in {0,1}を説明変数  \bf{x}_i \in {R}^kで表すとき、線形モデルを考えると、

 \hat{y_i} = \beta_0 + \beta_1 \bf{x}_i + \epsilon_i

として表すことができる。 回帰モデルによる予測値\hat{y_i}は連続的な値となり、

  •  \hat{y_i} >0の場合、 y_i = 1

  •  \hat{y_i} \leq 0 の場合、 y_i = 0

として、 y_iの値を推定する。

プロビットモデルとロジットモデルの違いは?

 P(y_i = 1 | \bf{x}_i の形としてどの分布を採用するかが異なる

  • プロビットモデル 標準正規分布を採用

  • ロジットモデル ロジスティック分布を採用

両方の分布は、原点に対して対称性のある分布である。 ほとんど似たような分布の形をしているので、好みの問題かも...

ロジスティック回帰の回帰係数の検定は?

単回帰や重回帰の時と同じ。

多重共線性の対策方法

参考

自然科学の統計学