質的データに対する線形モデル
質的データに対する線形モデルとは?
- プロビットモデル
- ロジットモデル(ロジスティックモデル)
定式化
を説明変数 で表すとき、線形モデルを考えると、
として表すことができる。 回帰モデルによる予測値\hat{y_i}は連続的な値となり、
の場合、
の場合、
として、の値を推定する。
プロビットモデルとロジットモデルの違いは?
の形としてどの分布を採用するかが異なる
プロビットモデル 標準正規分布を採用
ロジットモデル ロジスティック分布を採用
両方の分布は、原点に対して対称性のある分布である。 ほとんど似たような分布の形をしているので、好みの問題かも...
ロジスティック回帰の回帰係数の検定は?
単回帰や重回帰の時と同じ。
多重共線性の対策方法
相関行列から、相関しているところがないかチェック
stepwise法を使う 参考:ロジスティック回帰と変数選択
決定木の変数重要度が高い変数を取り出して、ロジスティック回帰に適用する方法もありそう。。 参考:http://www.fun.ac.jp/~niimi/ronbun/100118.pdf