モデルの評価基準について
残差平方和
- 残差平方和は高次な式ほど小さい値になりやすい
Mellowsの基準
詳細はこの資料
http://www.orsj.or.jp/~archive/pdf/bul/Vol.23_05_280.pdf
にありそう。だけど結構むずい。。
情報量基準
構築したモデルの予測値を確率分布で表して、 真の確率分布との距離をカルバック・ライブラー情報量と呼ばれる基準を用いて測る
この距離自体は、「モデルの当てはまりの良さ」のみを評価するのではなく、 「このモデルを将来のデータの予測に利用しても大丈夫かどうか」という観点で見ている
カルバック・ライブラー情報量
最尤法によって推定された確率分布モデルが、データを発生した真の確率分布にどれだけ近いかを測ることを考える。 データを発生された真の分布を近似するために、想定した確率分布を
とする。(は線形回帰でいうと回帰係数などのパラメータとなる。このパラメータは最尤法によって推定する)
”真の確率分布"が”想定した確率分布モデル”に含まれるということは、 あるが存在していて、と表すことができる状態。
今後このモデルを利用していって大丈夫なのかを判断するため、 真のモデルからランダムに取ってきたデータ集合 の従う分布を、構築した統計モデルで 予測した時の平均的な良し悪しを測る。
→このとの分布の距離を測るのが「カルバック・ライブラー情報量」となる
とかける。
- 左の項:
ここのモデルには依存せず、一定の値をとるので、無視してOK
- 右の項:
これは、未知の真の確率分布に依存するため、この値を計算できない。
したがって、この式をどうやって推定するのかという話に帰着する。
AIC
は、に依存していて未知なる値だが、観測したデータから推定することはできる。 等確率にデータが取れると仮定して
で推定する。この結果、平均対数尤度の推定量として、
をえる。
ただし、これらの推定値は標本分布に従っていて、真の分布ではない。また全く同じ値が取り出されていることもあることによるバイアスなども考慮しないといけない。
最終的には、
情報量基準 = -2 * (統計モデルの対数尤度 - バイアス補正項 ) = [tex: -2 \log{f(y|\hat{\theta})}] + 2(バイアス補正項)
という式で表せるらしい。 (この式に持って行くまでがよくわからない...)