Think Outside the Box

自分のメモのために。

A Unified Approach toInterpreting Model Predictions

「A Unified Approach toInterpreting Model Predictions」を読んだ内容をまとめる。 概要 ●どういう内容? 「モデルAとモデルBの精度を比較した時、モデルAの方がモデルBよりもAccuracyが高いが、何故なのかわからない」といったことはよくある →それを解決…

主成分分析について振り返る

主成分分析とは 多次元データに内在する情報 = 分散と考えて、情報を出来るだけ失うことなく 新たな変数を定義していく方法 合成された変数を通してデータの中から有益な情報を読み取るための有効な分析手法 分散最大化のイメージ 2次元データに対して主成…

モデルの評価基準について

残差平方和 残差平方和は高次な式ほど小さい値になりやすい Mellowsの基準 詳細はこの資料 http://www.orsj.or.jp/~archive/pdf/bul/Vol.23_05_280.pdf にありそう。だけど結構むずい。。 情報量基準 構築したモデルの予測値を確率分布で表して、 真の確率分…

質的データに対する線形モデル

質的データに対する線形モデルとは? プロビットモデル ロジットモデル(ロジスティックモデル) 定式化 を説明変数 で表すとき、線形モデルを考えると、 として表すことができる。 回帰モデルによる予測値\hat{y_i}は連続的な値となり、 の場合、 の場合、 と…

重回帰モデルについて考える

重回帰のモデルは、行列で表すと、 この時、が元の値を最も近似できるようなを推定する。 単回帰モデルと重回帰モデルの違い 他の説明変数の影響を調整した上で、目的変数と説明変数の関連を見ることができるのが重回帰分析。 引用:https://www.niph.go.jp/…

単回帰モデルについて考える

単回帰モデルについて 説明変数X と目的変数yに対して、以下のような線型モデルを考える。 最も目的変数とが近似できるような回帰係数を求める。は定数項で切片と呼ばれる。 回帰係数の求め方 回帰係数を求めるためには、最小二乗法を利用する。 なお、誤差…

確率の基礎をもう一度

確率変数とは? ある事象を表す値が確率pにしたがって出現する時、その値を確率変数という。 (例)サイコロの目や宝くじの当選金額など 確率変数には離散か連続か、値のタイプに応じて2タイプ存在する。 * 離散型 * 連続型 確率分布とは? 確率変数がどんな…

相関係数を考える

統計学入門を少しずつ復習しながら、データを正しく扱えるように勉強していく. 自分用めも。 ピアソンの積率相関係数 概要 相関と言われればこれのことが多い。 xとyの相関係数は、 で表せる。 分子の式/nをすると、共分散を表すことになる。 定義より、分母…