ゲノムワイド関連研究の構造化についての主成分分析による補正

主成分分析Principal components analysisについて

総合指標zと、それを構成するx_1, x_2を考える。

z=l_1x_1+l_2x_2

ここでl_1, l_2は未知の重み係数であり、これを求めるのが主成分分析。これらを次の条件を満たすように求める。

  • zの分散が最大となるように
分散最大=分散が大きいほど個体を識別しやすく情報量が大きいと考える。
  • l_1^2+l_2^2=1となるように

それで

zの分散V_z

  • V_z=\frac{1}{n}\sum(z-\bar{z})^2
=\frac{1}{n}\sum\{(l_1x_1+l_2x_2)-(l_1\bar{x_1}+l_2\bar{x_2})\}^2
=\frac{1}{n}\sum\{l_1(x_1-\bar{x_1})+l_2(x_2-\bar{x_2})\}^2
=l_1^2\frac{1}{n}\sum(x_1-\bar{x_1})^2+l_2^2\frac{1}{n}\sum(x_2-\bar{x_2})^2+2l_1l_2\frac{1}{n}\sum(x_1-\bar{x_1})(x_2-\bar{x_2})
=l_1^2v_1+l_2^2v_2+2l_1l_2v_{12}
  • ここで、v_1x_1の分散、v_2x_2の分散、v_{12}x_1x_2の共分散である。

そんでそんで

  • ラグランジュの未定乗数法で、前述の条件を満たすl_1l_2を求めるみたいなんだけど、よくわかんないので今日はココマデで。
最終更新:2007年09月29日 21:33
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。