「ゲノムワイド関連研究の構造化についての主成分分析による補正」の編集履歴(バックアップ)一覧はこちら
追加された行は緑色になります。
削除された行は赤色になります。
=主成分分析Principal components analysisについて=
総合指標<math>z</math>と、それを構成する<math>x_1</math>, <math>x_2</math>を考える。
:<math>z=l_1x_1+l_2x_2</math>
ここで<math>l_1</math>, <math>l_2</math>は未知の重み係数であり、これを求めるのが主成分分析。これらを次の条件を満たすように求める。
*zの分散が最大となるように
::分散最大=分散が大きいほど個体を識別しやすく情報量が大きいと考える。
*<math>l_1^2+l_2^2=1</math>となるように
==それで==
<math>z</math>の分散<math>V_z</math>は
*<math>V_z=\frac{1}{n}\sum(z-\bar{z})^2</math>
:<math>=\frac{1}{n}\sum\{(l_1x_1+l_2x_2)-(l_1\bar{x_1}+l_2\bar{x_2})\}^2</math>
:<math>=\frac{1}{n}\sum\{l_1(x_1-\bar{x_1})+l_2(x_2-\bar{x_2})\}^2</math>
=主成分分析Principal components analysisについて=
総合指標<math>z</math>と、それを構成する<math>x_1</math>, <math>x_2</math>を考える。
:<math>z=l_1x_1+l_2x_2</math>
ここで<math>l_1</math>, <math>l_2</math>は未知の重み係数であり、これを求めるのが主成分分析。これらを次の条件を満たすように求める。
*zの分散が最大となるように
::分散最大=分散が大きいほど個体を識別しやすく情報量が大きいと考える。
*<math>l_1^2+l_2^2=1</math>となるように
==それで==
<math>z</math>の分散<math>V_z</math>は
*<math>V_z=\frac{1}{n}\sum(z-\bar{z})^2</math>
:<math>=\frac{1}{n}\sum\{(l_1x_1+l_2x_2)-(l_1\bar{x_1}+l_2\bar{x_2})\}^2</math>
:<math>=\frac{1}{n}\sum\{l_1(x_1-\bar{x_1})+l_2(x_2-\bar{x_2})\}^2</math>
:<math>=l_1^2\frac{1}{n}\sum(x_1-\bar{x_1})^2+l_2^2\frac{1}{n}\sum(x_2-\bar{x_2})^2+2l_1l_2\frac{1}{n}\sum(x_1-\bar{x_1})(x_2-\bar{x_2})</math>
:<math>=l_1^2v_1+l_2^2v_2+2l_1l_2v_{12}</math>
*ここで、<math>v_1</math>は<math>x_1</math>の分散、<math>v_2</math>は<math>x_2</math>の分散、<math>v_{12}</math>は<math>x_1</math>と<math>x_2</math>の共分散である。
==そんでそんで==
*ラグランジュの未定乗数法で、前述の条件を満たす<math>l_1</math>と<math>l_2</math>を求めるみたいなんだけど、よくわかんないので今日はココマデで。