遺伝統計学

項目

その他

\lambda_s

  • Rybicki and Elston. AJHG 2000;66:593.
  • \lambda_sはRisch 1990のレビュー三枚により使われるようになった。このとき、多重ローカスモデルではλは各ローカスのλの積で表される(\lambda=\lambda_1 \lambda_2 ... \lambda_i)ことを示した。
  • またある状況では罹患同胞対連鎖解析の検出力を予測できることを示したが、これは否定されたよう
  • 欠点: 共有する遺伝子と同じくらい共有する環境因子の影響を受ける。
  • ジェノタイプ相対リスクを\gammaとする。ジェノタイプ相対リスクは、そのジェノタイプの人の発症率を、それ以外のジェノタイプの発症率で割ったものである。したがって、g+をsusceptible genotypeありの状態、g-を無しの状態とすると、
\gamma=\frac{Pr(D|g+)}{Pr(D|g-)} \quad (1)
と書ける。一方\lambdaはaffected relativeをARと書くことにより、
\lambda=\frac{Pr(D|AR)}{Pr(D)} \quad (2)
と書ける。ここで集団でのsusceptible genotypeの頻度をp_G、それ以外をp_0とすると、
Pr(D)=p_G Pr(D|G+)+p_0 Pr(D|G-) \quad (3)
である。(2)式と(3)式より、
Pr(D|G+)=\frac{Pr(D|AR)\div\lambda-p_0Pr(D|G-)}{p_G} \quad (4)
である。(4)式を(1)式に代入すれば、
\gamma=\frac{Pr(D|AR)\div\lambda-p_0Pr(D|G-)}{p_G Pr(D|g-)} \quad (5)
たとえば、\lambda_s=5で、集団の発症率が1/1,000である疾患と感受性ジェノタイプを考える。感受性ジェノタイプがない場合の発症率を1/10,000、集団の90%が感受性ジェノタイプを持っていないとするなら、(5)式より\gammaは91となり、\lambda_sの20倍近い。

sequence coverage

  • raw value for coverage:
\frac{L+T}{R}

ここでRはリファレンスであるSNPセット(たとえばHapMap SNP)、Tはtag SNPセット(tagSNPと、それによってまとめられるSNP)である。ここで、ゲノム全体のSNPセットG>Rであるためこの式ではcoverageを過大に評価してしまう。したがって

\frac{\left ( \frac{L}{R-T} \right ) (G-T)+T}{G}

ENCODEの予測から、G \approx7500万と示唆されているが、これが1億だからといって予測が大きく変わるわけではない。

r2とpower

  • 真のsusceptible locusであるlocus 1でcase-control N1サンプルをタイピング、近傍のマーカーlocus 2でN2サンプルをタイピングし関連研究をしたとする。
    • locus 1のアレルはAとa、locus2のアレルはBとb。
    • \pi_{DA}はケースのAアレル頻度、\pi_{CA}はコントロールのAアレル頻度。
    • qABはある染色体上でlocus1がアレルA、locus2がアレルBである確率。
  • すると、(論文ではつづめてあったがバカな自分のために展開)
\pi_{DB}-\pi_{CB}=(\pi_{DA}-\pi_{CA})q_{AB}+(\pi_{Da}-\pi_{Ca})q_{aB}
=(\pi_{DA}-\pi_{CA})q_{AB}+(1-\pi_{DA}-1+\pi_{CA})q_{aB}
=(\pi_{DA}-\pi_{CA})(q_{AB}-q_{aB})
  • するとlocus1での関連解析のカイ二乗統計量は、ケースのサンプル数:コントロールのサンプル数=φ:1-φとすると、
\chi^2_1 = \frac{\{(\phi 2N_1+(1-\phi) 2N_1\}\{\phi 2N_1\hat{\pi}_{DA}(1-\phi)2N_1\hat{\pi}_{Ca}-\phi 2N_1\hat{\pi}_{Da}(1-\phi)2N_1\hat{\pi}_{CA}\}^2}{\phi 2N_1 (1-\phi) 2N_1 \hat{\pi}_A 2N_1 (1-\hat{\pi}_A)}
= \frac{(\hat{\pi}_{DA}-\hat{\pi}_{CA})^2 2N_1 \phi (1-\phi)}{\hat{\pi}_A(1-\hat{\pi}_A)}
ここで、 \hat{\pi}_{DA}, \hat{\pi}_{CA}, \hat{\pi}_Aはそれぞれ患者、コントロール、全体でのアレルAのサンプル頻度である。AをBにしてN1をN2にすればlocus 2の\chi^2_2となる。
  • \chi^2_1\chi^2_2の分布はだいたい正規分布の確率変数の二乗である。正規分布の平均は
(\pi_{DA}-\pi_{CA})\left \[ \frac{2N_1 \phi(1-\phi)}{\bar{\pi}_A(1-\bar{\pi}_A)}\right \] ^{\frac{1}{2}}
(\pi_{DA}-\pi_{CA})(q_{AB}-q_{aB})\left \[ \frac{2N_2 \phi(1-\phi)}{\bar{\pi}_B(1-\bar{\pi}_B)}\right \] ^{\frac{1}{2}}
\bar{\pi}_A=\phi \pi_{DA}+(1-\phi) \pi_{CA} \approx \pi_A
  • ここで、(下の式は自分で導出できず)
r^2=\frac{(q_{AB}-q_{aB})^2\pi_A(1-\pi_A)}{\pi_B(1-\pi_B)}
  • したがって、N2=N1/r2のとき\chi^2_2\chi^2_1とほぼ同じ分布となる。

Journal abstracts

最終更新:2007年09月19日 10:37
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。