「連鎖不平衡を用いた関連研究のための最も有益なSNPセットの選択」の編集履歴(バックアップ)一覧はこちら
追加された行は緑色になります。
削除された行は赤色になります。
=導入=
*全てのSNPをタイピングするのは今のところ大変なので、どのSNPをタイピングするかが問題である。
**必要SNP数を軽減するためtagSNPsについて検討されているが、ハプロタイプをどれくらい説明するのか、疾患関連をみつける検出力がどれくらいなのかについて、部分的にしか解かれていない。
**tagSNP法において、タイピングされていない真の感受性多型のタイピングされた多型からの検出力は、サンプル数Nの場合、サンプル数Nr<sup>2</sup>を直接タイピングしたときと同等である。
=方法=
*tagSNP選択→r2高いのbinに巻き取り法
*めんどいので略
=結果=
*100の遺伝子周囲からMAF>10%のSNPをアフロアメリカンから3178、ユーロアメリカンから2375選んだ。
===ペアワイズSNPの関連解析===
*r<sup>2</sup>の分散はきわめて大きいので(なんのこっちゃ)、[[遺伝用語#coalescent|coalescent]] simulated dataを用いて候補遺伝子のLDパターンをモデル化した。
=導入=
*全てのSNPをタイピングするのは今のところ大変なので、どのSNPをタイピングするかが問題である。
**必要SNP数を軽減するためtagSNPsについて検討されているが、ハプロタイプをどれくらい説明するのか、疾患関連をみつける検出力がどれくらいなのかについて、部分的にしか解かれていない。
**tagSNP法において、タイピングされていない真の感受性多型のタイピングされた多型からの検出力は、サンプル数Nの場合、サンプル数Nr<sup>2</sup>を直接タイピングしたときと同等である。
=方法=
*tagSNP選択→r2高いのbinに巻き取り法
*めんどいので略
=結果=
*100の遺伝子周囲からMAF>10%のSNPをアフロアメリカンから3178、ユーロアメリカンから2375選んだ。
===ペアワイズSNPの関連解析===
*r<sup>2</sup>の分散はきわめて大きいので(なんのこっちゃ)、[[遺伝用語#coalescent|coalescent]] simulated dataを用いて候補遺伝子のLDパターンをモデル化した。→抽出された小集団でのr<sup>2</sup>と、overall populationでのr<sup>2</sup>を比較するため。
**24個体でのr<sup>2</sup>が与えられた閾値を越えており、10,000個体からの真のr<sup>2</sup>が越えていないという状況の頻度が、r<sup>2</sup>の閾値 < 0.5で劇的に増大することから、閾値はr<sup>2</sup> > 0.5にしたほうがよさそうだとわかった。
*BDKRB2上のtagSNP
**r<sup>2</sup>>0.5、MAF>10%として5つのbinが認められた。1つは9SNP、2つは4SNP、1つは3SNP、1つは2SNPからなるbinであった。
**それぞれのbin内での遺伝子型パターンはきわめて類似していた。
*100遺伝子それぞれでのtagSNP binsは図2Aと表1に示されている。
**想定されたように数の少ないtagSNP binはアフロアメリカンで多くて、nucleotide diversityの高さと弱いLDを示していると考えられる。
**また想定されたようにtagSNP binの数は遺伝子サイズに応じて多くなったが、場所により密度の違いがあって、組換えの歴史を反映しているのだと思われた。
*著者らはLD-based tagSNP selectionがgreedyだと考えた。
**いっしょうけんめいtagを絞り込むやり方と比較してみたところ、がんばったのにgreedy algorithmと同数のtagになった。
*100遺伝子でのr<sup>2</sup>閾値を動かしたtagSNP binの数のグラフを示す(図3)。