導入
- 全てのSNPをタイピングするのは今のところ大変なので、どのSNPをタイピングするかが問題である。
- 必要SNP数を軽減するためtagSNPsについて検討されているが、ハプロタイプをどれくらい説明するのか、疾患関連をみつける検出力がどれくらいなのかについて、部分的にしか解かれていない。
- tagSNP法において、タイピングされていない真の感受性多型のタイピングされた多型からの検出力は、サンプル数Nの場合、サンプル数Nr2を直接タイピングしたときと同等である。
方法
- tagSNP選択→r2高いのbinに巻き取り法
- めんどいので略
結果
- 100の遺伝子周囲からMAF>10%のSNPをアフロアメリカンから3178、ユーロアメリカンから2375選んだ。
ペアワイズSNPの関連解析
- r2の分散はきわめて大きいので(なんのこっちゃ)、coalescent simulated dataを用いて候補遺伝子のLDパターンをモデル化した。→抽出された小集団でのr2と、overall populationでのr2を比較するため。
- 24個体でのr2が与えられた閾値を越えており、10,000個体からの真のr2が越えていないという状況の頻度が、r2の閾値 < 0.5で劇的に増大することから、閾値はr2 > 0.5にしたほうがよさそうだとわかった。
- BDKRB2上のtagSNP
- r2>0.5、MAF>10%として5つのbinが認められた。1つは9SNP、2つは4SNP、1つは3SNP、1つは2SNPからなるbinであった。
- それぞれのbin内での遺伝子型パターンはきわめて類似していた。
- 100遺伝子それぞれでのtagSNP binsは図2Aと表1に示されている。
- 想定されたように数の少ないtagSNP binはアフロアメリカンで多くて、nucleotide diversityの高さと弱いLDを示していると考えられる。
- また想定されたようにtagSNP binの数は遺伝子サイズに応じて多くなったが、場所により密度の違いがあって、組換えの歴史を反映しているのだと思われた。
- 著者らはLD-based tagSNP selectionがgreedyだと考えた。
- いっしょうけんめいtagを絞り込むやり方と比較してみたところ、がんばったのにgreedy algorithmと同数のtagになった。
- 100遺伝子でのr2閾値を動かしたtagSNP binの数のグラフを示す(図3)。
最終更新:2007年06月20日 22:16