このページを編集する

連鎖不平衡を用いた関連研究のための最も有益なSNPセットの選択

導入

全てのSNPをタイピングするのは今のところ大変なので、どのSNPをタイピングするかが問題である。
- 必要SNP数を軽減するためtagSNPsについて検討されているが、ハプロタイプをどれくらい説明するのか、疾患関連をみつける検出力がどれくらいなのかについて、部分的にしか解かれていない。
- tagSNP法において、タイピングされていない真の感受性多型のタイピングされた多型からの検出力は、サンプル数Nの場合、サンプル数Nr²を直接タイピングしたときと同等である。

方法

tagSNP選択→r2高いのbinに巻き取り法
めんどいので略

結果

100の遺伝子周囲からMAF>10%のSNPをアフロアメリカンから3178、ユーロアメリカンから2375選んだ。

ペアワイズSNPの関連解析

r²の分散はきわめて大きいので（なんのこっちゃ）、coalescent simulated dataを用いて候補遺伝子のLDパターンをモデル化した。→抽出された小集団でのr²と、overall populationでのr²を比較するため。
- 24個体でのr²が与えられた閾値を越えており、10,000個体からの真のr²が越えていないという状況の頻度が、r²の閾値 < 0.5で劇的に増大することから、閾値はr² > 0.5にしたほうがよさそうだとわかった。
BDKRB2上のtagSNP
- r²>0.5、MAF>10%として5つのbinが認められた。1つは9SNP、2つは4SNP、1つは3SNP、1つは2SNPからなるbinであった。
- それぞれのbin内での遺伝子型パターンはきわめて類似していた。
100遺伝子それぞれでのtagSNP binsは図2Aと表1に示されている。
- 想定されたように数の少ないtagSNP binはアフロアメリカンで多くて、nucleotide diversityの高さと弱いLDを示していると考えられる。
- また想定されたようにtagSNP binの数は遺伝子サイズに応じて多くなったが、場所により密度の違いがあって、組換えの歴史を反映しているのだと思われた。
著者らはLD-based tagSNP selectionがgreedyだと考えた。
- いっしょうけんめいtagを絞り込むやり方と比較してみたところ、がんばったのにgreedy algorithmと同数のtagになった。
100遺伝子でのr²閾値を動かしたtagSNP binの数のグラフを示す(図3)。

最終更新：2007年06月20日 22:16

ツールボックス

下から選んでください:

新しいページを作成する

ヘルプ / FAQ もご覧ください。

メニュー

TOBIRA

更新履歴

取得中です。

rss ＆コンタクト & タグ

aspirin-marcov @ ウィキ

連鎖不平衡を用いた関連研究のための最も有益なSNPセットの選択

導入

方法

結果

ペアワイズSNPの関連解析

更新履歴