導入
- Boehnke 1994によると、家族ベースのmutation mappingではどうがんばっても~1cMを越える解像度は得られないそうだ。
- 連鎖不平衡マッピングのアドバンテージ
- unrelated individualsから得られる染色体サンプルの背景となるgenealogyはきわめて大きくて、何百回の有糸分裂イベントを反映しているということである。
- mutationは、特定のハプロタイプに発生し、当初疾患とハプロタイプはその集団で関連している。
- 時を経て関連は組換えにより、disease mutationからマーカーまでの距離によって決定されるrateに従いdecayする。
言い切っちゃってるが・・
- LDマッピングは、候補領域を<0.1cMに絞り込むことができる。
- 完全で、99.9%正確なヒトゲノム配列がもうすぐ手に入る。
- もはやポジショナルクローニングを行う必要はなく、候補領域の多型を相手にすればよい。
中略
理論
- を、特定の遺伝病を持つunrelated individualsからサンプルしたn本の染色体からなるmultilocusなハプロタイプとする。
- それぞれの染色体はL個のマーカーについてタイピングされる。は染色体i上のローカスjのマーカーアレルを意味する。
- 集団の、指数関数的な拡大(または縮小)率を仮定する。
- なら、集団サイズが変化しないということ
- 過去の時間t0に発生したdisease mutationについて考える
- 現時点での疾患染色体(最初のmutationから引き継いだもの)全体の集団からサンプルされた一部をfとする。
- 簡単のため、このモデルにおける人工統計学的demographicパラメータをとする。
- Y0をmutationが起こった染色体におけるマルチローカスハプロタイプであるとする。
- は正常染色体でのアレル頻度行列で、ローカスjにおけるアレルiの頻度である。
- サンプルのgene treeとはdisease locusという観点からのサンプルの歴史を記述するもので、で表される。
- これはtips i=1,2,...,nとノードi=n,n-1,...,2からなるa vector of labeled binary tree Tである。nodesはn-1回のcommon ancestral chromosomeからわかれた系統を表す。
- 共通の先祖(ノード)がいた時点の時間をcoalescent timesと言い、として定義され、tiは時間で、i=n,n-1,...,2であり、iの変異系統がi-1の先祖系統にcoalesceする時間である。
- Coalescent modelはRannnala, Slatkin (1998)に基づき、intra-allelic coalescent of a rare mutation(定義不明)を用いて、coalescent timesとgene treesの確率分布を決めた。
- を
最終更新:2007年08月14日 21:57