ヒトゲノム配列の文脈における高解像度連鎖不平衡マッピング

導入

  • Boehnke 1994によると、家族ベースのmutation mappingではどうがんばっても~1cMを越える解像度は得られないそうだ。
  • 連鎖不平衡マッピングのアドバンテージ
    • unrelated individualsから得られる染色体サンプルの背景となるgenealogyはきわめて大きくて、何百回の有糸分裂イベントを反映しているということである。
    • mutationは、特定のハプロタイプに発生し、当初疾患とハプロタイプはその集団で関連している。
    • 時を経て関連は組換えにより、disease mutationからマーカーまでの距離によって決定されるrateに従いdecayする。
言い切っちゃってるが・・
  • LDマッピングは、候補領域を<0.1cMに絞り込むことができる。
  • 完全で、99.9%正確なヒトゲノム配列がもうすぐ手に入る。
    • もはやポジショナルクローニングを行う必要はなく、候補領域の多型を相手にすればよい。
中略

理論

  • \mathbf{X}=\{X_{ij}\}を、特定の遺伝病を持つunrelated individualsからサンプルしたn本の染色体からなるmultilocusなハプロタイプとする。
  • それぞれの染色体はL個のマーカーについてタイピングされる。X_{ij}は染色体i上のローカスjのマーカーアレルを意味する。
  • 集団の、指数関数的な拡大(または縮小)率\zetaを仮定する。
    • \zeta=0なら、集団サイズが変化しないということ
  • 過去の時間t0に発生したdisease mutationについて考える
    • 現時点での疾患染色体(最初のmutationから引き継いだもの)全体の集団からサンプルされた一部をfとする。
    • 簡単のため、このモデルにおける人工統計学的demographicパラメータを\Lambda=\{f,\zeta,t_0\}とする。
  • Y0をmutationが起こった染色体におけるマルチローカスハプロタイプであるとする。
    • \mathbf{p}=\{p_{ij}\}は正常染色体でのアレル頻度行列で、ローカスjにおけるアレルiの頻度である。
  • サンプルのgene treeとはdisease locusという観点からのサンプルの歴史を記述するもので、\tau=\{T,\mathbf{t}\}で表される。
    • これはtips i=1,2,...,nとノードi=n,n-1,...,2からなるa vector of labeled binary tree Tである。nodesはn-1回のcommon ancestral chromosomeからわかれた系統を表す。
    • 共通の先祖(ノード)がいた時点の時間をcoalescent timesと言い、\mathbf{t}=\{t_i\}として定義され、tiは時間で、i=n,n-1,...,2であり、iの変異系統がi-1の先祖系統にcoalesceする時間である。
    • Coalescent modelはRannnala, Slatkin (1998)に基づき、intra-allelic coalescent of a rare mutation(定義不明)を用いて、coalescent timesとgene treesの確率分布を決めた。
  • \mathbf{Y}=\{Y_{ij}\}
最終更新:2007年08月14日 21:57
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。