「拡張MHC領域における疾患関連研究のための高解像度HLA、SNPハプロタイプマップ」の編集履歴(バックアップ)一覧はこちら
追加された行は緑色になります。
削除された行は赤色になります。
*HLAアレルと疾患感受性との関連を証明した研究は山ほどあるが、近傍のHLAや非HLA遺伝子との強い相関により、その解釈は混乱している。
**そのため全MHCの遺伝子と多様性をカタログ化する努力が払われてきた。
**これまでのヨーロッパ系人種の研究では、SNPにより原因多様性を分離することができそうである。
*今回、7.5MbのxMHC領域についての高密度でより多くのサンプルを使用したガイドとなるリソースを提供する。
**LDはCEU、CHB、JPTでYRIよりも高かった。(図1)
**異なったHLA座位にあるアレルは強い相関を示した。(sup 表2)
*HLA周囲でのこのようなSNPsやdeletion*insertionの高いLDをもとに、HLA遺伝子外のSNPがHLAタイプの情報を与えると考えられる(図2a)
*HLAタイプと単SNPの関連を領域全体で調べた。(図2b)
**34*44%のHLAアレルが、ひとつ以上のSNPと強い関連にあった(最大r^2>0.8)、そのうちいくつかはかなり遠いところにあった
**HLA*C*0702はYRIとCEUで数Mbの範囲で多くのSNPsと強いLDにあったが、CHBとJPTでは、50kb以内のSNPにしか強い関連をみなかった。
**逆にHLA*C*0304は強い関連を示すSNPがどの集団でもひとつもなかった。
**したがって、頻度の高いHLAアレルは比較的straightforwardにタグ付けができるが、集団によってtagSNPsの内容は異なり、いくつかのHLAアレルは関連の証明が困難であると示唆された。
*HLA座位のアレル多様性を近傍のSNPがどれくらい捕まえられているかをはかるため、Taggerアルゴリズムを用いた。
**ほとんどの主要なHLAアレルの効果的で能率的なtaggingに成功した。
**tag化のパフォーマンスには違いがあった
***頻度の高いHLA*A, B, Cアレルは平均してr^2=0.97でcaptureされており、一方HLA*DRB1のcommon allelesはr*2=0.90程度であった
**YRIとCEUで75%、CHBとJPTは100%がr^2>0.8でcaptureされた。
*二つの独立したサンプルで、結果を確認した。(表2)感度、特異度とも良好だった。
*一般に、二つの点でHLAアレルはSNPよりもtag付けしづらい。
**第一に、HLAアレルはそれ自体が多座位のハプロタイプであることだ。
**二つ目に、MHCの特有の進化の歴史からは、そのパターンは組換え、gene conversion、地理的要因、[[遺伝的浮動]]genetic driftだけではなくnatural selectionにもよると考えられる。
===方法===
*DNAサンプル
**HapMapサンプル
**オランダのセリアック病研究の330サンプル、UK SLE研究の996サンプル
*SNPタイピング、indelタイピング
**SNPはIlluminaまたはTaqMan
**indelはTaqMan
*HLAタイピング
**PCR-SSOPベースの方法
*LD解析
**biallelic SNP <i>i</i>とN個のアレルを持つマルチアレリックなHLA座位<i>j</i>とのLDには、relative informationを定義した。すなわち
::<math>I_{ij}=1-\frac{H^C_{ij}}{H_j}</math>
::で、
::<math>H_j=-\sum^N_{k=1} p_k \ln p_k</math>
::と、
::<math>H^C_{ij}=-\left \[ f^0_i \sum^N_{k=1}p^0_k \ln p^0_k + f^1_i \sum^N_{k=1} p^1_k \ln p^1_k \right \]</math>
::ここで<math>p^x_k</math>はSNPアレルx上のk番目のHLAアレルの頻度であり、<math>f^x_i</math>はxアレルの頻度である。
*組換えとハプロタイプ構造の解析
*HLAアレルと疾患感受性との関連を証明した研究は山ほどあるが、近傍のHLAや非HLA遺伝子との強い相関により、その解釈は混乱している。
**そのため全MHCの遺伝子と多様性をカタログ化する努力が払われてきた。
**これまでのヨーロッパ系人種の研究では、SNPにより原因多様性を分離することができそうである。
*今回、7.5MbのxMHC領域についての高密度でより多くのサンプルを使用したガイドとなるリソースを提供する。
**LDはCEU、CHB、JPTでYRIよりも高かった。(図1)
**異なったHLA座位にあるアレルは強い相関を示した。(sup 表2)
*HLA周囲でのこのようなSNPsやdeletion*insertionの高いLDをもとに、HLA遺伝子外のSNPがHLAタイプの情報を与えると考えられる(図2a)
*HLAタイプと単SNPの関連を領域全体で調べた。(図2b)
**34*44%のHLAアレルが、ひとつ以上のSNPと強い関連にあった(最大r^2>0.8)、そのうちいくつかはかなり遠いところにあった
**HLA*C*0702はYRIとCEUで数Mbの範囲で多くのSNPsと強いLDにあったが、CHBとJPTでは、50kb以内のSNPにしか強い関連をみなかった。
**逆にHLA*C*0304は強い関連を示すSNPがどの集団でもひとつもなかった。
**したがって、頻度の高いHLAアレルは比較的straightforwardにタグ付けができるが、集団によってtagSNPsの内容は異なり、いくつかのHLAアレルは関連の証明が困難であると示唆された。
*HLA座位のアレル多様性を近傍のSNPがどれくらい捕まえられているかをはかるため、Taggerアルゴリズムを用いた。
**ほとんどの主要なHLAアレルの効果的で能率的なtaggingに成功した。
**tag化のパフォーマンスには違いがあった
***頻度の高いHLA*A, B, Cアレルは平均してr^2=0.97でcaptureされており、一方HLA*DRB1のcommon allelesはr*2=0.90程度であった
**YRIとCEUで75%、CHBとJPTは100%がr^2>0.8でcaptureされた。
*二つの独立したサンプルで、結果を確認した。(表2)感度、特異度とも良好だった。
*一般に、二つの点でHLAアレルはSNPよりもtag付けしづらい。
**第一に、HLAアレルはそれ自体が多座位のハプロタイプであることだ。
**二つ目に、MHCの特有の進化の歴史からは、そのパターンは組換え、gene conversion、地理的要因、[[遺伝的浮動]]genetic driftだけではなくnatural selectionにもよると考えられる。
*少し難しいので略
*陽性の選択圧を受けたアレルというのは関連解析の候補である。
**最近の陽性の選択圧を受けたアレルを探すひとつの方法は、長いハプロタイプ(→長期間、組換えを受けていない)と関連した頻度の高いアレルを探すというものである。
===方法===
*DNAサンプル
**HapMapサンプル
**オランダのセリアック病研究の330サンプル、UK SLE研究の996サンプル
*SNPタイピング、indelタイピング
**SNPはIlluminaまたはTaqMan
**indelはTaqMan
*HLAタイピング
**PCR-SSOPベースの方法
*LD解析
**biallelic SNP <i>i</i>とN個のアレルを持つマルチアレリックなHLA座位<i>j</i>とのLDには、relative informationを定義した。すなわち
::<math>I_{ij}=1-\frac{H^C_{ij}}{H_j}</math>
::で、
::<math>H_j=-\sum^N_{k=1} p_k \ln p_k</math>
::と、
::<math>H^C_{ij}=-\left \[ f^0_i \sum^N_{k=1}p^0_k \ln p^0_k + f^1_i \sum^N_{k=1} p^1_k \ln p^1_k \right \]</math>
::ここで<math>p^x_k</math>はSNPアレルx上のk番目のHLAアレルの頻度であり、<math>f^x_i</math>はxアレルの頻度である。
*組換えとハプロタイプ構造の解析
**フェイジングされたハプロタイプセットから、場所xにおいて発見的アプローチにより家系を推定する方法を用いた。
**T<sub>i</sub>の初期値は0
**<math>F_{ij}(x)=L^{5'}_{ij}(x)L^{3'}{ij}(x)</math>
::で、<math>L^{5'}_{ij}(x)</math>は5'側で最初にハプロタイプiとjが異なっている位置までのSNPの数。
**この統計量が最も大きい組み合わせの中で、突然変異が最も少ないものを選択した。