拡張MHC領域における疾患関連研究のための高解像度HLA、SNPハプロタイプマップ

このページを編集する

HLAアレルと疾患感受性との関連を証明した研究は山ほどあるが、近傍のHLAや非HLA遺伝子との強い相関により、その解釈は混乱している。
- そのため全MHCの遺伝子と多様性をカタログ化する努力が払われてきた。
- これまでのヨーロッパ系人種の研究では、SNPにより原因多様性を分離することができそうである。
今回、7.5MbのxMHC領域についての高密度でより多くのサンプルを使用したガイドとなるリソースを提供する。
- LDはCEU、CHB、JPTでYRIよりも高かった。（図1）
- 異なったHLA座位にあるアレルは強い相関を示した。(sup 表2）
HLA周囲でのこのようなSNPsやdeletion*insertionの高いLDをもとに、HLA遺伝子外のSNPがHLAタイプの情報を与えると考えられる（図2a）
HLAタイプと単SNPの関連を領域全体で調べた。（図2b）
- 34*44%のHLAアレルが、ひとつ以上のSNPと強い関連にあった(最大r^2>0.8)、そのうちいくつかはかなり遠いところにあった
- HLA*C*0702はYRIとCEUで数Mbの範囲で多くのSNPsと強いLDにあったが、CHBとJPTでは、50kb以内のSNPにしか強い関連をみなかった。
- 逆にHLA*C*0304は強い関連を示すSNPがどの集団でもひとつもなかった。
- したがって、頻度の高いHLAアレルは比較的straightforwardにタグ付けができるが、集団によってtagSNPsの内容は異なり、いくつかのHLAアレルは関連の証明が困難であると示唆された。
HLA座位のアレル多様性を近傍のSNPがどれくらい捕まえられているかをはかるため、Taggerアルゴリズムを用いた。
- ほとんどの主要なHLAアレルの効果的で能率的なtaggingに成功した。
- tag化のパフォーマンスには違いがあった
  - 頻度の高いHLA*A, B, Cアレルは平均してr^2=0.97でcaptureされており、一方HLA*DRB1のcommon allelesはr*2=0.90程度であった
- YRIとCEUで75%、CHBとJPTは100%がr^2>0.8でcaptureされた。
二つの独立したサンプルで、結果を確認した。（表2）感度、特異度とも良好だった。
一般に、二つの点でHLAアレルはSNPよりもtag付けしづらい。
- 第一に、HLAアレルはそれ自体が多座位のハプロタイプであることだ。
- 二つ目に、MHCの特有の進化の歴史からは、そのパターンは組換え、gene conversion、地理的要因、遺伝的浮動genetic driftだけではなくnatural selectionにもよると考えられる。
少し難しいので略
陽性の選択圧を受けたアレルというのは関連解析の候補である。
- 最近の陽性の選択圧を受けたアレルを探すひとつの方法は、長いハプロタイプ（→長期間、組換えを受けていない）と関連した頻度の高いアレルを探すというものである。

方法

DNAサンプル
- HapMapサンプル
- オランダのセリアック病研究の330サンプル、UK SLE研究の996サンプル
SNPタイピング、indelタイピング
- SNPはIlluminaまたはTaqMan
- indelはTaqMan
HLAタイピング
- PCR-SSOPベースの方法
LD解析
- biallelic SNP iとN個のアレルを持つマルチアレリックなHLA座位jとのLDには、relative informationを定義した。すなわち