2010年5月16日日曜日

2010年版人類のCNVパターンカタログ

CNVというのは文字通りゲノム・コピー数の個人個人による違いのことをいう。 copy number variation

さて年配の方はいうだろう。
・・・コピーの違いなんかあるわけがない。染色体は22対と性染色体の46本に決まっている。そのゲノムの上の遺伝子・ゲノムの数はだれでも同じだぞ。そうだろ? 病気でもないかぎり個人間にゲノム遺伝子のコピー数に差はない。みんな2コピーづつ。母親と父親から一つづつ受け継いだもの。あたりまえじゃないか!もちろん違うことがあるは知っているよ。でも例外的だろう?たとえばダウン症候群なんかだな。云々・・・。

病気になるとゲノムの一部の量が変化することはここ50年でかなり知られてきた。その大部分は染色体異常であった。これは染色体を染める技術が進むことで様々なパターンがカタログ化されてきた。ほとんど芸術的な作業であった。文字通り切った、貼ったの世界である。精緻なジグゾーパズルの世界なのであった。この染色体異常には二つのパターンが知られている。
一つは先天的に親から引き継いだ染色体数異常である。染色体異常を持ちながら胎生期、出産を乗り越え出生できた。文字通り生きて生まれることが可能であった人たちである。障害を持たれて生きておられる方もまた多い。

今ひとつは生後あらたに染色体異常を起こしたが為に病気が発症するパターンである。人体を構成する大部分の細胞は正常であり、このなかから異常パターンを持った細胞が検索可能になるためには、それらがクローナルに増えて行かなければ(つまり量が増えなければ)無理である。これって腫瘍化しなければ、このようなパターンは見えてこない、気が付かれることはないことを意味する。白血病、リンパ腫、肉腫がこのような生後におこる染色体数異常がみつかる代表的な疾患群である。

4〜5年前までは上のような議論がすべてあった。正常な人のゲノムは大部分等価である。ほとんど同じ配列である。その中で塩基単位の違いが遺伝子多型を作ることは了解されていた。アルコール耐性や血液型、HLAや免疫グロブリン遺伝子の多様性。これらの多型性・多様性の原理はかなり知られていた。しかしそれよりも大きな長さの単位レベルでは多型性はあり得ないというのがコンセンサスであった。

今は違う。ドラスティックに変わってしまった。個人間のゲノムの違いはダイナミックである。数が違う。普遍的にその事実が知られるようになったのはゲノムアレイ研究が世に出てきてからである。コピー数の違いは大部分は機能遺伝子が存在する場所以外で見られる傾向はあろう。機能遺伝子のコピーが2コピー(父母由来)以上あると困りますからな(そのように教科書に書いてある)。しかし驚くことに機能遺伝子でもコピー数が違うものがある。アミラーゼ遺伝子は米食を盛んにする人種では多いことが知られており、日本人は平均6本もっているようだ。1番染色体の端に存在するこの遺伝子領域は、ゲノムアレイではそそり立つヒゲのように見える。母親由来の一番上に4コピー、父親由来で2コピータンデムに重複しており合わせて6コピー見える。多い人では14コピーある。このような「ヒゲ」は局所的にコピー数が増減していることを意味しているが、小生がゲノムアレイの研究を始めた当初はそのヒゲの数のあまりの多さに信じられない思いであった。しかも個人間で共通するヒゲも多いし、共通しないヒゲも多い。しかし決してランダムではない。ある程度の「頻度」と場所の特異性はあるようで非常に興味深いパターンを見せてくれるのだった。

前置きが長くなったが2010年版人類のCNVパターンカタログが発表された。
この土日は楽しめそうである。

Article

Nature 464, 704-712 (1 April 2010) | doi:10.1038/nature08516; Received 14 August 2009; Accepted 21 September 2009; Published online 7 October 2009

Origins and functional impact of copy number variation in the human genome

Donald F. Conrad1,7, Dalila Pinto2,7, Richard Redon1,3, Lars Feuk2,4, Omer Gokcumen5, Yujun Zhang1, Jan Aerts1, T. Daniel Andrews1, Chris Barnes1, Peter Campbell1, Tomas Fitzgerald1, Min Hu1, Chun Hwa Ihm5, Kati Kristiansson1, Daniel G. MacArthur1, Jeffrey R. MacDonald2, Ifejinelo Onyiah1, Andy Wing Chun Pang2, Sam Robson1, Kathy Stirrups1, Armand Valsesia1, Klaudia Walter1, John Wei2, The Wellcome Trust Case Control Consortium, Chris Tyler-Smith1, Nigel P. Carter1, Charles Lee5, Stephen W. Scherer2,6 & Matthew E. Hurles1

  1. The Wellcome Trust Sanger Institute, Wellcome Trust Genome Campus, Hinxton, Cambridge, CB10 1SA UK
  2. The Centre for Applied Genomics and Program in Genetics and Genomic Biology, The Hospital for Sick Children, MaRS Centre–East Tower, 101 College Street, Room 14-701, Toronto, Ontario M5G 1L7, Canada
  3. Inserm UMR915, L’institut du thorax, Nantes 44035, France
  4. Uppsala: Department of Genetics and Pathology, Rudbeck Laboratory Uppsala University, Uppsala 751 85, Sweden
  5. Department of Pathology, Brigham and Women’s Hospital and Harvard Medical School, Boston, Massachusetts 02115, USA
  6. Department of Molecular Genetics, University of Toronto, Toronto M5S 1A8, Canada
  7. These authors contributed equally to this work.
  8. Lists of participants and affiliations appear in Supplementary Information.

Structural variations of DNA greater than 1 kilobase in size account for most bases that vary among human genomes, but are still relatively under-ascertained. Here we use tiling oligonucleotide microarrays, comprising 42million probes, to generate a comprehensive map of 11,700 copy number variations (CNVs) greater than 443 base pairs, of which most (8,599) have been validated independently. For 4,978 of these CNVs, we generated reference genotypes from 450 individuals of European, African or East Asian ancestry. The predominant mutational mechanisms differ among CNV size classes. Retrotransposition has duplicated and inserted some coding and non-coding DNA segments randomly around the genome. Furthermore, by correlation with known trait-associated single nucleotide polymorphisms (SNPs), we identified 30 loci with CNVs that are candidates for influencing disease susceptibility. Despite this, having assessed the completeness of our map and the patterns of linkage disequilibrium between CNVs and SNPs, we conclude that, for complex traits, the heritability void left by genome-wide association studies will not be accounted for by common CNVs.

0 件のコメント:

コメントを投稿