2014年11月21日金曜日

ゲノムプロジェクトは終わっていない

ヒトゲノムの「シークエンス・ギャップ」を埋める 論文がnatureに登場した。個人的には2014年のトップ3の論文である。

Nature
 /nature13907

Resolving the complexity of the human genome using single-molecule sequencing

  • Received
  • Accepted
  • Published online
  • Department of Genome Sciences, University of Washington School of Medicine, Seattle, Washington 98195, USAMark J. P. Chaisson,・・・John A. Stamatoyannopoulos & Evan E. Eichler 

    • The human genome is arguably the most complete mammalian reference assembly1, 2, 3, yet more than 160 euchromatic gaps remain4, 5, 6 and aspects of its structural variation remain poorly understood ten years after its completion7, 8, 9. To identify missing sequence and genetic variation, here we sequence and analyse a haploid human genome (CHM1) using single-molecule, real-time DNA sequencing10. We close or extend 55% of the remaining interstitial gaps in the human GRCh37 reference genome—78% of which carried long runs of degenerate short tandem repeats, often several kilobases in length, embedded within (G+C)-rich genomic regions. We resolve the complete sequence of 26,079 euchromatic structural variants at the base-pair level, including inversions, complex insertions and long tracts of tandem repeats. Most have not been previously reported, with the greatest increases in sensitivity occurring for events less than 5 kilobases in size. Compared to the human reference, we find a significant insertional bias (3:1) in regions corresponding to complex insertions and long short tandem repeats. Our results suggest a greater complexity of the human genome in the form of variation of longer and more complex repetitive DNA that can now be largely resolved with the application of this longer-read sequencing technology.


    2003年ゲノムプロジェクトが一応の宣言をしたころ、まだ読みきれていない「シークエンス・ギャップ」について世間の関心は希薄だった。小生は研究会や学会に出かけては「隙間をどう埋めるか」質問したものだったが、学会のお偉方の関心は薄かった。染色体は中心と端に極めて冗長な反復配列の塊を抱えている(らしい)ということは数十年前から予想されており、教科書にも載っていた。いろんな色素で染色体を染めると端っこと中央の染色パターンが違う。GCコンテントがリッチである。いろんな呼ばれ方をしていた。アルフォイドとかヘテロクロマチンとか・・・この領域はシークエンスが極めて困難であった。

    1995年頃ベンターがインフルエンザ桿菌のショットガン・シークエンスに成功したころ、小生はこの方法に魅せられてヒトの三番染色体のある領域のシークエンスに取りかかったが、この方法が有効だと思えたのは、ほとんど同時期にBACというクローニング方法が開発・商品化されてきたことによる。先行世代はYACに夢中になっていた。Yeast Artificial Chromosomeである。酵母を使うので研究室の「香り」が奇妙に甘くなる。YACは長いDNAを断片化できるので皆が夢中になったのだが、培養増殖すると組換えを起こすことがしられ始めていて皆が困っていた。勝手にヒトの染色体構造が変化してはこまるわけだ。そこにBACが登場したのである。大腸菌が増やしてくれる。組換えは起こさない。実験室には目的のBACを捜すための96穴プレート数十枚セットが宝物のように配備された。 そのころ創刊されたばかりのHuman Molecular Geneticsの裏表紙にはBAC販売会社(名前を失念した)の広告が毎号のように載っていた。

    この技術を開発したのはShizuya Hiroaki先生であり、小生は下↓のPNAS論文を大事に大事に思って引用していたものだ。Shizuya先生はのちにあのEric Landerのヒトゲノム完成nature論文にも名前が登場するけど、日本ではほとんどしられていないようである。とても残念であり、慶応大学はもっと喧伝してもよいとおもわれるが如何。


    0 件のコメント: