コロナ対策に役立つホームページ
世の中の皆さんはどこを参考に日々を過ごしておられるのだろうか?
私が毎日定点観測をするHPは数箇所であるが、これを掲げておこう。これ以外に優れたHPがあれば教えてもらえるとありがたいと思います。
コロナ対策に役立つホームページ
今回のScienceの発表では論文が6篇同時公開されている。一冊丸ごとゲノムプロジェクトに捧げた2000年の「ホップ」ステージの Nature論文(発表は2001年)に比べると随分地味であるが、これもこの22年間の学問の進化と成熟を示すものだろう。世間的なインパクトは地味ですし。
さてこの6編であるが先頭から
この6編を概説する能力は小生にはないが、それでもそのそれぞれにおける個人的興味・観点を述べることはできる。では先頭から順番にたどっていこう。
セントロメア構造であるが、概略は下図である。
アルフォイド配列
ヒト染色体のcentromeric heterochromatinに見られる反復DNA配列の複雑なファミリーである。アルフォイドファミリーは、170塩基対のセグメントのタンデムアレイから構成されている。異なる染色体から単離されたセグメントはコンセンサス配列を示すが、個々の塩基に関しても違いがあり、170塩基対の単位では40%も配列が異なることがある。この繰り返し配列は、数個のユニットがタンデムに並ぶグループに整理され、さらにこれらのグループは1〜6キロベースの長さの大きな配列に整理される。これらの大きな配列が繰り返され、0.5~10メガベースの大きさの配列が形成される。このような大きな、つまり「マクロ」なDNAリピートは染色体特異的である。アルフォイド配列は転写されないので、染色体サイクルの中でまだ定義されていない構造的な役割を担っている。アルフォイドDNA内の配列の変動は、高い頻度でRFLPを生じさせる。これらは遺伝するため、特定の個体やその近親者のDNAを特徴づけるために用いることができる。 (Oxfordより)
下図は
この論文の意義はこれまで存在したギャップを完全に埋めてしまったことです。
これで初めてゲノムプロジェクトが終了した、完了したといって良いのではないかと思う。
ゲノムプロジェクトを3段飛びに例えてみたい。
「ホップ」
ゲノムプロジェクトは米国の国家プロジェクトとして1990年に始まった。国家プロジェクトとしてのゲノムプロジェクトはゆっくり進行していったが、1995年に Craig Venterがインフルエンザ細菌の完全ゲノム配列決定に成功し、ゲノムプロジェクトに参入してからの劇的な展開はスリリングであった。当時米国でゲノム研究を行っていた小生は、リアルにその展開の渦中にいたと言っても良いが、私の意見では、ゲノムプロジェクトの真の推進役は Craig Venterである。進め方が猪突猛進であり、融和的ではない彼のスタイルが、公的プロジェクトを混乱させたことは間違いないが、当時傍で見ていた小生はVenterに肩入れしていたし、周りの研究者からはかえって評判が良かったのだ。彼のショットガン・シークエンス法は最初評判が悪く(とても洗練された方法ではないようにアカデミアには思えたのだ。超音波ソニックでDNAをバラバラにした、その断片を片っ端からシークエンスし、つないでいく)、細菌は小さいのでうまくいくが、高等生物では無理であろうの評価であった。しかし彼の戦略は優れていた。インフルエンザの次はピロリ菌であり、その次が「古細菌」であった。カール・リチャード・ウーズがrDNA(リボゾーマルDNA)による生物を3つにわける分類から細菌、古細菌、真核生物を提唱し、激しい議論が続いていた時代に、ゲノム解析で決定打を打った極めてインパクトの強い研究であった。
この頃の公的プロジェクト側の研究は本当に地味だったよ。米国と英国がお金を集める算段にいかに苦労したか、そんな話題ばかりだった。 Craig Venterがどんどん面白い成果をだしてくるので、公的プロジェクト側がうかうかしておられず、遅ればせながら、どんどん研究が加速するようになったというのが真相だと思います。
2000年にはドラフト版が完成し、米国大統領クリントンと英国首相ブレアがその成功を世界に喧伝した。公的プロジェクト側は Nature1冊をすべて使って、その成果を公表し、一方セレラ側はScienceにその成果を発表した。
「ステップ」
その後、遺伝子領域については配列データは洗練を極め、2013年に「参照配列」といわれる配列データが発表されたのが「ステップ」であろう。
しかし、この段階のゲノムデータは穴だらけだった。シークエンスが困難な反復配列が山のようにあり、特にセントロメア周辺は、従来のシークエンス法では攻略不可能であった。一方で、発現遺伝子(蛋白になる遺伝子)についてはほぼ全てが網羅されているから、良いではないかという意見もあったはず。小生は全く満足していなかった。セントロメアやテロメアがどんな構造をしているのか、この近傍に知られていない発現遺伝子があるのではないか・・・・
「ジャンプ」
そして2022年である。今回一分子シークエンス技術が実用に耐える時代を迎え、超ロング・シークエンス(10万塩基を延々とシークエンスする技術)が可能となって、初めて巨大な反復配列をカバーすることができたのである。
1)セントロメアにあるアルフォイド配列
2)400単位はあるというrDNA
(リボゾームDNA配列)
3)segmental duplication
ヒト・ゲノム総延長は3,054,815,472塩基なんですって。ギャップは"0"ゼロである。蛋白発現遺伝子の総数はこれまでより99個増えて、総数19,959個となった。ほぼ30年かかってここまで来たのである。私は本当に感激しているのです。論文を読み込んでいくのが楽しみだ。