A family of long reiterated DNA sequences, one copy of which is next to the human beta globin gene
J.W. Adams*, R.E. Kaufman*, P.J. Kretschmer+, M. Harrison+ and A.W. Nienhuis*Clinical Hematology Branch, National Heart, Lung and Blood Institute, National Institutes of Health Bethesda, MD 20205, USA
+Laboratory of Molecular Hematology, National Heart, Lung and Blood Institute, National Institutes of Health Bethesda, MD 20205, USA
LINEの最も初期の(最初の?)論文の一つはこれ↑である。1980年である。シークエンス技術が漸く芽生えたかどうかという時期である。技術的にはサザン法が全盛のころである。よく見つかった もんだと思うが、しかしヒトのゲノムDNAを探索していた研究者にとっては、やがてうるさくてしょうがないほどよく見る、うっとおしい配列単位となってきたはずだ。どこにでも顔を出す目障りな変なやつ。ヒトゲノムは30億塩基あるがこの16%はLINEの配列で占められていることが今では分かっている。ヒトゲノム中で約5億塩基はLINEの配列なのだ。これらの配列は全くのジャンク(くず)と呼ばれてきたし、ほとんど存在が意味不明なのである。なのに、ヒトの正確な DNA複製機構を利用して、この「くず配列」は子孫に正確に伝えられ続けていくのだ、5億塩基も!
この意味不明の配列に取り憑かれた人々がいる(小生もその一人だ)。まだ知られていない生命の神秘のヒントがありそうだと思う訳だ。反復配列にはいろいろあるが、LINEは相当高等生物にならないと出現しない。それならば高等で複雑な生命体へのヒントになりやせぬか。目の前に「意味不明ながら興味津々のパターン配列が5億塩基もあるのである」小生など興奮したものだ。
LINEの話はそれほど難しい話ではないが、それでも順を追って話さないとわからないかもしれない。試みよう。
- LINEというのはゲノム反復配列の一種であり、数百塩基から時に数千塩基の長さのお互いによく似た遺伝子配列である。基本モチーフがありその最大長は6.5kbであるが、多くはそれほど長くはなく、基本モチーフの大部分が欠け去った残りのゴミのような配列(しかもその配列は変異を山のように抱え込んでいるので、元のモチーフとはかなり変わっている)である。ゲノムをシークエンスしていくと、数キロおきにそのコピーが現れる。またかと思うくらいその数は多い。反復配列と言われる由縁である。
- 理解を容易にする為に、まずactive LINEの話をしておこう。
LINEには完全長のフルシークエンスがあって、ゲノムサイズでは6.5kbであることが知られている。しかもそいつらは発現するのである。完全長の発現 可能なLINEのことをactive LINEと呼んでいる。そう、遺伝子なのである。しかも全ゲノムン中に散在している。2個ではないのかって?そうです。複数ある。正確な数は今もって不明 だが、60コピーくらいはヒトゲノムにあるようである(LINEの大家であったKazazian教授の90年代の後半の総説には30個内外と書いてあった が、最近の総説では60個くらいと記述がある。
- active LINEは何をするのか?
大きく2つの領域からなっている(エクソンみたいだ)。一方はウイルスゲノム様の構造をもつ。他方の配列が問題である。ヒトの細胞内で発現してほしくない蛋白なのだ。これ「毒素配列」といってもよい。なぜならこれは「逆転写酵素」配列なのだから。この逆転写酵素は発現したactive LINE RNAから自分自身のDNAを複製するのである。このコピーは既にゲノム中に散在するLINE配列と相同性が高いので、この相同性をもって別の場所にDNA配列を挿入する。
- 自分自身はそのままの構造を保ちながら、自分のコピーを周りのゲノム中にまき散らすシステムを形成しているわけだ。
- 逆転写酵素活性をもつ蛋白はヒトでは2種類しか知られていない。一つはテロメラーゼであり、今ひとつがLINEというわけだ。毒素であると前述した。この酵素が周りのmRNAを次々にDNA化したとしたら、細胞内はわけの分からない無秩序な世界になっていただろう。セントラルドグマの破綻なのだから。だから毒なのだ。
- 幸いこのLINEの「逆転写酵素」はsis-actingであると説明されている。すぐ近傍に存在する遺伝子配列(つまりLINEのRNA転写物)しか基質にならないというわけだ。他のRNAは相手をするには遠すぎるということ。遠くにある配列も相手にできるということをtrans-actingという。普通のDNA polymeraseはtrans-actingな酵素だ。
- しかしこれもどこまで保証されているのかだれも知らない。LINEが極めて活発に転写されている細胞があったとしたら、LINE以外の遺伝子が影響をうけていることも「理屈」ではありうる。
- さて、自分自身はそのままの構造を保ちながら、自分のコピーを周りのゲノム中にまき散らすシステムと前述したが、これがゲノム中にLINEがこれほど多く存在する理由だ。数百万年以上かけてゲノムにコピーがまき散らされたということである。そして埋め込まれたコピーは数百万年以上かかって、短く刈り取られていった(変異脱落していった)。active LINEはそれほどコピー数を増やせなかったようである。
- なぜactiveは少ないのか? 一つの理由は「逆転写酵素」の精度が低いからであろう。もう一つはプロモーターの問題かもしれない。
- 以上が現代のホモサピエンスが16% 5億塩基のLINE 配列を抱えている説明(とされるもの)である。誰も見た人はいないのが、この世界の通例であるが、おそらくこんなものであろうと小生も思います。
0 件のコメント:
コメントを投稿