がんの分子腫瘍学・遺伝学: 05/01/2022

2022年5月14日土曜日

コロナ対策に役立つホームページ:　2年ぶりに更新

コロナ対策に役立つホームページ

新型コロナが出現してほぼ2年５ヶ月がたつが、この間様々なホームページ(HP)が立ち上がった。

世の中の皆さんはどこを参考に日々を過ごしておられるのだろうか？

私が毎日定点観測をするHPは数箇所であるが、これを掲げておこう。これ以外に優れたHPがあれば教えてもらえるとありがたいと思います。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

という記事を投稿して二年たつ。この間、自分が仕事で参考にするホームページを更新してみよう。

前回と変わったような、変わっていないような。

世界の動きは二箇所

１.　　Financial TimesのHP

ここは知らない方が多いのではないか？　このHPは小生の最も好むHPです。こんなHPをよく作れるものだと感心する。リタラシーが高いよなあ。私は３月中途から欠かさず毎日見続けている。

と前回書いたが、二年たちやはり参考にし続けている。定点観測としては、ここが最も参考になる。ワクチンの接種進行状況や国別罹患状況などやはり大したHPである。

かつて参考にしていたJohns Hopkins（https://coronavirus.jhu.edu/map.html）や新型コロナウイルス感染速報　（https://covid-2019.live/）、東洋経済新聞（https://toyokeizai.net/sp/visual/tko/covid19/）、は今では殆ど見ない。

2.　　World Meter : Corona Virus（https://www.worldometers.info/coronavirus）

国別の最新情報を一度に見たいときはここだ。一年以上参考にしている。米国やドイツの動きなどなど、リアルにわかる。

国内情報は３箇所

これは公的な情報がありがたい。

1.　　小生居住区の県庁のHPはかなりの優れものだと思う。

2.　　厚労省のアドバイザリーボードの発表資料

毎週月曜日の夜に公表される。生情報の羅列であり、洗練とはほど遠いが、かえってリアル。時々珠玉のデータが交じる。

忘れてはいけないのが

3.　　NPO法人日本ECMOnet：COVID-19 重症患者状況の集計

である。感染が始まった頃から、ここの集計表は本当に誠実に書き換えられているし、全国の重症患者の動きが優れてよく分かる。誰がやっているのだろうと思いますが、感謝します。

時々でてくる「ECMO」の救命率の進歩などのコラムが楽しみである。

大御所たちの珠玉のレポート

1.　　黒木登志夫先生

　　　コロナ禍を科学者として、広い視野から概説してくれるありがたいレポートです。

　　　月イチの頻度でレポートがでます。楽しみにしています。

２．　古川俊治先生

　　　国会議員の古川さんの「コロナ白書」である。網羅的であり、これまで６回くらい書き換えられた。二年前の６月に最初の版が出たときは４０ページだったものが、最近の版は１２００ページもある。世界の中でも希な、包括的レポートであろう。文書通信交通滞在費はこういう使い方をしてほしい。素晴らしいが、一読拝見とはいかない（なにしろ量が膨大）。参考文献を探しに行くのに最適である。国会議員でこの「白書」を更新されていることに敬意を表する。

３．　山中伸弥先生

　　　以前ほどの勢いがなくなったのは残念ですが、それでも上記お二人のレポート更新時には、きちんと報告してくれるので助かります。

これ以外にご存じの方があれば、ぜひお教えいただければ幸いです。

2022年5月7日土曜日

今回の発表6論文の概説：教科書が書き換えられる内容です。

今回のScienceの発表では論文が６篇同時公開されている。一冊丸ごとゲノムプロジェクトに捧げた2000年の「ホップ」ステージの Nature論文（発表は2001年）に比べると随分地味であるが、これもこの22年間の学問の進化と成熟を示すものだろう。世間的なインパクトは地味ですし。

さてこの6編であるが先頭から

Epigenetic patterns in a complete human genome

Segmental duplications and their variation in a complete human genome

From telomere to telomere: The transcriptional and epigenetic state of human repeat elements

A complete reference genome improves analysis of human genetic variation

Complete genomic and epigenetic maps of human centromeres

The complete sequence of a human genome

この6編を概説する能力は小生にはないが、それでもそのそれぞれにおける個人的興味・観点を述べることはできる。では先頭から順番にたどっていこう。

これまで明らかでなかった領域、セントロメアや様々な反復領域のメチーレーションmapを作ったこと。6人の個別ゲノムパターンや臓器別パターンを示す。
ヒトゲノムは二倍体であるが、更に個別の遺伝子については多倍体があることが知られている。パラログ・オルソログなどで知られる3番目、4番目のコピーは比較的最近多倍体化したといわれているが、その中でも「分節的重複」とでも訳すのであろうか「Segmental Duplication(SD)」が今回41528個カタログ化された。その分布概観が報告されている。
ゲノムの 16%はLINE、10%は SINE(Alu)なる反復配列が占める。ショットガンで局所的ゲノム・シークエンスを試みるレベルでも、これら配列に悩まされる。それほど数と頻度がただならぬ。この論文ではそのLINE,、SINEを始めとして様々な反復配列のゲノム存在様式が報告される。とともに、小生にとっては待ちに待った「発現している反復配列」の全貌が述べられている（ようだ）。詳細はまだ読んでいないが、参考文献中に敬愛するKazazianの論文が5篇も引用されているし、 active LINEなる用語も論文中にパラパラでてくる。個人的にはもっとも楽しみな論文です。
中を見ていないが、これまでで最も参考になる「参照配列」が作れましたよ、という話だろう。ただこのシークエンスのソースは一個人由来の「胞状奇胎」細胞株であるから、今後この「参照配列」はすぐにバージョンアップされる運命にあるだろう。細胞株ではなく、真の「in vivo」な材料によるシークエンスが近々に望まれる。
セントロメアの構造である。
そして核になる主論文

こうしてみると、この発表とてもよくできているが、一般の研究者や臨床家には一見どうでもよい瑣末なカタログ、にしか見えかねないのが気がかり。反復配列やセントロメアなんか興味ないかもしれないね、皆さん。

ただ、これは本物の研究成果であり、少しでも生物学をかじったことがある人間なら、概説だけでも勉強して、ご自分の遺伝学のフレームをアップデートしておくべきだと思う。これはもう教科書が書き換えられるレベルの研究成果だということです。従来であれば100ページかかって、ああでもない、こうでもないと議論されていたことが、10ページ程度ですっきり記述されたのだから、一度きっちりリフレッシュしておいてよいのではと思います。もっともオリジナルの論文は専門的だからハードルは高いと思います。であるがゆえに・・・・・・

だれかブルーバックスを書いて欲しい。あるいは出来のよい総説を書いてほしい。

問題は教科書方面であるが・・・

T.A.Brownは直ちに彼の教科書「Genomes」を書き換えなくてはいけない。今は ver 4ですがすぐにver5にすべきだ。昔から「Genomes」はBrownが一人で書いているのだから、やればすぐにできるでしょう。徹夜でやってほしいね。

Tom Strachanも徹夜組です（笑）。

ThompsonやHartwellも頑張ってください。こちらはゆっくりで良い。

2022年5月6日金曜日

反復構造（２）セントロメアとペリセントロメアについて

セントロメア構造であるが、概略は下図である。

その詳細には全く通じていないが、頑張って概説すると中央のαSatがアルフォイド反復配列である。下にrepeat unitとあるがここでは171塩基と表示。これが数Mベース続くのだ。この重層構造は更に解説が必要だ。（後日待たれい！）

次にその周囲をHSatと呼ばれる別の反復配列が取り囲む。この反復単位は４２，６２塩基〜と表示されている。この中に蛋白を作る遺伝子は埋もれているのであろうか？

クリックで拡大します↑

この図は総説であるが、次いで各染色体に移る。まず一番染色体を見てみよう。

下のシェーマは一番染色体である。具体的な番地が記されているが、最上位にこのセントロメアが一番染色体の端から１億２千３５０万塩基〜１億３千万塩基の間の拡大として見ていることがわかる。一番ではペリセントロメア・セントロメアの長さが20Mbあることがわかる。一番染色体は全長250Mbであるから8％程度である。αサテライトだけだと4.5Mbであり1.8%ということになる。

皆さん、この数字新鮮ではないでしょうか！僕などはこれだけでも目が覚めるのだ。臨床で核形分析（karyotype）を一回も見たことがない人はいないと思います。白血病や婦人科不妊外来などでは日常茶飯事の検査でしょうし、外科臨床でも時々は見る。その本体がついに、解き明かされたということです。数字が実にリアル。下の方の記述にに染色の縞が出てくるけど、ギムザなどによるこの「縞」がなぜできるか、その本体がなんなのか、ヘテロクロマチンとかユークロマチンの本体はなんなのか、そのような疑問を小生はずーっと思っていたわけです。今回その全てが解決したわけではないだろうが、それでも染色体がずっとリアルなものになっていくのが実感できているわけです。

追記：古典的な核形分析についての解説（主に手法について）はこのHPなど。

下図にはD1Z７という表記がαサテライトに振られている。どうやらD1が一番染色体、そしてZ7というのがαサテライトのサブタイプに相当するようだ。そしてその外にHSatが取り囲むが、この一番ではとりわけ長腕側の13.2Mbに及ぶHsat2反復配列領域が巨大である。

上から３列目に注目してください。ここには遺伝子構造が表記されている。IncRNAや転写される偽遺伝子（昔はとんでもなく興奮したが、今では当たり前のように登場する）も多いが、この中には蛋白をコードする遺伝子（赤色）も確かに二個存在する。これ周辺のサテライト構造(HSat2)のど真ん中である。

クリックで拡大します↑

最後に染色体ごとのセントロメア（＋ペリセントロメア）構造を比較的大きな（そして単純な）第２〜４染色体で紹介する。メタフェースでDAPI染色すると濃く染まっていたのはHsat1なのだろう。そしてαサテライトはこの３本の間でも随分異なることがわかる。２番や４番は長いのに対し３番はとても短い。

大きな染色体は単純である。このあと出てくる短腕の短い５本の染色体は相当複雑である。また９番も随分複雑である。シークエンスはさぞ大変だっただろうと推察される。

さて今回はこれくらいにさせていただく。

2022年5月5日木曜日

反復構造（１）：アルフォイドについて

アルフォイド配列

ヒト染色体のcentromeric heterochromatinに見られる反復DNA配列の複雑なファミリーである。アルフォイドファミリーは、170塩基対のセグメントのタンデムアレイから構成されている。異なる染色体から単離されたセグメントはコンセンサス配列を示すが、個々の塩基に関しても違いがあり、170塩基対の単位では40%も配列が異なることがある。この繰り返し配列は、数個のユニットがタンデムに並ぶグループに整理され、さらにこれらのグループは1〜6キロベースの長さの大きな配列に整理される。これらの大きな配列が繰り返され、0.5～10メガベースの大きさの配列が形成される。このような大きな、つまり「マクロ」なDNAリピートは染色体特異的である。アルフォイド配列は転写されないので、染色体サイクルの中でまだ定義されていない構造的な役割を担っている。アルフォイドDNA内の配列の変動は、高い頻度でRFLPを生じさせる。これらは遺伝するため、特定の個体やその近親者のDNAを特徴づけるために用いることができる。 (Oxfordより）

下図は

Exp Cell Res Vol 389, Issue 2, 15 April 2020,.から引用。かずさDNA研の大関先生・・・

上図中央の緑三角が170塩基の1単位で具体的な遺伝子配列は下図。

コンセンサスを数えると170程度である。この小単位にCENPと呼ばれる蛋白群が連なり、更にキネトコア蛋白群がくっつき、これが微小管につながる。これはDNAの複製が終わり、そろそろ細胞分裂を始めようかというタイミングで二本のDNAが離れていくための装置である。

複製が終わったばかりの染色体DNAはまだ裸であろう。ここにいろんな化粧が施される。3次構造も複雑に織り込まれていく（なんせ、凝縮した太い染色体をみることができるのは、このタイミングだけだし、私達の染色体イメージは通常の染色糸状態とはかけ離れたものである。Diploid状態も異常なのだ。）

とはいえ一見分離誘導されるだけのために、どうしてこれだけの蛋白が必要なのか不思議でしょうがない。

これは1992年にカルフォルニア大学からでているものを引用。

2022年5月4日水曜日

今回の完全ゲノム配列決定について（１）

この論文の意義はこれまで存在したギャップを完全に埋めてしまったことです。

これで初めてゲノムプロジェクトが終了した、完了したといって良いのではないかと思う。

ゲノムプロジェクトを３段飛びに例えてみたい。

「ホップ」

ゲノムプロジェクトは米国の国家プロジェクトとして1990年に始まった。国家プロジェクトとしてのゲノムプロジェクトはゆっくり進行していったが、1995年に Craig Venterがインフルエンザ細菌の完全ゲノム配列決定に成功し、ゲノムプロジェクトに参入してからの劇的な展開はスリリングであった。当時米国でゲノム研究を行っていた小生は、リアルにその展開の渦中にいたと言っても良いが、私の意見では、ゲノムプロジェクトの真の推進役は Craig Venterである。進め方が猪突猛進であり、融和的ではない彼のスタイルが、公的プロジェクトを混乱させたことは間違いないが、当時傍で見ていた小生はVenterに肩入れしていたし、周りの研究者からはかえって評判が良かったのだ。彼のショットガン・シークエンス法は最初評判が悪く（とても洗練された方法ではないようにアカデミアには思えたのだ。超音波ソニックでDNAをバラバラにした、その断片を片っ端からシークエンスし、つないでいく）、細菌は小さいのでうまくいくが、高等生物では無理であろうの評価であった。しかし彼の戦略は優れていた。インフルエンザの次はピロリ菌であり、その次が「古細菌」であった。カール・リチャード・ウーズがrDNA（リボゾーマルDNA）による生物を３つにわける分類から細菌、古細菌、真核生物を提唱し、激しい議論が続いていた時代に、ゲノム解析で決定打を打った極めてインパクトの強い研究であった。

この頃の公的プロジェクト側の研究は本当に地味だったよ。米国と英国がお金を集める算段にいかに苦労したか、そんな話題ばかりだった。 Craig Venterがどんどん面白い成果をだしてくるので、公的プロジェクト側がうかうかしておられず、遅ればせながら、どんどん研究が加速するようになったというのが真相だと思います。

2000年にはドラフト版が完成し、米国大統領クリントンと英国首相ブレアがその成功を世界に喧伝した。公的プロジェクト側は Nature１冊をすべて使って、その成果を公表し、一方セレラ側はScienceにその成果を発表した。

「ステップ」

その後、遺伝子領域については配列データは洗練を極め、2013年に「参照配列」といわれる配列データが発表されたのが「ステップ」であろう。

しかし、この段階のゲノムデータは穴だらけだった。シークエンスが困難な反復配列が山のようにあり、特にセントロメア周辺は、従来のシークエンス法では攻略不可能であった。一方で、発現遺伝子（蛋白になる遺伝子）についてはほぼ全てが網羅されているから、良いではないかという意見もあったはず。小生は全く満足していなかった。セントロメアやテロメアがどんな構造をしているのか、この近傍に知られていない発現遺伝子があるのではないか・・・・

「ジャンプ」

そして2022年である。今回一分子シークエンス技術が実用に耐える時代を迎え、超ロング・シークエンス（10万塩基を延々とシークエンスする技術）が可能となって、初めて巨大な反復配列をカバーすることができたのである。

　　　　　　１）セントロメアにあるアルフォイド配列

　　　　　　２）400単位はあるというrDNA

　　　　　　　　　　（リボゾームDNA配列）

　　　　　　３）segmental duplication

ヒト・ゲノム総延長は3,054,815,472塩基なんですって。ギャップは"0"ゼロである。蛋白発現遺伝子の総数はこれまでより99個増えて、総数19,959個となった。ほぼ30年かかってここまで来たのである。私は本当に感激しているのです。論文を読み込んでいくのが楽しみだ。

2022年5月3日火曜日

Nanoporeシークエンスの原理をおさらいしておこう！

Nanoporeシークエンスの原理について簡単に復習しておこう。

スマホと同じくらいの大きさのデバイスを10万円で購入する。製品名は「MinION」。カバーを開け、前処理済みのDNA（RNA)溶液を滴下。一枚の膜に2048個のポアと呼ばれる蛋白が埋め込まれている。この蛋白は、細菌のタンパク質CsgG（Cell Surface Glycoprotein)あるいはその派生物が用いられるが、これは膜貫通型のチャネル蛋白質と考えれば良い。DNAはこの穴の間をするすると流れ通っていく。

「流しそうめん」のイメージだ。二本以上通らないのか、一本も通らないポアがあるのでは？　これはポアソンの確率によるのだと理解すれば良い。

動画でみるように、DNAは断端処置がされている。アダプター配列（ポアとは別に膜表面に生えているtether[つなぎ縄]と親和性があり、DNA鎖をポアへ誘導。）とDNAポリメラ➖ゼが結合している。このポリメラーゼには2つの役割があり、一つは二重鎖の開裂であり、DNA二重鎖はこれで一本鎖になる。今一つは一本鎖DNAがポアに突入するスピードを一定値にコントロールする役割であり、これは後述電位差データをより正確に測定するために必須の機能であり「Stepping Motor」と表現されることもある。

以前の報告ではDNAの通過スピードは毎秒1000塩基とされていたが、現在では400塩基と記述される。2048個のポアがあるので、100％の効率なら一秒間のシークエンス数は81万9千。~~一秒間のリード数（Read数）が82万~~、分速で5000万、時速で30億ということだ。

奇しくもヒトのハプロイドゲノム塩基数に等しい。設計段階で幹部から「一時間でヒトゲノム解析が可能なスピードにしろ！」という必達目標が厳命されたに違いない（笑）。

追記）古びた頭で間違ったことを書いてしまった。しれっと訂正するより、自分に対する教育もあるので、追記で書きます。上記一秒間のリード数（Read数）が82万は全く間違いです。一リードはDNA一本という意味でした。だから８２万リードも読めるわけがない。ちなみに１リードの最高値のめやすは200ｋオーダーと書かれている（２０万塩基！！）だから、この一本を読むのには５００秒かかる。およそ８分間、延々と読み続けるわけです。

ちなみに「MinION」とは古い英語で子分、召使いという意味です。お気に入りという意味もあるようだ。

2022年5月2日月曜日

二年ぶりの投稿：T2Tゲノム・プロジェクトと私の興奮

二年もの間投稿が途切れていたこのブログであるが、この間、ときどき自分で自分の書いた文章を確認することはあり（特にコロナ関連文献）、更にこのところGoogleでググると、自分のブログに誘導されることもあり、全く存在を忘れていたわけではなかった。

久しぶりの書き込みだから、どうせ読んでくれるヒトもいないだろうが、なぜ書きたくなったかだけ記録しておく。（とはいえ、このブログさきほどから書き込んでいるが、プラットフォームが随分変わっておりとても書きにくいなあ。最終形が予測できない入力フォームである、とほほ）

今年になり、いくつかの幸運が重なって、小生が遠ざかっていた雑誌媒体に、再度アクセス可能な状況になった。卒業した大学から「名誉称号」を頂き（大した称号ではないです）、それに付随する特権として電子図書館へのフリーアクセス権を与えられたのである。アカデミアにいる人々にはなんでもないことであろうが、私のような民間人には、これはありがたみのある特権なのだ。ほとんどの雑誌にアクセスできるのは嬉しい。NEJM、Science、Natureなどは時々見ていたから懐かしさはないが、PNAS、Journal of Cellular Biology、Journal of Immunology、Cancer Researchなどは10年ぶりなので、本当に懐かしい。昔に比べるといずれも、素っ気ない目次なのが意外である。以前はもっと派手な意匠を凝らしていたと思ったが。

もっとも久しぶりに中身を覗いて、読もうと思えるような雑誌ではすでにない。JIやJCBを10年ぶりに見て、すぐに読みこなせたら大したものだと思う。第一、読みたくなるようなタイトルがない。ほとんど意味不明だ。

昔はできていた"Browsing"が今はできないのが残念だ。この"Browsing"というのは雑誌の一ページ目から順繰りに最終ページまで読めるスタイルのE-magazineである。サイエンスなんて、薄い雑誌だったので、これができていた時代は、本当に冊子体とおなじイメージで読んでいたが、これがいつの間にかできなくなっているようだ。残念。

さてそのサイエンスを久しぶりに読んだら、ゲノム・プロジェクトの最前線の記事が載っていた。Telomere to telomere (T2T)というプロジェクトであり、ギャップなしで端から端までシークエンスしたという記事であった。世の中はこんなのが流行っているのかと興奮したが、実は流行っているわけではなかった。ゲノム・プロジェクトの最終局面であるこの報告は、本当に久しぶりの大快挙であり、本当に久しぶりのbig reportだったということなのだ。

この記事にいきなり、久しぶりにぶち当たった小生は、やはり運が良いと思った。小生のためにこのレポートが今頃出版されたのだろう（笑）と確信する。このレポートは（若干難しいところはあるが）なんとか読めるぞ。Karen Migaという女性研究者が、今の主役らしい。もう一つの主役は、なんとNanopore Sequenceである。2011年ころNanopore Sequenceの記事を書いたことがあるが、あれがものになるんだねえ。大したものだ。アルフォイドの反復配列の山脈を乗り越えるにはsingle molecule sequenceしかないと思っていたが、すごいよ最近は。なんせ、最長Read（一回で連続いくつ読めるか）は 200kを超えるらしい。20万塩基である。 overlapping contigではないのだ。single read (with no gap!)なのだ。小生がショットガンを1995年〜97年やっていた時代は、ベクターで拾っていたのでまあ700塩基読めれば最良だった。これを「しこしこ」contigにつなぐ。

素晴らしき哉、この技術的革新！ーそれはそれとして問題は中身である。どんな新しいことがわかったのか？興味津々であり、何回かに分けてメモしておこうと思う。

がんの分子腫瘍学・遺伝学

2022年5月14日土曜日

コロナ対策に役立つホームページ:　2年ぶりに更新

3.　　NPO法人日本ECMOnet：COVID-19 重症患者状況の集計

2022年5月7日土曜日

今回の発表6論文の概説：教科書が書き換えられる内容です。

2022年5月6日金曜日

反復構造（２）セントロメアとペリセントロメアについて

2022年5月5日木曜日

反復構造（１）：アルフォイドについて

2022年5月4日水曜日

今回の完全ゲノム配列決定について（１）

2022年5月3日火曜日

Nanoporeシークエンスの原理をおさらいしておこう！

2022年5月2日月曜日

二年ぶりの投稿：T2Tゲノム・プロジェクトと私の興奮

ブログアーカイブ

自己紹介

2022年5月14日土曜日

3. NPO法人日本ECMOnet：COVID-19 重症患者状況の集計

2022年5月7日土曜日

2022年5月6日金曜日

2022年5月5日木曜日

2022年5月4日水曜日

2022年5月3日火曜日

2022年5月2日月曜日

ブログ アーカイブ

自己紹介

3.　　NPO法人日本ECMOnet：COVID-19 重症患者状況の集計

ブログアーカイブ