1000人ゲノム・プロジェクトは来年の終わりまでに2,500人のゲノム・シークエンスを終了
1000人ゲノム・プロジェクトについて最初にブログに書いたのは2008年だからもう2年になる。
1000人ゲノムプロ ジェクト(1)
http://cancerbiology.blogspot.com/2008/02/1000.html
1000人ゲノ ムプロジェクト(2)
http://cancerbiology.blogspot.com/2008/02/1000_24.html
その後の進行が気になっているのだが、なかなか情報が一般メディアには出ないので果たして順調なのかどうか不明であった。最近 ネットサーフィンしてみたら、5月に記事が出ていた。土曜の朝を利用して、ちと訳してみよう。
1000 Genomes
A Deep Catalog of Human Genetic Variation
http://www.1000genomes.org/page.php
2010年5月14日
アン ドレア・アンダーソン
1000人ゲノム・プロジェクトは予定通り進行中であ ることがこの5月 に中間報告され、プロジェクト代表ウェルカムトラストサンガー研究所の生命情報工学リチャード・ダービン博士によると、およそ500人分のサンプルが今月末(2010年5月)までにシークエンス されたと報告した。今年の夏までに1,100個のサ ンプルをシークエンスする予定である。2010年度中には1,900個におよぶゲノムサンプルがシークエンス終了し、更に2011年の終わりま でに約2,500個のサンプルがシークエンスされるはずだ。これら のシークエンスにはインドと南アジアからのサンプルが含まれている。
現 時点までのデータシミュレーションによると、ヨーロッパに住む人々のゲノムには1900~2000万におよぶSNPsが存在するようだ。そのうち1パーセント以上の遺伝子座頻度を持つSNPsは800 万個であり、0.1~1パーセントの頻度があるものは600万SNPs、単独で存在するSNPsが250万である。
この数年間に1000人ゲノム・プロジェクトでは準備段階としてのパイロット・スタディとして、ヨーロッパとアフリカ人由来のトリオ(父と母および子供のゲノム・セット)の高密度シークエンス、3つの人種別に60人を選び比較的ラフなシークエンス、700人のエキソン・シークエンスを行った。これらのパイロッ ト・スタディによりヨーロッパ人トリオからは400万 種類、アフリカ人トリオからは500万種類のSNPsが見つかった。そしてラフ・シークエンス研究からは1450万SNPsが、エクソン・シークエンス研究からは12700個のSNPsが同定された。 なおこれらの研究により何千もの欠失、構造変異、トランスポゾンによる挿入も見つかっている。パ イロット・スタディによりいわゆるありふれた多型・変異情報はすでに充分に得られたと言っても良い。さらにこれらの情報はプロジェクト本番研究に大きな示 唆を与えたのである。低密度データセットで特定された1450万SNPsのうち約800万は新規多 型であった。そして100万個を超える新規 SNPsはヨルバ族(これはアフリカ)にユニークなものであった。一方、高密度データ(トリオ由来)は塩基の置換速度を教えてくれる。例えば細胞株における塩基置換の頻度 は体細胞系列の変異速度の約7~12倍速いことがわかった。
これまでのところ数百症例を対象に多型変異を見出そうとするなら解析は低密度解析で十分であることを示唆している。
1000 Genomes
A Deep Catalog of Human Genetic Variation
http://www.1000genomes.org/page.php
☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆
当初の予定よりも対象症例の数が増えている。1000と2500ではえらく違うではないか。ここ数年、シークエンスコストが低減したということなのかね?それとも戦略目標ー簡単にいえばcoverage rateーを変更して、よりラフな楽なシークエンスに代わったのかね?このあたりのことが知りたい。
初めてコメントさせていただきます。
返信削除>ヨーロッパとアフリカ人由来700組のトリオ(父と母および子供のゲノム・セット)の高密度シークエンス、
Over the past few years, the 1000 Genomes Project has undertaken a set of pilot projects including high-depth sequencing of European and African trios, low-coverage sequencing of 60 individuals from each of three populations, and exon capture and sequencing of 700 samples.
トリオのサンプルの解析数は、
CEUとYRIでそれぞれ1組ずつです。
http://www.1000genomes.org/page.php?page=about#ProjectDesign
http://www.1000genomes.org/docs/PilotsSummary.pdf
誤解があってはいけないと思い、コメントさせていただきました。
700組2100人の高密度シーケンスをやってたら、とんでもない金額がかかってそうですね。
fifthdoorさん
返信削除コメントありがとうございます。確かに700サンプルを700組と間違っておりました。訂正させて頂きます。このブログをお読みの方がいらっしゃるとは驚きです。備忘録のつもりで書いておりますが、なにかありましたらよろしく書き込んでいただけますと幸いです。
うまくコメントがウェブの画面に出せませんので、fifthdoorさんコメントを本分に再掲させて頂きます。
重ね重ねありがとうございました。