Nature. Vol 447. 14 June 2007
Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project
ヒトゲノムという広大なフロンティアにはまだ我々人類が知らない未知の世界が広がっています。
ヒトゲノムの全塩基配列を解読するヒトゲノムプロジェクトがホットトピックとなってから早数年。あの頃NHKスペシャルでアメリカのセレラ社のシークエンサーが列をなしてフル稼働している映像を見て生命科学の新時代の幕開けを感じたものです。
その後の目覚ましい科学技術の進展によって加速したヒトゲノムプロジェクトによって、果たして人類はATGCの遺伝暗号が敷き詰められた広大なゲノムのフロンティアを見渡すことができるようになりました。
2004年10月のScienceにENCODEプロジェクトが発表されてから3年を待たずして、パイロットプロジェクトとして計画されたゲノムの1%にあたる30Mbの機能解析が完了し、先月Natureに報告されました。
ENCODE(The Encyclopedia of DNA Elements)はDNAの百科事典と略されますが、 遺伝暗号に秘められた機能を解き明かすゲノムワイドの実験はその名に相応しい人類の挑戦と言えるかもしれません。
そこから明らかになった知られざる転写と翻訳のメカニズムを今回のパイロットプロジェクトは提供しています。
現在のサイエンスの筆頭に挙げられるほど目覚ましい進展を続ける生命科学は個々の遺伝子の分子生物学的研究の膨大な蓄積によって相当の機能解析がなされていることは事実です。
けれどENCODEでしかできない研究、つまり国際的視野に立って各国の専門家と資材を科学的インフラとして統合し、各国の秀逸な人材と巨額の資金を投じる世界規模の共同研究にはそれにしかできない大きな成果が期待できます。
パイロットプロジェクトの対象とされた30Mbは44のゲノム領域に位置していて、15Mbは既に生物学的解明が成されている14領域で、残りの15Mbは無作為抽出法によって選択された30領域に位置しています。
ENCODEでは分子の挙動である生化学的機能とその結果の個体の生物学的役割を明確に区別しています。
前回の記事の内容と重複する知見もありますが、ゲノムはかなり広汎に転写されること、多くのNon protein coding transcriptsが同定されたこと、これまで知られていなかった多くの転写開始点が同定されたこと、転写開始点周囲の制御配列は決して上流優位なのではなく対称に分布すること、染色体とヒストンの修飾が転写開始点の存在と活性を強く予測すること、実験によって機能していることが明らかになった領域と進化的に保存されている領域は必ずしも重複しないこと、多くの機能的要素が哺乳類間で保存されていないこと、つまり生化学的活性はあるものの個体として特異的利点がない、機能的に保存されているが種間で非相同遺伝子的要素であることなどが明らかになりました。
ENCODEは機能解析ですからシークエンスをひたすら行うヒトゲノムプロジェクトとは全く異なり、ゲノムワイドの多くの実験の統合です。35グループがタイリングアレイ、RT-PCR、ChIP-ChIP、RACE、EST、CAGE、PETなどのデータを統合してウェットとドライの結果を出しています。
内容は非常に濃いのでここでは詳しくは説明しません。この論文一つを完全に理解すれば現在のゲノム科学を知ることができると言っても過言ではないような気がします。必要とされる知識も多く、僕も完全には理解していません。
このプロジェクトが終了する未来にライフサイエンスはどうなっているんだろう。
僕は理由なく未来のサイエンスへの興奮を覚える。
“The great ocean of truth lay all undiscovered before me.”
ニュートンが感じた海はいつの時代もサイエンティストの心の中に広がっている。