ディープラーニングによる細胞の階層的構造や機能のモデル化

Using deep learning to model the hierarchical structure and function of a cell.

Ma J, Yu MK, Fong S, Ono K, Sage E, Demchak B, Sharan R, Ideker T. Nat Methods. 2018 Mar 5. doi: 10.1038/nmeth.4627. PMID:29505029

「遺伝子型から表現型をすべて説明できるようになる」のは、遺伝学・システム生物学の究極のゴールでしょう。

じゃあどうなったらすべて説明できたことになるのか? 私はその一つの方法が、「全細胞の数理モデル化」だと思っています。遺伝子型を変えたらそれがどのように反映されるかを、そのモデルが再現する。それが実際の細胞で起きることと完全に一致したら、そのとき上記のゴールに達したと言っていいでしょう。

じゃあその数理モデル化の方法は? 1つのやり方はシミュレーションです。細胞内で起きていること、例えば転写や翻訳、複製などをなるべく分かっているメカニズムのまま再構築して動かす。以前このブログでも紹介した、マイコプラズマの全細胞シミュレーションがそのアプローチの一つです。

もう一つ、間違いなくできると思われているもの(私が思っていたもの)が人工知能による全細胞のモデル。こちらはおそらく、メカニズムを再構築するのではなく、「知識を再構築するモデル」になると予想していました。そして、やっぱりやっている人はいて、「遂に(と言うか、もう?)そのモデルが発表された!」、とこの論文のタイトルを見て私は思いました。

ただ、実際にはこのモデルの「ウリ」はそういうことではなかったようですし、このモデルの利用価値はまだ限られているように思いました。

前置きはこのへんで。

この論文の主旨は、「Gene Ontologyをベースにして作った階層的なニューラルネットワークを、遺伝子破壊・二重遺伝子破壊の表現型(増殖)をもとにトレーニング(ディープラーニング)したら、とても予測精度の高いモデルが出来た。しかも、前情報なしで作ったニューラルネットワークではできなかった、モデルの中で起きていることが人間に見えるモデルになった。」というものです。

Gene Ontologyは、文献情報(知識)をもとにつくられた細胞・遺伝子の機能を説明するための語彙で、それ自身が階層構造を持っています。その階層構造をニューラルネットワークで再構築してモデル化するというのが、なるほど斬新。そして、このモデルはまさに予想していたような「知識を再構築するモデル」という事になります。

ただ、実際にはその試みはこの論文が初めてではなく、同じ筆者らの1つ前の論文(以下)で行われました(この論文、私は見逃していました)。

Translation of Genotype to Phenotype by a Hierarchy of Cell Subsystems.

Yu MK, Kramer M, Dutkowski J, Srivas R, Licon K, Kreisberg J, Ng CT, Krogan N, Sharan R, Ideker T. Cell Syst. 2016 Feb 24;2(2):77-88. PMID:26949740

 この論文では、「Gene Ontologyをもとに階層構造を持つモデル(この時はニューラルネットワークではなかった)をつくりトレーニングしたら、今までの数理モデルよりも予測精度が高かった」ことを示してます。「(Gene Ongologyという)語彙を数学的に連関させたら全細胞モデルになる」なんて、なんてすごい発見なんだろうと私は思いました。
で、この論文をうけて今回の論文ではこの階層モデルをニューラルネットワーク化した。すると、さらに予測精度が上がった(筆者らは、「実験で観察されるのと同じくらいの精度」と言っています)。実際には、Ontologyによる拘束条件をつけずに作ったニューラルネットワークをディープラーニングしても同じような精度のモデルはできるようです。ただ、その場合にはそのモデルの予測の中身について生物学的な解釈を行うことができない。だから、今回の「見えるニューラルネットワーク(VNN)」は生物学的に役に立つということになるわけです。
一方で、すでに分かっている知識をもとに作られたGene Ontologyをもとにネットワークを作っていて、かつ内部メカニズムがないモデルなので、ここからどのような新しい生物学的がなされるのか、ちょっとはっきりしません。モデル構築の1つの目的は、分かっていることと分かっていないことをはっきりさせて、新しい実験のヒントを与えることにあるのですが、このモデルはどのようなヒントを与えてくれるのか、イメージがわかないのです。モデルを利用できるウェブサイト(http://d-cell.ucsd.edu/)もあり、私も少し動かしてみましたが、すぐに使えるという印象は受けませんでした。
まあ、これは新しいモデル構築の方法論のスタートであり、これが完成型ということではないでしょう。これからこのタイプのモデルがどう発展していくのか、どう研究者に使われていくのか、期待しながらフォローしていきたいと思います。
(Visited 234 times, 1 visits today)

Leave a Comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください