CellDesigner4.3でCell Cycleモデルを再構築してみよう(4 最終回)

CellDesigner4.3でCell Cycleモデルを再構築してみよう(3)」の続きです。

いろんなエラーがあって動かないシミュレーションを動くようにしていきます。

 

モデルのエラーを修正する(1/2):シミューレーションが動くまで

まずはエラーの種類。Simulation用のControl panelが開くかどうか、大抵の場合ここでエラーが出ます。この時は何がおかしいのか表示してくれますので、それを見ながら直していきます。

一番多いのは、変数やパラメーターの名前が間違っているというものです。数式に出てくるパラメーターがどこにも定義されていないというエラーとなります。これはメッセージをもとにひとつづ直していけば解決します。

めでたくControlパネルが開くようになったら、Executeでシミュレーションを走らせます。この時に注意するのは、「COPASI」のSolverを使うこと。標準のSOSlib solverではこのモデルは動きません(イベントがあるせいらしいです)。COPASI solverがインストールされていない場合には、このページをもとにインストールしておきましょう。

そして、Executeのボタンを押します。私の場合にはここでエラーが出て何も動かなくなりました。CellDesigner4.3を強制終了して、立ち上げ直し何がおかしいのか原因を究明していきます。

また、シミュレーションしようとするとCellDesigner4.3が突然終了することがあります。というか、このモデルでは、エラーがなくてもたびたび終了します。モデルのファイルはこまめに保存しておいたほうが良いです。

CellDesigner4.3は、Reactionsに書かれた微分方程式にエラーがないかの支援はとても強力なので(気づきやすいので)、上手く動かない時のエラーは大抵、RulesのAssignmentかEventsに原因が有ります。そうでなければいずれにせよシミュレーションが動くからです。

私の場合にもAssignmentのエラー(これは単純にエラーとはいえない、「VariablesとParameterの違い」あるいは、「描画とモデル構造のコンフリクト」が原因だったりもします)を修正し、なんとかシミュレーションは走るようになりました。

モデルのシミューレーション:動くようにはなったが・・・。

モデルのシミューレーション:動くようにはなったが・・・。

ところが、細胞周期の特徴である「周期解」がでません。周期を起こさせるためには要素間の連携がきちんととれていないとダメなので、多分どこかに細かいエラーがあるものと思われます。それをまた探します。

 

モデルのエラーを修正する(2/2):エラーの場所を「生物学的に」探す

エラーメッセージがないが、思い通りのシミュレーション結果が出ない。ここからが一番大変なところです。これだけ複雑なモデルになってくると人間の目でパラメーターや数式のわずかな間違いを探すのは容易ではありません。

ここからは「生物学的に」エラーを見つけていきたいと思います。実はこのプロセスは、モデルがどのような分子生物学的知識を背景に作られているのかを理解するのにとても役に立ちます。

基本的なやり方は、「BioModelsから入手できるモデルのシミュレーション結果(正解)と、自分が作っている途中のシミュレーション結果をじっくりと比べて、どのような反応が起きていないのかを明らかにして、その部分にあるエラーを見つけ修正する」というものです。

この作業を生物学的にとらえて、正解のモデルを「野生型細胞」、自分が作っている途中のエラーがあるモデルを「変異型細胞」と考えて、何が起きていないからこの変異細胞はおかしな振る舞いをするのかを考え、それを戻してやるという風に考えるのです。これがエラー修正の最短の方法はどうかはわかりませんが、こうするといろいろ勉強になるし、エラー修正の過程も楽しくなります。

以下、私が行った代表的な5つの修正についてのプロセスを説明します。意味はほとんどわからないと思いますが、雰囲気が伝われば。

(1)周期が出ない。

周期を起こすのに重要なCDK(Clb2, CLb5)の活性化は起きているか? :起きていない(☓)。では、CDKの転写活性化は?:タイムリーに起きている(◯)。では、CDKの活性化に必要なサイクリンのインヒビター(Sic1, Cdc6)の不活性化は?:起きていない(☓)。では、インヒビターの活性制御に関わるフォスファターゼCdc14の制御は?:挙動がおかしい(☓)。パラメータの間違い発見・修正:Cdc14の挙動がまだおかしい。では、Cdc14の制御を行うCdc15の挙動は?:おかしい(☓)。Cdc15の制御の式に間違いを発見、修正:まだCdc14の挙動がおかしい。Cdc14のインヒビターNet1のリン酸化を行なうPPXの振る舞いが違う(☓)。では、PPXの分解に含まれるPds1の挙動は?:タイムリーに上がってきていない(☓)。では、Pds1の分解を行なうCdc20の振る舞いは?:高すぎる(☓)。Cdc20の制御にかかわる式を入れ忘れていた。Cdc14の挙動は正解とほぼおなじになった。

Cdc14制御の挙動(正解)

Cdc14制御の挙動(正解)

Cdc14制御の挙動(エラーあり)

Cdc14制御の挙動(エラーあり)

(2)だがまだ周期が出ない。

上記2の過程でCdc20の制御についていくつかの式を入れ忘れていたことを発見。Mad2のイベントを修正。ここから周期が発生するようになった。

(3)値がマイナスになっている。

Clb5の値がマイナスに(☓)。では、Clb5の分解を行なうCdc20の値は?:マイナスになっている(☓)。では、Cdc20の活性化を行なうAPC-Pの値は?:マイナスになっている(☓)。APC-PがCdc20の活性化を行なう式に間違いを発見(会合ではなく活性化だった)。 Clb5のマイナス問題は解決した。

マイナスになるのは、大抵の場合Mass actionやMichaelis-Menten式のSubstrateにエッジの出発点の要素が含まれていないことが原因です。

モデル修正途中(マイナスになるのはおかしい)

モデル修正途中(マイナスになるのはおかしい)

(4)DNA複製起点(ORI)の上昇度合いが遅い(サイクルが遅延する)。

ORIの式のパラメーターの書き間違い(Clb2のパラメーターeorib2と書くべきところをClb5のパラメーターeorib5を書いていた)。修正したら、ORIの上昇度合いが今度は早過ぎる。Clb5の活性上昇が早過ぎることがわかった。Clb5の分解酵素Cdc20の活性制御はOK。Clb5のインヒビター(CKI)が正解よりも早く失われることがわかった(☓)。では、CKIの転写活性化を行なうSwi5の活性は?:不活性化されるのが早過ぎる(☓)。Swi5の活性化と不活性化の制御式に間違いを発見。

(5)Clb2の活性が高くなりすぎる。

Clb2のグラフの形が違う、Anaphaseでの下がり具合が悪い(☓)。Clb2のCdc20による分解が起きていない(☓)。Clb2の分解に関わる式の中にパラメーターの間違いを発見(kdb2_pとkdb2pの間違い)。Clb2の挙動は修正された。

Clb2活性化(青いライン)の正解グラフ

Clb2活性化の正解グラフ(濃い青のライン)

Clb2活性化(エラーあり)のグラフ(青いライン)

Clb2活性化(エラーあり)のグラフ(濃い青のライン)

これ以外にもいろいろありましたが、なんとか正解(野生型)と同じ挙動をするようになりました。上記の4とか5とかの細かい間違いは、こういう手がかりを使っていかずに見つけるのは非常に難しいのではないでしょうか。

途中いくつかあったエラーですが、生物学的には因子の制御がおかしくなった「変異」であると考えることも出来ます。例えば4の後半は「Swi5のリン酸化制御が破綻した変異株」(Swi5は必須ではないので死にませんが、周期の速度に異常が出る)、5では「Cdc20によるClb2の分解効率が悪くなった変異」といえます。

完成図を最後に載せます。若干周期速度が違うのは成長速度のパラメーターが違うためです。これは論文のモデルには含まれていないパラメーターなのですが、データベースのモデルには含まれています。グラフの色が違うのは、要素と色のアサインが違うからです。

「正解モデル」のシミュレーション

「正解モデル」のシミュレーション

完成したモデルのシミューレーション

完成したモデルのシミューレーション

数式の修正等も含めたChen2004モデルのダイアグラムです。

Budding yeast cell cycle model (Chen2004, CellDesigner4.3 ver)

Budding yeast cell cycle model (Chen2004, CellDesigner4.3 ver)

最後に

なかなか大変な作業でしたが、達成感は非常にあります。このプロセスが、「サイエンスか」と言われれば若干疑問ではありますが、私自身もおさらいを含めていろいろと勉強になることが多かったです。最初、「写経」と言いましたが、後半の作業はむしろ精巧な模型を作っているような気持ちになりました。模型も数理モデルも英語では「model」ですから似たようなものなんでしょうか。

最後にいくつか気になった点を書いて終わりにしたいと思います。

(1)Chen2004モデルでは、特に要素の量を記述する式に統一されていないところがあります。以前の論文で作られていた「古い」部分と「新しい部分」の記述のポリシーが異なっています。新しい部分は代数で要素の量を記述しているところが多いです。

(2)1の「代数」があるせいで、CellDesigner4.3の記述(ダイアグラム)では齟齬が生じ、モデルに忠実にダイアグラムを書くことができません。BioModelsのモデルではその齟齬が生じるためか、CellDesigner4.3で開いたあと「別名で保存」するとシミュレーションがうまく動かなくなります。

(3)このモデルは、CellDesigner4.3のSimulation Control Panelの標準のSolver(SOSlib)ではシミュレーションできません。COPASI solverではシミュレーションできますが、非常にしばしばクラシュしてしまいます。これはなかなか辛かったです。

(4)正解モデルと作成途上のモデルとを比較するときに交互にSimulationを動かして、グラフのスクリーンショットを撮って比べていたのですが、3の問題もあって非常にやりずらかったです。2つのパソコンを使って別々のモデルを動かして比較すると圧倒的に効率が良くなると思いました。

 

(Visited 215 times, 1 visits this week)

1 Comment

Leave a Comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください