さて、115個のdosage sensitive gene(DSG)が取得されました。この遺伝子群はどんな特長をもっているのでしょうか?こういうときに、過去の大規模解析と比べて統計的に有意に重なっているか(重なっていないか)を調べることで特長が分かることがあります。例えば、タンパク質複合体に含まれているか、とか壊したときに死ぬ遺伝子が多く含まれているか、とかといった解析です。
いろいろやった結果分かったことは、DSGがコードするタンパク質は、細胞内でたくさん発現している、タンパク質複合体を構成している、ハブである、などの傾向が統計的に有意であることが分かりました。また、統計的な有意差はでませんでしたが壊したときに死ぬ(必須の)遺伝子も、ゲノム全体より多く含まれていました。これらの結果は、先のSopkoらの結果と真逆の結果でした。
次にこういう解析を行なったときによく使われるGene Ontology(GO)解析というものを説明したいと思います。GOというのは、それぞれの遺伝子とそれが作るタンパク質に、それらが関わる細胞内のプロセス、それらの機能、それらが存在する細胞内のコンパートメント、という既知の情報をもとにタグづけがなされたものです。例えば、アクチンをコードする遺伝子ACT1であれば、細胞骨格を作るとか、小胞を輸送するとか、細胞質に存在している、といったような情報がGOとして付加されます。
今回の解析でとれてきた115個の遺伝子をGO解析すれば、どんなプロセス/機能/コンパートメントが115個の遺伝子に濃縮されているのかが分かります。115個のDSGで言えば、細胞骨格に関わる遺伝子や細胞内の輸送に関わる遺伝子が、遺伝子全体のパーセンテージから比べると統計的に有意にDSGに濃縮されていました。つまり、細胞骨格や輸送に関わる遺伝子はDSGになりやすい傾向がある、ということになります。もう少し言い方を変えると、細胞骨格の制御や細胞内の輸送は、遺伝子発現の変動に対してロバストネスが低い(脆弱である)という言い方もできます。これはSopkoらの実験結果でも得られているものでした。
一方で、例えば、代謝や遺伝子発現の転写制御、細胞内の信号伝達に関わる遺伝子は、DSGにはあまり含まれておらずこれらのプロセスはロバストネスが高いと言うことが分かりました。転写制御や信号伝達はSopkoらが取得した遺伝子にはたくさん含まれていて、私たちの結果とは反対になります。これは恐らく、転写制御因子や信号伝達に関わる遺伝子はそもそもの存在量が少ないのに、プロモーター置換によって非常に過剰に発現させられてしまったためにおきたことではないか、と考えています。
こんな風に、私たちが得たDSG、わずかな過剰発現で細胞を殺してしまうような遺伝子は、Sopkoらのプロモーター置換で得られた過剰発現で細胞を殺してしまう遺伝子達とは違う特長を持っていたのです。
上記の解析でだいたいDSGの特長というのは分かりました。しかし私は何となく数字を扱うだけのボワっとした理解では納得がいかなかったので、これまでに分かっているDSG遺伝子/タンパク質の機能とそれらのつながりについて、目で見える形にしたいと思いました。それと同時に、DSGの遺伝子それぞれについて遺伝子データベースをながめて、自分の頭の中でそれらの持つ特徴について仮説を作れないかと考えました。ちなみに出芽酵母(Saccharomyces cerevisiae)は、Saccharomyces Genome Database(SGD)という、非常に優れたゲノム(遺伝子の総体のことを意味する)のデータベースが存在しています。
このために、CytoscapeというソフトウェアをもちいてDSG遺伝子/タンパク質の機能それらのつながりをネットワーク図にしました。
私はこういった方法でとれてきた遺伝子の機能をながめながら、「細胞ってこんな機能をもっているんだ〜!」ということを知るのが昔から大好きでした。一生懸命頑張ってとった115個の遺伝子は、私にとっては宝石の1つ1つのようなものです。こうする事によって、GO解析では統計的有意差としてでてこなかった、いくつかの特長あるタンパク質の集団があることも分かりました(例えば、cAMP依存性キナーゼや、プロテアーゼなど)。
私としてはとてもきれいなネットワーク図がかけて満足しましたし、どんな遺伝子があるのか一目瞭然、機能カテゴリーにも分かれているので、この図はこの後何度も何度も見ることになった愛しい図です。ところが、のちに登場するバイオインフォマティクスが専門の牧野氏には、論文投稿のときに「この図を示す必要がある理由は何ですか?ここから得られる結論は?」と突っ込まれて、「いや、こういうの見やすくていいでしょ・・・。」と苦し紛れに答えたのをおぼえています。幸いなことに(?)論文の審査員(レビューアー)からは、この図には意味がないという突っ込みは受けず、無事論文に掲載されることになりました。
「これこれこんなタンパク質をコードする遺伝子がDSGになりやすい。」、つまり、「何がDSGになりやすいか?」、これは上記の研究で分かったこと、それはそれでいいでしょう。ですがそれでは、「どうしてDSGになるのか?」、DSGを生み出す原理、分子メカニズムとはいったいなんでしょうか?
もちろん、それぞれのタンパク質が過剰になったときに細胞を殺す理由はさまざまです。細胞骨格を作るアクチンが過剰になったときと、タンパク質分解酵素が過剰になった時、信号伝達因子が過剰になった時、リボソームの構成因子が過剰になった時・・・それぞれの機構が壊れて細胞が死ぬ、その理由は違うと思われます。
ここで問題にしたいのは、これら115個のDSGが、「なぜわずかな過剰発現で細胞を死に至らしめるか」という原理です。これは、GO解析や上記の情報学的解析からではなかなか分かりません。じっくりとそれぞれの遺伝子をながめてみて、いろいろな過去の論文を読んでみて、自分の頭の中で仮説を作っていく必要があります。
その中ででてきたのが、遺伝子量不均衡もしくは、化学量不均衡でした。実はこれ、私たちの先行論文で既に発表していました*1。細胞周期M期で働くタンパク質脱リン酸化酵素をコードするCDC14のコピー数限界は非常に低く、わずか1コピーでも過剰にあると細胞を殺してしまいます。その原因が、Cdc14の阻害因子であるNet1というタンパク質との「量比の乱れ」のせいだと示したのがその論文です。簡単に言うと、「DSGにはパートナーがいて、DSGとパートナーの数のバランスがおかしくなると細胞が死んでしまう」ということす。
そういう視点で見てみると、それぞれのDSGにはパートナー分子があるように見える。そして、パートナーかどうかを確かめる実験は既に先攻論文で発表していましたから、それを確かめれば良い。簡単に言うと、gTOW用のプラスミドにそれぞれのDSGを組み込み、別のプラスミドにパートナーを組み込んで、酵母に同時に導入して、酵母がgTOW実験で死なずにすむようになる(そのDSGの限界コピー数があがるようになる)ことを確認すれば良いのです。
この実験は「パートナー探し」という呼び名がつけられ、研究室で当時修士課程に在籍していた金高令子さんがやりました。彼女は、60あまりのDSGとパートナーの候補の組み合わせを日夜試し、13個のパートナーを探し当てました。つまり、少なくともDSGのいくつかについては、遺伝子量の不均衡がわずかなコピー数上昇で細胞を殺してしまう原因であったと結論づけられた訳です。それと同時に、これは遺伝子量の乱れが細胞機能に悪影響を与えるという、先に述べた「バランス仮説」を支持する結果でもありました。
またこれは、「元のレベルから何倍」という過剰発現を行なうgTOWだから得られた結果で、元のレベルを無視したプロモーター置換による過剰発現では得られない結果なのです。プロモーター置換の過剰発現でバランス仮説を議論することは正しくないということが、ここでも分かります。
余談ですが、この実験の話をするときにプレゼンで使う図をお見せします。
私は社交ダンスはやりませんが、ダンス業界では、女性のことを「パートナー」、男性のことを「リーダー」と呼ぶのだそうです。私たちの研究では、DSGがリーダーにあたります。リーダーとパートナーの数がちゃんとあっていないとダンス大会は成立しない。もしフロアーにパートナーを求める男性ばかりがあふれてしまったら・・・想像するだに大変なことになると思いませんか?簡単にいうと、それがDSGを生み出す機構の1つだという、まあ、これはアナロジーですが。
少し本題から話がそれます。
研究者業界ではよくあることですが、シンポジウムなどで講演依頼をされることがあります。私も年に数回こういった招待講演をやります。私の場合には、やっていることが特殊だからか、分野が少し私の専門から外れているいわゆる「アウェー」の場で講演することが多いです。
そのメールもシンポジウムでの発表の依頼でした。私は一度も参加したことのない「進化学会」、そして「遺伝子量重複・遺伝子量バランス」がテーマのシンポジウムです。私はそれまで、特に日本でこのようなテーマで研究している研究者がいることを知りませんでした。しかも、このシンポジウムの発表者は、ほとんどがいわゆる「ドライ研究者」つまりバイオインフォマティクスの研究者でした。
招待のメールを下さったのは、遺伝子量バランスをバイオインフォマティクスの側面から研究されている、東北大学助教の牧野能士氏でした。面識は全くありません。私が以前の論文で遺伝子つなひき法を用いた遺伝子量バランスの論文を発表していること、最近もそれに関する研究をしていることを人づてに聞いたらしく、シンポジウムに招待してくださったとのことでした。
実はこの時すでに、上で述べた「遺伝子量バランスの乱れがDSGを作る原因ではないか」、という考えをもって実験を始めていました。まさにgTOW6000の仕事を発表するのにうってつけの機会です。海外出張と重なって、スケジュールが非常に厳しいタイミングでしたが喜んで引き受けさせて頂きました。
シンポジウムでお互いの発表を聞いて、私と牧野さんの2人は、「日本はほとんどいない遺伝子量バランスに興味を持つ研究者」だということが分かりました。私はウェット研究者(実験専門)、牧野氏はドライ研究者(計算機専門)、「2人が組めばきっと面白いことができる」、意気投合し共同研究が始まりました。その後、牧野氏はgTOW6000のデータ解析や論文発表のいろいろな面で助けてくださいました*2。
遺伝子量不均衡は、DSGを生み出す原理の1つでした。それでは他には原理はないのでしょうか?
先にも述べたように、「そもそもたくさん発現するタンパク質の遺伝子がDSGになりやすい」。これはどういう意味でしょうか?一番簡単な理由は、「量が毒をなす」です。何でもいいから、細胞の中にたくさんあると邪魔になる。細胞内では、常にたくさんのタンパク質が合成され、分解されています。合成・分解にはそれ専用のマシナリー(装置)が必要で、かつエネルギーを使っています。何の役にも立たないタンパク質を大量に作ったり壊したりを繰り返されたら、他の大事なタンパク質が作れない。細胞にとってとても迷惑な話です。
この、「細胞にとって役に立たないタンパク質を大量に作らせると細胞の増殖が悪くなる」、という現象は、細胞にむりやり特定のタンパク質を作らせようとした経験がある研究者なら、たびたび出くわすものです。特に大腸菌では「組換えタンパク質」という形で、例えばヒトのインスリンを大量に作らせることがあります。この時に、大腸菌の増殖が悪くなることは多くの研究者が知っています。
この現象は、「Protein Burden」、あるいは「Protein Cost」(日本語では、「タンパク質負荷」でしょうか)と呼ばれる現象で、1950年に既に報告があります。最近になってシステムバイオロジーの研究の流れの中で、タンパク質負荷の研究が再び始まっています*3。
DSGがそもそもたくさんタンパク質を作っている、そしてそのコピー数をあげたら・・・たぶんタンパク質負荷がおきているのではないか、これは想像に難くありません。こんな議論を牧野さんとメールでしていて、私はふっとある実験を思いつきました。それは、クラゲの緑色蛍光蛋白質(GFP)という酵母の機能には関係ないタンパク質を、DSGのプロモーター(遺伝子発現量をつかさどる領域)につないで、細胞内で非常にたくさん作らせてやったときに、DSGと同じように低いコピー数限界を示すかを確かめたらどうだろう、というものでした。
思いついたらすぐ始める。すぐにそれ専用のプラスミドを作って、酵母の中で「思いっきり」GFPを発現してみました。そうすると、確かにこの人工遺伝子のコピー数限界は低くなりました。さらに、このGFPに分解を促進するアミノ酸配列を付加してみると、さらに限界コピー数が低くなりました。
つまり、合成や分解の負荷、タンパク質負荷が実際にDSGをつくる要因となっているということが示された事になります。これは自明のような気もしますが、酵母の実際のプロモーターからタンパク質を作らせたときに、タンパク質負荷を生むということをちゃんと示したものとしては、はじめての例です。またこの結果は、「酵母でなんらかのタンパク質を作らせようとしたときに、どうすればよりたくさん作らせられるか?」という、生物工学的な視点からも役に立つ発見ではないかと考えています。
ところで、この酵母に「思いっきりGFPを作らせる」実験を行なうと、酵母の作るコロニー(細胞集団)自体が蛍光緑になります。とっても奇麗だと思いませんか?
GFPは、通常青色の光を当ててオレンジ色のフィルターを通したときに始めて光っているのが観察されるのですが、とにかく大量に作らせるとコロニー自体が緑色になるというのは、私自身とても大きな驚きでした。
これまでDSGを生むメカニズムについて、いろいろと説明してきました。しかし、実は大きな疑問が残されています。それは、「なぜDSGが存在するのか?」ということです。
生命は進化の過程で、ちょっとやそっとじゃ壊れない性質「ロバストネス」を獲得してきたと考えられます。確かに酵母の遺伝子の80%以上は、それぞれ100倍以上にそのコピー数をあげても細胞は死なない。つまりロバストネスが高いといえます。一方、115個の遺伝子は、わずか10コピー以下のコピー数上昇で細胞が死んでしまう。この低いロバストネス(脆弱性)が、どうして残されているのでしょうか?進化してロバストにならなかったのでしょうか?
これは、トレードオフという考え方で説明されます。これらのDSGは、その遺伝子発現が変動することによって細胞システムが被る不利益よりも、もっと細胞にとって大事な機能があり、そちらを優先するがために「引き換えに生じてしまった不利益」であるという考え方です。
その「大事な機能」とは何か?帰宅中の冬の月夜に、ふっとひらめいたのが「ゲノム骨格説」でした。
(1)染色体上に、わずかなコピー数の上昇で細胞を殺してしまう遺伝子(DSG)がバラバラに存在している、(2)別の染色体上に、それらのパートナーとなる遺伝子が、これまたバラバラに存在している、という状況を想定します。両者は遺伝子量のバランスによりつながれた、「見えないネットワーク」を作ることになります。。
もし、染色体のどれか1本が、細胞の複製の失敗によって増えてしまったらどうなるでしょうか?このバランスがみだれ、細胞は増殖できず、子孫を残すことができません。これを逆に言うと、DSGとそのパートナーが作るネットワークが、染色体数のバランスが乱れたときに細胞をあえて殺すように組み込まれた、「自殺装置」として働いているという事です。
何で自殺する必要があるのか?酵母のような多数の集団で増えていく細胞の場合には、自分と同じでないものが次々と作られてしまうと、それは安定な種として存在しえません。同じ染色体を同じ数もっているからこそ安定な種になりえているわけです。これは、それをちゃんと保証する機構であると同時に、進化の過程で今の安定な染色体の構成が作られてきた原理を説明する仮説です。ちなみにこの仮説、ゲノムに見えない骨格があるということで、「ゲノム骨格説」と名付けましたが、この名前は論文には書きませんでした。
私自身は面白い仮説だと思っていますが、実際にどこまで本当なのかは今のところ分かりません。後で述べるように、異数体の増殖が悪い理由が、遺伝子量不均衡によるものだという証拠は得られてきていますので、ある程度は正しいものだと思います。また、出芽酵母では今回得られた13の遺伝子ペアは全部別の染色体にのっていて、確かにネットワークを作っているように見えます。今後は、出芽酵母の祖先種でもこういうネットワークがあるのかどうかを調べたいと思っています。
染色体上のDSGとパートナーが作るネットワーク(赤線)。これが私たちが見つけた、「酵母ゲノムの骨格」だ!
第4章「gTOW6000を世にはなつ」に、続く。