RNAseqとマイクロアレイによるmRNAの定量ーある解析例

別件で、自前でとったマイクロアレイによるmRNAの発現量の解析データと、パブリッシュされているRNAseqによる同様なデータを比較する機会があったので、覚え書きの意味も含めてブログに書いておきます。

まず、条件ですが、私たちは合成培地でとあるプラスミドを持たせた酵母株を対数増殖期まで増殖させた条件で、RNAを抽出し、アジレントのYeastマイクロアレイ4x44k (1色法)で解析しています。

比較対象の1つ目の論文では、富栄養培地(YPD)で対数増殖期まで増殖させた細胞をRNAseqで解析しています。

The transcriptional landscape of the yeast genome defined by RNA sequencing. Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M. Science. 2008 Jun 6;320(5881):1344-9. doi: 10.1126/science.1158441. Epub 2008 May 1. PMID:18451266

このデータと、私たちが取得したデータを比較してみます。

スクリーンショット 2013-01-29 15.06.05

合成培地と富栄養培地の違いがあるので、発現量は100%一致する必要はないはずです。発現量はおおむね相関していますし、ピアソン相関係数も0.77で、悪くありません。

しかし気になるのが、遺伝子発現量が低い遺伝子。RNAseqでは2より下では、プロットが横に並んでしまっており、解像度が悪くなっていることがわかります。また、この解析では、マイクロアレイ解析で検出できている900個近い遺伝子の解析ができていません。

次に、同じ解析をした別の論文のデータを見てみます。

2つ目の論文でも、富栄養培地(YPD)で対数増殖期まで増殖させた細胞をRNAseqで解析しています。

Ab initio construction of a eukaryotic transcriptome by massively parallel mRNA sequencing. Yassour M, Kaplan T, Fraser HB, Levin JZ, Pfiffner J, Adiconis X, Schroth G, Luo S, Khrebtukova I, Gnirke A, Nusbaum C, Thompson DA, Friedman N, Regev A. Proc Natl Acad Sci U S A. 2009 Mar 3;106(9):3264-9. Doi:10.1073/pnas.0812841106. Epub 2009 Feb 10. PMID:19208812

スクリーンショット 2013-01-29 15.06.15

こちらも全体の相関は上記と0.77でほとんど変わりません。しかし、低い発現量の遺伝子の解像度が先の解析より高いことが分かります。また、データが取得できていない遺伝子も150程度に少なくなっています。

後から発表されている論文ですから、データの中身が良くなるのは当然かもしれません。2013年の現在ではもっと質の高いデータがでるのかもしれません。

このエントリーの結論として、2つのことをいいたいと思います。

1)誰かがパブリッシュした大規模データを使うときには、データの質に注意する必要がある。Scienceのデータ > PNASのデータではない。皆が使っているからといって、それを使ったら良い訳ではない。

2)現在のマイクロアレイによるmRNAの発現量解析の解像度はかなり高い。

当たり前のことかもしれませんが、自警もふくめて。

(Visited 756 times, 10 visits this week)

Leave a Comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください