Millefy: 見逃されていた細胞ごとのばらつきを可視化する

1細胞RNA-seqデータのリードカバレッジを可視化するソフトウェアを開発しました。そのソフトウェアと論文が公開されました。この研究は筑波大の尾崎遼さんとの共同研究です。

Haruka OzakiTetsutaro HayashiUmeda ManaItoshi NikaidoMillefy: visualizing cell-to-cell heterogeneity in read coverage of single-cell RNA sequencing datasetsBMC Genomics volume 21, Article number: 177, 2020.

一般的に、1細胞RNA-seqではどの細胞でどの遺伝子がどのぐらい転写しているかを明らかにできます。これにより細胞種の同定や細胞分化系譜などの解析ができます。しかし1細胞RNA-seqのデータには、ゲノムのどこ位置から、どのぐらいのRNA分子が転写しているか、というゲノム座標との関連を示す情報も含まれています。このような情報を用いれば、新規転写単位の発見、RNAの配列変異、RNAスプライシング、アンチセンスRNA、エンハンサーRNA同定などが行えます。このようなRNA配列変化やゲノム位置などの情報は、疾患の解析では重要になります。我々が2018年に発表したRamDA-seqは、完全長Total RNAを1細胞から高感度に捉える世界で唯一の方法です。この手法では、非ポリAも含むRNAの全長がどんなに長いRNAでも読めるため、その特徴を活かしてRNA配列異常が起きる遺伝性疾患やがんの解析への応用が期待されています。

https://www.nature.com/articles/s41467-018-02866-0/

このRamDA-seqの性能を十二分に発揮するには、RNA配列変化に着目したデータ解析手法やソフトウェアが必要になります。先日発表した論文ではRamDA-seqの全長性を活かして、ゲノム中で発現量の異なる転写領域を同定する手法です。https://doi.org/10.1093/nargab/lqz020

今回の論文は、そのようなゲノム中で発現量の異なる転写領域を可視化することができるツールです。もちろん、そのほかの(いわゆる全長系と呼ばれている)1細胞RNA-seq法のデータでも利用できます。

https://www.riken.jp/press/2020/20200303_1/index.html