Quartz-Seq2が世界最高性能を示しました

理化学研究所(理研)生命機能科学研究センターバイオインフォマティクス研究開発チームの笹川洋平上級研究員、田中かおりテクニカルスタッフI(研究当時)、林哲太郎技師、二階堂愛チームリーダーの研究チームは、「高出力型1細胞RNAシーケンス法」の国際的な性能比較研究に参加し、同研究室で開発された手法「Quartz-Seq2」が世界最高性能を示しました。

本手法は、今後、細胞分化や臓器・器官発生などの基礎研究から、再生医療や創薬などさまざまな研究分野の発展に貢献すると期待できます。

近年、高出力型1細胞RNAシーケンス法により、臓器に含まれる全ての細胞種と機能を同定し、これにより疾患の解明や発生の機序を理解する研究が盛んに行われています。現在、ヒトの全種類の細胞を調べる国際プロジェクト「ヒト細胞アトラス(HCA)」計画が進められおり、疾患解明や創薬研究などが進展すると期待されています。しかし、1細胞RNAシーケンス法はいくつかの手法が提案されており、その特性の違いが理解されていませんでした。

今回、1細胞RNA-seq法の中で世界的に主要な13手法の開発者・企業が参加し、その性能を比較する研究が実施されました。その結果、研究チームが開発したQuartz-Seq2が総合的な性能スコアで世界最高成績を収めました。

本研究は、科学雑誌『Nature Biotechnology』の掲載に先立ち、オンライン版(4月6日付:日本時間4月7日)に掲載されます。

Elisabetta Mereu, Atefeh Lafzi, Catia Moutinho, Christoph Ziegenhain, Davis J. McCarthy, Adrian Alvarez, Eduard Batlle, Sagar, Dominic Grün, Julia K. Lau, Stéphane C. Boutet, Chad Sanada, Aik Ooi, Robert C. Jones, Kelly Kaihara, Chris Brampton, Yasha Talaga, Yohei Sasagawa, Kaori Tanaka, Tetsutaro Hayashi, Caroline Braeuning, Cornelius Fischer, Sascha Sauer, Timo Trefzer, Christian Conrad, Xian Adiconis, Lan T. Nguyen, Aviv Regev, Joshua Z. Levin, Swati Parekh, Aleksandar Janjic, Lucas E. Wange, Johannes W. Bagnoli, Wolfgang Enard, Marta Gut, Rickard Sandberg, Itoshi Nikaido, Ivo Gut, Oliver Stegle, Holger Heyn, “Benchmarking Single-Cell RNA Sequencing Protocols for Cell Atlas Projects”Nature Biotechnology, 10.1038/s41587-020-0469-4

日本語のプレスリリースはこちら

1細胞RNA解析で世界最高成績-国際的な性能比較研究で証明-

もうひとつの Nikaido Lab.

チームリーダーの二階堂愛が国立大学法人 東京医科歯科大学 難治疾患研究所 ゲノム応用医学部門 ゲノム機能情報分野にもラボを構えることになりました。また、東京医科歯科大学 大学院医歯学総合研究科 修士課程 医歯理工保健学専攻博士課程 生命理工医療科学専攻 ゲノム機能情報 教授を兼務し、教育研究も行います。

今後は、理研のラボと大学との連携を深めることで、新しいゲノム科学、バイオインフォマティクス研究者の育成にも貢献します。

Millefy: 見逃されていた細胞ごとのばらつきを可視化する

1細胞RNA-seqデータのリードカバレッジを可視化するソフトウェアを開発しました。そのソフトウェアと論文が公開されました。この研究は筑波大の尾崎遼さんとの共同研究です。

Haruka OzakiTetsutaro HayashiUmeda ManaItoshi NikaidoMillefy: visualizing cell-to-cell heterogeneity in read coverage of single-cell RNA sequencing datasetsBMC Genomics volume 21, Article number: 177, 2020.

一般的に、1細胞RNA-seqではどの細胞でどの遺伝子がどのぐらい転写しているかを明らかにできます。これにより細胞種の同定や細胞分化系譜などの解析ができます。しかし1細胞RNA-seqのデータには、ゲノムのどこ位置から、どのぐらいのRNA分子が転写しているか、というゲノム座標との関連を示す情報も含まれています。このような情報を用いれば、新規転写単位の発見、RNAの配列変異、RNAスプライシング、アンチセンスRNA、エンハンサーRNA同定などが行えます。このようなRNA配列変化やゲノム位置などの情報は、疾患の解析では重要になります。我々が2018年に発表したRamDA-seqは、完全長Total RNAを1細胞から高感度に捉える世界で唯一の方法です。この手法では、非ポリAも含むRNAの全長がどんなに長いRNAでも読めるため、その特徴を活かしてRNA配列異常が起きる遺伝性疾患やがんの解析への応用が期待されています。

https://www.nature.com/articles/s41467-018-02866-0/

このRamDA-seqの性能を十二分に発揮するには、RNA配列変化に着目したデータ解析手法やソフトウェアが必要になります。先日発表した論文ではRamDA-seqの全長性を活かして、ゲノム中で発現量の異なる転写領域を同定する手法です。https://doi.org/10.1093/nargab/lqz020

今回の論文は、そのようなゲノム中で発現量の異なる転写領域を可視化することができるツールです。もちろん、そのほかの(いわゆる全長系と呼ばれている)1細胞RNA-seq法のデータでも利用できます。

https://www.riken.jp/press/2020/20200303_1/index.html

大規模データに対する主成分分析

大規模1細胞発現データを高精度・高速・低メモリで主成分分析(PCA)[1]する手法の性能評価を行い、論文を出版しました。本研究成果は、大規模な遺伝子発現データからの疾患関連細胞や遺伝子の発見で利用されるアルゴリズムの高速化・軽量化に貢献すると期待できます。

近年、臓器が持つ全細胞種を1細胞RNAシーケンス法(1細胞RNA-seq)で同定する研究が盛んです。この方法で得られたデータをPCAで簡素化し、細胞の種類や数、機能を特定しますが、大規模研究では細胞の数が100万を超えるため、従来法ではそもそも計算できなかったり、膨大な計算時間、メモリ量が必要とされます。

我々は、10種のPCAアルゴリズムを比較しました。その結果、高速化や低メモリ化には、行列の非ゼロ要素のみを格納する疎行列フォーマット[3]の利用や、行列の一部を逐次的に計算に用いるOut-of-core[4]な実装が有効なことが分かりました。そして、それらを考慮したソフトウェアを実装し、その有効性を示しました。

本研究は、英国の科学雑誌『Genome Biology』のオンライン版(1月20日付)に掲載されました。

Koki Tsuyuzaki, Hiroyuki Sato, Kenta SatoItoshi NikaidoBenchmarking principal component analysis for large-scale single-cell RNA-sequencing. Genome Biology. 21, Article number: 9, 2020.

大規模データに対する主成分分析の性能を評価
-100万規模の1細胞発現データで検証-

微量DNA精製用マグネットプレート

ラボの林さんが監修した「マグネットプレートBit-Mag96」が発売になりました。微量DNAをマグネットビーズで精製するときなどに利用できます。3 uLでも精製できます。もともろはRamDA-seqのDNA精製に利用するために開発したものです。

マグネットプレート Bit-Mag96
シーケンサー解析の前処理用に効果大!わずか3μlの微量容量にも対応

RamDA-seq, RT-RamDAの試薬キット発売

我々が2018年に発表した、非ポリAも含むRNAの完全長をカバーする世界初の高感度1細胞RNA-seq法RamDA-seqの試薬キットが、東洋紡から2019/09/30に発売されます。

がんなど1細胞レベルでの疾患解析や診断に貢献します。

RamDA-seqのキットと同時に、RT-qPCR用のキットも同時リリースです。RamDA-seqの基礎反応であるRT-RamDAは、微量RNAから、複数遺伝子をqPCRで検出することにも使えます。RNAウイルス検出や微量検体からの診断などにも応用できます。

シーケンスのほうはキット化に際して、1細胞だけでなく微量RNAサンプルにも対応させてあります。また懸案だったnot-so-random primer も発売されますので、自分で試薬を集めるよりかなり簡便になっています。メーカーサポートも付きます。

キット発売に向けて、1次データ解析(fastqから発現行列、QCまで)の解析ワークフローをオープンソース、商用利用化で公開準備中です。こちらは続報をお待ちください。発現行列移行はSeuratなりMonocleなりお好きなツールでどうぞ!

発現ゆらぎと転写バーストに関する論文のプレプリントを公開

新しい論文のプレプリント公開しました。この研究は広大の落合博さんとの共同研究です。

この研究では、哺乳類細胞の遺伝子発現ゆらぎと転写バーストの関係をゲノムワイドに解析しました。まず、1細胞RNA-seqを利用してES細胞の発現ゆらぎと転写バーストの関連を調べました。我々が2018年に発表したRamDA-seqを利用しています。転写バーストの動力学はポリコームや転写伸長因子など、プロモーターと遺伝子本体に結合するタンパク質によって決定されていました。

次に、ゲノム編集ライブラリを使って、ゲノムワイドに転写バーストに関わる遺伝子をスクリーニングしたところ、Akt/MAPKシグナル伝達経路が転写伸長効率の調節を介してバースト速度を調節することが明らかになりました。
このプレプリントは、現在、国際学術誌で専門家による査読を受けており、将来的に採択されれば出版となります。

Hiroshi Ochiai, Tetsutaro HayashiMana UmedaMika Yoshimura, Akihito Harada, Yukiko Shimizu, Kenta Nakano, Noriko Saitoh, Hiroshi Kimura, Zhe Liu, Takashi Yamamoto, Tadashi Okamura, Yasuyuki Ohkawa, Itoshi NikaidoGenome-wide analysis of transcriptional bursting-induced noise in mammalian cells. bioRxiv. (under review)

1細胞RNA-seqベンチマーク論文のpreprintが公開されました

世界中のハイスループット型1細胞RNA-seq開発者や企業が参加した国際的なベンチマーク大会が、Human Cell Atlas Projectで開催されました。これまで報告されている13種類の代表的な手法が比較されました。この活動は、7カ国, 25研究機関が参加した国際的な取り組みです。アジアからは唯一我々がQuartz-Seq2で参加しました。その結果をまとめた論文の preprint が公開されました。

全参加チームがスペインのバルセロナから送られた同じ細胞カクテルを用いて、各拠点で1細胞採取からシーケンスまでを実施しました。細胞カクテルは事前にヒトやマウス、イヌなどの細胞を一定量混ぜたサンプルで、バルセロナで混合されたサンプルが世界中の拠点に冷凍輸送されました。そのサンプルを元に各チームが各方法で1細胞RNA-seqを実施しました。その後、生データはバルセロナに集められ、その性能を比較が比較されました。評価指標としては検出遺伝子数や、細胞型の判別など複数の項目に渡ります。

その結果、我々のQuartz-Seq2が評価項目のほとんどでTopの成績を示し、ベンチマーク総合スコアでトップスコアを示しました。特に検出遺伝子は他の手法を圧倒しています。これまで我々自身の論文で示してきたことではありますが、今回より客観的にQuartz-Seq2が世界最高精度のハイスループット1細胞RNA-seqであることが示されました。

このプレプリントはすでに学術誌に投稿しており、専門家のレビューを受けて、採択を目指しています。このベンチマーキングでは、Human Cell Atlas ProjectChan Zuckerberg Initiative の支援を受けました。

Elisabetta Mereu, Atefeh Lafzi, Catia Moutinho, Christoph Ziegenhain, Davis J.MacCarthy, Adrian Alvarez, Eduard Batlle, Sagar, Dominic Grün, Julia K. Lau, StéphaneBoutet, Chad Sanada, Aik Ooi, Robert C. Jones, Kelly Kaihara, Chris Brampton, YashaTalaga, Yohei Sasagawa, Kaori Tanaka, Tetsutaro Hayashi, Itoshi Nikaido, CorneliusFischer, Sascha Sauer, Timo Trefzer, Christian Conrad, Xian Adiconis, Lan T. Nguyen, Aviv Regev, Joshua Z. Levin, Aleksandar Janjic, Lucas E. Wange, Johannes W. Bagnoli, Swati Parekh, Wolfgang Enard, Marta Gut, Rickard Sandberg, Ivo Gut, Oliver Stegle, Holger Heyn. Benchmarking Single-Cell RNA Sequencing Protocols for Cell Atlas Projects. bioRxiv. (submitted)

細胞あたりの検出遺伝子数とリード数の関係。黄色がQuartz-Seq2

バイオインフォマティクス研究開発チームへ昇格

バイオインフォマティクス研究開発ユニットは、所内選考によりこれまでの業績が認められ、2019年4月1日よりチームへの昇格が認められました。これにより、研究室名は「バイオインフォマティクス研究開発チーム」となり、二階堂ユニットリーダーは、チームリーダーへ昇格になりました。

英語名は、Laboratory for Bioinformatics Researchのままで変更になりません。

ハイブリッドクラウドに関する共同研究がNII「クラウド活用事例」で紹介されました

ライフサイエンスのデータ解析クラウドの構築技術について、国立情報学研究所(NII)と共同研究を行ってきました。具体的には、理研内のオンプレミスなPCクラスタとAmazon AWSのようなパブリッククラウドをNIIが提供するオンデマンドクラウド接続サービスで、繋げて利用する方法を開発しました。

これにより、理研内PCクラスタに計算ジョブを投入すると、自動的にパブリッククラウドから計算ノードを調達し、計算の設定や計算自体が自動的に行われます。計算が終了したクラウド上の計算機は自動的にシャットダウンします。このようなハイブリッドクラウドを利用することで、計算機の調達・維持管理コストを減らし、普段使っている計算機から、自由にいつでもどこでも大量の計算ができるようになります。

今回、この共同研究で利用しているNIIのオンデマンドクラウド接続サービスの利用事例としてインタビューを受けました。紙面の関係で、技術的な詳細については割愛されていますが、その使い勝手や意義について述べています。

インタビュー記事はこちら。NIIクラウド活用事例 理化学研究所

これまでのクラウドに関わる活動については以下をご覧ください。