1細胞RNA-seqベンチマーク論文のpreprintが公開されました

世界中のハイスループット型1細胞RNA-seq開発者や企業が参加した国際的なベンチマーク大会が、Human Cell Atlas Projectで開催されました。これまで報告されている13種類の代表的な手法が比較されました。この活動は、7カ国, 25研究機関が参加した国際的な取り組みです。アジアからは唯一我々がQuartz-Seq2で参加しました。その結果をまとめた論文の preprint が公開されました。

全参加チームがスペインのバルセロナから送られた同じ細胞カクテルを用いて、各拠点で1細胞採取からシーケンスまでを実施しました。細胞カクテルは事前にヒトやマウス、イヌなどの細胞を一定量混ぜたサンプルで、バルセロナで混合されたサンプルが世界中の拠点に冷凍輸送されました。そのサンプルを元に各チームが各方法で1細胞RNA-seqを実施しました。その後、生データはバルセロナに集められ、その性能を比較が比較されました。評価指標としては検出遺伝子数や、細胞型の判別など複数の項目に渡ります。

その結果、我々のQuartz-Seq2が評価項目のほとんどでTopの成績を示し、ベンチマーク総合スコアでトップスコアを示しました。特に検出遺伝子は他の手法を圧倒しています。これまで我々自身の論文で示してきたことではありますが、今回より客観的にQuartz-Seq2が世界最高精度のハイスループット1細胞RNA-seqであることが示されました。

このプレプリントはすでに学術誌に投稿しており、専門家のレビューを受けて、採択を目指しています。このベンチマーキングでは、Human Cell Atlas ProjectChan Zuckerberg Initiative の支援を受けました。

Elisabetta Mereu, Atefeh Lafzi, Catia Moutinho, Christoph Ziegenhain, Davis J.MacCarthy, Adrian Alvarez, Eduard Batlle, Sagar, Dominic Grün, Julia K. Lau, StéphaneBoutet, Chad Sanada, Aik Ooi, Robert C. Jones, Kelly Kaihara, Chris Brampton, YashaTalaga, Yohei Sasagawa, Kaori Tanaka, Tetsutaro Hayashi, Itoshi Nikaido, CorneliusFischer, Sascha Sauer, Timo Trefzer, Christian Conrad, Xian Adiconis, Lan T. Nguyen, Aviv Regev, Joshua Z. Levin, Aleksandar Janjic, Lucas E. Wange, Johannes W. Bagnoli, Swati Parekh, Wolfgang Enard, Marta Gut, Rickard Sandberg, Ivo Gut, Oliver Stegle, Holger Heyn. Benchmarking Single-Cell RNA Sequencing Protocols for Cell Atlas Projects. bioRxiv. (submitted)

細胞あたりの検出遺伝子数とリード数の関係。黄色がQuartz-Seq2

バイオインフォマティクス研究開発チームへ昇格

バイオインフォマティクス研究開発ユニットは、所内選考によりこれまでの業績が認められ、2019年4月1日よりチームへの昇格が認められました。これにより、研究室名は「バイオインフォマティクス研究開発チーム」となり、二階堂ユニットリーダーは、チームリーダーへ昇格になりました。

英語名は、Laboratory for Bioinformatics Researchのままで変更になりません。

ハイブリッドクラウドに関する共同研究がNII「クラウド活用事例」で紹介されました

ライフサイエンスのデータ解析クラウドの構築技術について、国立情報学研究所(NII)と共同研究を行ってきました。具体的には、理研内のオンプレミスなPCクラスタとAmazon AWSのようなパブリッククラウドをNIIが提供するオンデマンドクラウド接続サービスで、繋げて利用する方法を開発しました。

これにより、理研内PCクラスタに計算ジョブを投入すると、自動的にパブリッククラウドから計算ノードを調達し、計算の設定や計算自体が自動的に行われます。計算が終了したクラウド上の計算機は自動的にシャットダウンします。このようなハイブリッドクラウドを利用することで、計算機の調達・維持管理コストを減らし、普段使っている計算機から、自由にいつでもどこでも大量の計算ができるようになります。

今回、この共同研究で利用しているNIIのオンデマンドクラウド接続サービスの利用事例としてインタビューを受けました。紙面の関係で、技術的な詳細については割愛されていますが、その使い勝手や意義について述べています。

インタビュー記事はこちら。NIIクラウド活用事例 理化学研究所

これまでのクラウドに関わる活動については以下をご覧ください。



高速検索エンジン「CellFishing.jl」を開発 -大規模1細胞データベースから類似細胞を瞬時に検出する手法-

大規模1細胞データベース(DB)から、類似細胞を高速検索するソフトウェア「CellFishing.jl」を開発しました。

本研究成果は、細胞分化や臓器・器官発生などの基礎研究から、再生医療における移植細胞の有効性・安全性評価、創薬などの発展に貢献すると期待できます。

多細胞生物が持つ数百種類の細胞の機能を理解する方法として、1細胞ごとにRNAの種類と量を計測する「1細胞RNAシーケンス法]」があります。これにより、共同研究チームを含め、世界中が協力してヒトの全細胞種の遺伝子発現データをデータベース化する研究が進行中で、次々とデータが公開されています。世界中の研究者がこれらのDBと自分のデータを比較できれば、疾患の原因や薬剤応答を細胞レベルで精緻に理解できるようになります。

今回、我々は、1細胞発現データを検索するアルゴリズムを開発し、百万個の細胞DBから、高い検索精度を保ちつつも、1細胞あたり0.63ミリ秒で類似細胞の検索に成功しました。これは既存の方法の100倍以上の速さです。さらに、類似細胞で特徴的に働く遺伝子を高速に検出する機能も開発しました。

本研究は、英国の科学雑誌『Genome Biology』(2月11日付)に掲載されました。詳細は以下の日本語プレスリリースをご覧ください。

理研からのプレスリリース: 高速検索エンジン「CellFishing.jl」を開発 -大規模1細胞データベースから類似細胞を瞬時に検出する手法-
AMEDからのプレスリリース: 高速検索エンジン「CellFishing.jl」を開発 -大規模1細胞データベースから類似細胞を瞬時に検出する手法-

Kenta Sato, Koki Tsuyuzaki, Kentaro Shimizu, Itoshi Nikaido, “CellFishing.jl: an ultrafast and scalable cell search method for single-cell RNA-sequencing”, Genome Biology10.1186/s13059-019-1639-x

ソースコード: Github: CellFishing.j

2018年度からの理研バイオインフォマティクス研究開発ユニット

理化学研究所情報基盤センターが2018年3月31日でクローズし、事務部門主体の情報システム部へと改組されます。それに伴い、バイオインフォマティクス研究開発ユニットは、2018年4月よりスタートする理研の新センターである、理化学研究所 生命機能科学研究センターに所属が異動になります。

また、二階堂ユニットリーダーが、PIを兼任していた理化学研究所多細胞システム形成研究センター 一細胞オミックス研究ユニットは、バイオインフォマティクス研究開発ユニットへと発展的に統合され、さらなる研究を推進していきます。これにより、それぞれの研究室が持っていた研究ミッションが新センターへと引き継がれます。

研究拠点は、引き続き、和光キャンパスと神戸キャンパスにまたがった、2拠点体制となります。2018年度中には、ウェットの実験室と研究チームは神戸へ異動となります。バイオインフォやITに関わる研究チームは和光キャンパスか神戸キャンパスを自由に選べる、という体制になります。

研究テーマは、これまで通り「生命の情報」を計測技術・情報科学の両面から理解することを目標とし、そのための様々な技術の研究開発していきます。実験技術の開発はよりユーザーが近い神戸キャンパスで開発の連携を深めます。スパコン・クラウドの利活用は、これまで以上に情報システム部と連携を深めて、和光キャンパスにて研究開発を進めます。バイオインフォマティクス研究は両拠点で実施します。

高精度で低コストなハイスループット1細胞RNA-seq法Quartz-Seq2の論文が出版

大量の1細胞由来RNAを網羅的、高精度かつ低コストで計測する高出力型1細胞RNAシーケンス法「Quartz-Seq2(クォーツ・セックツー)」を開発し、論文が出版されました。以前プレプリントを公開していた論文です(参考: 高精度で低コストなハイスループット1細胞RNA-seq法Quartz-Seq2の論文が出版, 2017/07/05)

私たちの体は、数百種類の細胞が適切に混ざり合って構成されています。体の臓器が数十年にわたって正常に働くためには、必要な細胞を必要なだけ供給する幹細胞が必要ですが、臓器には幹細胞がごくわずかしか含まれていません。多種多様な細胞集団や希少な細胞の機能を理解するためには、一つ一つの細胞の特徴を調べる必要があります。その方法として、1細胞ごとにRNAの種類と量を計測する「1細胞RNAシーケンス法(1細胞RNA-seq)」があります。たくさんの細胞で正確に1細胞RNAシーケンスを実施できれば、細胞の状態を正確に計測できます。これまで、大量の1細胞からRNAの種類と量を計測する高出力型1細胞シーケンス法が開発されてきましたが、非高出力型の従来法と比べて、50~60%程度の遺伝子しか捉えられず、希少な細胞の状態を類推することが困難でした。

今回、我々は、高い検出遺伝子数と低コストを両立した、高出力型1細胞シーケンス法「Quartz-Seq2」を開発しました。Quartz-Seq2は、市販の高出力型1細胞RNAシーケンス法とほぼ同等のコストながら、200~240%の遺伝子数を検出しました。またQuartz-Seq2を利用し、胚性幹細胞(ES細胞)・分化細胞の計4,500個において、数個の希少細胞を検出することに成功しました。さらに、間葉系幹細胞が含まれる約1,000個のマウス脂肪組織から取り出した細胞を1細胞RNAシーケンスしたところ、間葉系幹細胞には2種類の幹細胞が含まれることが分かり、それぞれの細胞機能の違いを類推することができました。

本成果は、細胞分化や臓器・器官発生などの基礎研究から、再生医療における移植細胞の有効性・安全性評価など、様々なライフサイエンスの研究分野の発展に貢献すると期待できます。

Yohei Sasagawa, Hiroki Danno, Hitomi Takada, Masashi Ebisawa, Tetsutaro Hayashi, Akira Kurisaki, Itoshi Nikaido. Quartz-Seq2: a high-throughput single-cell RNA-sequencing method that effectively uses limited sequence reads. Genome Biology. 2018.

以下にプレスリリースが公開されています。

[論文]1細胞完全長トータルRNAシーケンス法RamDA-seqを発表

これまで検出が難しかった多様なRNA[1]の発現量と完全長を1細胞で計測できる「1細胞完全長トータルRNAシーケンス法『RamDA-seq』」を開発し、論文発表しました。

細胞の多様性は、ゲノムにコードされた数万の遺伝子領域から転写されるRNAの種類や量によって決まります。そのため、一つ一つの細胞の中に存在するRNAの種類と量が分かれば、どの遺伝子がどのくらい働いているかが分かり、細胞や臓器の状態・機能をより深く理解できます。1細胞に含まれるRNAの種類と量を網羅的に計測する技術は、「1細胞RNAシーケンス法(1細胞RNA-seq)」と呼ばれます。最近、非ポリA型RNA[4]が細胞分化や疾患に関与することが明らかになり、大きな注目を集めています。しかし、既存の1細胞RNA-seqでは非ポリA型RNAが検出できないため、非ポリA型RNAが細胞の中で機能していたとしても見逃してしまうという問題がありました。加えて、従来法にはRNAの全長が計測できずに途中で欠損する問題もありました。そのため、ゲノムDNAから転写された全てのRNAについて、ポリA型・非ポリA型を問わず、全長を偏りなく計測するために、新しい技術を開発する必要がありました。

今回、研究チームは、林センター研究員が新たに開発した核酸増幅法RT-RamDA法とランダムプライミング法を組み合わせ、「1細胞完全長トータルRNAシーケンス法『RamDA-seq』」を開発しました。従来法との性能比較の結果、RamDA-seqは非ポリA型RNAを含む約2倍の遺伝子種を精度よく検出でき、どんなに長いRNAでもほぼ全長の配列を計測できることを確認しました。また、マウス胚性幹細胞(ES細胞)[7]を用いた検証の結果、従来法では計測できなかったヒストンmRNA、長鎖ノンコーディングRNA(lncRNA)のNeat1、エンハンサーRNAといった非ポリA型RNAの細胞間での変動を計測できました。さらに、30万塩基を超える非常に長い新生RNAを捉えられました。

本成果は今後、細胞分化や臓器・器官発生などの基礎研究から、再生医療における移植細胞の安全性評価、血中循環腫瘍細胞など希少細胞集団の診断マーカーの開発まで、あらゆるライフサイエンスの研究分野の発展に貢献すると期待できます。

本研究は、英国のオンライン科学雑誌『Nature Communications』(2月12日付け)に掲載されました。

Tetsutaro Hayashi*, Haruka Ozaki*, Yohei Sasagawa, Mana Umeda, Hiroki Danno and Itoshi Nikaido. Single-cell full-length total RNA sequencing uncovers dynamics of recursive splicing and enhancer RNAs. Nature Communications. 2018.

より詳細なプレスリリースは以下からご覧頂けます。

1細胞から多種多様なRNAのふるまいを計測 -1細胞完全長トータルRNAシーケンス法の開発に成功-

[論文]CHARGE症候群原因遺伝子CHD7の機能解析にQuartz-Seqが貢献

慶應義塾大学医学部生理学教室の岡野栄之教授、神山淳准教授、MuhChyi Chaiさん、佐野坂さんらとの共著論文が出版されました。

MuhChyi Chai, Tsukasa Sanosaka et al. Chromatin remodeler CHD7 regulates the stem cell identity of human neural progenitors. Genes Dev. February 9, 2018

CHARGE症候群の原因遺伝子CHD7が、ヒト中枢神経系神経前駆細胞の性質維持に関連しているという報告です。前駆細胞の一部が、神経堤様前駆細胞に分化転換していました。我々が2013年に開発した1細胞RNA-seq法 Quartz-Seqが使われています。

慶應大の岡野研は、うちのラボからQuartz-Seqを導入して、自分らで実施できるようになりました。岡野先生と神山さんの素晴しいマネジメントのもと、優秀なテクスタさんが、いつでもデータが出せる状態になっていて、今回の論文に結びつきました。我々の方法の再現性が高いことを示して頂き、感謝です。

今回の論文は、疾患iPS細胞、ゲノム編集、エピゲノム、1細胞RNA-seqと最新技術を駆使しまくりでの希少疾患メカニズム解明でした。その一端を担えたことを誇りに思います。このようなメディカルサイエンスも含む多様なテーマで貢献できるのが、技術開発の醍醐味。First authorのひとりであるMuhChyi Chaiさんも、この論文で博士号を取得できるとのこと。おめでとうございます

少し裏話をしますと、なにげに、今回の論文で使っている方法は、ただのQuartz-Seqではなく、未発表の96ウェルベースQuartz-Seqだったりします。ライブラリプレップ報もLIMprep(ライゲーション)でなく、Nextera を使うという、幻のバージョンです。我々のラボではQuartz-Seq Nextというコードネームが付いていました。

Quartz-Sea Nextを発表しなかったのは、たくさんの細胞が実施できるQuartz-Seq2と、そろそろpublishになる1細胞完全長Total RNA-seq開発に集中したからです。このような形で、Quartz-Seq Nextが世に出てくれたことは、我々としても非常に嬉しいことです。

露崎さんのHeterogeneous Information Networkについての論文が採択

HeteroNAM’18/WSDM2018に、特別研究員の露崎弘毅さんの以下の論文が採択されました。

Koki Tsuyuzak and Itoshi Nikaido. Biological Systems as Heterogeneous Information Networks: A Mini-review and Perspectives. HeteroNAM’18. WSDM2018. 2018.

生命科学のデータは、ゲノム、RNA、タンパク質、表現型など様々な階層に渡り、複雑で多様なデータ構造を扱います。生命科学分野でのデータ解析では、これらのデータを統合的に解析する手法の確立が大きな課題となっています。一方、機械学習の分野では、Heterogeneous Information Network (HIN) という分野で、このような複雑なデータを統合的に解析する手法が発達しつつあります。

HINは、あらゆるデータを頂点(ノード)と枝(リンク)からなる「グラフ」と捉え、ノード同士の繋りを行列やテンソルとして表現します。これにより異なる種類のデータ同士を連結できます。このようなHINは、1. Prioritization、2. Missing-Link、3. Cross-Domain の解析ができるという良い性質があります。

本論文では、生命科学のデータ解析とHINについてのレビューと展望を述べました。まず、複雑で多様な生命科学データが、HIN として捉えられることを指摘しました。また、これまで生命科学でGuilt-By-Associationと呼ばれて活用されていた解析手法が、HINとして捉えられることを示し、これまでの手法との関連を網羅的に整理しました。さらに、生命科学分野でのHINによるデータ統合について、今後の展望を議論しました。特に、1細胞レベルでマルチオミックスが得られた際のデータ統合に利活用できるということを提言しました。

ConBio2017で5つの講演があります

2017年12月6-9日に神戸で行われる生命系学会合同年次大会(ConBio2017)では、我々のラボから、1つのシンポジウム、3つのワークショップにて講演があります。

0. 2017年12月6日(水) 09:00 〜 11:30 第1会場 (神戸ポートピアホテル 本館 地下1階 偕楽1)
[1AW01] いかにして「使える」データベースを維持し続けるか?
10:54 〜 11:12 [1AW01-6] データベースとデータ解析の融合 ~なぜデータベースは必要か~
〇露崎 弘毅1 (1.理研・情報基盤・バイオインフォ)

1. 2017年12月7日(木) 09:00 〜 11:30 第14会場 (神戸国際会議場 3階 国際会議室)
シンポジウム[2AS14] シングルセル解析が切り開く薬理学の新潮流
オーガナイザー:成田 年(星薬科大学)、オーガナイザー:山中 章弘(名古屋大学)
09:33 〜 10:01 [2AS14-2] RamDA-seq: あらゆるRNAの全長を1細胞レベルで検出するRNAシーケンス法
〇二階堂 愛1(1.理研・情セ・バイオインフォ)

2. 2017年12月8日(金) 09:00 〜 11:30 第5会場 (神戸ポートピアホテル 本館 地下1階 菊水)
ワークショップ[3AW05] 分子生物学的アプローチによる運動器研究の新展開
オーガナイザー:乾 雅史(明治大学)、オーガナイザー:早田 匡芳(筑波大学)
11:05 〜 11:25 [3AW05-7] 高出力1細胞トランスクリプトーム解析の展開と多細胞生物学
〇團野 宏樹1、笹川 洋平1、二階堂 愛1(1.理研・情報基盤・バイオインフォマティクス)

3. 2017年12月8日(金) 16:00 〜 18:30 第15会場 (神戸国際会議場 3階 レセプションホール)
[3PW15] ゆらぎが担う器官発生のしくみ
オーガナイザー:髙里 実(理化学研究所)、オーガナイザー:栗崎 晃(奈良先端科学技術大学院大学)
16:00 〜 16:25 [3PW15-1] 1細胞トータルRNAシーケンス法は、発生生物学の「ゆらぎ」解析にパラダイムシフトをもたらすのか?
〇林 哲太郎1、尾崎 遼1、笹川 洋平1、團野 宏樹1、梅田 茉奈1、二階堂 愛1(1.理研・ACCC・バイオインフォマティクスU)

共同研究者からの一般口頭発表もあります。

4. 2017年12月9日(土) 16:15 〜 17:45 第16会場 (神戸国際会議場 4階 401+402)
一般口頭発表 | 7. 発生・再生 | 発生・再生(一般口頭発表)
[4P2T16] 発生・再生 Ⅴ
座長:谷水 直樹(札幌医科大学)、座長:松井 貴輝(奈良先端科学技術大学院大学)
16:55 〜 17:05 [4P2T16-05(3P-0817)] 毛包幹細胞の起源と誘導メカニズムの解明
〇森田 梨津子1、三千 典子1、林 哲太郎2、梅田 茉奈2、芳村 美佳2、二階堂 愛2、阿部 高也3、清成 寛3,4、古田 泰秀3,4、藤原 裕展1(1.理化学研究所、2.理化学研究所、3.理化学研究所、4.理化学研究所)