第1回 HPC OPS 研究会のお知らせ

第1回 HPC OPS研究会

概要

HPC OPS(えいちぴーしー おぷす)研究会は、自然科学研究の成果を最大化するための科学計算環境についての研究会です。研究時間やコストを低下させ、本来の研究活動に時間を割けられるよう科学計算環境の開発運用のノウハウを共有します。また、そのような計算環境そのものを研究開発したり、提供する研究者や技術者との交流を目指します。

具体的な技術としては、コンテナ型仮想計算やクラウドでのHigh Performance Computing への応用や、DevOps による科学計算環境の自動構築、データ解析ワークフローエンジンの実装、最適なオンプレミスPCクラウタの運用構築などについて議論します。産学官などの垣根を越えて、クラウドやDevOps, HPCに関わる技術者や科学者などからの参加を広く募集します。

  • 日時:2018年3月13日、13時30分-18時
  • 場所:日本マイクロソフト (品川)、31階セミナールーム(C+D)
  • 参加申し込み: support-bayes at riken dot jp へご連絡だください。3月8日13:00まで。延長しました。3月12日月曜日 13:00 まで。(席が埋まりましたらその前に締め切らせていただくことがあります)。
  • 主催: 理化学研究所. 協賛: 日本マイクロソフト

プログラム

時間 内容
13:00-13:30 受付
13:30-13:40 オープニング

二階堂愛
国立研究開発法人理化学研究所 情報基盤センター バイオインフォマ
ティクス研究開発ユニット 「研究生産性を向上させるためのHPC OPS」

13:40-13:45 諸注意など
石井学
国立研究開発法人理化学研究所 情報基盤センター バイオインフォマ
ティクス研究開発ユニット
13:45-14:10 大田 達郎
大学共同利用機関法人 情報・システム研究機構 データサイエンス共同利用基盤施設 ライフサイエンス統合データベースセンター「DBCLSでのコンテナ・クラウド活用紹介」
14:10-14:35 澤登亨彦
HiganWorks合同会社 .モビンギ株式会社「Dockerコンテナをつかったホスティングサービスと用途別コンテナイメージの話」
14:35-14:45 中田寿穂
日本マイクロソフト株式会社パブリックセクター事業本部
クラウドアーキテクト「HPC on Azure」
14:45-15:05 休憩&ミキサー
15:05-15:20 柴田 直樹
エクストリーム-D株式会社 CEO, High Performance Cloud Architect クラウドスパコン構築運用自動化サービス「XTREME-DNA」
15:20-15:45 竹房あつ子
国立情報学研究所 アーキテクチャ科学研究系「クラウドでのアプリケーション環境構築・管理を支援するオンデマンドクラウド構築サービス」
15:45-16:10 松嶋明宏
国立研究開発法人理化学研究所 情報基盤センター バイオインフォマ
ティクス研究開発ユニット「科学技術計算用クラスタへのDocker導入と運用」
16:10-16:35 笠原雅弘
東京大学 大学院新領域創成科学研究科 メディカル情報生命専攻
「最先端のゲノム解析で使いたい理想のコンテナ仮想化を考える」
16:35-16:55 休憩&ミキサー
16:55-17:50 ディスカッション
17:50-18:00 クロージング
懇親会

講演は、発表20分、質疑応答、演者交代を含めて5分、トータル25分予定です。

休憩とミキサーの時間を何度か取っておりますので、交流や議論などを深めていただければと思います。終了後、懇親会を行いたいと思っております。

ディスカッションの話題としては、以下のようなものを考えております

  • パブリッククラウドやプライベートクラウドの利活用
  • コンテナ型計算環境
  • Reproducibility, バックアップ
  • HPC, ジョブスケジューラ, DevOps、セキュリティ
  • 産官学連携、他研究分野との交流、情報交換など

これまでの活動

ハッシュタグ: #hpcopsjp

追記: プレゼンに利用したスライドをを演題タイトルからリンクしました (2018/03/15)

[論文]1細胞完全長トータルRNAシーケンス法RamDA-seqを発表

これまで検出が難しかった多様なRNA[1]の発現量と完全長を1細胞で計測できる「1細胞完全長トータルRNAシーケンス法『RamDA-seq』」を開発し、論文発表しました。

細胞の多様性は、ゲノムにコードされた数万の遺伝子領域から転写されるRNAの種類や量によって決まります。そのため、一つ一つの細胞の中に存在するRNAの種類と量が分かれば、どの遺伝子がどのくらい働いているかが分かり、細胞や臓器の状態・機能をより深く理解できます。1細胞に含まれるRNAの種類と量を網羅的に計測する技術は、「1細胞RNAシーケンス法(1細胞RNA-seq)」と呼ばれます。最近、非ポリA型RNA[4]が細胞分化や疾患に関与することが明らかになり、大きな注目を集めています。しかし、既存の1細胞RNA-seqでは非ポリA型RNAが検出できないため、非ポリA型RNAが細胞の中で機能していたとしても見逃してしまうという問題がありました。加えて、従来法にはRNAの全長が計測できずに途中で欠損する問題もありました。そのため、ゲノムDNAから転写された全てのRNAについて、ポリA型・非ポリA型を問わず、全長を偏りなく計測するために、新しい技術を開発する必要がありました。

今回、研究チームは、林センター研究員が新たに開発した核酸増幅法RT-RamDA法とランダムプライミング法を組み合わせ、「1細胞完全長トータルRNAシーケンス法『RamDA-seq』」を開発しました。従来法との性能比較の結果、RamDA-seqは非ポリA型RNAを含む約2倍の遺伝子種を精度よく検出でき、どんなに長いRNAでもほぼ全長の配列を計測できることを確認しました。また、マウス胚性幹細胞(ES細胞)[7]を用いた検証の結果、従来法では計測できなかったヒストンmRNA、長鎖ノンコーディングRNA(lncRNA)のNeat1、エンハンサーRNAといった非ポリA型RNAの細胞間での変動を計測できました。さらに、30万塩基を超える非常に長い新生RNAを捉えられました。

本成果は今後、細胞分化や臓器・器官発生などの基礎研究から、再生医療における移植細胞の安全性評価、血中循環腫瘍細胞など希少細胞集団の診断マーカーの開発まで、あらゆるライフサイエンスの研究分野の発展に貢献すると期待できます。

本研究は、英国のオンライン科学雑誌『Nature Communications』(2月12日付け)に掲載されました。

Tetsutaro Hayashi*, Haruka Ozaki*, Yohei Sasagawa, Mana Umeda, Hiroki Danno and Itoshi Nikaido. Single-cell full-length total RNA sequencing uncovers dynamics of recursive splicing and enhancer RNAs. Nature Communications. 2018.

より詳細なプレスリリースは以下からご覧頂けます。

1細胞から多種多様なRNAのふるまいを計測 -1細胞完全長トータルRNAシーケンス法の開発に成功-

[論文]CHARGE症候群原因遺伝子CHD7の機能解析にQuartz-Seqが貢献

慶應義塾大学医学部生理学教室の岡野栄之教授、神山淳准教授、MuhChyi Chaiさん、佐野坂さんらとの共著論文が出版されました。

MuhChyi Chai, Tsukasa Sanosaka et al. Chromatin remodeler CHD7 regulates the stem cell identity of human neural progenitors. Genes Dev. February 9, 2018

CHARGE症候群の原因遺伝子CHD7が、ヒト中枢神経系神経前駆細胞の性質維持に関連しているという報告です。前駆細胞の一部が、神経堤様前駆細胞に分化転換していました。我々が2013年に開発した1細胞RNA-seq法 Quartz-Seqが使われています。

慶應大の岡野研は、うちのラボからQuartz-Seqを導入して、自分らで実施できるようになりました。岡野先生と神山さんの素晴しいマネジメントのもと、優秀なテクスタさんが、いつでもデータが出せる状態になっていて、今回の論文に結びつきました。我々の方法の再現性が高いことを示して頂き、感謝です。

今回の論文は、疾患iPS細胞、ゲノム編集、エピゲノム、1細胞RNA-seqと最新技術を駆使しまくりでの希少疾患メカニズム解明でした。その一端を担えたことを誇りに思います。このようなメディカルサイエンスも含む多様なテーマで貢献できるのが、技術開発の醍醐味。First authorのひとりであるMuhChyi Chaiさんも、この論文で博士号を取得できるとのこと。おめでとうございます

少し裏話をしますと、なにげに、今回の論文で使っている方法は、ただのQuartz-Seqではなく、未発表の96ウェルベースQuartz-Seqだったりします。ライブラリプレップ報もLIMprep(ライゲーション)でなく、Nextera を使うという、幻のバージョンです。我々のラボではQuartz-Seq Nextというコードネームが付いていました。

Quartz-Sea Nextを発表しなかったのは、たくさんの細胞が実施できるQuartz-Seq2と、そろそろpublishになる1細胞完全長Total RNA-seq開発に集中したからです。このような形で、Quartz-Seq Nextが世に出てくれたことは、我々としても非常に嬉しいことです。