OpenUpSPtalk

「京」を中核とする日本の高性能計算基盤(HPCI)を活用して、生命科学分野で世界最高水準の研究成果を達成することを目指し、2011年度から本格実施となったHPCI戦略プログラム 分野1「予測する生命科学・医療および創薬基盤」(略称SCLS)が2015年度末に終了する。計算生命科学によって、生命現象の予測・制御の可能性を探り、その成果を医療・創薬に結び付けるという目的に向けて研究を実施するなかで、どのような成果が得られ、今後の計算生命科学の発展に向けてどのような展望が得られたのか。プロジェクト推進に尽力してきた柳田敏雄氏、木寺詔紀氏、江口至洋氏にお話しいただいた。


以下緑色の文字で表記している箇所はWeb版でのみ公開のロングバージョン部分です。

計算科学なんて役に立つの?

−SCLSが動き出した当初、どのようなお気持ちでしたか。

柳田 (敬称略、以下同) 突然に統括責任者に任命されて、「なぜ計測をやってきた私が統括責任者なのか、計算機のプロでもないのに」と戸惑う気持ちもありました。確か、最初の挨拶のときに、「計算科学なんて、生命科学にあまり役にたたへんのちゃう?」といってしまったような気がします(笑)。

木寺 そうでした(笑)。

柳田 それまでの生命科学自体が、中身がよく分からなくても成果を上げることができており、「ややこしいプロセスなんて知らなくてもええやん」という感じだったからだと思うんです。でも、それではもうだめだということは、もちろん生命科学者の実感として広がっていて、「じゃあ、どうしたらいいの」という状況だったわけです。遺伝子解析などの計測技術はどんどん進んで、データを取れば分かるかと思ったら複雑になるばかり。「これは、やっぱり計算せなあかんのちゃうか」という機運になって、少しずつ理解を示すようになったと思います。もう1つ、「これからは複雑なものを複雑なまま理解せなあかん」ということも、みんな分かってきました。これまでは、研究者が複雑な現象を自分の頭のなかで単純化して、仮説に従って実験をし、答えを出してきました。科学者は、誰もがそれを求めます。ところが、生命科学はそれほど単純にはいきません。そこに働いているメカニズムは、1つの数式ですっきりと表現できるような美しいものではありません。もっと複雑な解析が必要です。そうするとコンピュータが必要になります。そうやって、少しずつ「生命科学の研究に、計算科学は欠かせんものなんやなぁ」という思いが生まれてきました。しかし実際にやってみたら、全然パワーが足りない。それでも「京」を使い、みなさんが努力してくださったおかげで、「あ、『京』を使ったら、質の違うサイエンスが生まれるやん」という感じで、統括責任者も心変わりをして、「これは推進せなあかん」という気持ちに至ったという次第です。計算科学の人たちが頑張ってくれたおかげですね。

木寺 柳田先生の最初の一言は、すごく印象に残っています。確かその挨拶の後に、「若い研究者のやる気を削ぐようなことをいわないでください」とお話しした記憶があります(笑)。そうクギをさしたくなるほど柳田先生の一言にはインパクトがありました。というのも、まさに図星だったからです。要するに、本当に生命科学に貢献するような結果を、当時、計算科学は出すことができていませんでした。SCLSの前に「次世代生命体統合シミュレーションソフトウェアの研究開発(ISLiM)」がありましたが、そこで私たちが何をやってきたかというと、基本はソフトウェア開発です。その成果はこのプロジェクトの基盤になっていますが、そのころはソフトウェアをつくっただけで、まだ「京」は使わせてもらえませんでしたから、生命科学者が納得するような成果を出すことはできませんでした。また、何をターゲットに選んで、どういう計算をして、どういう結果が欲しいかという問題意識も、それほどはっきりしていませんでした。いってみれば、「汎用性のあるソフトウェアをつくりました。どうです、すごいでしょ」というのが、ISLiMの結果でした。それが分かっていたから、柳田先生にズバリといわれたら困るという思いがありました。ただ、実際に「京」を使い始めると、「ここまでできるのか」という気持ちで、ターゲットや何を見るべきかも明確になり、そのための研究体制も整ってきました。「京」を使ってどのように計算をすればよいのかが分かってくるにつれて、研究者もある程度経験を積み、自信が持てるようになり、「もう、柳田先生も怖くない。どうだ」という気分になってきた、それがちょうどプロジェクトが半ばを迎えたころです。ようやくスーパーコンピュータを活用したライフサイエンスのイメージがつかめてきましたし、少しずつ結果も出始めてきてきました。その後は、それまで以上に勢いが出て研究が進んだ、そんな5年間だったと思います。

柳田 そういう意味では、最初の挨拶は作戦成功だった(笑)。

木寺 成功どころか、とにかくいちばん強いインパクトは、その最初の挨拶と、中間段階でのいろいろな組織改編、要するに計算科学の外の生命科学者らとどう組むのかという点を強調されたところです。それによって、初めてスムーズに動き出したといってもいいと思います。それまでは、計算科学の殻に閉じこもるというほどではないにしても、実際にプロダクトを出さずとも、優れたソフトウェアをつくって、それがうまく動けば何か分かった気がする、そんなところがありました。それが大きく変わりました。

柳田 いや、私はもっとマイルドに、「計算機もとても楽しいけれど、それを応用して生命科学のメカニズムを生命科学者と一緒に理解したら、もっと楽しいよ」といったんです(笑)。そうすることによって、これまでと質の違うサイエンスが生まれたわけです。
柳田先生

大学や産業界の研究現場と「京」をつなぐことが重要

江口 プロジェクトを始めるときに柳田先生がいっておられましたが、他の分野と違い、まだ生命科学の分野では計算機はマイナーな人しかやっていなくて、人数的にも質的にもマイナーな分野。「そこで何を考えたらええの」って。それはまさに真実で、もしかしたら今も同じかもしれません。そんな状況のなかで、何をしていけばいいのか。いちばん重要なのは、「京」を使って研究開発されている先生方と、大学の研究や民間企業での研究の現場をつなぐことではないかと思っています。そして、大学や産業界の方々が、「もしかすると使えるかもしれない」、「薬がつくれるかもしれない」、「医療現場で役立つかもしれない」と近づいてきて、実際にやっている様子を目にして「自分もやってみようか」と考えるようになればいいと思って進めてきました。それが私のスタートラインでした。そして、具体的につながったのが、藤谷先生が開発された「MP-CAFEE」を利用するプロジェクトでした。当初、木寺先生に相談したら、「誰もが使いやすいのは『MP-CAFEE』ではないですか。他は専門的すぎて、一般の人はなかなか入りにくいですから」といわれました。そこで、「MP-CAFEE」をベースに産業界の方々を組織しようということになりました。最初は製薬企業2社でしたが、現在は参加する企業が20社を超えています。恐らく大学の研究者との間でも、そういった“つなぐ”ということがいちばん重要で、それがアウトリーチ活動の肝だろうと思っています。産業界や大学等研究機関で計算科学を活用していくことは、世界的な動きでもあります。もちろん、生命科学の分野に限ると日本で大きく広がったかというと、まだそれほどではありません。もっと盛んにしていくためには、現在プロジェクトに参画している先生方の次の世代、さらにその次の世代を育てなければいけないと思います。そういう意味で、教育は重要です。かなり努力しないといけません。ただ本来的には、それは大学あるいは高等学校の役割かもしれませんが。
江口先生

柳田 生命科学では、まだ計算科学が成熟しておらず、大学の教育も足りない、それは理解できますが、他の分野では、もうコンピュータは基盤技術というか、サイエンスとして必須のものになっています。それでもソフトウェア開発者の人材が足りません。ユーザー的立場の人はたくさんおるのにね。

江口 学問的に評価されにくいということもあるかもしれません。

柳田 技術開発と一緒ですね。一生懸命にベースになる技術を開発しても、それを使って面白い仕事をした人だけが評価されてしまうという……。

江口 それは、これまで使っていたソフトウェアを「京」に移植する場合も同じです。「京」の能力を最大限に引き出すためには、新しいプログラムを書くことになります。でも、それは「生命科学の仕事じゃない。そんなの誰かやってよ」ということになってしまうわけです。

柳田 研究者は生命科学の研究がやりたいのであって、コンピュータの研究がしたいわけではないということですね。やはり、大学の改革が必要です。私たちが踏み込む話ではありませんが、新しい分野がどんどん開発されているのに、学生たちが最先端で研究したくても大学に計算生命科学科がないわけですからね。計算機のソフトを書いて、それを面白いサイエンスに展開していくところまで視野に入れた教育を、きちんとやっていくべきかもしれません。

木寺 生命科学や医学は、古くからあります。計算科学や情報科学もありますよね。でもその間をつなぐ分野がないわけです。なぜないのか。それはすべての大学組織が学部を基礎にしているからです。そのため、それぞれの間を結ぶ境界領域が育ちにくいわけです。そこで、例えば大学に境界領域の研究を行う附置研究所を設置して、新しい研究の芽を育てようとするのですが、当然ながら学生は集まりません。人は育たないし、研究も進まず、結局それぞれが“タコつぼ”でやることになる、これが日本の大学の状況だと思います。計算生命科学に限らず、あらゆる分野で境界領域が育たないという話はよく聞きます。

それぞれに優れた成果を達成した4課題

−SCLSの4つの課題は、この5年間でどのような成果を達成してきたでしょうか。

木寺 4課題それぞれに、少しずつ違った意味の成果が出ています。ISLiMでは、まずはソフトウェア開発が必要だといいながら、実際に要求されたのは、生命科学にとって意味のある成果でした。当時求められた最も大きな課題は、生命科学における階層接続でした。生命には、分子から細胞・臓器・全身という空間的に小さなものから大きなもの、さらに時間的に短いものからゆっくりした現象が、非常に幅広いスケールで存在しています。それぞれがどうかみ合わさっているのかを詳細に理解できるようにすることが要求されました。
木寺先生
「京」がまだ使えない状況で、「そんなことできません」というのが私の正直な気持ちでしたが、とにかく頑張るしかありませんでした。それでも、SCLSが始まって、初めて「京」レベルで計算ができるようになり、まだ始まったばかりでしたが、生命の階層を接続する道が開けてきました。例えば課題1の分子レベルの研究では、たくさんのタンパク質、生体分子を入れた細胞スケールの生命現象を扱うことに取り組み、細胞内でのタンパク質などの振る舞いをあるがままに再現する最初の細胞モデルになり得るかもしれない、その入り口に立ったともいえるシミュレーションができようとしています。
より大きなスケールで階層接続に挑戦しているのが課題3です。ここでは、本当に奇跡としかいいようがないレベルで、分子スケールから心臓という臓器までをつなぐことに成功し、心臓シミュレータ「UT-Heart」が開発されました。実に驚くべき成果だと思います。もちろん、課題1のレベルで分子を扱ったら、「京」の計算能力でもとても追いつきませんが、そのエッセンスを取り込んだ上で、その上位の心筋細胞の振る舞いを表現するモデルづくりに成功し、非常に精緻な心臓全体のモデルができました。そればかりでなく、課題3では脳・神経・筋肉・骨などをつなぐという、よりチャレンジングな課題に取り組み、全身のモデルをつくり上げ、今まさに動かしつつあるというところまできました。課題3では、小さなスケールから大きなスケールまで、いろいろな種類のアルゴリズムでつくったシミュレータで階層を接続するというだけでなく、まさに階層を統合したシミュレーションを実現していると思います。ISLiMの課題であった階層接続に対する答えが、「京」を活用することにより、十分に出てきたわけです。これにより、ようやくいろいろな生命科学の問題に応えるための準備が整いつつあります。
最初に柳田先生からお話がありましたが、これまでの生命科学では、実はこうした階層接続をはじめ、いろいろなところで無理矢理つないでいた部分がありました。ジェノタイプ(遺伝子型)とフェノタイプ(表現型)もその1つです。しかし、「実はジェノタイプって、もっと複雑ですよ」というところに着目し、とにかく全部調べて、その関係を見ましょうと、膨大な量のデータ解析を「京」を活用した大規模計算で展開したのが課題4です。そして、この大規模な生命データ解析によって、初めて本当の意味でジェノタイプとフェノタイプを結びつけ、その複雑なシステムを明らかにすることができ始めています。単にデータ解析のレベルが大きくなっただけではありません。フェノタイプは、言い換えれば臨床現場から上がってくる疾病の情報であり、ジェノタイプは、その疾患を持っている人たちの情報です。それらを結びつけることで、疾患を理解できるかもしれないということを、現場の医師の信頼を勝ち取りながら体制をつくり、本当の意味でジェノタイプとフェノタイプの接続を可能にしようとしています。これが何よりもすごいところです。実際に医療の現場で次世代シーケンサーによって得られた情報が、本当に有用な情報として活かされる、そのベースを築いたことは高く評価できると思います。
「スパコンを使って何をするのか?結果を出しなさい」というストレートな社会的要請に応えるために参加していただいたのが、藤谷秀章先生を中心とした課題2です。「『京』があれば、薬が開発できますか?」といわれて「やってみましょう」と答えられたことに、最初は驚きました。「大丈夫ですか」という思いでした。ところが、最終的には、ちゃんと前臨床までたどりつく成果を、抗体も含めて3つほど生み出してくださいました。もちろん、いろいろなサポートがあって実現したのだとは思いますが、「京」を使えば、限られた時間のなかでこれだけのことができるということを見事に実証された。これはすごいことです。また、その最大効率を追求する姿勢は、この戦略分野にとって大きな刺激になったと思います。私たちも含め、プロジェクトに参加する研究者にとって、大いに学ぶところがありました。

計算科学が生命科学を主導する

柳田 何よりも強調しておきたいのは、「京」の計算パワーがあったからこそ、これだけの成果が生まれたということです。「もっと計算性能が低いマシンでも、それなりの時間をかければ達成できたのでは」という人もいますが、そうではありません。どの課題も、明らかに「京」の計算パワーがなければできないことにチャレンジしてきました。最初にいったように、計算科学が生命科学の質を変えつつあるということを示してくれました。そこが大事だと思います。

木寺 例えば階層接続を考えたら、本当は無限大の計算量が欲しいんです。ところが計算量は限られています。研究者は、いつもそのなかで何ができるかを考えるわけです。上限があって、計算の仕方が決まります。しかし、「京」ができたことによって、「ここまで使えるなら、こんな幅広い可能性が追求できます」というように、計算の自由度が広がりました。そこに意味があると私は考えています。今後さらに先へ進めば、もっと大きなチャレンジが生まれるはずです。そのためのプロトタイプ、お手本を「京」がつくったといえるのではないでしょうか。

江口 まさに生命科学そのものの見方を、この4つの研究グループは変えつつあるという思いを抱いています。近年、計測技術は驚くほど進歩し、大量のデータが一気に出てくるようになりました。それにより、得られたデータの一部に注目して現象を理解しようとする今までの生命科学とは違う、例えば課題4のように大量のデータのなかでトータルに現象を語らせようとする手法が求められるようになっています。それを「京」が可能にしました。今後も、これまでやりたくてもできなかった新しい研究スタイルが、どんどん出てくると思っています。

柳田 まだまだ生命科学の研究者のなかには、計算機を自分たちがやった実験結果や仮説を説明してくれる道具として認識している人が少なからずいます。しかし、計算科学は生命科学のお手伝いをしているわけではありません。計算科学が新しい生命科学を切り拓いていくのだということを知っていただきたい。データ駆動型の生命科学を主導していく立場にあるということです。計算生命科学は、ただ計算するだけでなく、データを解析する技術や解析結果をどう見るかというところまで踏み込んでいかなければ進んでいきません。つまり生命科学者がそういう分野をつくっていかなければいけないわけです。そのためには、最先端のソフトウェアを理解できるポテンシャルを持った人に生命科学をやってもらい、「京」をどんどん使って、新しいデータ駆動型の生命科学を開拓していってもらいたいですね。もはや計算科学は、生命科学の一部であるということです。


−5年間、ご苦労も多かったのではありませんか。

江口 最初の2~3年間は、「京」を使いこなす上でいろいろと試行錯誤が続き、先生方も苦労されたと思います。「京」ができる前にISLiMでソフトウェア開発が始まり、それをベースにSCLSの先生方がそれぞれ開発を進めてきましたが、「京」の能力を最大限引き出すには多くの苦労がありました。それまでとは比べものにならない高速かつ大規模の計算を進めていかなければいけないわけですから。

木寺 半年以上かけた計算を全てやり直さなければいけないケースもありました。チェックしながら進めてくださいといわれても、実際は不可能です。何しろ膨大なデータと格闘しながら、それをうまく整理しつつ研究を進めていくのですが、計算結果が正しいと思うからこそできるわけで、そのなかで技術的なエラーを探せといわれてもそれは無理な話です。とにかく「京」でソフトウェアを動かして、まさにデータまみれになりながら、実験データを再現し、そこから新しい何かを見つけ出す、それは本当にたいへんな作業です。巨大なデータを処理し、膨大な時間がかかる作業を延々と続けながら成果につなげていかなければなりません。そんなわけで、プロジェクトの半ばくらいまでが試行錯誤の段階だったといっても過言ではありませんでした。このように膨大な計算量と時間をかけて、それでも最終的に4課題全てで、しっかりとした研究のプロトタイプと呼べるものができたという思いを強く抱いています。新しいシステムになっても、課題が違っても、これからこの分野に加わる研究者に「こうやればいいんだよ」といえる1つの形をつくり上げることができたと思います。

生命科学者が計算機を使いこなす時代へ

集合写真

−この5年間の成果は、今後、どのように継承されていくのでしょうか。

木寺 今回の「京」による研究とその成果は、今後さらに計算資源が大きくなる方向に進んだときの新たな芽になると思います。研究のやり方、つまりどのように大量の情報を持ち込んで、それをどう操作して、どのような結果を得るかについて、確かなお手本ができ上がりました。これを活かして、今後、さらに多くに研究者がこの分野に参入してくれることを期待したいですね。

柳田 「京」でできたことは、それで十分というわけでなく、さらに100倍の計算パワーを持つ計算機ができれば、さらに階層をつなぐ計算がしたくなるし、もっとジェネラルな問題を解きたくなるという話になるでしょうね。例えば、体全体のシステムのなかで心臓の機能をどうとらえるか、メンタルな状態とどのようにカップルしているのかといったことも含まれるかもしれません。私は、大学で生理学教室の教授をしていましたが、実は医学にとっていちばん大事なのは生理学です。例えば、メンタルな状態が免疫反応をどうコントロールしているのかといった、体丸ごとの生理的状態を知りたいわけです。これについても、やがて計算生命科学が新たな道を拓いてくれるのではないかと確信しています。それによって、生命科学も医学も大きく変わっていくでしょう。

江口 生命科学を変えようとしているのは、計測と計算機だと思います。ただ、計算機が100倍大きくなっても、計測が今のままだったら、精度の高い計算はできません。計算科学に対応して計測技術も進化させていかなければいけないはずです。例えば、本当の意味で細胞丸ごとシミュレーション、心臓丸ごとシミュレーションができるためには、「細胞丸ごと」、「心臓丸ごと」という言葉に対応する計測技術がついてこないと、結局は机上の空論になってしまいます。今後、計測と計算機は、お互いに意識しながら、つながって進んでいくことが必要です。

柳田 おっしゃるとおりです。今の計測は、複雑なものをそのまま計測しているわけではありません。仮説のもとで、見たい現象にフォーカスして、単純化して、それを計測しています。いってみれば、99%のデータを捨てているわけです、仮説に合ったデータしか残しませんから。でも、体丸ごとでどんなパラメーターを計測しても、計算機のなかで評価してもらえるなら、多分、計測屋さんは今の100倍ぐらいのデータを出してくれるでしょう。また、そういうシステムができたら、計測屋さんがそれに合わせて必要なデータを測って、コンピュータに入れて次の計算に役立てることも可能になります。計算と計測でターゲットを絞って、薬を入れたらどう変わるかを詳しく調べることもできます。計測も変わるし、何より生命科学の質が変わりますよね。パラダイムシフトを起こすことができるわけです。

木寺 実際のデータをモデルに取り込むことによってシミュレーションの精度を高めるといったデータ同化は、多分、生命科学分野でこれからより強くキーワードとして認識されるだろうと思っています。そのためにも、生命科学のフロントの部分では、やはり研究者が計算機を使わないといけない時代になってきています。つまり、計算生命科学という分野を立ち上げる必要はないわけです。生命科学のなかに組み込まれていけばいい。むしろ、その方が理想的であると考えています。

江口 計算機とかソフトウェアというものが、これまでの試験管や試薬と同じようなものになりつつあるということですね。生命科学の研究室のなかで、計算機が当たり前のように存在する。そうなったら、もう計算生命科学という言葉はなくなってしまいますね。

木寺 「スーパーコンピュータを使わないと、もう、これからはやっていけません」と話す現場の先生方が現れたのは、今回のプロジェクトが初めてかもしれません。さらに今後、そうした芽が育っていってほしいですね。

柳田 生命科学者が計算機を試験管と同じように使いこなす時代は、きっと来ると思いますよ。

pegetop

Open Up Special Talk 4課題の5年間の取り組みと成果
課題1  細胞内分子ダイナミクスのシミュレーション
課題2  創薬応用シミュレーション
課題3  予測医療に向けた階層統合シミュレーション
課題4  大規模生命データ解析