OpenUpSPtalk

「京」の登場によって、これまで計算性能の限界から困難とされていた、実際の細胞内の環境に近い条件下で生体分子の振る舞いを再現する道筋が開かれようとしている。課題1「細胞内分子ダイナミクスのシミュレーション」(代表:理化学研究所・杉田有治主任研究員)は、分子レベルの計算から、生命現象の理解・予測に向けた「細胞まるごとシミュレーション」の実現をめざす。今回は、そのための要となる細胞内分子ダイナミクスのシミュレーション研究に取り組む6名の研究者に話を聞いた。

緩やかな連携のもと、それぞれの課題にチャレンジ

openup

●みなさんは、現在、課題1でどのような研究に取り組んでおられるのですか。

 杉田チームは、「京」を用いた大規模な分子動力学計算によって、細胞環境中における生体分子の振る舞いをコンピュータ上に再現することをめざしています。そのなかで、私たちはマイコプラズマというバクテリアをターゲットに、その代謝ネットワークに関わるほぼ全てのタンパク質や代謝物が、現実の細胞内に近い濃度で共存する細胞環境モデルを、原子レベルで作成しました。現在はそのモデルを用いて、全原子分子動力学シミュレーションを実行しています。細胞内は生体分子が非常に混み合っていて、たくさんのタンパク質や低分子、イオンなどが、満員電車のようにごった返しています。そうした混雑環境でタンパク質や低分子がどのようなダイナミクスや相互作用を示しているかは、生物学的にも重要な問いですが、実験的に測定が難しく、よく分かっていません。それを解明するのが目標です。

岩本  私たちのチームがやっているのは、細胞内環境を考慮した細胞内のシグナル伝達経路のモデリングとシミュレーションです。細胞は、環境の変化に対して適切に応答しています。その応答はシグナル伝達と呼ばれ、その経路は、細胞内の多くのタンパク質同士の化学反応による一連の反応ネットワークです。こうしたシグナル伝達経路は細胞内に数多く存在しています。そのなかでもよく知られているのが、上皮成長因子(EGF)シグナル伝達経路です。これは、外部からEGFタンパク質の刺激を受けて情報を細胞内に伝達し、細胞の成長や分裂、分化を促す役割を持っています。今、私たちはこの経路のネットワークに関する細胞シミュレーションに取り組んでいます。細胞シミュレーションは、コンピュータ上で仮想的に細胞をシミュレーションする方法ですが、私たちの手法の大きな特徴は、「京」の高度な計算性能を活用して、細胞の形や構造物をすべて入れ込み、細胞内のタンパク質の1分子ごとのランダムな動き・衝突・ゆらぎなどをすべて表現している点です。

神谷  細胞内のシグナル伝達は、主に複数のリン酸化酵素のリン酸化反応によって行われます。リン酸化酵素の反応活性は、細胞内のシグナル伝達のカギとなる化学的な過程であり、細胞環境内での反応活性の分子機構を明らかにすることは、細胞内シグナル伝達の理解と制御に向けた分子論的な基盤を構築する上で重要です。私たちのチームは、そのためにシグナル伝達経路上のリン酸化酵素の反応性解析に関する研究開発を行っています。優さんが話されたように、細胞内は非常に混み合った環境です。私たちは、そうした混み合った環境のなかで、どんな化学反応がおきているのか、それは普通の水のなかでおきる反応とどう違うのかを明らかにするために、量子化学計算(QM)と分子力場計算(MM)を結合したQM/MM法を用いて解析を行っています。

金田  私たちの研究チームが開発した粗視化分子動力学シミュレーター(CafeMol)を使い、シグナル伝達経路の代表的モデルの1つであるMAPK系のリン酸化カスケード(反応の連鎖)に焦点を当てた研究を行っています。シグナル伝達については岩本さん、神谷さんも話されましたが、哺乳類のMAPK系カスケードでは、外からの刺激を契機に上流のタンパク質MEK1(MAPKK)が、下流のタンパク質ERK2(MAPK)をリン酸化することで活性化し、信号が最終的に核内まで伝達されます。しかし、リン酸化の分子スケールでの動的機構については、未だにその詳細は明らかになっていません。そこで私たちは、すでに構造が分かっているMEKとERKの単体構造を基に、MEK-ERKの複合体構造やその形成ダイナミクスを明らかにしようとしています。さらにもう1つのターゲットは、リン酸化した後に核内に移ったERKタンパクについてです。クロマチン構造が高濃度に存在している核内混み合い環境において、ERKタンパクがどのように挙動するのか、そのダイナミクスを粗視化シミュレーションで明らかにしたいと考えています。

石田  私たちが扱っているのはヌクレオソームです。ヒトを含む真核生物のDNAは、ヒストンと呼ばれるタンパク質の芯にDNAが巻きついたヌクレオソームという基本構造を持ち、それがいくつも並んで染色体を形成し、核内にコンパクトに収納されています。このヌクレオソームは、遺伝子制御と深く関わっていて、転写や複製、修復といったDNAの代謝に関係して構造が変化したり、位置を変えたりすることが知られています。このヌクレオソームの運動メカニズムや構造の安定性などを明らかにするため、ヌクレオソームを構成する一般的なカノニカルヒストンと変異体のそれぞれの系について、DNAがどれくらいヒストンに巻きついたり、ほどけたりしているのかを、全原子モデルで計算しています。分かりやすく言うと、DNAをゆっくりと引き剥がすようなシミュレーションを行い、その際の構造分布、専門的な言葉では自由エネルギープロファイルと言いますが、引き剥がれたDNAの自由エネルギーが高いか低いかといったことを「京」を使って計算しています。ヌクレオソームの成分が変わると、剥がれやすさはどのように違ってくるのか、そうしたところまで全原子レベルで見ていこうとしています。

小甲  石田さんが説明されたように、核内DNAはヒストンタンパク質にDNAが巻きついたヌクレオソーム構造を持ち、複数のヌクレオソームが凝集した構造をとっています。私たちの研究室では、この核内DNA結合タンパク質の機能ダイナミクスについて、実験系と連携しながら、分子シミュレーションを用いた研究に取り組んでいます。そのなかで私たちは、粗視化MD-SAXS法のプログラム開発を行ってきました。SAXS(X線小角散乱法)は、溶液中のタンパク質にX線を照射し、その散乱パターンから分子の概形を測定する手法で、ゆらぎを含むタンパク質の構造を見ることができます。一方、MD(分子動力学)シミュレーションは、運動方程式を解くことによって、タンパク質などの生体高分子の挙動を全原子レベルで予測することができます。ただ、ヌクレオソームのような巨大分子の場合は、全原子MDシミュレーションでは計算時間がかかり過ぎるため、1つのアミノ酸を1つの粒子に置き換えた粗視化(CG)MDを用いて構造を予測し、その結果から理論的にSAXSの散乱パターンを計算します。計算結果とSAXSの実験データを比較・検討して、一致すればシミュレーション結果は妥当であると判断できるわけです。

longver

※以下太字で表記している箇所はWeb版でのみ公開のロングバージョン部分です。

●それぞれのテーマで研究開発を進めておられますが、みなさんのなかでの連携はあるのですか。

 同じターゲットをいろいろな計算精度で見ているという意味で連携しています。例えば、金田さんはMEKとERKの複合体の予測をやっておられますが、私たちも同じ系を扱っています。どのレベルで粗視化するかによって扱える時間スケールが違ってきますので、例えば金田さんたちの粗視化シミュレーションで大まかな複合体構造を予測して、私たちはそれを全原子分子動力学という、より精度の高いシミュレーションで構造を緻密化するといった、マルチスケールの連携・協力が可能です。

神谷 長い時間で見ないと見えてこないものもありますし、細かく見ないと見えないものもありますから、ターゲットや状況に合わせて、いろいろな方法を選び、組み合わせていく必要があります。また、いろいろな方法で見ないと全てが分からない系もあります。例えば、膜についても、まず粗視化モデルで見て、細かいところは古典MDで、もっと細かいところはQM/MM法で見ることによって理解が進みます。まさにマルチスケール。ただ、古典MDとQM/MMの垣根はそれほど高くなくて、むしろ全原子を扱うMDと粗視化したMDとの間の方がかけ離れていて、マルチスケールという感覚があります。

金田 確かに、1アミノ酸を1粒子として扱う粗視化シミュレーションは全原子MDと比較して計算コストが格段に低くなってよいのですが、力場(粒子同士の相互作用)の精度が問題視されます。そうした問題を解決し、全原子と粗視化のギャップを埋めるため、私たちの研究室では、タンパク質のアミノ酸配列や二次構造の依存性を考慮したAICGモデル(原子相互作用に基づく粗視化モデル)を開発しています。このモデルを用いてMEK-ERK複合体の構造予測を行った結果、優さんたちの全原子アプローチとよく似た構造が得られました。今後は、実験グループにも何らかの形で協力を頂く事で、予測した構造の妥当性を検証する必要があります。もう1つ、私たちの研究は神谷さんのグループともつながりがあります。CafeMolによるシミュレーションでは、実験などで得られた天然(参照)構造が必要ですが、リン酸化された後のMEK単体の天然構造が実験では得られていません。そこで私たちは、神谷さんのグループが全原子MDで構築されていたリン酸化MEKの構造を基にMEK-ERK複合体形成シミュレーションを行っています。

●今年度の進捗状況やご苦労などについてお話しください。

 大規模なシミュレーションはほぼ終了していて、今年度は、主に得られたデータの解析をやっています。分子動力学シミュレーションでは、どの原子がいつどこにあったかという時系列データは得られるものの、それら座標値だけを眺めていても全く何も分かりません。データを使って、細胞質内でタンパク質がどのように拡散していくのか、代謝物がどこに多く分布し、どう動いているのか、そういったことを解析する必要があるのです。とはいえ、データ量は数十テラバイトという膨大な量で、そこから必要な情報を取り出し、それを可視化するための解析プログラムも自分でつくらなければならないので苦労しています。

神谷 私自身は2013年から参加し、まだ始めたばかりの状況です。今年度の大きな課題は、QM/MM法のプログラムを「京」で動かすためのプログラム改造でしたが、今はそれを終えて、混み合った環境での化学反応ということで、タンパク質Ras-GAP複合体のGTP加水分解反応に関する計算に着手し始めたところです。

小甲 粗視化MD-SAXS法の開発はほとんど終了し、現在はさまざまなシミュレーション条件でヌクレオソームの粗視化MDを行っています。苦労したのは、粗視化MD-SAXS法の開発でした。例えば、SAXSプロファイルの計算ではタンパク質の周りにある水和層を一緒に取り扱わなければなりません。水和層の取り扱い方の妥当性を全原子MDの水和層と比較しながら検証するのがとてもたいへんでした。

岩本 今年度、苦労したのは実験データを集めるところでした。細胞は実際には3次元構造ですが、顕微鏡の画像では2次元でしか見られません。そのため、MRIのようにスライス画像を束ねて3次元情報に置き換えることが必要でした。しかし、そうした実験をやっている方が、身近になかなか見つからなかったのです。

金田 先ほど申し上げましたように、「CafeMol」によるMEK-ERK複合体の構造予測を行い、全原子アプローチとよく似た構造を得ることができました。今後は、シミュレーションで得られた複合体構造を、実験グループにご協力いただくことで、何らかの形で検証する必要があります。核内混み合い環境におけるERKタンパクのダイナミクスの調査についても、「京」を活用したを粗視化シミュレーションにより、現在進行中です。

石田 今年度苦労したのは、「京」の特殊なアーキテクチャーにプログラムを移植するところでした。当初は何度も神戸に通いました。今は何とかクリアして、後は流すだけというところまでこぎつけました。

夢を持ちながら研究に取り組む

●「京」を使った感想はいかがですか。

石田  約50万原子からなるヌクレオソームを引き剥がす全原子のシミュレーションで、4,800ノードを使う大きな計算をやっています。計算では、のべ約5,000万原子の振る舞いをシミュレーションしています。やはり「京」でなければこういったシミュレーションは不可能ですし、今までできなかった最先端の計算をやっていることを実感しています。現在、解析中ですが、超大規模系シミュレーションで精度の高い解析をするために必要なことも分かってきました。

 マイコプラズマという最も小さなバクテリアでも、代謝ネットワークに関わるタンパク質を現実的な数密度比で全部入れようとすると、最低でも総数は1,500個ほどになってしまいます。通常の研究室レベルでは、大きなタンパク質が1~数個のシミュレーションが一般的ですから、やはり「京」がなければできない研究だと思います。実際に使用した感想という意味では、ジョブが混んでいるということもありますが、最適なノード数を割り出すのに、少し試行錯誤が必要でした。あまり大きいノード数を確保してしまうと、待ち時間が非常に長くなったり、逆にあまり小さいノード数では、ジョブはテンポよく入るけれど、その分可能なシミュレーション時間が短くなってしまいます。いちばんバランスのよいノード数を見つけるのに、最初は苦労しました。

神谷  やはり大きなシステムを扱うためには、「京」は魅力的です。MDについては、優さんのグループでも使われている分子動力学シミュレータ「GENESIS」を私たちも使っています。非常に効率がよく、助かっています。大規模系のMDを高速に流せるというのは、やはり大事なことです。QM/MMの方は、流れるようになったものの、インプットがとても複雑になったこともあり、失敗が多いことが課題になっています。また何度もジョブの投入を繰り返さなければいけないため、そのための待ち時間が長いのが辛いところです。

金田  核内混み合い環境におけるERKタンパクのダイナミクスを調査する際、私たちは20ヌクレオソームからなるクロマチン構造を系に含めて計算をしています。これは「CafeMol」による粗視化シミュレーションとしては非常に大きな系なので、大規模な計算を効率的かつシステマチックに進める上で、「京」の活用は非常に役立っているという印象を持っています。

岩本  私もみなさんと同じで、大きな系を細かい解像度で見ることができるのが、「京」の魅力だと思います。私は細胞全体を扱っています。理想としては、格子サイズをタンパク質1分子の大きさ、5ナノメートルくらいにしたいのですが、一般の研究室にあるようなPCクラスターではメモリが足りません。その点、「京」なら全く問題なく進められます。

小甲  私の場合、粗視化シミュレーションなので、計算する系そのものはそれほど大きくないのですが、さまざまな条件を検討するため、1個のヌクレオソームに対して90条件でシミュレーションを行っています。また、粗視化シミュレーションであっても、1回だけでは構造空間を十分に探索することができず、同じ計算を100回くらい繰り返しています。そのためにも、「京」を使うことが非常に重要と感じています。

●今後、どのような研究をやっていきたいとお考えですか。

石田  私はこれまでに、100万原子を超えるような生体超高分子系のシミュレーション研究を行ってきました。「京」のような高い計算性能を持つ計算機が開発されて、シミュレーションの精度もかつてに比べて飛躍的に向上しています。そうしたなかで、私はシミュレーション手法に関心を持ちながら、粗視化のよいところと全原子のよいところを上手く結び付けるといった研究をしたいと思っています。また、シミュレーション研究は、最終的には創薬などに結び付けることが課題になるかと思いますが、個人的にはより基盤的な研究をしっかりやっていきたいと考えています。

 私は逆に、医療や創薬の方面に展開していきたいですね。現在取り組んでいる研究は基礎科学的な側面が強いのですが、もちろんそれを大事にしつつも、将来的には、細胞の環境を考慮した創薬プロセスの開発に寄与できればと思っています。今のコンピュータ創薬は、主にタンパク質と薬剤の親和性を見ていますが、そこに細胞内環境の影響を付加したいのです。例えば細胞内の水は、純水とは粘性や誘電率も違っており、ターゲットと薬剤の結合親和性にも大きな影響を与えていると思っています。こうした知見を集めて、細胞環境の標準モデルができれば、より現実的な創薬プロセスにつながるのではないでしょうか。

神谷  自分の“根っこ”は化学なので、生命科学分野でもその基盤になっている化学反応をきちんと扱っていきたいという気持ちがあります。そうした方向性をめざしながら、創薬などで社会に貢献できればと考えています。

金田  私は「CafeMol」の特徴を活かし、より大きな系の振る舞いを粗視化シミュレーションによって再現していきたいと思っています。将来的には「CafeMol」で細胞まるごとシミュレーションも可能になると考えています。タンパク質のモデルだけでなく、DNAや脂質のモデルを用いて、「京」のような高い性能の計算機を長時間走らせれば、細胞をまるごと計算することができるはずです。現在の私のメインターゲットはシグナル伝達に関わるタンパク質ですが、今後は、それ以外のDNAや脂質を含む系の研究についても貢献していきたいと考えています。

岩本  一言で言うと、私も細胞まるごとシミュレーションを実現させたいと思っています。ただ、私は粗視化シミュレーションではなく、細胞がさまざまな外界からの刺激に応答するために持っている多くのシグナル伝達や代謝といった機能を、全部入れ込んだ細胞まるごとシミュレーションを実現させたいと考えています。2年ほど前に米国の研究グループがマイコプラズマの反応系を全てシミュレーションしたという論文が出ました。大腸菌などでもまるごとシミュレーションの研究が進められています。自分もそちらの方向に進んでいきたいですね。

小甲  実験分野の分子生物学者たちと共同研究を行うこともあり、自分たちのシミュレーションによる予測が、実際に実験で正しかったことが分かると、とても嬉しかったりするわけです。そのようなことから、これからも実験の方々との共同研究を大切にしていきたいと考えています。実験を行う分子生物学者たちにとっても、シミュレーションによる知見は非常に有用だと思います。シミュレーションによって実験計画をサポートしていけるような研究もやっていきたいと思っています。

pegetop

OpenupSPTALK OpenupSPTALK OpenupSPTALK OpenupSPTALK OpenupSPTALK