富士通株式会社
テクニカルコンピューティングソリューション事業本部 エグゼクティブ・アーキテクト
奥田 基
奥田 これまでの世界のスパコン性能競争(TOP500第1位)の歴史を見ると、10年間で約1,000倍の性能向上がなされてきました。このペースで線を延ばしていくと、だいたい2018 ~ 20年ころに1EFLOPS(エクサフロップス)のマシンができるであろうと予測されており、日本もそれをめざしています。一方で、研究者が自由に使えるスパコンについて考えてみると、そのスパコンは各国に何台も導入されている必要があり、その性能はTOP性能のスパコンの1/10程度と考えられます。 実際に、日本でも「京」の完成とほぼ同時に、東京大学情報基盤センターに「京」の約1/10のピーク性能1.13PFLOPSの新スパコンシステム(Oakleaf-FX)が導入されています。 約3.3年で10倍の性能向上が見られますから、約3.3年経つと、現在のTOP500第1位と同等の性能を持つスパコンが各国に何カ所か展開されると予想されます。すなわち、「京」と同等の性能を持つスパコンが大学や研究機関に入るようになるのは、2015年くらいではないかと予測されます。
奥田 ベンダー各社、それぞれ考え方や取り組みは異なりますが、私たち富士通がどんなことを考えているかというと、これまで「京」の開発を進めてきたことから、今後も国のプロジェクトに沿いながら、さまざまな製品の開発を進めていくという方向性を打ち出しています。これから本格的な運用が始まる「京」に対しても、運用支援や利用支援、アプリ最適化支援を行っていくと同時に、これから研究者のみなさんが「京」向けのアプリケーションをどんどん開発され、チューニングし最適化していくなかで蓄積されるソフトウェアの資産を、さらに発展させながら利用できる環境を継続的に提供していくことが、これからの私たちの役割であると思っています。商用機である「FX10」の提供もまさにそうですが、さらに2014 ~ 15年ころの製品化をめざして、エクサスケールへの繋ぎという意味で「Trans-Exa」と呼んでいますが、「100PFLOPS級Trans-Exaシステム」を開発中です。これは、「京」や「FX10」のアプリケーションを、そのまま実行することができることを念頭に置いたマシンです。アーキテクチャも同様のコンセプトで、プログラミングモデルを変える必要もありません。もちろん、コンパイルし直してもらえれば、より高い性能を出すことができます。「FX10」は一つのCPUの性能が「京」の1.85倍(ピーク性能)上がっており、他にも運用性を向上できる機能が備わっていますが、「Trans-Exa」では、CPU性能、ネットワーク性能、さらには実装密度、消費電力も大幅に改善したマシンを予定しています。もちろん100ペタまで拡張できるとはいえ、100ペタをそのまま導入できるところは限られるでしょうが、それでも、数ペタクラスのスパコンがオンサイトで利用できる環境が、2015年ころには大学や研究機関に整うことになるはずです。
奥田 今年のTOP500で、非常に大きな技術的なジャンプがありました。それは第1位になった米国「Sequoia」の電力効率(電力あたりの性能)です。これまでのTOP1マシンのなかでは、「京」はいちばんよかったのですが、「Sequoia」は2,000GFLOPS/KW以上という圧倒的な差をつけて成績を塗り替えました。要するに、これまでにない非常に低消費電力のスパコンが誕生したということです。一方、CPUのなかにはコアと呼ばれる演算ユニットがありますが、TOP1マシンの1つのコアあたりの性能(LINPACK性能)は、この5年ほどの間、それほど大きく変わっていません。「京」は比較的高く、約15GFLOPSですが、「Sequoia」では逆に下がって、10GFLOPS程度です。つまり、現在はコアの性能を高めるというより、コアの数を増やすことによって性能を向上させる方向に動いているということです。
奥田 そうですね。先ほど「Trans-Exa」の話をしましたが、私たちは、これをエクサスケール実現に向けた技術開発の第1段階と位置付けて、さらに第2段階の研究開発を経てエクサスケールシステムを実現させたいと考えています。第1段階、つまり現在開発中の「Trans-Exa」では、1つのコアの性能を高めるとともに、さらなるマルチコア化を進めようとしています。「京」は8コアで、「FX10」は16コアですが、次はさらにコア数を増やしたい考えです。CPUの性能を高めることに伴い、当然ながらインターコネクトの高性能化も図ります。さらに低消費電力化も進める考えですが、実はこれがいちばん大きな課題です。それでも、「Sequoia」を越えることを目標に開発を続けているところです。あとは、実装密度、つまり面積あたりどれだけのCPUが搭載されているかということですが、これももっと高めて、高性能・高密度をめざしています。こうした第1段階を経て、さらにエクサスケールをめざすのですが、その間にはかなり大きな技術的なジャンプがあるだろうと考えています。先ほどの予測では、エクサ到達は2018 ~ 20年ですから、第1段階の開発からさらに3 ~ 5年あるわけです。コンピュータの世界で5年先のテクノロジーというのは、正直なところ、どうなるのか読めない部分があります。実際のところ、CPUの単なる演算性能の向上だけでしたら、方向性は見えていますが、低消費電力化に関しては、まだこれからという部分があります。開発中の100PFLOPS級のマシンではかなりメドがついているのですが、さらにその10倍となると、今のテクノロジーの延長では難しく、新しい技術の創出に期待しています。また、エクサスケールの実現には、さらなる高信頼化のための研究開発も必要です。
アプリケーション開発においても、どのような形にしろ、エクサシステムではさらに並列度を高めざるを得ないわけですから、プログラミングモデルも変える必要が出てくるかもしれません。エクサスケールというのはまだまだ読み切れないところがあるわけです。ですから、100PFLOPS級システムが、次のエクサスケールに進むための準備をするためのプラットフォームになるのではないかと考えています。マルチコアが進み、SIMDが導入されたマシンをどうやって使いこなすかという研究開発を進めて、次に繋げていただきたいと思っています。
![]() |
![]() |
エクサフロップス達成はいつごろか? |
エクサスケール実現に向けた課題と取り組み |
奥田 「京」の場合も、プロジェクトの開始と同時にアプリケーションのプロジェクトが走り出しました。2011年度からHPCI戦略プログラムが動き出しましたが、後半で100PFLOPS級のマシンを使って、次に向けた準備を始めていただければ、エクサスケールで何をすればよいのかが見えてくるのではないでしょうか。
奥田 「コ・デザイン」といわれるように、技術者と研究者が一緒になって、マシンとアプリを設計・開発していく時代だと思っています。「京」におけるグランドチャレンジアプリケーションの開発がそうであったように、事前の準備期間がないと、エクサスケールのマシンは完成したけれど、性能が活かせるアプリがないということになりかねません。「京」の場合は、4、5年前から準備が始まっていて、いろいろな分野で、これから続々とその成果が出ようとしている段階に来ていますよね。2013、14年に優れた成果が出れば、次の研究開発への弾みになると思いますし、逆にいえば、そのときに次に進むためのマシンが、「京」のほかにも用意されているということが、とても重要なことだと思います。私たちとしても、そうした流れを描いて、100PFLOPS級マシンの開発を行っています。
奥田 そのくらいの準備がないと、いくら性能の高いマシンができても、すぐには性能が出せないと思っています。
奥田 やはり、消費電力の低減がいちばんのポイントになると思います。CPU性能の向上に関しては、半導体テクノロジーが進んで、1つのチップのなかに演算回路を数多く入れる事は可能と考えられています。ただ、その高性能CPUの演算回路が全て動くと、消費電力がものすごいことになってしまい、効率的に動かすことができません。どうしても消費電力を下げることが課題になってきます。電力をできるだけ喰わずに演算できる回路を考えることはとてもたいへんですが、そうしたことにも取り組んでいかないといけません。とにかく未知数な部分も含めて、さまざまな技術開発の積み重ねによってエクサスケールを実現させたい、実現させなければいけないと考えています。
奥田 もちろん、続けていかなければいけないと思っています。「京」を使い出した研究者の方から、一度「京」を使ったらもう元には戻れませんという話を聞いています。開発が始まったころは、「10ペタなんて必要なの?」、「使えるアプリがあるの?」といった議論もあったと思いますが、5年たったら状況は全く変わっている、そういうものではないでしょうか。それに、日本の研究者が他の国の人たちと一緒にプロジェクトをやろうとするときに、自分たちが“強み”を持っていなければ、対等に議論することもできませんよね。今、世界中の人々が、「京」に関心を持ち、「京」を使ってどんな研究成果が出るのかを見守っています。ですから、今後も世界に負けないマシンをつくり続けていかなければいけないと考えています。
![]() |
BioSupercomputing Newsletter Vol.7