You are here

東京工業大学が世界初の大規模GPGPUコンピューティング基盤を大規模スーパコンピュータ基盤TSUBAME上に実現

2008.11.19
日本語

ポイント

  • 国立大学法人 東京工業大学 (学長 伊賀健一) (以下「東工大」) 学術国際情報センター (センター長 渡辺治) は平成18年3月にスーパコンピュータTSUBAMEを構築・導入し、2年連続で我が国一位となるなど、その性能向上の研究開発に努めてきた。当初 Top500 の性能は38.18テラフロップス(毎秒38.18兆回演算)であったが、半年の更新ごとに性能向上を果たしてきた。これは世界に類をみない状況である。また、一千人以上のユーザ、しかも大学などの学術研究だけでなく企業利用においても我が国でいち早く開放した実績を持つ。
  • 今回、高いメモリバンド幅を要求する流体計算などのアプリケーションを有効にサポートするために、GPUベンダーであるNVIDIA社をはじめNEC, サンマイクロシステムズ社などと共同し、「高速フーリエ変換演算加速装置」として、世界で初めてNVIDIA社のTesla GPGPU(汎用GPU計算)アクセラレータの大規模導入(680枚)を果たし、TSUBAME上に展開した。
  • また、NVIDIA社, NEC, その他大学と共同し、科学技術計算におけるGPUの世界的なリーディングサイトとして、多くの研究活動や普及活動を行っている。例えば、流体計算や、タンパク質の計算などにおいて、新たなGPU向けのアルゴリズムの開発により従来の数十倍の速度向上を得ている。また、現有のTSUBAMEと連動し、4つの異なるCPU・GPUで動作するLinpackプログラムを開発して、77.48テラフロップスと、当初の2倍の大幅な性能向上を果たした。
  • また、東工大は高校生を対象とするスーパーコンピューティングコンテスト (SuperCon)を過去十数年に渡り主催してきたが、それらの経験を生かし、情報処理学会のGPUプログラミングコンテストの開催に協力し、TSUBAME上で審査を行う。
  • これらの成果を今後2010年春導入予定のペタフロップス級スパコンとなるTSUBAME2.0に生かす。

概要

東工大は、スーパコンピュータTSUBAMEを平成18年3月に学術国際情報センターに構築・導入し、2年連続で我が国一位となるなど、その性能向上の研究開発に努めてきました。当初、スパコンの世界ランキングであるTop500におけるLinpackベンチマークの性能は38.18テラフロップス(毎秒 38.18兆回演算)で、我が国トップ・世界7位にランクインしました。その後も半年の更新ごとに毎回性能向上を果たしてきましたが、これは世界に類をみない状況であります。また、単に性能を誇るだけでなく、「みんなのスパコン」として一千人以上のユーザベースをもち、かつ大学などの学術研究だけでなく企業利用においても我が国でいち早く開放してきた実績を持ちます。

しかしながら、2年半の実際の運用により、特に東工大にとって重要な流体構造系のシミュレーションや、ゲノムや蛋白質などのライフサイエンス系のアプリケーションなどにおいて、TSUBAMEの容量を上回る需要があることも明らかになりました。ところが、すでにTSUBAMEは一万CPUコアを超え、1メガワットを超える電力を消費する我が国最大級のスパコンであったため、通常のCPUだけでの大幅な性能向上は困難な状況でした。そこで、このような事態を見越して数年来そのHPC応用を研究してきたGPUを大規模に用い、高いメモリバンド幅を要求する流体計算などのGPUが得意とする計算領域において、大幅な性能向上を果たすことを計画しました。

今回のシステム「高速フーリエ変換演算加速装置」は、世界有数のGPUベンダーである米国NVIDIA社をはじめNEC, サンマイクロシステムズ社などとの共同作業で実現したものです。近年、GPUのHPCにおける導入例はありましたが、ほとんどの場合はボード数枚~数十枚程度の小中規模のもので、かつ低価格で専用利用的な小中規模のクラスタ計算機に装着されているものでした。それらに対し、本システムはアナウンスされたばかりのHPC向けGPUであるTesla 10Pが680枚の大規模で構成され、かつトップランクのスパコンTSUBAME上に展開されます。その規模、可能な計算領域、1千人以上のユーザによる共同利用など、どれをとっても類を見ない世界初の試みです。

今後の展開

今後、東工大はNVIDIA社, NECや、他の大学・研究機関と協力し、GPU向けの大規模計算の研究開発をアグレッシブに行っていくと共に、その教育や普及にも努めていく所存です。

  • 例えば、津波などの大規模な流体計算や、創薬におけるタンパク質のドッキング計算などにおいて、新たなGPU向けのアルゴリズムの開発により、TSUBAME上の従来のCPUでの動作に比べて、数十倍の速度向上を得ることができました。
  • また、現有のTSUBAMEと連動し、4つの異なるCPU・GPUで動作するLinpackプログラムを開発して、全体の性能が77.48テラフロップスと、TSUBAMEの初期の2倍の大幅な性能向上を果たし、2008年11月のTop500にエントリしました。
  • さらに、東工大は高校生を対象とするスーパーコンピューティングコンテスト (SuperCon)を過去十数年に渡り主催してきましたが、それらの経験を生かし、情報処理学会のGPUプログラミングコンテストの開催を提案し、協力体制をひきました。実際のプログラム開発の一部、ならびに審査はTSUBAME上のTeslaで行われます。

今後も2010年春に構築・導入されるTSUBAME2.0のために、GPGPUコンピューティングの研究開発や普及に努めていきます。 TSUBAME2.0は我が国初のペタフロップス(毎秒1000兆演算)級のスーパコンピュータとして設計が進んでおりますが、大幅にGPUが導入され、個人のパソコン上で実現されたGPU向けのHPCプログラムがそのまま、かつ大規模に実行可能となる予定です。

用語説明

HPC

High Performance Computing = 高性能計算、およびそれを用いたシミュレーション一般を指す

GPU

Graphical Processing Unitの略称。本来のルーツはコンピュータグラフィックス用のアクセラレータであるが、その高い演算性能と、潤沢なメモリバンド幅により、HPC汎用計算を行わせることが着目されている。

GPGPUコンピューティング

General Purpose GPU Computing, 従来は一般のCPUで行ってきたシミュレーションなどの計算をGPU上で行い、大幅な性能向上を果たすもの。

コア

1つのシリコン基板(ダイ)やLSIチップのパッケージ内に複数のCPU単位を収めるようになり,単一CPU機能単位の呼称として「コア」が使われるようになった。デュアルコアプロセッサでは1つのLSIパッケージ内に2つのCPU機能単位が含まれ、一つの物理的なソケットに挿される。通常のCPUは 2-4コア程度であるが、GPUでは数十コアを一チップに内包する。

アクセラレータ

計算機において計算を通常のCPUとは別なハードウェアで加速するもの。GPUは元来はグラフィックス用途のアクセラレータであるが、近年では他の加速用途にも用いられる。今回のTesla導入により、TSUBAMEは汎用CPUに加え二つの異なるHPC用のアクセラレータが混在する異機種システムとなった。

Top500

世界のトップランクのスパコンを500位まで集約した一覧表で、6月と11月の年2回発表される。ランキングは後述のLinpackベンチマークの実行性能値を用いる。2008年6月の世界トップは米国Los Alamos国立研究所のIBM RoadRunnerで、その性能は1ペタフロップ(毎秒1000兆演算)を超える。TSUBAMEは2006年6月に世界7位で登場し、その後6回連続で性能向上を果たしている。2008年11月の順位は世界29位、国内では東大に次ぎ2位。
http://www.top500.org/

Linpack

Top500にて用いられるベンチマークで、基本的には科学技術計算でよく出てくる大規模な連立一次方程式を解くもの。単一ベンチマークとの批判も多いが、スパコンにおいてでも通常では起こらないストレスがシステム全般にわたって長時間かかり、きちんと実行して性能を出すことは実運用に供するスパコンの指標として大変重要である。自動車における指標に例えれば、テストコースでの連続高速運転における平均時速に類似する。

連絡先

【取材に関するお問い合わせ・お申込み先】
 東京工業大学総務部評価・広報課
 TEL: 03-5734-2975
 FAX: 03-5734-3661
 E-mail: こちらのメールアドレスまで

備考

本プレスリリースPDFダウンロード

PageTop