野村 哲弘 (Akihiro Nomura)

東京工業大学
学術国際情報センター
先端研究部門 高性能計算システム分野
マネジメント准教授

旧所属: 東京大学 石川研究室

English Page

Work

Efficient Scheduling of Supercomputer Jobs

スーパーコンピュータの計算資源は多数のユーザによって共有されており、さまざまな計算要求(ジョブ)をどのような順番で実行するかは、簡単には決められません。
計算時間を無駄にしないためにも、ジョブを空間方向(ノード分割)と時間方向(正確な実行時間予測)の両方で最適に配置できるようにする必要があります。

High performance collective operation

MPI 3.0から, 非ブロッキング集団通信がAPIに導入されました。
一般的に, 非ブロッキング集団通信を実装するには通信の継続のためのスレッドが必要になります。 これは, コンテキストスイッチに起因する性能低下につながります。
そこで, これらの通信スレッドの機能をOSカーネルの割り込みハンドラに移すことでこれらのコストを回避する手法を研究しています。

Modeling of collective communications in commodity network environment

Ethernet+TCP/IPなどのコモディティネットワークがクラウド環境を中心に使われています。 HPC向けのInfiniBandなどの高速なネットワークと比較して、TCP/IPにおける通信のふるまいは再送制御のために複雑になります。 そのような環境下でも通信時間を予測できる性能モデルを作ることで、クラウド計算機においても効率のよい通信方式が作れるようになるでしょう。

Publications

High performance collective operation

Modeling of collective communications in commodity network environment

OS-level support for realtime communication

連絡先

野村 哲弘 (Akihiro Nomura)
のむら.エー.エーシー@エム.たいてっく.エーシー.ジェーピー (迷惑メール防止のため, 画像にしています)