sc13note/Q and A
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
since1995
開始行:
[[sc13note]]
- 問:「最終審査ではK=250, L=100程度」とあるが,Kが250を...
答:越えることはない.K≦250,L≦100 です.
- 問:N=500, M=4000, T =5000 は固定か?(文責:権藤) 8/2...
答:はい,固定です.ただし,初期宇宙状態の粒子群の形は正...
- 問:共有メモリのサイズ変更をしたい。(文責:星野) 8/21...
答:TSUBAMEのGPUでは、デフォルトで(共有メモリ:L1キャッシ...
この値は変更することができて、(共有メモリ:L1キャッシュ) ...
なので、この変更を行うことにより、共有メモリを使っていな...
-変更方法
以下の呼び出しをCUDA関数の呼び出し前に書いておく。
・関数全てをL1キャッシュ=48KBモードで動かしたい場合:
cudaDeviceSetCacheConfig(cudaFuncCachePreferL1);
・関数単位でL1キャッシュ=48KBモードにしたい場合:
cudaFuncSetCacheConfig(自分のCUDA関数名, cudaFuncCacheP...
- 問:GPUの各スレッドで同じメモリに書き込むとき、ロックの...
答:排他制御そのものはありませんが、atomic命令というもの...
ただし、atomic命令は各スレッドが逐次に実行されるため、速...
また、スレッドブロックの内部では__syncthreads()という同...
- 問:final.cu以外に独自のソースファイルやヘッダファイル...
答:いいえ、作らないでください。
提出してもらうfinal.cuと、配布済のtransition_rule.h(変更...
コンパイル・実行できるようにしてください。
- 問:プログラムを動作させている間に、GPUのメモリをどのく...
答:nvidia-smiというコマンドで、現在のGPU状況を知ること...
もう一枚別の画面を開くなどしておいて、プログラム実行最中...
nvidia-smi(オプションなくてよい)コマンドを打ち込んでくだ...
以下のような表示がされれば成功です。
endo-t-ac@t2a010091:~> nvidia-smi
Tue Aug 20 14:34:28 2013
+------------------------------------------------------+
| NVIDIA-SMI 4.304.54 Driver Version: 304.54 |
|-------------------------------+----------------------+...
| GPU Name | Bus-Id Disp. |...
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage |...
|===============================+======================+...
| 0 Tesla M2050 | 0000:06:00.0 Off |...
| N/A N/A P0 N/A / N/A | 11% 301MB / 2687MB |...
+-------------------------------+----------------------+...
| 1 Tesla M2050 | 0000:14:00.0 Off |...
| N/A N/A P1 N/A / N/A | 0% 7MB / 2687MB |...
+-------------------------------+----------------------+...
| 2 Tesla M2050 | 0000:11:00.0 Off |...
| N/A N/A P1 N/A / N/A | 0% 7MB / 2687MB |...
+-------------------------------+----------------------+...
+-------------------------------------------------------...
| Compute processes: ...
| GPU PID Process name ...
|=======================================================...
| 0 32591 ./gpusample ...
+-------------------------------------------------------...
この例の場合、0番GPUで、メモリを約11%の301MB消費している...
また、最近数秒のうち91%の時間、何らかのGPUカーネル関数が...
今年のコンテストでは0番GPUのみ使うので、1番、2番は無視し...
また表示の一番最後の部分には、GPUを使っているプロセス名...
この場合、0番を./gpusampleというプログラムが使っています。
ここに、覚えのないプログラムや、必要より多いプロセスが表...
場合、プログラムのバグなどで、終了しそこなっているかもし...
- 問:マイキーボードを持ち込んでもいいか?(文責:権藤)8...
答:いえ,持ち込まないで下さい.
- 問:サンプルデータが欲しい(文責:遠藤,代理アップロー...
サンプルデータを /home/SC13/sampledata/ 以下に複数置きま...
ex00.txt, ex30.txtのように番号がつけてあり、大きい番号が...
各チームのプログラムに、ex??.txtを標準入力として食わせま...
$ ./final < ex30.txt
のような使い方になります。
そして最後に出力された内容が、ans??.txtと同じであれば正...
''(追記) ex00では衝突が起きなかったので衝突が起きる小さい...
- コンパイルオプションについて(文責:遠藤)8/19 19:24, 1...
チームによっては、大域変数のサイズが2GB越えになる場合が...
コンパイル時には以下のオプションをおすすめします。
- gccの場合: gcc -mcmodel=large ...
- nvccの場合: nvcc -Xcompiler -mcmodel=large -arch sm_21...
最終審査では、提出されたプログラムを以下のようにコンパイ...
- nvcc -Xcompiler -mcmodel=large -arch sm_21 -O3 final.c...
(プログラム名がfinal.cuの場合)
特に、「~~~relocation truncated to fit: R_X86_64_PC32...
上記オプションを試してください。
終了行:
[[sc13note]]
- 問:「最終審査ではK=250, L=100程度」とあるが,Kが250を...
答:越えることはない.K≦250,L≦100 です.
- 問:N=500, M=4000, T =5000 は固定か?(文責:権藤) 8/2...
答:はい,固定です.ただし,初期宇宙状態の粒子群の形は正...
- 問:共有メモリのサイズ変更をしたい。(文責:星野) 8/21...
答:TSUBAMEのGPUでは、デフォルトで(共有メモリ:L1キャッシ...
この値は変更することができて、(共有メモリ:L1キャッシュ) ...
なので、この変更を行うことにより、共有メモリを使っていな...
-変更方法
以下の呼び出しをCUDA関数の呼び出し前に書いておく。
・関数全てをL1キャッシュ=48KBモードで動かしたい場合:
cudaDeviceSetCacheConfig(cudaFuncCachePreferL1);
・関数単位でL1キャッシュ=48KBモードにしたい場合:
cudaFuncSetCacheConfig(自分のCUDA関数名, cudaFuncCacheP...
- 問:GPUの各スレッドで同じメモリに書き込むとき、ロックの...
答:排他制御そのものはありませんが、atomic命令というもの...
ただし、atomic命令は各スレッドが逐次に実行されるため、速...
また、スレッドブロックの内部では__syncthreads()という同...
- 問:final.cu以外に独自のソースファイルやヘッダファイル...
答:いいえ、作らないでください。
提出してもらうfinal.cuと、配布済のtransition_rule.h(変更...
コンパイル・実行できるようにしてください。
- 問:プログラムを動作させている間に、GPUのメモリをどのく...
答:nvidia-smiというコマンドで、現在のGPU状況を知ること...
もう一枚別の画面を開くなどしておいて、プログラム実行最中...
nvidia-smi(オプションなくてよい)コマンドを打ち込んでくだ...
以下のような表示がされれば成功です。
endo-t-ac@t2a010091:~> nvidia-smi
Tue Aug 20 14:34:28 2013
+------------------------------------------------------+
| NVIDIA-SMI 4.304.54 Driver Version: 304.54 |
|-------------------------------+----------------------+...
| GPU Name | Bus-Id Disp. |...
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage |...
|===============================+======================+...
| 0 Tesla M2050 | 0000:06:00.0 Off |...
| N/A N/A P0 N/A / N/A | 11% 301MB / 2687MB |...
+-------------------------------+----------------------+...
| 1 Tesla M2050 | 0000:14:00.0 Off |...
| N/A N/A P1 N/A / N/A | 0% 7MB / 2687MB |...
+-------------------------------+----------------------+...
| 2 Tesla M2050 | 0000:11:00.0 Off |...
| N/A N/A P1 N/A / N/A | 0% 7MB / 2687MB |...
+-------------------------------+----------------------+...
+-------------------------------------------------------...
| Compute processes: ...
| GPU PID Process name ...
|=======================================================...
| 0 32591 ./gpusample ...
+-------------------------------------------------------...
この例の場合、0番GPUで、メモリを約11%の301MB消費している...
また、最近数秒のうち91%の時間、何らかのGPUカーネル関数が...
今年のコンテストでは0番GPUのみ使うので、1番、2番は無視し...
また表示の一番最後の部分には、GPUを使っているプロセス名...
この場合、0番を./gpusampleというプログラムが使っています。
ここに、覚えのないプログラムや、必要より多いプロセスが表...
場合、プログラムのバグなどで、終了しそこなっているかもし...
- 問:マイキーボードを持ち込んでもいいか?(文責:権藤)8...
答:いえ,持ち込まないで下さい.
- 問:サンプルデータが欲しい(文責:遠藤,代理アップロー...
サンプルデータを /home/SC13/sampledata/ 以下に複数置きま...
ex00.txt, ex30.txtのように番号がつけてあり、大きい番号が...
各チームのプログラムに、ex??.txtを標準入力として食わせま...
$ ./final < ex30.txt
のような使い方になります。
そして最後に出力された内容が、ans??.txtと同じであれば正...
''(追記) ex00では衝突が起きなかったので衝突が起きる小さい...
- コンパイルオプションについて(文責:遠藤)8/19 19:24, 1...
チームによっては、大域変数のサイズが2GB越えになる場合が...
コンパイル時には以下のオプションをおすすめします。
- gccの場合: gcc -mcmodel=large ...
- nvccの場合: nvcc -Xcompiler -mcmodel=large -arch sm_21...
最終審査では、提出されたプログラムを以下のようにコンパイ...
- nvcc -Xcompiler -mcmodel=large -arch sm_21 -O3 final.c...
(プログラム名がfinal.cuの場合)
特に、「~~~relocation truncated to fit: R_X86_64_PC32...
上記オプションを試してください。
ページ名: