Skip to content

Latest commit

 

History

History
43 lines (31 loc) · 1.16 KB

README.md

File metadata and controls

43 lines (31 loc) · 1.16 KB

Software Design 2021年4月号 ディープラーニングではじめるソフトウェア高速化入門 第6回 サンプルコード

Software Design 2021年4月号掲載の「ディープラーニングではじめるソフトウェア高速化入門 第6回」のサンプルコードです。

動作確認環境

  • Ubuntu 18.04 LTS
  • CUDA Toolkit 10.0

ビルド方法

各サブディレクトリ中で make コマンドを実行することで対応するプログラムがビルドされます。

プログラムの説明と実行方法

naive

  • 愚直に実装されたGPU版行列積です。
  • 行列サイズはコマンドライン引数として指定します。
./matmul 2048

blocking

  • レジスタブロッキングを行ったGPU版行列積です。
  • 行列サイズはコマンドライン引数として指定します。
./matmul 2048

cublas

  • cuBLASを利用したGPU版行列積です。
  • 行列サイズはコマンドライン引数として指定します。
./matmul 2048

作者

  • 平櫛 貴章 (株式会社フィックスターズ)

ライセンス

  • Apache License 2.0