あざらしなので

備忘録と日常のこと

Raspberry Pi4のGPGPUに挑戦(その1)

””””内蔵GPUもったいなくないですか?”””” Raspberry Pi4には計算資源としてCPUの他にVideoCoreⅥ(VC6)と呼ばれるGPUが搭載されています。 GPUを汎用計算に活用するGPGPUは一般的にNvidia社の外付けGPUを用いて行われていますが、組み込みボードやノートPCで…

Winograd_k7x7_st2勉強メモ

Winograd_st2勉強メモの続き.今回はカーネル7x7の実装法についてメモする. カーネル7x7でも3x3と同じように入力ブロックをいくつかのグループに分けて畳み込み計算をする(元論文参照).計算量を削減するために各グループの畳み込みはWinogradで計算する…

Winograd stride2勉強メモ

Winograd Stride2の実装法ないかなーってググったら新しめの論文が出てきたので読んでメモ Stride 2 1-D, 2-D, and 3-D Winograd for Convolutional Neural Networks この論文の提案手法ではNvidiaGPUにて通常の畳み込みよりカーネル3x3で1.44倍,5x5で2.04…

Winograd勉強メモ

忘れるからメモ Winogradとは 畳み込み演算を高速に計算できる(かもしれない)アルゴリズム論文↓ Fast Algorithms for Convolutional Neural Networks Winograd F(2x2,3x3) 入力画像を4x4,出力画像を2x2,カーネルサイズを3x3のwinogradアルゴリズム 計算式は…