ポスト

最近の NVIDIA CUTLASS (Collection of CUDA C++ template abstractions for implementing high-performance matrix-matrix multiplication (GEMM) and related computations) Webinarです x.com/ogawa_tter/sta… Hopperアーキテクチャ紹介を含む CUTLASSを活用した GPU行列積最適化のご参考に。

メニューを開く
OGAWA, Tadashi@ogawa_tter

=> "Speaking Tensor Cores", V. Thakkar & P. Ramani, NVIDIA, CUDA MODE, Jun 7, 2024 (1:47:49) youtube.com/watch?v=hQ9GPn… (95 pp) drive.google.com/file/d/18sthk6… CUTLASS github.com/NVIDIA/cutlass 3.5, Apr 2024 P. Ramani scholar.google.com/citations?user… V. Thakkar scholar.google.com/citations?user… via @neurosp1ke

OGAWA, Tadashi@ogawa_tter

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ