「パフォーマンスチューニング」の記事一覧
-
GPU最適化の試行錯誤と教訓
2025-05-21 07:57
科学・技術ML開発者がしばしば直面するGPU最適化の課題に対し、意味のないが並列化しやすいカードゲームアルゴリズムを題材に実験が行われました。C++コードをGPUに移植しながら、スレッド分岐の抑制、共有メモリの活用、状態遷移の明示化、データ構造の軽量化など、段階的な改善を重ね、最終的にCPU比で30倍以上の高速化に成功。NVIDIA Nsight Computeの解析を通じて、GPU最適化の実践的知見が豊富に得られた記録です。
Page 1 / 1