「SIMD」の記事一覧
-
Sep 0.10.0、AMD 9950Xで21GB/sを達成したCSVパーサー
2025-05-09 13:38
科学・技術Sep 0.10.0は、.NET 9.0環境とAVX-512対応CPU、特にAMDのZen 5アーキテクチャを活用することで、単一スレッドで最大21GB/sという驚異的なCSVパース速度を実現しました。従来のAVX-512パーサーの非効率性を回避するため、AVX-512-to-256パーサーを導入し、マスクレジスタの使用を抑制。さらに、Vector256ベースのクロスプラットフォーム対応や、マルチスレッドでの8GB/s超の実行性能も報告されています。ハードウェアとソフトウェアの進化が連携することで、大幅な性能向上が達成されました。
-
SIMDとCUDAで高速化されたビトニックソートの実装
2025-05-05 19:45
科学・技術この記事は、GPUの並列処理機能を活用して高速なビトニックソートを実装した技術的解説です。CUDAの__shfl_sync命令を用いることで、共有メモリを使わずにワープ内のデータを直接シャッフルし、従来の実装よりも30%高速化を実現しています。ビトニックソートの原理、SIMDやCUDAによる実装手法、そしてベンチマーク結果を通して、並列アルゴリズムの効果的な応用方法が紹介されています。
Page 1 / 1