「GPU」の記事一覧
-
Thunder Compute、GPU仮想化でAI開発を革新
2025-05-08 07:01
科学・技術Thunder Computeは、GPU資源の効率的活用を可能にする仮想化技術を開発中のスタートアップです。Y Combinatorの支援を受け、わずか3人のチームでGPUのアイドル時間を削減し、最大5倍の利用効率を実現する独自ソフトウェアを構築しています。ネットワーク越しにGPUを割り当てる技術により、研究者や開発者向けに低価格なクラウド環境を提供。現在、4人目のエンジニアを募集しており、高度なシステム設計に挑戦できる機会となっています。
-
OpenSearch 3.0がAI時代の検索と分析基盤を強化
2025-05-07 15:38
IT・ネットOpenSearch 3.0が正式リリースされ、旧バージョンに比べ9.5倍の性能向上を実現しました。新たにGPUによるベクトル検索の高速化や、Model Context Protocol対応、データ管理・転送機能の最適化が加わり、生成AIやRAGといった最新アプリケーションに対応。gRPCやApache Kafkaとの連携、Lucene 10やJava 21対応も含め、スケーラブルかつ柔軟なAI対応検索基盤を目指すアップデートとなっています。
-
NVIDIA GPUコアのマイクロアーキテクチャ解析
2025-05-05 23:38
科学・技術最新のNVIDIA GPUコアのマイクロアーキテクチャを逆解析した研究が発表されました。これまでの学術研究は、15年以上前のアーキテクチャに基づいていましたが、本研究では、最新のAmpereアーキテクチャに焦点を当て、発行ロジック、レジスタファイル、メモリパイプラインなどの詳細を明らかにしています。さらに、ソフトウェアベースの依存関係管理が、従来のハードウェアベースのスコアボードよりも性能と面積の面で優れていることが示されました。これにより、GPUのシミュレーション精度が向上し、研究や開発におけるGPUの理解が深まります。
-
SIMDとCUDAで高速化されたビトニックソートの実装
2025-05-05 19:45
科学・技術この記事は、GPUの並列処理機能を活用して高速なビトニックソートを実装した技術的解説です。CUDAの__shfl_sync命令を用いることで、共有メモリを使わずにワープ内のデータを直接シャッフルし、従来の実装よりも30%高速化を実現しています。ビトニックソートの原理、SIMDやCUDAによる実装手法、そしてベンチマーク結果を通して、並列アルゴリズムの効果的な応用方法が紹介されています。
-
WebMonkeys:GPU並列計算を簡単に行えるJavaScriptライブラリ
2025-05-04 17:00
IT・ネットWebMonkeysは、JavaScriptから簡単にGPUを使った並列処理を行えるライブラリです。WebGLの複雑な設定を隠蔽し、簡単なAPIで高速処理を実現します。ブラウザやNode.jsで動作し、配列操作や暗号通貨マイニングなどにも活用可能。GLSLベースで並列タスクを記述し、開発者が直接GPUを扱わずに高度な処理を実現できる点が特長です。
-
Anukari:3D物理シミュレーションで音を作る新型シンセ
2025-05-02 18:12
科学・技術Anukariは、3D物理シミュレーションを基盤とした新しいソフトウェアシンセサイザーです。質量やバネといった要素を組み合わせて独自の楽器やエフェクトを構築し、MIDI入力でリアルタイムに演奏できます。GPUでの処理により膨大な演算が可能で、従来のMIDIやMPEコントローラーに対応。VST3やAUなどプラグインとしても使用でき、ライブ演奏用の3Dビジュアル出力も可能です。
-
AI Flame GraphがGPU性能解析に革命をもたらす
2025-05-01 14:30
科学・技術Brendan Greggが開発したAI Flame Graphがオープンソース化され、Intelの最新GPU「Battlemage」に対応。これにより、ゲームやAI処理におけるCPU・GPUの負荷をミリ秒単位で可視化し、性能ボトルネックを詳細に解析可能に。FlameScopeと連携し、GZDoomのようなゲームでのCPUとGPUの動作を視覚的に理解できます。セットアップにはLinux環境と高度な設定が必要ですが、将来的な簡易化が期待されています。