「リアルタイム処理」の記事一覧
-
リアルタイム音声対話AI「RealtimeVoiceChat」の仕組み
2025-05-05 20:17
IT・ネット「RealtimeVoiceChat」は、音声入力からAIによる応答までをリアルタイムで処理するシステムです。ユーザーの音声はブラウザで収録され、WebSocketを通じてPythonバックエンドに送信されます。音声はリアルタイムでテキストに変換され、大規模言語モデル(LLM)で処理された後、再び音声に変換されてユーザーに返されます。システムは低遅延を重視し、音声チャンクのストリーミングや動的な無音検出などの技術を採用しています。Docker Composeを使用したデプロイも可能で、OllamaやOpenAIなどのLLMバックエンドを柔軟に選択できます。
-
AI実況付きポンゲーム「xPong」が公開
2025-05-02 16:49
IT・ネットxPongは、古典的なゲーム「Pong」にLLMによるリアルタイム実況を組み合わせたプロジェクトです。OpenAIのgpt-4o-mini-ttsを活用し、プレイヤーの動きに応じた多層的な音声解説を自動生成します。トーナメントシミュレーションや過去データの参照、実況の中断と再開など高度な演出も特徴で、今後のスポーツゲームへの応用が期待されています。コードはMITライセンスで公開されています。
Page 1 / 1