「音声認識」の記事一覧
-
AIが英語アクセントの強さを聞き分ける仕組み
2025-05-06 14:07
科学・技術BoldVoiceは、英語学習者向けのAI発音指導アプリで、話者のアクセントの強さを「アクセント指紋」として数値化・可視化します。Victorという学習者がネイティブ講師Elizaの発音に近づけるように、機械学習モデルを使って音声空間上での位置を分析。バックグラウンドノイズ除去や声色変換、模倣練習を通じて、Victorの発音は「中級〜上級」レベルへと改善されました。この研究は、アクセント教育におけるAI活用の新たな可能性を示しています。
-
リアルタイム音声対話AI「RealtimeVoiceChat」の仕組み
2025-05-05 20:17
IT・ネット「RealtimeVoiceChat」は、音声入力からAIによる応答までをリアルタイムで処理するシステムです。ユーザーの音声はブラウザで収録され、WebSocketを通じてPythonバックエンドに送信されます。音声はリアルタイムでテキストに変換され、大規模言語モデル(LLM)で処理された後、再び音声に変換されてユーザーに返されます。システムは低遅延を重視し、音声チャンクのストリーミングや動的な無音検出などの技術を採用しています。Docker Composeを使用したデプロイも可能で、OllamaやOpenAIなどのLLMバックエンドを柔軟に選択できます。
-
完全ローカルAIアシスタント「AgenticSeek」登場
2025-04-26 17:23
科学・技術AgenticSeekは、API不要で音声操作が可能な完全ローカルのAIエージェントです。ウェブ検索、コーディング、複雑なタスク管理までを自動で実行し、すべての処理をユーザーのPC内で完結させます。PythonやC、Goなどの言語に対応し、DeepseekなどのローカルLLMを利用可能。音声認識・対話も実装され、まるでSF映画のような操作体験を実現します。OSSとして開発が進行中で、貢献者も募集中。高性能GPU環境での活用が推奨されています。