ニュースボイス

2025-05-17 07:02

科学・技術

オランダ語学習を目指すユーザーが、AIとの会話を通じた学習方法を模索しています。単なる発話支援ではなく、仕事交渉や電話応対など具体的なシチュエーション設定が可能なAIを探しており、会話の文字起こし表示も重視されています。既存ツールのGliglishは音声中心であり、学習支援には限定的。より柔軟な対話型AIへのニーズが浮き彫りになっています。

音声操作で学ぶAI単語帳アプリ「YapCards」

2025-05-15 01:14

科学・技術

YapCardsは通勤中など手を使えない状況でも音声のみで学習できるiOS向けの単語帳アプリです。ユーザーは問題を聞いて声で回答し、AIが内容を評価してフィードバックを返します。Ankiのような反復学習アルゴリズムSM2を採用し、自作リストの公開や他人のリスト利用も可能。開発にはSwiftやOpenAI、ElevenLabsなどが使われており、語学学習や教育分野への応用が期待されます。

AIが英語アクセントの強さを聞き分ける仕組み

2025-05-06 14:07

科学・技術

BoldVoiceは、英語学習者向けのAI発音指導アプリで、話者のアクセントの強さを「アクセント指紋」として数値化・可視化します。Victorという学習者がネイティブ講師Elizaの発音に近づけるように、機械学習モデルを使って音声空間上での位置を分析。バックグラウンドノイズ除去や声色変換、模倣練習を通じて、Victorの発音は「中級〜上級」レベルへと改善されました。この研究は、アクセント教育におけるAI活用の新たな可能性を示しています。

リアルタイム音声対話AI「RealtimeVoiceChat」の仕組み

2025-05-05 20:17

IT・ネット

「RealtimeVoiceChat」は、音声入力からAIによる応答までをリアルタイムで処理するシステムです。ユーザーの音声はブラウザで収録され、WebSocketを通じてPythonバックエンドに送信されます。音声はリアルタイムでテキストに変換され、大規模言語モデル（LLM）で処理された後、再び音声に変換されてユーザーに返されます。システムは低遅延を重視し、音声チャンクのストリーミングや動的な無音検出などの技術を採用しています。Docker Composeを使用したデプロイも可能で、OllamaやOpenAIなどのLLMバックエンドを柔軟に選択できます。

完全ローカルAIアシスタント「AgenticSeek」登場

2025-04-26 17:23

科学・技術

AgenticSeekは、API不要で音声操作が可能な完全ローカルのAIエージェントです。ウェブ検索、コーディング、複雑なタスク管理までを自動で実行し、すべての処理をユーザーのPC内で完結させます。PythonやC、Goなどの言語に対応し、DeepseekなどのローカルLLMを利用可能。音声認識・対話も実装され、まるでSF映画のような操作体験を実現します。OSSとして開発が進行中で、貢献者も募集中。高性能GPU環境での活用が推奨されています。

「音声認識」の記事一覧