ニュースボイス

2025-05-27 10:39

科学・技術

独立研究者Zack Kinsmanが提案したZK-LSTMは、従来のLSTMの記憶保持能力を大幅に拡張し、文書全体レベルの文脈を記憶・処理可能なリカレントアーキテクチャです。論文の本文内で引用元を明示する構造が特徴で、1万単語以上のスケールでも一貫した文脈管理が可能。外部メモリは使わず、トークンごとの帰納的な状態更新で処理を行う。Transformerとは異なる系列モデルの新しい可能性として注目されています。

シンボリック代数とMCPの実験的融合

2025-05-22 13:59

科学・技術

本記事では、シンボリック代数システムと大規模言語モデル（LLM）をMCP（Model Context Protocol）で接続し、自然言語と記号操作の強みを統合する試みが紹介されています。MCPにより、LLMがSymPyなどの外部ツールを呼び出して正確な数学的処理を行えるようになり、数学問題への対応力が向上します。実例として微分方程式の解法を提示し、その実用性と将来の形式数学・検証ツールとの統合可能性も示唆されています。

LLMの脆弱性「甘い毒」攻撃で明らかに

2025-05-21 05:36

科学・技術

大規模言語モデル（LLM）は広範な応用が進む一方で、設計された制限を回避させる「脱獄（Jailbreak）」攻撃の脅威に直面しています。本論文では、モデルの注意重みが入力から出力へ移行することで防御が緩む「防御閾値劣化（DTD）」を突く新たな手法「Sugar-Coated Poison（SCP）」を提案。この手法は一見無害な出力を通じてモデルを誘導し、やがて有害な内容を生成させるものです。対策として、効果的な防御戦略「POSD」も提案されています。

word2vecで手作り検索エンジンを構築する方法

2025-05-20 09:58

科学・技術

この記事は、word2vecを用いた検索エンジンの自作プロジェクトを解説しています。筆者はブログ記事をベクトル化し、検索クエリとの類似度をコサイン類似度で評価する仕組みをPythonで構築。さらにGitHub Pages上で軽量なフロントエンドを設け、単語のベクトルデータを効率的に配信する工夫も紹介されています。手軽ながらも機能的な全文検索システムの設計が学べる実践的内容です。

GeminiがEメールから甥の名前を特定した方法

2025-05-19 00:35

IT・ネット

筆者は、個人のEメールにLLMが安全にアクセスできるMCPサーバを構築し、GoogleのGeminiを使って甥の名前を特定しました。Geminiは様々な検索クエリを通じて対象となるメールを絞り込み、直接的な言及がない中で“Monty”という名前にたどり着きました。LLMはメールスレッドを横断的に読み取り、間接的な文脈から情報を抽出する力を発揮した例です。

ヴォイニッチ手稿をNLPで解析したGitHubプロジェクト

2025-05-18 16:09

科学・技術

謎の古文書「ヴォイニッチ手稿」に現代の自然言語処理技術を適用したGitHubプロジェクトが注目を集めています。クラスタリング、品詞推定、マルコフ遷移などの手法を用いて、言語的構造が存在するかを検証。語幹の抽出や構造的パターンの発見を通じて、手稿が意味ある構造を持つ可能性が示されました。意味の解読は試みていませんが、構造的に自然言語に似た性質を持つと分析しています。

Rust製モデル埋め込みツールModel2Vec

2025-05-18 15:01

IT・ネット

Model2Vec-rsは、静的埋め込みモデル「Model2Vec」のRust実装であり、Hugging Face Hubなどからモデルを取得して高速にエンコード処理を実行できます。Python版より約1.7倍のスループットを実現し、高効率な推論を提供します。用途は文章類似度検索や検索タスクなどで、多言語対応モデルも含まれています。CLIとRustコードの両方で利用可能で、軽量かつ高速な埋め込み生成を実現することが特徴です。

Transformerの理解に向けたN-gram統計の応用

2025-05-17 19:56

科学・技術

この論文は、Transformerモデルの出力をN-gram統計によって近似することで、モデルの予測がどのように文脈に依存しているかを明らかにしようとしています。これにより過学習の検出や、モデルが単純な統計ルールから複雑なものへ学習を進める様子を観察できます。TinyStoriesやWikipediaのデータセットで高い一致率が得られており、LLMの理解に貢献する新しい視点を提示しています。

Google Cloud、AIによる自然言語からのSQL生成を解説

2025-05-16 21:10

IT・ネット

Google Cloudは、自然言語からSQLクエリを生成する「text-to-SQL」技術の詳細を解説しました。GeminiをはじめとするLLMの進化により、BigQueryやCloud SQLなどで自然言語でのデータ検索が可能になっています。Googleは、スキーマ情報の提供、曖昧な質問への対応、SQL方言の違いなどの課題に対し、モデルの文脈構築や再生成、自己整合性評価などの手法を導入。正確性と信頼性を高め、非技術者にもデータ活用を促進しています。

Ollamaがマルチモーダル対応エンジンを公開、視覚と言語の統合強化

2025-05-16 01:43

IT・ネット

Ollamaは、新たなマルチモーダルエンジンを導入し、視覚と言語を統合的に扱う最新モデルへの対応を強化しました。GemmaやLlama 4など主要モデルに対応し、画像認識、文脈理解、ツール呼び出し、長文コンテキスト処理などの高度な機能を実装。モデルのモジュール性やキャッシュ処理、精度向上を意識した設計で、ローカル実行の安定性と将来の拡張性を両立しています。

Windsurfが初のフロンティアモデルSWE-1を発表

2025-05-15 18:47

IT・ネット

Windsurfは、初の大規模言語モデル「SWE-1」のリリースを発表しました。詳細な情報は未公開ながら、同社の製品ラインやAPI提供を通じて、商用利用や研究用途を見据えた展開が示唆されています。これにより、LLM市場における新たな競争軸として注目されています。SWE-1は今後のアップデートと共に、企業や開発者に対し柔軟な言語生成能力を提供する可能性があります。

Llamaをゼロから実装する方法

2025-05-15 09:34

科学・技術

この記事では、言語モデル「Llama」を学習データTinyShakespeareでゼロから実装する過程が丁寧に紹介されています。基礎的な前処理から始まり、RMSNormやRoPE埋め込み、多頭注意といったLlama特有の工夫を段階的に追加し、検証とデバッグを繰り返す方法論が述べられています。実験的な実装を通じて、実行可能な最小構成のモデルを作り、学習・推論を通じて性能向上を目指す実践的なアプローチが示されています。

LLMは複数ターンの会話で精度低下、研究が指摘

2025-05-15 02:28

科学・技術

最新の研究によると、大規模言語モデル（LLM）はシングルターンでの指示には強いものの、複数ターンにわたる会話では平均39%の性能低下が見られることが判明しました。これは早期の誤解や仮定に基づいた応答が蓄積され、最終的な回答の信頼性が著しく下がるためです。研究は20万件以上のシミュレーション会話を分析し、現行のLLMが会話の中で自己修正できない構造的課題を抱えていることを明らかにしています。

PDFからのテキスト抽出はなぜ難しいのか

2025-05-13 15:01

IT・ネット

検索エンジンでPDFをインデックスするための課題とその技術的対応について解説。PDFは実際にはグリフの座標配置に基づいたグラフィック形式で、テキスト構造が明示されていない。記事では、PDFBoxのPDFTextStripperを改良し、フォントサイズや間隔の統計分析による見出しや段落の特定方法を導入。また、見出しの複数行統合や段落区切りの判定といった難題にも対応しており、機械学習を用いない省リソース環境での現実的な手法を提示している。

MLによるコード補完で開発効率が6％向上

2025-05-13 11:20

科学・技術

Googleは、機械学習とセマンティックエンジンを組み合わせたハイブリッドコード補完システムを社内IDEに導入し、10,000人以上の開発者を対象に検証を行いました。MLが提案するコード補完に対して、セマンティックチェックを加えることで信頼性を確保し、開発者の受容率と生産性が向上。結果として、開発サイクル時間が6％短縮され、新規コードの約3％がML提案によるものとなりました。今後はさらなるSEとの連携を予定しています。

Byte Latent Transformer：トークンの代わりにパッチで効率化を実現

2025-05-12 16:55

科学・技術

Byte Latent Transformer（BLT）は、従来のトークンベースのLLMと同等の性能を維持しつつ、推論効率と頑健性を向上させた新しいアーキテクチャ。データの予測困難度に応じて動的にパッチを形成し、複雑な情報には多くの計算資源を割く仕組み。8Bパラメータまでのスケーリング実験では、固定語彙を持たないまま、効率的な学習と推論が可能であることを示した。将来のLLMの設計指針に影響を与える成果。

拡張可能なブロック拡散型言語モデルBD3-LMの提案

2025-05-08 18:18

科学・技術

BD3-LMは、従来のオートレグレッシブモデルと離散拡散モデルの長所を統合し、柔軟な長さのテキスト生成や並列生成を可能にする新しい言語モデルです。トークンのブロック単位で拡散を行い、自己回帰的に文脈を捉えることで、精度を維持しつつ生成速度を向上させます。学習時にはノイズ率の最適化により高い安定性と低パープレキシティを実現し、従来の拡散モデルの限界を克服しています。

自然言語で機械学習モデルを構築できるPlexe

2025-05-06 15:38

IT・ネット

Plexeは、自然言語による記述だけで機械学習モデルを自動生成できる革新的なツールです。利用者は意図や入出力スキーマをテキストで記述するだけで、AIエージェントが設計、学習、評価、デプロイまで一貫して処理します。分散学習にも対応し、OpenAIやAnthropic、Hugging Faceなど複数のLLMプロバイダと連携可能。データ生成やスキーマの自動推論も可能で、技術者以外のユーザーにも使いやすい設計となっています。

ChatGPTが自然言語処理の常識を変えた瞬間

2025-05-01 07:51

IT・ネット

自然言語処理（NLP）分野は、ChatGPTをはじめとする大規模言語モデル（LLM）の登場により、未曾有の変革期を迎えました。2017年のTransformer論文から始まり、BERTやGPT-3が登場、ChatGPTの公開で業界構造が一変。学術界では既存の研究が無意味になったと感じる研究者も多く、技術の本質的理解や倫理問題も議論の的となりました。従来の研究手法や教育、キャリア観が揺らぐ中、NLP分野は「AI」の一部として再定義されつつあります。

Qwen3公開：柔軟な思考モードと119言語対応の新世代モデル

2025-04-28 20:44

科学・技術

AlibabaのQwenプロジェクトが、Qwen3シリーズを発表。大規模MoEモデルから小型モデルまで幅広く揃い、柔軟な思考モード切替、119言語対応、高度なエージェント機能を搭載。プレトレーニングとポストトレーニングの両面で大幅な改良が加えられている。

「自然言語処理」の記事一覧