「検索エンジン」の記事一覧
-
Googleが個人番号を公開?思わぬ情報漏えいの経緯
2025-05-26 05:34
IT・ネットボランティア管理ソフト「Three Rings」の開発者が、自身の携帯番号がGoogle検索結果に表示されていることに気づき、混乱が広がりました。以前、Googleの本人確認で提供した情報が突如公開設定となっていた可能性があります。Googleビジネスプロフィール上から削除後、表示は消えたものの、なぜ共有されたのかは不明なままです。個人情報保護や検索エンジンの透明性が改めて問われています。
-
Google、検索を革新する「AIモード」を正式導入
2025-05-20 21:49
IT・ネットGoogleは米国で新たな「AIモード」を導入し、検索エンジンの対話型化を進めています。このモードは、質問に対し専門家のように応答し、より複雑な検索ニーズに応えるものです。すでに15億人が「AIオーバービュー」を利用しており、従来の検索リンクよりもAIによる要約が上位表示されるケースが増えています。AI導入により外部サイトへのクリック率は約30%減少しており、ウェブ流入減少への懸念も広がっています。
-
word2vecで手作り検索エンジンを構築する方法
2025-05-20 09:58
科学・技術この記事は、word2vecを用いた検索エンジンの自作プロジェクトを解説しています。筆者はブログ記事をベクトル化し、検索クエリとの類似度をコサイン類似度で評価する仕組みをPythonで構築。さらにGitHub Pages上で軽量なフロントエンドを設け、単語のベクトルデータを効率的に配信する工夫も紹介されています。手軽ながらも機能的な全文検索システムの設計が学べる実践的内容です。
-
PDFからのテキスト抽出はなぜ難しいのか
2025-05-13 15:01
IT・ネット検索エンジンでPDFをインデックスするための課題とその技術的対応について解説。PDFは実際にはグリフの座標配置に基づいたグラフィック形式で、テキスト構造が明示されていない。記事では、PDFBoxのPDFTextStripperを改良し、フォントサイズや間隔の統計分析による見出しや段落の特定方法を導入。また、見出しの複数行統合や段落区切りの判定といった難題にも対応しており、機械学習を用いない省リソース環境での現実的な手法を提示している。
-
Exa Websets、検索体験を再定義
2025-05-06 16:18
IT・ネットExa Websetsは、ベクトル検索とエージェント処理を組み合わせた新しい検索エンジンで、複雑なクエリにも正確に応答可能です。従来のキーワード検索とは異なり、クエリの意味に合致する実体を返すことを目的としています。検索結果は表形式で、項目ごとに補足情報を付加できる点も特徴。Googleに代わる精密な情報取得手段として、開発者や研究者に注目されています。