ニュースボイス

リザーバーサンプリングとは何か

🕒

カテゴリ

科学・技術

リザーバーサンプリングは、データ総数が事前に分からない場合でも、公平にランダムサンプリングを行うアルゴリズムです。1件ずつ流れてくるデータから一定数をメモリ効率良く選ぶことができ、ログ収集などにも応用可能です。仕組みは、n番目の要素が選ばれる確率を1/nとすることで、すべてのデータに均等な選択機会を与えます。複数の要素を選ぶ場合も拡張可能です。