ニュースボイス

Rubyの正規表現エンジンを高速化する選択肢とは

🕒

カテゴリ

IT・ネット

SerpApiが抱えるデータ抽出の課題を背景に、Rubyの正規表現エンジン「Onigmo」のパフォーマンスを改善する代替エンジンとして、Googleのre2やRustのregexが比較検証されました。ベンチマークでは、特にUnicodeや大規模データ、ReDoS耐性の面でRust製エンジンが最も優秀とされ、次いでre2、最下位がRubyとなりました。一方でre2はUnicodeへの対応が不十分であることも判明しました。