Hyperscan - 高性能な複数正規表現パターンマッチングのオープンソースライブラリ
(hyperscan.io)PCREのような正規表現文法に従う、Cで書かれたAPI。
データストリーム内で数万個の正規表現を同時に検索可能。
Intelが開発元のSensory Networksを買収後、オープンソースとして公開し、Intel CPU向けに最適化(AVX2、AVX512命令セットをサポート)
PCREのような正規表現文法に従う、Cで書かれたAPI。
データストリーム内で数万個の正規表現を同時に検索可能。
Intelが開発元のSensory Networksを買収後、オープンソースとして公開し、Intel CPU向けに最適化(AVX2、AVX512命令セットをサポート)
1件のコメント
Hyperscanは、GitHubがすべてのコミットを対象に、GitHub OAuth TokenやSSH Keyなどが含まれていないかを検査するために使っていることでも有名です。
https://github.blog/2018-10-17-behind-the-scenes-of-github-token-scann…
この用途(同時に非常に多くの値を見つけ出すこと)では、Hyperscan以外に代替はないとのことです。