Linuxカーネル100万件のコミットメッセージを検索する
(linux-commits-search.typesense.org)-
Linuxカーネル30周年と100万コミットを記念して作られたサイト
-
オープンソース検索エンジン typesense を使って、全コミットを高速に検索可能
-
コミット年、Author と Committer の名前およびメールドメイン、変更ファイル数などでフィルタリング可能
-
全データセットのサイズは950MB、メモリ上に載せたインデックスサイズは3GB、3ノードの Typesense クラスターにデプロイ
3件のコメント
思ったより f-word はあまり多くないですね。
s-word は人名が検索に引っかかるので……(遠い目……)
試しに korea、samsung などで検索してみたら、なかなか面白かったです..
Typesenseチームが自ら作って公開したようですね。自社の検索エンジンをPRするために、さまざまな試みをしています。
typesense - オープンソース検索エンジン https://ja.news.hada.io/topic?id=3369
200万件の料理レシピ検索エンジン https://ja.news.hada.io/topic?id=3370
Typesense検索エンジンを使った行政洞の韓国語検索性能テスト https://ja.news.hada.io/topic?id=3393
Ubuntu 20.04でのtypesenseサーバーのインストールからnode.jsクライアント例の実行まで https://ja.news.hada.io/topic?id=3387