Charcuterie – 視覚的類似性ベースのUnicodeエクスプローラー
(charcuterie.elastiq.ch)- Unicode文字セットを視覚的に探索し、各文字のグリフ・スクリプト・記号・形状を確認できるツール
- 文字間の視覚的類似性を分析するために、SigLIP 2埋め込みを活用してグリフをベクトル空間で比較
- ユーザーは文字同士の形態的関係を直感的に把握し、Unicode構造を探索可能
- インターフェースは視覚中心の探索体験を提供し、複雑な文字体系を容易に理解できるよう設計
- プロジェクトは継続的に開発中で、ユーザーのフィードバックと寄付による支援を受けている
Charcuterie 概要
- Unicode視覚エクスプローラーとして、文字セットを探索し、関連するグリフ・スクリプト・記号・形状を確認できるツール
- 各文字の視覚的類似性を分析するため、SigLIP 2でレンダリングされたグリフを埋め込み、これをベクトル空間で比較する方式を採用
- ユーザーは文字間の形態的関係を直感的に探索しながら、Unicode標準の構造を理解できる
- プロジェクトは継続的に開発中で、ユーザーのフィードバックと寄付を通じた支援を受けている
1件のコメント
Hacker Newsのコメント
入力フィールドを自動で trimするのは一般的には便利なデフォルトだと理解しているが、この場合は空白そのものを検索できなくなって不便
なので、
if (trim(str)=="") return strのような例外処理を追加するとよさそう最初は気づかなかったが、鉛筆アイコンをクリックすると、テキストの代わりに図形を直接描いて検索できる
本当に素晴らしいコンセプトと実装
ただ、「spotlight」UIの概念が少しわかりにくい。文字をクリックすると周辺領域が強調され、その文字の周囲にある似た文字の地形が再読み込みされる。こうやって類似度の地形を探索できるのだが、この視覚的メタファーの一部を見落としている気がする
すごく良くてすぐブックマークに追加した。以前は EmojiDB を使ってベクターベースの絵文字検索をしていたが、これからはこれも併用するつもり
自分のサイトは unicode-atlas.vercel.app
「X」という文字がどれだけ多いか見て笑ってしまった
charcuterie.elastiq.ch/#1100B のリンクを見ると、「Aegean Check Mark」なのか「Old North Arabian letter Teh」を意味しているのか紛らわしい
本当に素晴らしい。自分はできるだけ画像ではなくUnicode文字を使うのを好む。たとえば矢印のようなものだが、いつも適切な文字を見つけるのが難しかった
でもここでは直接 ‼ 描いて絞り込める。完璧。UXも直感的で、すぐブックマークに追加した
こんな文字があるとは知らなかった: J
自分のサイトは unicode-atlas.vercel.app
単なる視覚的類似性以上の要素を考慮しているように見える。そうでなければ、「@」と「U+1F582 (BACK OF ENVELOPE)」があんなに近い理由がない
それに、何年も、いや何十年も前から Word にこういう機能があってほしいと思っていた。記号を言葉で説明することはできるが、UIがあまりに使いにくくて自力で探すのが難しかった。いまだに「記号の挿入」ウィンドウに検索機能がないのが信じられない
自分のサイトは unicode-atlas.vercel.app
日本語の漢字検索が動かない
https://unicodeplus.com/U+2F8F は動くが
https://unicodeplus.com/U+884C は動かない
左上で文字を直接描いて似た文字を探せる点が印象的。単なるルックアップテーブル以上の機能があることを示している
自分のサイトは unicode-atlas.vercel.app
Unicode標準はコードポイントについて視覚的な形状を定義しない(一部の絵文字系を除く)
だからこのツールは、特定のフォント(言及もなく変更も不可)のグリフ類似度の可視化にすぎず、Unicodeコードポイントの「視覚的探索」とは別物だ