- フォント生成のための生成型機械学習(ML)モデル「FontoGen」を構築
- モデルはフォントの説明を入力として受け取り、フォントファイルを出力として提供
- 著者は2023年のAIの台頭に触発され、テキストからSVGを生成することを探求するようになり、そこからフォント生成のアイデアを得た
- IconShop2の論文を参考にしてモデルを構築し、SVG生成と似た形でフォント生成が可能であることを発見
- モデルは、テキスト埋め込みの後にフォント埋め込みが続くシーケンスとして学習されたシーケンス・ツー・シーケンスモデル
- テキスト埋め込みは事前学習済みのBERTエンコーダーモデルを使用して生成され、フォント埋め込みはフォントをトークン列に変換して生成
- モデルは16層・8ブロックで構成された自己回帰型のエンコーダー専用Transformerで、総パラメータ数は7,370万
- 著者はBigBird3アテンションを使用して初期プロンプトに集中し、N個の前のトークンを観察して複数の先行グリフのスタイルを捉えた
- モデルは、GPT-3.5を使ってさまざまな種類の説明をいくつかのキーワードに要約した、71k件のユニークなフォントデータセットで学習
- 学習には127時間を要し、検証損失がほとんど改善しなくなった時点で停止
- 著者は、可能な限り多くをデータセット前処理段階へ移すことで性能を3倍向上
- 著者は将来的な応用として、デザイナーが作成した単一のグリフを基に他のすべてのグリフを生成するため、既存のフォントエディタにモデルを統合することなどを提案
2件のコメント
かわいいフォントを作って
Hacker Newsの意見