- Appleが、トランスフォーマー言語モデルを活用したiOSおよびmacOSの新機能を発表: ユーザーが入力しながら予測テキストの候補を提供
- Appleが公に認めた初のTransformerベースモデルの1つで、オペレーティングシステムに統合される予定
- Gmailのオートコンプリートに似ており、個々の単語を補完し、ときには一度に2語以上を提案する機能
- 予測テキストモデルは、ユーザーの入力中にスペルや文法の誤りを確認するmacOSの内部アプリケーションであるAppleSpell内で発見
- モデルは、入力時に使われる複数のEspressoモデルファイルを含む
/System/Library/LinguisticData/RequiredAssets_en.bundle/AssetData/en.lm/unilm.bundle に配置
- 予測テキストモデルの語彙は、特殊トークン、短縮形、絵文字を含む15,000個のトークンで構成
- 予測テキストモデルの構造は、トークン埋め込み、位置エンコーディング、一連のデコーダーブロック、出力層を含み、GPT-2をベースにしているように見える
- Appleの予測テキストモデルは約3,400万個のパラメータと512個の隠れユニットを持ち、GPT-2の最小バージョンよりはるかに小さい
- モデルの小ささにより、デバイスのバッテリーをあまり消費せず、高速かつ高頻度で実行でき、ユーザー体験を向上
- モデルのサイズ制約により、文全体や段落を書く能力は不足しているが、次の1語または2語に高い確信がある場合には、ユーザーに提案するには十分に優れている
- 予測テキスト機能を直接試してみたい人のために、著者がGitHubにスクリプトを提供
1件のコメント
Hacker Newsの意見
unilm.bundleが新しいテキスト予測モデルであることを発見しました。UnilmCtrlという用語は、SocherのCTRLモデルへの何らかの依存を示唆しているのではないかと推測されていますが、確認はされていません。一部のユーザーは、AppleがNLP分野にもっと長く取り組んでいれば、より敬意を抱いただろうと述べています.