17 ポイント 投稿者 GN⁺ 2024-12-20 | 1件のコメント | WhatsAppで共有
  • ModernBERTは最新技術を適用した新しいエンコーダ専用モデルで、BERTとその後継モデルよりも速度と精度が向上している
  • 8192トークンの長いコンテキスト長をサポートし、コードデータも含めて学習されている
  • さまざまな応用分野で利用可能で、特に大規模なコード検索や新しいIDE機能に適している

紹介

  • BERTは2018年にリリースされ、現在も広く使われているモデルで、特に検索、分類、エンティティ抽出に適している。
  • ModernBERTはBERTの代替モデルとして、速度と精度の両面でPareto改善を実現している。
  • 長いコンテキスト長とコードデータの導入により、新たな応用分野を切り開いている。

デコーダ専用モデル

  • GPT、Llama、Claudeのようなデコーダ専用モデルは生成モデルであり、人間に近いコンテンツを生成できる。
  • しかし、これらのモデルは大きくて遅く、コストも高い。
  • エンコーダ専用モデルは実用的かつ効率的で、多くのタスクに適している。

エンコーダ専用モデル

  • エンコーダ専用モデルは入力を数値ベクトルに変換して表現する。
  • デコーダ専用モデルは未来のトークンを見ることができないが、エンコーダ専用モデルは双方向にトークンを見られるため効率的である。
  • エンコーダ専用モデルはさまざまな応用分野で使われており、特にRAGパイプラインや推薦システムで重要である。

性能概要

  • ModernBERTはさまざまなタスクで高い精度を示し、DeBERTaV3よりも高速でメモリ使用量も少ない。
  • 長いコンテキスト推論では、他の高品質モデルより最大3倍高速である。
  • コード検索で際立った性能を示し、新しいアプリケーション開発の可能性を開く。

効率性

  • ModernBERTは実用性を重視し、さまざまな入力長で高速な性能を示す。
  • 長いコンテキスト入力では、他のモデルより2〜3倍高速である。
  • より大きなバッチサイズを使えるため、小型GPUでも効果的に利用できる。

ModernBERTの現代性

  • ModernBERTは最新のエンジニアリングをエンコーダモデルに適用し、改良を実現している。
  • Transformer++アーキテクチャを採用して性能を向上させている。
  • 効率性と現代的なデータ規模・データソースを重視している。

新しいTransformer

  • ModernBERTはTransformer++アーキテクチャを採用して性能を向上させている。
  • RoPEを使って位置エンコーディングを改善し、GeGLUレイヤーを使ってMLPレイヤーを置き換えている。
  • 不要なバイアス項を削除し、パラメータ利用を最適化している。

レーストラック向けHonda Civicのアップグレード

  • ModernBERTは速度を重視しており、さまざまな応用分野で効率的に利用できる。
  • Flash Attention 2の高速化を活用して効率を高めている。
  • Alternating Attention、Unpadding、Sequence Packingによって計算の無駄を減らしている。

ハードウェアに関する注意

  • ModernBERTはハードウェア設計を重視し、さまざまなGPUで最適な性能を発揮するよう設計されている。
  • 深く狭い構造とハードウェア効率を考慮してモデルを設計している。

学習

  • ModernBERTはさまざまなソースのデータを使って学習され、2兆個のトークンを使用している。
  • 3段階の学習プロセスを通じて、さまざまなタスクで優れた性能を示す。
  • 初期学習段階ではバッチサイズのウォームアップを使って速度を高めている。

結論

  • ModernBERTは最新技術を適用することで、エンコーダ専用モデルの性能を改善している。
  • さまざまなタスクで強力な性能を提供し、サイズ/性能比が魅力的である。
  • コミュニティによる創造的な活用を期待しており、デモ向けのコンテストを実施中である。

1件のコメント

 
GN⁺ 2024-12-20
Hacker Newsの意見
  • Answer.AIのJeremyは、新しいモデルのリリースがさまざまなスタートアップやプロジェクトの基盤になり得ると期待している
    • ブログ記事で触れられている内容は氷山の一角にすぎず、モデルを多様な方法で細かく調整できる多くの機会がある
  • エンコーダ専用モデルは毎月10億件以上のダウンロードを記録しており、デコーダ専用モデルの3倍に達する
    • これはデコーダの利用者がHugging Faceを使わずAPI呼び出しを利用しているためでもあり、エンコーダが大半の本格的なMLアプリケーションを支える縁の下の力持ちだからでもある
    • ランキング、推薦、RAGなどを行うにはエンコーダが必要で、一般的にはBERT、RoBERTa、ALBERT系のモデルが使われる
  • 数年前にBERTモデルを要約などに使ったときは、まるで奇跡のように感じられた
    • Ollamaがライブラリに追加するまで待つ予定であり、最近のLLMの速度向上は印象的だ
    • Appleはこれまでも開発者SDKでBERTモデルをサポートしてきたが、新しい技術へどれだけ早く更新するのか気になる
  • 論文を読んで、ローカルアテンション層の追加に感銘を受けた
    • Lucidrainsのリポジトリで何年も実験してきたが、これ以上発展してこなかったのが驚きだった
    • 推論速度は素晴らしく、NSPの削除やマスキングの増加、RoPEや長いコンテキストなど多くの改善が行われている
    • "ModernTinyBERT"を作りたいが、レイヤーが複雑に絡み合っていて難しい
  • BERTモデルが現在どこで使われているのか気になる
    • 特定のタスクではLLMより優れた代替手段だと理解しており、双方向に文脈をよりよく理解できる
    • ただしLLMも強力なので、差はわずかかもしれない
  • モデルをSentenceTransformersで細かく調整できるのか気になる
    • ColBERTがベンチマークに含まれており、answerai-colbert-small-v2が近くリリースされる予定なのか気になる
  • ModernBERTのRAG評価を見た人がいるのか気になる
  • Answer.aiチームは今日しっかり成果を出しており、Jeremyとチームを称賛している
  • モデルが英語のみをサポートしているのか、多言語モデルや他言語の単一言語モデルを公開する予定があるのか気になる
  • モデル名をERNIEにしなかったのは惜しい機会だった