2 ポイント 投稿者 GN⁺ 2024-12-07 | 1件のコメント | WhatsAppで共有
  • Llama 3.3 コレクション
    • このコレクションには、Llama 3.3 のコンバーターと元のリポジトリが含まれています
    • 最近8時間前に更新されました
    • 合計1件の項目を含みます

1件のコメント

 
GN⁺ 2024-12-07
Hacker Newsの意見
  • Llama 3.2 405Bと比べると、性能は同等か、やや上回っているように見える

    • Zuckによれば、これは Llama 3 シリーズの最後のリリースであり、Llama 4 は 2025 年にリリース予定
    • Steve Jobs が Dropbox について「機能であって製品ではない」と述べた有名な発言を思い起こさせる
    • Meta は強力なモデルをオープンソースで提供することで AI をコモディティ化しており、それによって Facebook と Instagram のサービスを強化できる
    • AI を売るのではなく、AI を使って中核事業を強化している
    • オープンソースとして提供することで、広く採用され開発される利点を得られる
  • 私たちのベンチマークでは、予想以上に良い結果を示した

    • さらに詳しく調べる予定だが、印象的だ
  • 現在、優れた「汎用」Macデスクトップクライアントについての議論が続いている

    • Ollama、ChatGPT、Claude、Perplexity などを使いたい
    • さまざまなアプリで AI チャットを使いたく、デスクトップアプリである必要はない
    • MacMind は良いが、他の API のフロントエンドとしてはかなり高価だ
    • 「けちけちするな」という返答ももっともだ
  • 複数のベンチマークで GPT-4o に近い性能を示している

  • Hugging Face に 4bit bitsandbytes、GGUFs、そして元の 16bit 重みをアップロードした

    • Llama 3.3 70B を 48GB VRAM 未満で 2 倍速くファインチューニングでき、メモリ使用量を 70% 削減できる
  • OpenRouter で 1M トークンの価格を追跡しているが、更新するたびに価格が下がっている

  • Llama のオープンソース化は、「Commoditize Your Complement」戦略の優れた例だ

    • この戦略を知らない人のために、Gwern の「Laws of Tech: Commoditize Your Complement」へのリンクが共有されている
  • Hugging Face のモデルについての質問

    • ノートPCで JupyterLab を通じて実行できるか
    • どのような利点があるか
    • 定期的に更新できるか
    • 特定の用途に合わせてファインチューニングできるか
    • モデルのファインチューニングにどれほどの時間と労力が必要か
    • Hugging Face がこうした質問への答えを提供しているかどうかに関する URL の要望
  • Meta は OpenAI/Anthropic を狙って強力なオープンモデルを公開し、継続的に期待を上回っている

    • 最大の恩恵を受けるのは開発者たちだ