6 ポイント 投稿者 GN⁺ 2025-01-22 | 1件のコメント | WhatsAppで共有
  • Ollamaで利用できる0.5B-3B範囲のモデルに関する議論
  • こうしたモデルをワークフローの一部として使う面白いツールを構築したことがあるか、という質問

1件のコメント

 
GN⁺ 2025-01-22
Hacker Newsの意見
  • ollamaを使ってSMSスパムメッセージに返信するよう設定した。各番号に、ミレニアル世代のジム友達や19世紀のイギリス紳士のようなペルソナを与えている

  • Llamaモデルを使ってウェブサイトのクッキー通知を識別し、EasyList Cookieにフィルタールールを追加している。ほとんどのクッキー通知はHTML/CSSが似ているため、innerTextを取得して小さなLLMで誤検知をふるい落とせる。3Bモデルは十分なプロンプトエンジニアリングでそこそこの性能を示し、7Bは追加コストなしで誤検知率がほぼない。コードとプロンプトはGitHubで確認できる

  • n100 CPUを搭載したミニPCを使って、さまざまなジャンルやスタイルの物語を生成している。CPUファンは過熱せず、生産的ではないが面白い

  • 小さなfishスクリプトを使って、現在のgit diffに基づくコミットメッセージを3つ生成している。複数のモデルをテスト中で、アイデアが必要なときに役立つ。スクリプトと例はGitHubで確認できる

  • 会話の途中で「勝者」を宣言しようとする小さなデバイスを持っている

  • Jamie Brewの「Comedy Writing With Small Generative Models」という講演をおすすめする。ギターを持って演奏し始めるまで待つとよい

  • MicrosoftがFLAMEモデル(6000万パラメータ)を発表した。Excelの数式修復・補完で、はるかに大きなモデル(1000億パラメータ以上)を上回っている

  • Micro Wake Wordは、ESPで音声ウェイクアップを行うためのライブラリおよびデバイスモデル群。Home Assistantsの完全ローカルなAlexa代替として最近デプロイされた

  • Gemma 2Bをファインチューニングして、政府運営の母性健康相談電話で新たな妊婦からの緊急メッセージを識別している

  • 約100万パラメータのモデルを作ってMagic the Gatheringのカードをランダム生成している。Karpathyのnanogptをベースにいくつか機能を追加した。AppleシリコンMacがあれば、GitHubから直接モデルを生成できる