34 ポイント 投稿者 GN⁺ 2025-08-10 | まだコメントはありません。 | WhatsAppで共有
  • 複数の無料Web AIモデルを並行利用し、問題解決とコード生成を分離して、モデルごとの強みを生かすハイブリッド戦略を活用
  • AI Code Prep GUIで必要なコードだけを選別・整理し、不要なコンテキストによる性能低下を防いで、核心的なコンテキストだけをAIに提供
  • 企画・デバッグは高性能/無料モデル(Gemini 2.5 Pro、o3、o4-mini、Claude 4 など)で、実行・コード作成GPT-4.1・Claude 3.5で実施
  • OpenAIのデータ共有GitHub CopilotPoe.comOpenRouterなどで無料・低価格のトークンを確保し、コストを最小化
  • Claude Code、Qwen Code、Gemini CLI、Roo Code、Trae IDE など多様なエージェント・CLIツールを状況別に組み合わせて作業効率を向上

My Browser Setup: The Free AI Buffet

  • ブラウザでさまざまな高性能AIモデルの無料版を複数タブで開いて使っている
  • 1つのモデルだけに依存せず、複数の観点から回答を得るやり方である。代表的に使っている無料モデルの組み合わせは次のとおり。
  • GLM 4.5: Webで無料利用でき、体感では Claude 4 レベルまたはそれ以上に性能が高い。常に2〜3個のタブを開いている
  • Kimi K2: Claude または Opus 系列に近いモデルで、Webで無料利用可能。通常は1〜2個のタブを開き、GLM 4.5 登場前は難しいバグを1日に何度も解決してくれた
  • Qwen3 Coder および新型モデル群: さまざまなコーディング特化モデルのテスト用に使用
  • OpenAI Playground: GPT-4.5、o3 など多様なモデルを無料で活用可能。アカウントのデータ設定で「OpenAIがデータをモデル学習に使用」することを許可すると無料トークンが付与される
  • Google Gemini AI Studio: Gemini 2.5 Pro/Flash モデルを無料かつほぼ無制限で利用可能。通常は1〜3個のタブを開いている
  • Google Gemini 2.5 Pro: AI Studio とは別サービスで、画像生成と深層リサーチ機能がより優れている。AI Studio と併用してタブを並行利用
  • Poe.com: Claude 4 や o4-mini などのプレミアムモデルに対して日次の無料クレジットを提供
  • OpenRouter: 無料モデルと有料モデルを混在利用できる。複数モデルをそれぞれ別タブに設定している
  • ChatGPT: 無料版も依然として有用なため、最低1つのタブは維持
  • Perplexity AI: リサーチ中心の質問に強み
  • Deepseek: v3 と r1 モデルを無料提供。ただしコンテキスト制限に注意
  • Grok.com: 一般用途、深層リサーチ、画像編集を無制限無料で提供。特に深層リサーチ機能は Perplexity に近く有用
  • Phind: 回答時にフローチャートやダイアグラムも併せて提示しようとする
  • lmarena.ai: Claude Opus 4 と Sonnet 4 を無料提供。Opus 4 を無料で使える価値はかなり高い

Claude.ai 自体も無料だが、利用制限が頻繁で不便なことがあり、Cody 拡張や Copilot などを通じて別のアプローチを使っている。

注意事項 – Grok を使う際
Grok は無料の計算資源と無検閲の画像生成を提供しており、他モデルの安全システムが邪魔になるときに役立つ場合がある。しかし、運営側がナチ関連思想や偽情報を広めようとする意図を持っている可能性があるという報告がある。特にアフリカの集団虐殺など歴史的事件について虚偽情報を提供するよう指示されていたという主張もある。このような歪みは主に X プラットフォームで見られるが、コーディングのような安全な用途に限定して使うか、潜在的なバイアスを意識して使うことが推奨される。

A smarter, cheaper workflow: Focused Context

  • WebベースのAIチャットインターフェース(AI Studio、ChatGPT、OpenRouter など)を使うと、IDE やエージェントフレームワーク(Cline、Trae、Copilot など)より問題解決やソリューション提案に優れている場合が多い
  • Cursor、Cline、Roo Code のようなツールですべての作業を処理すると、MCP サーバーの使い方やファイル編集手順など、問題と直接関係ない大量のテキストまで AI に送信してしまい、AI が混乱して性能が落ちる
  • そのため、最高価格帯のモデルを使っても、不要な情報による「鈍化効果」を克服できない
  • そこで、問題解決に必要な正確なコンテキストを自分で作成し、WebベースのAIチャットに貼り付けて質問したりコードレビューを依頼したりする方法を取っている
  • 解決策が出たら、その内容を Cline などのエージェント向けプロンプトに書き直し、ファイル編集だけを任せる
  • こうすれば GPT-4.1(無制限利用可能)を活用して、安価に問題解決や企画ができ、わざわざ Claude のクレジットを消費する必要がない
  • 難しい問題解決には Claude を、実行には Web チャットAIを併用して効率を高める
  • How AI Code Prep Helps (Example Prompt Structure)

    例のプロンプト:

    Can you help me figure out why my program does x instead of y?  
    
    • AI Code Prep GUI はプロジェクトフォルダを再帰的にスキャンし、サブフォルダやファイルまですべて探索したうえで、AI が見やすい形式にコードと質問を整理する
    • 生成されるコンテキストの例:
    Can you help me figure out why my program does x instead of y?  
    
    fileName.js: <code>  
    ... ファイル内容 ... </code>  
    
    nextFile.py: <code>  
    import example  
    ... その他の内容 ... </code>  
    
    Can you help me figure out why my program does x instead of y?  
    
    • 質問を2回繰り返し(上部/下部/両方を選択可能)、AI が焦点を保てるようにする
    • Windows ではプロジェクトフォルダ内でマウスを右クリック → 「AI Code Prep GUI」を実行 → 自動でコードファイルを選択し、node_modules.git など不要なディレクトリは自動除外
    • 選択が完璧でなくても、チェックボックスで簡単に調整できる
    • 大規模プロジェクトで AI のコンテキスト上限を超える場合、必要不可欠なファイルだけを選んで提供できる
  • なぜこの方式が重要なのか?

    • Cline、GitHub Copilot、Cursor、Windsurf など多くのコードエージェントは、コンテキストを送りすぎる少なすぎるかのどちらかで非効率
    • 自分でファイルを選別すれば、不要なデータなしで必要な情報だけを AI に提供できる
    • GUI ベースのため、CLI や公開 GitHub リンクを要求する他のコンテキスト生成ツールより個人コードのセキュリティ維持利便性に優れる
    • 最新機能の更新は wuu73.org/aicp を参照

Model Strategy: 仕事に合った頭脳を選ぶ

  • 多くの強力なAIモデルはWebインターフェース経由で無料提供されているため(Gemini in AI StudioGrokDeepseek など)、まずはこれらを優先的に活用する
  • Poe.com は Claude や新しい o4 シリーズのような最上位モデル向けに、毎日無料クレジットを提供している
  • Gemini 2.5 ProAI Studio 提供)は、デバッグ、企画、全般的な作業で非常に優秀で、現時点で最も汎用性の高いモデルと評価されている
  • 難しい問題には o4-miniOpenRouter または Poe で利用可能)を試す
    • 以前の最上位モデル(Claude 3.5/3.7/4)より、API利用時のコストがはるかに安い
    • 解決が難しかったバグを即座に直せた経験がある
  • Claude 3.7 または 4Poe、API(OpenRouter)、GitHub Copilot Chat などから利用できる
    • 一部の無料利用枠はあるが、頻繁に使うにはコスト負担が大きい
    • 3.7/4 は創造的で爆発力のある出力(「Hunter S. Thompson」風)を出せるが、実際のコーディングは落ち着いた Claude 3.5 に任せた方が効率的な場合がある
  • OpenAI Playground の無料トークン活用法

    • OpenAI アカウントのデータ共有設定を有効にすると、毎日大量の無料トークンを使える
    • OpenAI Playground → 右上の設定アイコン → 左メニュー Data ControlsSharing"Share inputs and outputs with OpenAI" を有効にすると、次の特典が得られる:
    • 1日最大25万トークン: gpt-5, gpt-4.1, gpt-4o, o1, o3
    • 1日最大250万トークン: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
    • この設定を活用すれば、o3GPT-4.5 のような最上位モデルを無料で大量に使える
    • OpenAI Playground では o3o4-mini を並べて実行し、比較しながら各モデルの強みや用途を把握できる。
  • 推奨モデル別の活用戦略

    • Gemini 2.5 Pro: デバッグ、企画、全般的なコーディング作業で最優先
    • o4-mini: 難しいバグ修正、コスト効率に優れる
    • Claude 4 / 3.7: 緊急かつ難易度の高い問題解決に最適。ただし、アクセス性とコストに制約がある
    • Claude 3.5: 3.7/4 の創造的な出力を整えたり、実際のコード作成に適している
    • o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: 複雑な問題解決能力が非常に高く、無料トークン設定を活用すれば大量利用が可能

The Hybrid Approach: Premium Planning + Budget Execution

  • さまざまなモデルをテストした結果、品質とコスト効率の両方を最大化できるハイブリッド戦略を確立した
  • 核となるインサイトは、モデルごとに開発プロセスの特定段階で得意分野が異なるという点

> "スマートジュース(Smart Juice)"理論 – AIが愚かになる理由
> モデルが受け取れる「知能エネルギー」には限りがある。
> 簡潔で集中したプロンプトを送れば、そのエネルギーのほぼ100%が問題解決に使われる。
> しかし、不必要に複雑な入力(ツールの使い方に関する長文説明、問題と無関係な文脈、何ページ分ものコードなど)を送ると、そのかなりの部分がそれらの処理に消費され、実際の問題解決に使える「知能」が減ってしまう。
>
> 例: Cursor や Cline のような IDE 連携型エージェントは、質問の前に大量の指示文やコンテキストを送るため、モデルの集中力が落ちる。
> したがって、不要な文脈を減らし、問題解決に必要な核心だけを送ることが最適な結果を出す方法である。

  • 新規プロジェクト開始時のワークフロー

    • 1. Plan & Brainstorm
      • 賢くて無料のWebモデル(Gemini 2.5、o4-mini、Claude 3.7/4、o3 など)でアプローチを設計し、段階的な計画を立て、必要なライブラリを特定する。
    • 2. Generate Agent Prompt
      • 上記モデルのいずれかに依頼する:
        "Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [作業内容]"
      • 生成されたプロンプトを、ChatGPT のようなリライトが得意な無料AIでさらに磨き上げる。
    • 3. Execute with Cline
      • 磨き上げたプロンプトを Cline に貼り付け、GPT 4.1 または Claude 3.5(複雑な作業なら Claude 4)で実行する。
      • GPT 4.1 系は指示遵守の訓練がよく行われている。
    • 4. Fallback
      • GPT 4.1 が失敗したら、API経由で Claude 3.5 に切り替える。
      • Deepseek v3 または R1 も指示実行に非常に強い。
  • 中核戦略

    • 高価で賢いモデル(または無料で使える Gemini 2.5 Pro)で、戦略と設計の段階を進める。
    • 計画を 2〜3 個の別の無料モデル(Deepseek R1Poe の Claude など)に貼り付けて検証する:
      "Is this good? Can you improve it or find flaws?"
    • コーディング・実行段階 では、安定していて効率的なモデル(GPT 4.1、Claude 3.5)を Cline で使う。
  • モデル別活用のヒント

    • o4-mini
      • 複雑なコードロジックの解釈、フレームワーク・ライブラリ選定などの 高レベルな実装戦略 に強い。
    • アイデアのブレインストーミング
      • Gemini 2.5、o4-mini、GPT 4.1、ChatGPT、o3-mini(duck.ai でしばしば無料)、Phind などを活用する。
    • 解決できない場合
      • 無料・低価格モデルで解決できなければ、API経由で上位の有料モデルへエスカレーションする。

Alternative Agents & Setups

  • Trae.ai(ByteDance、TikTokの制作元)
    • VS Code互換のIDEで、無料のAI利用を提供: Claude 4、Claude 3.7、Claude 3.5、GPT 4.1を含む。
    • 内蔵エージェントの性能はClineより劣る(正直、Clineが最強)。
    • VS Codeクローン型なので、Cline拡張機能もインストールできそう。
    • ただしサーバー過負荷で動作が遅い → 無料利用の実効性は低い。
    • それでも無料モデルへのアクセス性があるため言及。
  • おすすめ設定 2つ

    • 1. VS Code + Cline + Copilot
      • Copilotを月額$10で購読 → Clineで強力なモデルAPIを低コストで利用可能。
      • 無料ティアでも一部の基本機能は利用可能。
    • 2. Trae.ai + Cline
      • Traeの無料モデルアクセスと、ClineのAPIキー利用を併用できるかテスト。
        > ヒント: Copilot標準エージェントが、Clineではうまく解決できない問題を解くこともあり、その逆もあります。
        > Clineは過度に長いプロンプトを送って性能が落ちる場合がある → Copilotが有利なケースも存在。
  • Roo Code: Clineのクローン

    • Roo CodeはClineとほぼ同じだが、一部異なる機能を提供。
    • プロジェクトやコーディングスタイルによっては、Roo Codeのほうが適している場合もある。
    • Cline自体は無料だが、API呼び出し料金は発生する。
    • 最も経済的な方法: VS Code LM APIを設定 + Copilotを月額$10で購読 → ほぼ無制限に強力なモデルを使用。
  • 新規CLIツール: Claude Code、Qwen Code、Gemini CLI

    • 最近、CLIベースのコーディングツールへの関心が急増。
    • Claude Code: サブエージェント(subagent)対応 → 1つの作業のみ実行し、追加ツールは使わない。
      • このガイドで説明した**「スマートジュース」集中型ワークフロー**を再現可能。
      • 不要なエージェント指示文(bloat)を削除し、効率性を維持。
    • Qwen CodeGemini CLIにもそれぞれ利点がある。
    • Claude CodeをGLM 4.5で使うための設定ガイドがz.aiサイトにある。
    • 各CLIツールには異なる強みがあるため、ガイドやコミュニティのコツを参考にしながら試すのがおすすめ。

TL;DR: クイックスタートガイド

  • Models & Roles
    • Planning & Brainstorming
      GLM 4.5、Kimi K2、最新のQwen3 Coder & 2507シリーズ、Gemini 2.5 Pro(AI Studio)、o4-mini(OpenRouter)、Claude 3.7/4(Poe)、OpenAI Playgroundで1日25万の無料トークン(o3、GPT-5)の利用を推奨
    • Problem Solving & Debugging
      GPT-5(Playgroundの無料トークン)、GLM-4.5(Claude 4級の性能)、Claude 4(Poeの無料デイリートークン)
    • Actual Coding
      GPT-4.1(Cline)、失敗したらClaude 3.5に切り替え、またはQwen3 Coder、Instruct、2507、GLM 4.5、Kimi K2を使用
  • Key Tools
    • VS Code
    • AI Code Prep GUI – ローカルで必要なファイルだけをスキャン・選別し、AIコンテキストを最適化
    • Cline(VS Codeエージェント)– 段階的にコードを実行
    • 無料Webチャット – Poe.com、ChatGPT、Grok、Deepseek、Perplexity、OpenAI Playground、AI Studio(Gemini 2.5 Pro)、OpenRouter、duck.ai
  • Quick Workflow
    1. AI Code Prep GUIでプロジェクト関連ファイルをバンドル
    2. そのコンテキストを好みのWebチャットモデルに貼り付けて計画・デバッグ
    3. あるモデルに"この作業のための詳細なClineプロンプトを作成"と依頼し、その後ChatGPTなどで再調整
    4. 完成したプロンプトをGPT-4.1に設定したClineに貼り付けてコードを生成・修正
      → 失敗したらClaude 3.5に切り替え
  • Cost-Saving Hacks
    • OpenAI Playgroundの「データ共有」有効化 → 1日25万の無料トークン(GPT-4.5、o3) + 1日250万の無料トークン(o4-mini、o3-mini)
    • GitHub Copilotを月額$10で購読 → ClineでClaudeモデルを限定的に利用可能
    • OpenRouter従量課金 → o4-mini、Claude 3.7など最新モデルを低コストで利用

Some Thoughts

  • AIは驚異的な生産性ブースターですが、魔法の杖ではありません。
  • 本当の魔法は、皆さんの好奇心粘り強さ、そして試してみようとする意志が、これらの強力なツールと結びついたときに起こります。
  • バグや問題でくじけないでください — すべての挑戦は新しいことを学ぶ機会です。
  • モデルを組み合わせて使い、大胆なアイデアを試し、壊しては作り直すことを恐れないでください。
  • 最高の開発者とは、決して行き詰まらない人ではなく、行き詰まっても前に進み続け、あらゆるツールと技術を活用する人です。
  • 混沌を受け入れ、プロセスを楽しみ、皆さんの創造性が道を示すようにしてください!

Latest Model Updates (Aug 2025)

💰 予算重視: 最大限の価値を得る

  • GPT 4.5

    • Status: Discontinued
  • o3

    • 能力: Claude 4に匹敵する性能、難しい問題解決に卓越、天才級
    • 活用のヒント: AI Code Prep GUIでコードベース全体を投入して分析可能
    • Free Tokens: Data Controls/Sharing settingsでデータ共有を有効化すると25万トークン/日
  • o4-mini

    • 能力: o3よりやや劣るが非常に優秀で、いわばo3の弟のようなモデル
    • Free Tokens: データ共有を有効化すると250万トークン/日
  • Gemini 2.5 Pro

    • 利用: AI Studioで無料
    • 特化: 複雑なデバッグ、アーキテクチャ設計、計画立案
  • Deepseek R1 0528

    • 能力: 推論性能が向上した非常に賢いモデル
    • 利用: DeepseekのWebインターフェースで無料利用可能

🚀 Premium: 問題を今すぐ解決

  • Claude 4 Sonnet

    • 能力: 十分なコンテキストを与えれば、大半の問題を一発で解決
    • 特化: 文章作成、問題解決など全般的に最高クラスの性能
    • 活用: どうしても最初の試行で完璧に解決したいとき
  • Claude 4 Opus

    • 価格: $75 / 1Mトークン
    • 性能: Sonnetよりさらに優れているとされる「魔法のソース」級の性能
    • 活用: 究極の問題解決が必要なとき

堅実なワーカーモデル

以下のモデルは指示への追従性が高く、安定して作業を実行できる:

  • GPT 4.1

    • 上位の高性能モデルとして設計や問題解決を行った後、実際のコード修正に使用
    • どこで得た出力でも、そのまま Cline に貼り付けて実行可能
  • Claude Sonnet 3.5

    • コーディングと編集に強み
    • 4.1 よりやや遅いが非常に安定している
  • Deepseek v3

    • コード作成・修正・エージェント作業に適している
    • 価格対性能が非常に高い
  • OpenRouter Free Models

    • OpenRouter で価格フィルターを $0 に設定して無料モデルを探す
    • 新しいモデルが登場したら試す価値がある

Free Claude 4: lmarena.ai, and More

Claude Opus 4 and Sonnet 4
  • lmarena.ai で Claude Opus 4、Sonnet 4 などを無料提供
  • ヒント: Anthropic 系モデルを無料で使える機会は必ず保存・記憶・活用する
  • 活用: ほかがすべて失敗したとき、または即座に完璧に作業を完了しなければならないときは Claude 4 Sonnet または Opus を選ぶ

NEW!! Bad ass new Chinese models + GPT 5

  • GLM 4.5

    • 性能: Claude 4 Opus または Sonnet に近い
    • 特徴: エージェント規則とツール使用をほぼ完璧にこなす
    • 活用: 非常に難しいバグ修正や、多くのコンテキストを必要とする複雑な作業に強い
  • Qwen3 Coder 480B

    • 評価: 高性能かつ低コストで、好まれているモデル
    • 活用: 高性能・低コスト環境でのコーディング作業
  • Qwen3 Instruct & Thinking 2507

    • 性能: Qwen3 Coder と同様に安定して強力
    • 利点: 信頼でき、コスト効率も高い
  • Kimi K2 (Moonshot)

    • 特徴: Anthropic ベース、または Claude に似た合成データで学習されたような性質がある
    • 評価: 非常に優秀で、よく使われるモデル
  • GPT 5

    • 制限点: カスタムツールの使用(MCP、Cline など)では強みが少ない
    • 推奨される使い方:
      1. GPT 5、GLM 4.5 など最上位モデルで計画立案・問題解決を行う
      2. その後、シンプルなエージェントモデルが実際の編集とツール使用を行えるようプロンプトを書く
    • 比較:
      • GPT 4.1 は依然としてコストパフォーマンスに優れる
      • 新しい中国系モデルはカスタムツール/Cline の利用に強みがある
    • 総評: まだ十分に試し切れてはいないが、モデルごとに得意分野が異なり、現時点では価格と安定性の面で中国モデルが非常に魅力的である

Current Coding Workflow (2025)

  • For New Projects:

    • 1. Planning Phase:
      • すべてのプロジェクト詳細(言語、ライブラリ、サーバーなど)をメモ帳に記録
    • 2. Multi-Model Consultation:
      • 同じ内容を複数のモデルに貼り付けて「複数の医師の意見」のような見解を得る:
    • 3. Refinement:
      • モデルとの反復的な対話を通じて詳細を微調整
    • 4. Task Generation:
      • モデルに Cline AI コーディングエージェント向けの段階的なタスクリスト作成を依頼
    • 5. Execution:
      • Cline(または Roo Code)で GPT 4.1 を「act」モードに設定して作業を実行
  • For Problem Solving:

    • 複雑なコードベースの分析: GPT 4.5 + AI Code Prep を活用
    • GPT 4.5 に「Cline がこの作業を完了できるようなプロンプトを書いて」と依頼
    • 問題の複雑さに応じてモデルを選択
    • さまざまなモデルを活用して多角的な解決策を探る
  • Task List & Test Driven Development (Coming Soon)

    Test Driven Development & Task Lists:
    • AI に Cline、Roo Code、Trae agent 実行用の詳細なタスクリスト作成を依頼
    • Cline または Roo Code に、Markdown ファイルへ作業進捗を記録し、完了時にチェックするよう指示できる
    • これにより進捗を簡単に追跡でき、漏れも防げる
    • 現在は、モデルに Markdown チェックリストを生成させ、Cline や Roo Code にそのファイルを更新させる方法で実験可能
  • Money-Saving Hacks

    • GPT 4.5 & o3: モデル学習データの共有を有効にすると、毎日 25 万トークンを無料提供
    • 低価格モデル: o4-mini、4.1-mini/nano では毎日 250 万トークン使用可能
    • GitHub Copilot: 月額 $10 で新しい Claude モデルを利用可能(速度制限あり)
    • Trae IDE: 現在無料で Claude 4 と GPT 4.1 を利用可能(サブスク不要、制限なしに見える)
    • Poe.com: すべてのモデルに対して無料デイリークレジットを提供
    • Web Interfaces: 無料の Web チャットインターフェースを活用して計画立案とコンサルティングを行う
  • Coming Soon: Live Reddit Data & Insights

    Live Reddit Data Scraping & Daily Insights:
    • Reddit データをリアルタイムでスクレイピングし、毎日更新される AI モデルの活用事例を提供予定
    • 詳細な利用分析、データ可視化、実際のコーディングワークフローやトレンドに関する新たなインサイトを含む

まだコメントはありません。

まだコメントはありません。