34 ポイント 投稿者 GN⁺ 2025-08-10 | 1件のコメント | WhatsAppで共有
  • 複数の無料Web AIモデルを並行利用し、問題解決とコード生成を分離して、モデルごとの強みを生かすハイブリッド戦略を活用
  • AI Code Prep GUIで必要なコードだけを選別・整理し、不要なコンテキストによる性能低下を防いで、核心的なコンテキストだけをAIに提供
  • 企画・デバッグは高性能/無料モデル(Gemini 2.5 Pro、o3、o4-mini、Claude 4 など)で、実行・コード作成GPT-4.1・Claude 3.5で実施
  • OpenAIのデータ共有GitHub CopilotPoe.comOpenRouterなどで無料・低価格のトークンを確保し、コストを最小化
  • Claude Code、Qwen Code、Gemini CLI、Roo Code、Trae IDE など多様なエージェント・CLIツールを状況別に組み合わせて作業効率を向上

My Browser Setup: The Free AI Buffet

  • ブラウザでさまざまな高性能AIモデルの無料版を複数タブで開いて使っている
  • 1つのモデルだけに依存せず、複数の観点から回答を得るやり方である。代表的に使っている無料モデルの組み合わせは次のとおり。
  • GLM 4.5: Webで無料利用でき、体感では Claude 4 レベルまたはそれ以上に性能が高い。常に2〜3個のタブを開いている
  • Kimi K2: Claude または Opus 系列に近いモデルで、Webで無料利用可能。通常は1〜2個のタブを開き、GLM 4.5 登場前は難しいバグを1日に何度も解決してくれた
  • Qwen3 Coder および新型モデル群: さまざまなコーディング特化モデルのテスト用に使用
  • OpenAI Playground: GPT-4.5、o3 など多様なモデルを無料で活用可能。アカウントのデータ設定で「OpenAIがデータをモデル学習に使用」することを許可すると無料トークンが付与される
  • Google Gemini AI Studio: Gemini 2.5 Pro/Flash モデルを無料かつほぼ無制限で利用可能。通常は1〜3個のタブを開いている
  • Google Gemini 2.5 Pro: AI Studio とは別サービスで、画像生成と深層リサーチ機能がより優れている。AI Studio と併用してタブを並行利用
  • Poe.com: Claude 4 や o4-mini などのプレミアムモデルに対して日次の無料クレジットを提供
  • OpenRouter: 無料モデルと有料モデルを混在利用できる。複数モデルをそれぞれ別タブに設定している
  • ChatGPT: 無料版も依然として有用なため、最低1つのタブは維持
  • Perplexity AI: リサーチ中心の質問に強み
  • Deepseek: v3 と r1 モデルを無料提供。ただしコンテキスト制限に注意
  • Grok.com: 一般用途、深層リサーチ、画像編集を無制限無料で提供。特に深層リサーチ機能は Perplexity に近く有用
  • Phind: 回答時にフローチャートやダイアグラムも併せて提示しようとする
  • lmarena.ai: Claude Opus 4 と Sonnet 4 を無料提供。Opus 4 を無料で使える価値はかなり高い

Claude.ai 自体も無料だが、利用制限が頻繁で不便なことがあり、Cody 拡張や Copilot などを通じて別のアプローチを使っている。

注意事項 – Grok を使う際
Grok は無料の計算資源と無検閲の画像生成を提供しており、他モデルの安全システムが邪魔になるときに役立つ場合がある。しかし、運営側がナチ関連思想や偽情報を広めようとする意図を持っている可能性があるという報告がある。特にアフリカの集団虐殺など歴史的事件について虚偽情報を提供するよう指示されていたという主張もある。このような歪みは主に X プラットフォームで見られるが、コーディングのような安全な用途に限定して使うか、潜在的なバイアスを意識して使うことが推奨される。

A smarter, cheaper workflow: Focused Context

  • WebベースのAIチャットインターフェース(AI Studio、ChatGPT、OpenRouter など)を使うと、IDE やエージェントフレームワーク(Cline、Trae、Copilot など)より問題解決やソリューション提案に優れている場合が多い
  • Cursor、Cline、Roo Code のようなツールですべての作業を処理すると、MCP サーバーの使い方やファイル編集手順など、問題と直接関係ない大量のテキストまで AI に送信してしまい、AI が混乱して性能が落ちる
  • そのため、最高価格帯のモデルを使っても、不要な情報による「鈍化効果」を克服できない
  • そこで、問題解決に必要な正確なコンテキストを自分で作成し、WebベースのAIチャットに貼り付けて質問したりコードレビューを依頼したりする方法を取っている
  • 解決策が出たら、その内容を Cline などのエージェント向けプロンプトに書き直し、ファイル編集だけを任せる
  • こうすれば GPT-4.1(無制限利用可能)を活用して、安価に問題解決や企画ができ、わざわざ Claude のクレジットを消費する必要がない
  • 難しい問題解決には Claude を、実行には Web チャットAIを併用して効率を高める
  • How AI Code Prep Helps (Example Prompt Structure)

    例のプロンプト:

    Can you help me figure out why my program does x instead of y?  
    
    • AI Code Prep GUI はプロジェクトフォルダを再帰的にスキャンし、サブフォルダやファイルまですべて探索したうえで、AI が見やすい形式にコードと質問を整理する
    • 生成されるコンテキストの例:
    Can you help me figure out why my program does x instead of y?  
    
    fileName.js: <code>  
    ... ファイル内容 ... </code>  
    
    nextFile.py: <code>  
    import example  
    ... その他の内容 ... </code>  
    
    Can you help me figure out why my program does x instead of y?  
    
    • 質問を2回繰り返し(上部/下部/両方を選択可能)、AI が焦点を保てるようにする
    • Windows ではプロジェクトフォルダ内でマウスを右クリック → 「AI Code Prep GUI」を実行 → 自動でコードファイルを選択し、node_modules.git など不要なディレクトリは自動除外
    • 選択が完璧でなくても、チェックボックスで簡単に調整できる
    • 大規模プロジェクトで AI のコンテキスト上限を超える場合、必要不可欠なファイルだけを選んで提供できる
  • なぜこの方式が重要なのか?

    • Cline、GitHub Copilot、Cursor、Windsurf など多くのコードエージェントは、コンテキストを送りすぎる少なすぎるかのどちらかで非効率
    • 自分でファイルを選別すれば、不要なデータなしで必要な情報だけを AI に提供できる
    • GUI ベースのため、CLI や公開 GitHub リンクを要求する他のコンテキスト生成ツールより個人コードのセキュリティ維持利便性に優れる
    • 最新機能の更新は wuu73.org/aicp を参照
広告

Model Strategy: 仕事に合った頭脳を選ぶ

  • 多くの強力なAIモデルはWebインターフェース経由で無料提供されているため(Gemini in AI StudioGrokDeepseek など)、まずはこれらを優先的に活用する
  • Poe.com は Claude や新しい o4 シリーズのような最上位モデル向けに、毎日無料クレジットを提供している
  • Gemini 2.5 ProAI Studio 提供)は、デバッグ、企画、全般的な作業で非常に優秀で、現時点で最も汎用性の高いモデルと評価されている
  • 難しい問題には o4-miniOpenRouter または Poe で利用可能)を試す
    • 以前の最上位モデル(Claude 3.5/3.7/4)より、API利用時のコストがはるかに安い
    • 解決が難しかったバグを即座に直せた経験がある
  • Claude 3.7 または 4Poe、API(OpenRouter)、GitHub Copilot Chat などから利用できる
    • 一部の無料利用枠はあるが、頻繁に使うにはコスト負担が大きい
    • 3.7/4 は創造的で爆発力のある出力(「Hunter S. Thompson」風)を出せるが、実際のコーディングは落ち着いた Claude 3.5 に任せた方が効率的な場合がある
  • OpenAI Playground の無料トークン活用法

    • OpenAI アカウントのデータ共有設定を有効にすると、毎日大量の無料トークンを使える
    • OpenAI Playground → 右上の設定アイコン → 左メニュー Data ControlsSharing"Share inputs and outputs with OpenAI" を有効にすると、次の特典が得られる:
    • 1日最大25万トークン: gpt-5, gpt-4.1, gpt-4o, o1, o3
    • 1日最大250万トークン: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
    • この設定を活用すれば、o3GPT-4.5 のような最上位モデルを無料で大量に使える
    • OpenAI Playground では o3o4-mini を並べて実行し、比較しながら各モデルの強みや用途を把握できる。
  • 推奨モデル別の活用戦略

    • Gemini 2.5 Pro: デバッグ、企画、全般的なコーディング作業で最優先
    • o4-mini: 難しいバグ修正、コスト効率に優れる
    • Claude 4 / 3.7: 緊急かつ難易度の高い問題解決に最適。ただし、アクセス性とコストに制約がある
    • Claude 3.5: 3.7/4 の創造的な出力を整えたり、実際のコード作成に適している
    • o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: 複雑な問題解決能力が非常に高く、無料トークン設定を活用すれば大量利用が可能

The Hybrid Approach: Premium Planning + Budget Execution

  • さまざまなモデルをテストした結果、品質とコスト効率の両方を最大化できるハイブリッド戦略を確立した
  • 核となるインサイトは、モデルごとに開発プロセスの特定段階で得意分野が異なるという点

"スマートジュース(Smart Juice)"理論 – AIが愚かになる理由
モデルが受け取れる「知能エネルギー」には限りがある。
簡潔で集中したプロンプトを送れば、そのエネルギーのほぼ100%が問題解決に使われる。
しかし、不必要に複雑な入力(ツールの使い方に関する長文説明、問題と無関係な文脈、何ページ分ものコードなど)を送ると、そのかなりの部分がそれらの処理に消費され、実際の問題解決に使える「知能」が減ってしまう。

例: Cursor や Cline のような IDE 連携型エージェントは、質問の前に大量の指示文やコンテキストを送るため、モデルの集中力が落ちる。
したがって、不要な文脈を減らし、問題解決に必要な核心だけを送ることが最適な結果を出す方法である。

  • 新規プロジェクト開始時のワークフロー

    • 1. Plan & Brainstorm
      • 賢くて無料のWebモデル(Gemini 2.5、o4-mini、Claude 3.7/4、o3 など)でアプローチを設計し、段階的な計画を立て、必要なライブラリを特定する。
    • 2. Generate Agent Prompt
      • 上記モデルのいずれかに依頼する:
        "Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [作業内容]"
      • 生成されたプロンプトを、ChatGPT のようなリライトが得意な無料AIでさらに磨き上げる。
    • 3. Execute with Cline
      • 磨き上げたプロンプトを Cline に貼り付け、GPT 4.1 または Claude 3.5(複雑な作業なら Claude 4)で実行する。
      • GPT 4.1 系は指示遵守の訓練がよく行われている。
    • 4. Fallback
      • GPT 4.1 が失敗したら、API経由で Claude 3.5 に切り替える。
      • Deepseek v3 または R1 も指示実行に非常に強い。
    広告
  • 中核戦略

    • 高価で賢いモデル(または無料で使える Gemini 2.5 Pro)で、戦略と設計の段階を進める。
    • 計画を 2〜3 個の別の無料モデル(Deepseek R1Poe の Claude など)に貼り付けて検証する:
      "Is this good? Can you improve it or find flaws?"
    • コーディング・実行段階 では、安定していて効率的なモデル(GPT 4.1、Claude 3.5)を Cline で使う。
  • モデル別活用のヒント

    • o4-mini
      • 複雑なコードロジックの解釈、フレームワーク・ライブラリ選定などの 高レベルな実装戦略 に強い。
    • アイデアのブレインストーミング
      • Gemini 2.5、o4-mini、GPT 4.1、ChatGPT、o3-mini(duck.ai でしばしば無料)、Phind などを活用する。
    • 解決できない場合
      • 無料・低価格モデルで解決できなければ、API経由で上位の有料モデルへエスカレーションする。

Alternative Agents & Setups

  • Trae.ai(ByteDance、TikTokの制作元)
    • VS Code互換のIDEで、無料のAI利用を提供: Claude 4、Claude 3.7、Claude 3.5、GPT 4.1を含む。
    • 内蔵エージェントの性能はClineより劣る(正直、Clineが最強)。
    • VS Codeクローン型なので、Cline拡張機能もインストールできそう。
    • ただしサーバー過負荷で動作が遅い → 無料利用の実効性は低い。
    • それでも無料モデルへのアクセス性があるため言及。
  • おすすめ設定 2つ

    • 1. VS Code + Cline + Copilot
      • Copilotを月額$10で購読 → Clineで強力なモデルAPIを低コストで利用可能。
      • 無料ティアでも一部の基本機能は利用可能。
    • 2. Trae.ai + Cline
      • Traeの無料モデルアクセスと、ClineのAPIキー利用を併用できるかテスト。

    ヒント: Copilot標準エージェントが、Clineではうまく解決できない問題を解くこともあり、その逆もあります。
    Clineは過度に長いプロンプトを送って性能が落ちる場合がある → Copilotが有利なケースも存在。

  • Roo Code: Clineのクローン

    • Roo CodeはClineとほぼ同じだが、一部異なる機能を提供。
    • プロジェクトやコーディングスタイルによっては、Roo Codeのほうが適している場合もある。
    • Cline自体は無料だが、API呼び出し料金は発生する。
    • 最も経済的な方法: VS Code LM APIを設定 + Copilotを月額$10で購読 → ほぼ無制限に強力なモデルを使用。
  • 新規CLIツール: Claude Code、Qwen Code、Gemini CLI

    • 最近、CLIベースのコーディングツールへの関心が急増。
    • Claude Code: サブエージェント(subagent)対応 → 1つの作業のみ実行し、追加ツールは使わない。
      • このガイドで説明した**「スマートジュース」集中型ワークフロー**を再現可能。
      • 不要なエージェント指示文(bloat)を削除し、効率性を維持。
    • Qwen CodeGemini CLIにもそれぞれ利点がある。
    • Claude CodeをGLM 4.5で使うための設定ガイドがz.aiサイトにある。
    • 各CLIツールには異なる強みがあるため、ガイドやコミュニティのコツを参考にしながら試すのがおすすめ。
    広告

TL;DR: クイックスタートガイド

  • Models & Roles
    • Planning & Brainstorming
      GLM 4.5、Kimi K2、最新のQwen3 Coder & 2507シリーズ、Gemini 2.5 Pro(AI Studio)、o4-mini(OpenRouter)、Claude 3.7/4(Poe)、OpenAI Playgroundで1日25万の無料トークン(o3、GPT-5)の利用を推奨
    • Problem Solving & Debugging
      GPT-5(Playgroundの無料トークン)、GLM-4.5(Claude 4級の性能)、Claude 4(Poeの無料デイリートークン)
    • Actual Coding
      GPT-4.1(Cline)、失敗したらClaude 3.5に切り替え、またはQwen3 Coder、Instruct、2507、GLM 4.5、Kimi K2を使用
  • Key Tools
    • VS Code
    • AI Code Prep GUI – ローカルで必要なファイルだけをスキャン・選別し、AIコンテキストを最適化
    • Cline(VS Codeエージェント)– 段階的にコードを実行
    • 無料Webチャット – Poe.com、ChatGPT、Grok、Deepseek、Perplexity、OpenAI Playground、AI Studio(Gemini 2.5 Pro)、OpenRouter、duck.ai
  • Quick Workflow
    1. AI Code Prep GUIでプロジェクト関連ファイルをバンドル
    2. そのコンテキストを好みのWebチャットモデルに貼り付けて計画・デバッグ
    3. あるモデルに"この作業のための詳細なClineプロンプトを作成"と依頼し、その後ChatGPTなどで再調整
    4. 完成したプロンプトをGPT-4.1に設定したClineに貼り付けてコードを生成・修正
      → 失敗したらClaude 3.5に切り替え
  • Cost-Saving Hacks
    • OpenAI Playgroundの「データ共有」有効化 → 1日25万の無料トークン(GPT-4.5、o3) + 1日250万の無料トークン(o4-mini、o3-mini)
    • GitHub Copilotを月額$10で購読 → ClineでClaudeモデルを限定的に利用可能
    • OpenRouter従量課金 → o4-mini、Claude 3.7など最新モデルを低コストで利用

Some Thoughts

  • AIは驚異的な生産性ブースターですが、魔法の杖ではありません。
  • 本当の魔法は、皆さんの好奇心粘り強さ、そして試してみようとする意志が、これらの強力なツールと結びついたときに起こります。
  • バグや問題でくじけないでください — すべての挑戦は新しいことを学ぶ機会です。
  • モデルを組み合わせて使い、大胆なアイデアを試し、壊しては作り直すことを恐れないでください。
  • 最高の開発者とは、決して行き詰まらない人ではなく、行き詰まっても前に進み続け、あらゆるツールと技術を活用する人です。
  • 混沌を受け入れ、プロセスを楽しみ、皆さんの創造性が道を示すようにしてください!

Latest Model Updates (Aug 2025)

💰 予算重視: 最大限の価値を得る

  • GPT 4.5

    • Status: Discontinued
  • o3

    • 能力: Claude 4に匹敵する性能、難しい問題解決に卓越、天才級
    • 活用のヒント: AI Code Prep GUIでコードベース全体を投入して分析可能
    • Free Tokens: Data Controls/Sharing settingsでデータ共有を有効化すると25万トークン/日
  • o4-mini

    • 能力: o3よりやや劣るが非常に優秀で、いわばo3の弟のようなモデル
    • Free Tokens: データ共有を有効化すると250万トークン/日
  • Gemini 2.5 Pro

    • 利用: AI Studioで無料
    • 特化: 複雑なデバッグ、アーキテクチャ設計、計画立案
  • Deepseek R1 0528

    • 能力: 推論性能が向上した非常に賢いモデル
    • 利用: DeepseekのWebインターフェースで無料利用可能
    広告

🚀 Premium: 問題を今すぐ解決

  • Claude 4 Sonnet

    • 能力: 十分なコンテキストを与えれば、大半の問題を一発で解決
    • 特化: 文章作成、問題解決など全般的に最高クラスの性能
    • 活用: どうしても最初の試行で完璧に解決したいとき
  • Claude 4 Opus

    • 価格: $75 / 1Mトークン
    • 性能: Sonnetよりさらに優れているとされる「魔法のソース」級の性能
    • 活用: 究極の問題解決が必要なとき

堅実なワーカーモデル

以下のモデルは指示への追従性が高く、安定して作業を実行できる:

  • GPT 4.1

    • 上位の高性能モデルとして設計や問題解決を行った後、実際のコード修正に使用
    • どこで得た出力でも、そのまま Cline に貼り付けて実行可能
  • Claude Sonnet 3.5

    • コーディングと編集に強み
    • 4.1 よりやや遅いが非常に安定している
  • Deepseek v3

    • コード作成・修正・エージェント作業に適している
    • 価格対性能が非常に高い
  • OpenRouter Free Models

    • OpenRouter で価格フィルターを $0 に設定して無料モデルを探す
    • 新しいモデルが登場したら試す価値がある

Free Claude 4: lmarena.ai, and More

Claude Opus 4 and Sonnet 4
  • lmarena.ai で Claude Opus 4、Sonnet 4 などを無料提供
  • ヒント: Anthropic 系モデルを無料で使える機会は必ず保存・記憶・活用する
  • 活用: ほかがすべて失敗したとき、または即座に完璧に作業を完了しなければならないときは Claude 4 Sonnet または Opus を選ぶ

NEW!! Bad ass new Chinese models + GPT 5

  • GLM 4.5

    • 性能: Claude 4 Opus または Sonnet に近い
    • 特徴: エージェント規則とツール使用をほぼ完璧にこなす
    • 活用: 非常に難しいバグ修正や、多くのコンテキストを必要とする複雑な作業に強い
  • Qwen3 Coder 480B

    • 評価: 高性能かつ低コストで、好まれているモデル
    • 活用: 高性能・低コスト環境でのコーディング作業
  • Qwen3 Instruct & Thinking 2507

    • 性能: Qwen3 Coder と同様に安定して強力
    • 利点: 信頼でき、コスト効率も高い
  • Kimi K2 (Moonshot)

    • 特徴: Anthropic ベース、または Claude に似た合成データで学習されたような性質がある
    • 評価: 非常に優秀で、よく使われるモデル
    広告
  • GPT 5

    • 制限点: カスタムツールの使用(MCP、Cline など)では強みが少ない
    • 推奨される使い方:
      1. GPT 5、GLM 4.5 など最上位モデルで計画立案・問題解決を行う
      2. その後、シンプルなエージェントモデルが実際の編集とツール使用を行えるようプロンプトを書く
    • 比較:
      • GPT 4.1 は依然としてコストパフォーマンスに優れる
      • 新しい中国系モデルはカスタムツール/Cline の利用に強みがある
    • 総評: まだ十分に試し切れてはいないが、モデルごとに得意分野が異なり、現時点では価格と安定性の面で中国モデルが非常に魅力的である

Current Coding Workflow (2025)

  • For New Projects:

    • 1. Planning Phase:
      • すべてのプロジェクト詳細(言語、ライブラリ、サーバーなど)をメモ帳に記録
    • 2. Multi-Model Consultation:
      • 同じ内容を複数のモデルに貼り付けて「複数の医師の意見」のような見解を得る:
    • 3. Refinement:
      • モデルとの反復的な対話を通じて詳細を微調整
    • 4. Task Generation:
      • モデルに Cline AI コーディングエージェント向けの段階的なタスクリスト作成を依頼
    • 5. Execution:
      • Cline(または Roo Code)で GPT 4.1 を「act」モードに設定して作業を実行
  • For Problem Solving:

    • 複雑なコードベースの分析: GPT 4.5 + AI Code Prep を活用
    • GPT 4.5 に「Cline がこの作業を完了できるようなプロンプトを書いて」と依頼
    • 問題の複雑さに応じてモデルを選択
    • さまざまなモデルを活用して多角的な解決策を探る
  • Task List & Test Driven Development (Coming Soon)

    Test Driven Development & Task Lists:
    • AI に Cline、Roo Code、Trae agent 実行用の詳細なタスクリスト作成を依頼
    • Cline または Roo Code に、Markdown ファイルへ作業進捗を記録し、完了時にチェックするよう指示できる
    • これにより進捗を簡単に追跡でき、漏れも防げる
    • 現在は、モデルに Markdown チェックリストを生成させ、Cline や Roo Code にそのファイルを更新させる方法で実験可能
  • Money-Saving Hacks

    • GPT 4.5 & o3: モデル学習データの共有を有効にすると、毎日 25 万トークンを無料提供
    • 低価格モデル: o4-mini、4.1-mini/nano では毎日 250 万トークン使用可能
    • GitHub Copilot: 月額 $10 で新しい Claude モデルを利用可能(速度制限あり)
    • Trae IDE: 現在無料で Claude 4 と GPT 4.1 を利用可能(サブスク不要、制限なしに見える)
    • Poe.com: すべてのモデルに対して無料デイリークレジットを提供
    • Web Interfaces: 無料の Web チャットインターフェースを活用して計画立案とコンサルティングを行う
  • Coming Soon: Live Reddit Data & Insights

    Live Reddit Data Scraping & Daily Insights:
    • Reddit データをリアルタイムでスクレイピングし、毎日更新される AI モデルの活用事例を提供予定
    • 詳細な利用分析、データ可視化、実際のコーディングワークフローやトレンドに関する新たなインサイトを含む

1件のコメント

 
GN⁺ 2025-08-10
Hacker Newsの意見
  • 念のため混乱していた人向けに言うと、本文はさらに2〜3ページ続きがあり、下部の矢印アイコンからアクセス可能です

  • 本文の執筆者です。フォントの問題はすみません。内容が少し古くなっているのですが、AI分野は変化がとても速いので、最新モデルを含めて更新予定です。最近は新モデルが非常に頻繁に出ていて、個人的に最近いちばん気に入っているのはGLM-4.5です。Kimi K2も良いですし、Qwen3-Coder 480bや2507 instructもかなり優秀です。こうしたモデルは、どんなagentic環境やagentツールでも非常によく動きます 自分用のcontext helperアプリ(https://wuu73.org/aicp)も作っていて、このリンクから使えます。普段使っている多数のAIチャットタブとIDEの間を行き来するのにとても便利です(ほぼ常に無料で、しかも最良の結果も得られます)。Webチャットインターフェースを使うときのあらゆる面倒や不便をできるだけなくそうとしました。無料ですし、フィードバックもとても良好でした。批判的な意見も歓迎です IDE <----> Webチャットタブ間の移動がものすごく楽になります。もともと自分の時間を節約するために作ったもので、PySide6 UIなのでWebViewよりずっと軽く動きます。よく使うテキストはプリセットボタンで即座に追加でき、プロジェクトごとにウィンドウサイズや使用したファイルなどのコンテキスト状態も記憶します。次回起動時もそのまま開きます コードファイルを自動スキャンして、使えそうなファイルを推定します。プロンプトボックスではコードの前後にテキストを入れることもできます(こうすると出力がより良くなる傾向があります)。個人的によく使うボタンの1つは「Cline(コーディングエージェント)向けのプロンプトを作成し、プロンプト全体を1つのコードタグで囲んでコピペしやすくしてほしい。作業全体を細かく分解し、詳細な説明と理由まで付けてClineが追えるようにしてほしい。plain languageのsearch and replaceブロックを追加して編集箇所を指定してほしい」という設定です 問題解決やバグ探しのために自分がやっている流れは、VS Codeでたいていターミナルに aicp と入力してアプリを開き、ファイルのfine-tuningや自分が望む説明や修正点を入力し、ClineボタンとGenerate Context!をクリックしてからGLM-4.5に貼り付けます。難しい問題ならo3、o4-mini、GPT-5、Gemini 2.5 Proまで2〜3モデルでも試します。いちばん筋の通った答えを選んでCline(VS Code、GPT 4.1 unlimited/free版)に貼り付けます。4.1はものすごく賢いわけではありませんが、命令の実行は正確です。大きいモデル特有の細かなミスも自分で修正します。大きいモデルは詳細説明や作業リストをうまく書いてくれて、4.1がそれをagent modeで実行します こうすると、非常に賢いAIと無制限無料でコーディングできます。MCP(toolなど)をモデルに付けると、むしろ性能が落ちますし、Claude 4のようなAPIを使うとお金ばかりかかります

    • Webサイトのスクロール速度が遅いです(Firefox Androidでsub1-fps)。grok関連のcall-outはスクロールできません。上部にはCSS loadedという妙に大きい緑のボタンも見えます

    • [https://wuu73.org/aicp] の図は役に立つのですが、クリックしてもフル解像度で表示されずぼやけています。FirefoxでもChromeでも同じです。GitHubリポジトリでは鮮明なので、JSレンダリングライブラリ側の問題かもしれません

    • 記事は楽しく読みましたし、更新にも感謝します。もしRoo CodeとClineの使用感の違いについて、さらに深く扱ってもらえるならとても興味があります。自分は今のところRoo Codeしか使ったことがありませんが、面白い反面、結果にはややばらつきがありました

    • Microsoft Copilotを試したことがあるのか気になります。実質的に無料のOpenAIモデルです

    • 無料でコーディングできると言っていましたが、OpenAIのデータ設定で自分のデータをモデル訓練に使うことを許可した場合にだけ無料です。つまり、本当の意味で「無料」ではありません

  • 自分の経験も本文の内容と一致しています。agentic機能は本当に大きいモデルでしかまともに動きません(「動く」といっても……たとえばOpenAI Codexがo4-miniで3行直すのに200回リクエストを送る、みたいな感じです) 単純な修正なら、むしろ小さいモデルのほうがずっと速いので向いています。なので「最高」のモデルではなく「使える範囲でいちばん馬鹿なもの」に集中しています これをさらに突き詰めてagentic方式を捨てると、非常に小さいモデルでもかなり精密な作業が可能です。欲しいものを正確に伝えれば、すぐdiff結果を返してくれます ファイルシステムを漁るやり方は、自分のスケールでは非効率です。コードベースのほぼ全部をコンテキストに入れられるので、src/ 全体をプロンプトに放り込んでいます。他人のプロジェクトはボイラープレートが多いので、gpt-oss-20bのような超低コストモデルでコード検索を試していますが、その用途ならもっと小さいモデルでも十分使えます。Patent pendingです

    • 自分も同感です。Haikuでも会話の流れの管理には十分で、より複雑な作業はGemini 2.5 ProやGPT-5のような大きいモデルに投げています。最近はGemini CLIでMCP(${codex mcp})経由でCodexを使う実験中ですが、かなりうまくいっています。Gemini CLIは主にFlashベースですが、問題定義や回答の再評価には十分です。Claude Code MCP経由でGemini 2.5 Proを使うのも同様です。Claude Code自体をMCPとして使うのはあまりうまくいきません。こういうやり方の基本アイデアはもちろんAiderから来ていて、メイン・補助・エディタモデルを同時に使うというコンセプトです

    • Aiderはagenticではないコーディングツールとして、効率と効果の両方をうまく両立しています。tree-sitterでrepoマッピングを作るので、ファイルシステムを漁る必要がかなり減ります。MCPはありませんが、シェルコマンドなので自分がよく知っているユーティリティも使えます。Cerebrasのようなプロバイダと組み合わせると、プロンプト処理速度は即時に近いです。何度もツール呼び出しを待たずに継続して介入できます。小規模プロジェクトでは完全にベストです

    • 自分もだんだん近い考えになっています。欲しいのは速くて信頼できるツールです。自分にとってはflow stateに入るのが重要なのですが、agenticコーディングツールを待っているとその流れが全部途切れてしまいます。だから小さいモデルや、Cerebrasのようなプロバイダへの関心が高まっています。問題の範囲を絞れば、信頼性も上がります。個人的には、あなたが使っている「surgical」ツールについてももっと聞きたいです。このテーマについては最近 自分のブログ記事 でも、そのおかげでいろいろ考えを整理できました

    • Codex CLIでは、もうGPT-5未満のモデルには切り替えられません(APIキーがない場合)。推奨していないからだそうです。thinking=high オプションで動かすと、o4-miniよりはるかに性能が良く、o4-miniは実質gpt-5-thinking-miniのような感じです。codexではその設定ができず、gpt-5-thinking-highはo1やo3-proに近いです

    • 「(実質的には動く)」……OpenAI Codexがo4-miniで3行のコードを変えるのに200回リクエストしたという話がありましたが、参考までに言うと、自分の経験では本当に3行の作業に数日費やしたことも何度もあります

  • 完全にlocalで、Cursorのようなクラウド不要のスタックにはhuge potentialがあると思います。例としては: • agentic/dev作業向けのCursor CLI(https://x.com/cursor_ai/status/1953559384531050724) • CLIと互換性のあるローカルメモリレイヤー - LEANN(97% smaller index、クラウドコスト0、完全プライバシー、https://github.com/yichuan-w/LEANN)やMilvus(ただしこちらはしばしばクラウド/トークンベースで使うことになります) • inference engineの例としてはOllamaがあり、ローカルでOSS GPTモデルを動かすのに非常に優秀です こうした構成なら、完全オフラインで、プライベートかつ非常に高速な個人dev+AI環境を作れます。LEANNプロジェクトはまさにその用途のために設計されており、tiny footprint、完全local環境全体のセマンティック検索、Claude Code/Cursor互換がout-of-the-boxで、generationはollamaで解決できます。お金は一切かからず、APIもまったく不要です。もちろんセットアップには多少の手間が必要です。でも、誰かが完全オープンソースで簡単にしてくれたらいいのにと思っています

    • これは本当にlocal AI stackの究極形に近い要約だと感じます。Cursorやaiderのようなツールでは、強力でプライベートなmemory layerがいつも足りないと感じていました。LEANNのようなtiny private index + Ollamaローカルinferenceの組み合わせは本当に強力だと思います。プログラミングにこういう組み合わせを使うアイデアが気に入っていますし、本当にプライベートな「Cursor-like」体験が実現すれば、AI Workflowは完全に変わる気がします
  • 無料APIを探しているなら、Google GeminiではGemini、特にgemini-2.5-proをthinking機能付きで無料利用できます。制限はかなり高く、ベンチマーク中ですがまだ上限に達していません。オープンウェイトモデルのDeepSeek R1やGPT-OSSも、多くのinference providerやハードウェア企業が無料API accessを提供しています

    • Gemini 2.5 proの無料上限は1日100件です
      https://ai.google.dev/gemini-api/docs/rate-limits

    • 参考までに、この機能が機微でない用途なら問題ないかもしれませんが、Googleはこうしたinteractionを学習に使用します(有料なら除外)

  • 本文には思っていた以上に新しい情報が多くて驚きました。普段はそこまで選択肢を深掘りしないのですが、今回は記事を最後まで読んでよかったと感じました。そしてHNのコメントにも実用的な情報が多く、みなさんに感謝です

  • OPに勧めたいのですが、Continue.dev、ollama/lmstudio、ローカルでモデルを動かす方法はぜひ知っておくといいです。いくつかのモデルは自動補完に本当に強く、またgpt-ossのようなモデルは推論やツール活用も得意です。自分にとってはこれがmy goto copilotです

    • 自分も同じです!VSCodeでContinueを使っていますが、Qwenの大規模モデルやgpt-oss-120bはagenticモードでもかなりうまく動きます

    • continue.devよりZedのほうが一段上だと感じます。あちらでは使いたいモデルを自分で直接選べます

  • 投稿の内容どおり、コーディングエージェントの問題は、各リクエストごとに自分のデータ + コードベースのほぼ全体を送るのでコストが高いことです。一方でAIチャットではコストは事実上無視できるレベルです。自分はOpenRouterしか使っていませんが、ほぼすべてのモデルにアクセスできます。Sonnetがもともと最推しでしたが、Gemini 2.5 Proを使ってみると、ほぼ常にこちらのほうが優れています(欠点は遅いこと)。簡単な質問や構文を思い出せないときは、Gemini Flashが超高速なのでちょうどいいです

  • 無料ティアのためにここまで自分のデータを差し出すことに驚く人もいるでしょうが、実際には良いLLMを自宅で動かすにはリソースがかかりすぎるので、コードを渡して無料で使うほうがまだマシだと思います。どうせそのコードはいずれオープンソースになる予定ですし

    • 自分の職場でコーディングにモデルを使うことが許容されているなら、自分としては気にする点ではありません
  • 「WebチャットでAIを使うとき(つまりChatGPTやOpenrouterのようなWebインターフェース)、IDEやエージェントフレームワークよりも問題解決や解決策の提案でほぼ常により良い結果を示す」という主張には本当に同意します。IDEからコードをコピーしてWebチャットに貼り付けるのは多少面倒に見えても、自分の経験ではGithub CopilotやCursorよりずっと良い結果が得られます

    • 自分はまったく逆の経験です。agenticかどうかに関係なく、最も重要なのはcontextです。agenticでプロジェクト全体にアクセスしたり、GitHubに直接つないだり、fine-tuneやRAGなどでコンテキスト全体にアクセスできると、幻覚が大幅に減ります。「xを書いて」と「自分のスタイル、y依存関係、周辺のzコードまで反映してxを書いて」では大違いです。正直、コピペ前提のAIコーディングを擁護する理由が理解できません。だからこそ今、エージェント方式がここまで爆発的に人気なのだと思います