2 ポイント 投稿者 GN⁺ 1 일 전 | 1件のコメント | WhatsAppで共有
  • ZCodeは、開発ツールとAIエージェントを束ね、計画、コーディング、レビュー、デプロイをひとつの流れで処理しようとするGLM-5.2の公式ハーネス
  • ZCode 3.0はGLM-5.2最適化とマルチエージェント協業の改善を打ち出し、推論・コーディング作業全般でGLMとの統合を強調
  • 例示タスクでは、ブラウザベースのGomoku AIゲームを新規作成し、index.htmlapp.jsstyles.cssを生成した後、node --check app.jsの検証まで通過
  • 料金プランはLite $16.2/月、Pro $64.8/月、Max $144/月が提示され、最終価格と特典はz.aiで確認する必要あり
  • macOS、Windows、Linux向けのインストーラを提供し、LinuxはBeta表示のx64・ARM64 .debとAppImageあり

GLM-5.2に合わせた開発ハーネス

  • ZCodeは、AIエージェントと既存の開発ツールを組み合わせ、計画、コーディング、レビュー、デプロイをよりシームレスに進められるよう支援するツール
  • 製品のポジショニングは「Simple, Fast, Vibe‑Ready」で、GLM-5.2公式ハーネスとして紹介されている
  • ZCode 3.0はGLM-5.2向けに最適化されており、マルチエージェント協業の改善を主な変化として掲げる

作業フローの例

  • 例示タスク一覧にはgomoku-aizcode-websitezcode-desktoprelease-botが含まれる
  • gomoku-aiはインテリジェントなGomoku、つまり五目並べゲームを作る作業
    • プレイヤーがスマートなアルゴリズムと対戦する
    • 戦略的な手を打ち、勝利条件を正確に検出する機能を目指す
  • 作業ログでは既存リポジトリが空、またはほぼ空だったため、アプリをゼロから作る流れで進行
    • git status --shortの実行は、現在のディレクトリがGitリポジトリではないというエラーを返す
    • その後、index.htmlapp.jsstyles.cssファイルが作成される

Gomoku実装結果

  • 完成した例はスタンドアロンで動くブラウザGomokuゲーム
    • 15×15ボードをレンダリングする
    • プレイヤーは黒石を置ける
    • 4方向で勝利を検出する
    • 勝利ラインを強調表示する
    • ターンと手数を追跡する
    • ゲームの再スタートをサポートする
  • AIはランダムではなくヒューリスティック方式で手を選ぶ
    • 周辺の候補手を探索する
    • 自分に有利な攻撃パターンをスコア化する
    • プレイヤーの脅威を防ぐ守備の手をスコア化する
    • 中央を好む傾向を加味する
    • 最も強い手を選択する
  • オプションでAI focus areaオーバーレイを有効にすると、AIが考慮した有力候補地点を見られる
  • 検証段階ではnode --check app.jsが通過
  • 対話型のブラウザ実行は行われておらず、残る手順はindex.htmlをブラウザで開いてプレイすること

長時間タスクと外部制御

  • ZCodeは長時間タスク向けにGoals機能を提供
    • 複雑な作業で継続的な計画、実行、検証を管理する
  • Bot control機能により、WeChat、Feishu、TelegramからZCodeを起動し、調整できる
  • GLM-5.2との統合は、推論、コーディング、マルチエージェント協業全般にわたって最適化されている

料金プランとダウンロード

  • GLM Coding Planでは3つの料金プランを提示
    • Lite: 軽量タスク向け、$16.2/月、基本使用量を含む
    • Pro: 専門作業向け、$64.8/月、Liteの5倍の使用量を含む
    • Max: 高使用量タスク向け、$144/月、Liteの20倍の使用量を含む
  • 料金とプラン特典は変更される可能性があり、最終的な詳細はz.aiで確認する必要がある
  • All Downloadsではプラットフォーム別のインストーラを提供
    • macOS: Apple Silicon .dmg v3.2.2、Intel .dmg v3.2.2
    • Windows: 64-bit .exe v3.2.2、ARM64 .exe v3.2.2
    • Linux: Beta表示のx64 .deb、x64 AppImage、ARM64 .deb、ARM64 AppImage v3.2.2

1件のコメント

 
GN⁺ 1 일 전
Hacker News の意見
  • オープンソースではなさそうで少し驚いた。Mimo Code https://github.com/XiaomiMiMo/MiMo-Code と比較される。Mimo は CLI で、こちらはデスクトップアプリという違いはある

    • デスクトップアプリで何をすればいいのかも分からない。こういうものはヘッドレス VM で動かし、必要なら --dangerously-skip-permissions のようなオプションも付けられるようにする。そのフラグがなくても、自分のデスクトップ/ノートPCでは信用しない
    • CLI なのは、opencode のデスクトップコードを取り除いたから。opencode の Go/Zen モデルプロバイダーも一緒に外されている
      私の推測では、文字列置換を多用して、素早くファーストクラスのプロバイダーらしく見せようとしたのだと思う。それでも opencode を汎用プロバイダーとして再追加することはできたはずだが
    • 驚くことではないと思う。ハーネスは基盤モデルと同じくらい重要になりつつある。ハーネスだけでベンチマーク結果をほぼ2倍改善した事例もある
      ハーネスは急速に「モデル」そのものの中核構成要素になりつつあると思う。収益機会を見いだした企業がハーネスを非公開にしておくのは、まったく不思議ではない
    • 一部のユーザーリクエストを Anthropic に送って、自社モデル用の取引データを集めている可能性もある。そうだとすれば、隠しておきたいリクエスト追跡機能を付ける必要があるかもしれない
    • Anthropic が Claude の蒸留に強い懸念を示していて、さらにハーネスが堀だという考えまであるなら、反対側も自分たちがどれほどうまくやっているか、またそのアプローチが明らかにならないようにしようとするのは、それほど驚くことではない
  • Z.ai は、ほぼすべての人気のある CLI ベースのエージェントとの統合を文書化している: https://docs.z.ai/devpack/tool/others
    すでにターミナル UI のコーディングエージェントに慣れているなら、デスクトップエージェントは必要ない。それでも Codex App/Claude App の UI 方式を好む人にとっては、あるとよいものだ

    • ここでの誘因は、より多くのトークンだと思う。独自ハーネスを使うと制限がより緩かったと記憶している
    • GLM 5.2 を OpenCode で使っており、Docker コンテナ内で CodeNomad を Web ベースの GUI として付けて実行している。どこからでもアクセスでき、Anthropic のサブスクリプションモデルを除けば、すべてのモデルがうまく動く
    • Z.ai チームが初日から Linux サポートを入れたのは称賛に値する
  • かなり見た目がよい。OpenCode の代わりに使ってみたいかはよく分からない。OpenCode にもデスクトップアプリがあり、個人的にはそちらのターミナル UI のほうが好きだ。正直、Claude Code のターミナル UI よりも優れていると思う。デスクトップ版はより基本的だが、十分に良い: https://opencode.ai/download
    ただし ZCode、OCR.z.ai、Image.z.ai、Audio.z.ai、AutoClaw など、https://chat.z.ai/ からリンクされているものを一気に大量に出している点は興味深い。1つの組織が成し遂げるには相当な量だ
    Pro コーディングプランも使ってみたが、特定の作業を完了するのに必要なトークン数を考えると、Opus より割当量がものすごく多いようには見えない。それでも GLM 5.2 自体は、より強い Sonnet のようなモデルとしてかなり良い

    • そちらのターミナル UIは Claude Code と比べるとかなり重く、頻繁にクラッシュする
  • 「基本使用量込み」[1] や「標準制限」[2] のような表現を使い、上位プランはその「基本」の倍数として積み上げるのに、肝心の基本値が何なのかは公開しない企業が、こうやってやり過ごしているのが印象的だ
    基本値は今月の利益率に合わせて決まるようだ
    [1]: https://zcode.z.ai/en#:~:text=Base%20usage%20allowance%20inc...
    [2]: https://support.google.com/gemini/answer/16275805?hl=en#:~:t...

    • アプリを起動すると実際の基本使用量は教えてくれる。ただしプラン名が Web ページと違う
      Start plan: 1日500万トークン(GLM-5.2 300万、GLM-5 Turbo 200万)
      For individuals: 割当量 +150%、$18.00 USD+、個人開発者向けの専用 Coding Plan 割当量
    • これは本当に良くない。私たちは可能な限り透明に公開しようとして、ここに載せている: https://synthetic.new/rate-limits
    • だからオーストラリアの ACCC は良い。オーストラリアの会社だったなら、このようにやり過ごすことは許さなかったはずだ
    • 逆効果になり得る戦略だ。予測不能なツールは、悪いツールよりさらに悪い
  • GPT-5.5/Codex を毎日使っている人の視点で、すでにエージェントコーディング向けにセットアップされたコードベースで GLM-5.2/ZCode がどう比較されるのか気になる

    • GLM 5.2 は中途半端な谷間にある。自宅で動かすには大きすぎ、同程度の性能のモデルと比べると高くて遅い。良いチャートはここにある: https://deepswe.datacurve.ai/
      これは API 価格だけを比較したものだ。Anthropic と OpenAI のサブスクリプション商品まで見ると、比較にならない。Codex の $200 サブスクリプションなら、GPT 5.5 high/xhigh で週10億トークンも簡単に使える
      最も性能の高いオープンウェイトモデルという観点では興味深いが、今の市場で明確な居場所があるようには見えない
    • 要約すると、GLM は作業にずっと長い時間をかけることになり、複雑さによってはトークンもより多く使う可能性がある
      それでもはるかに安いので、私にとっては使う価値がある。Claude の経験のほうが多いが、Opus 4.1 とほぼ同程度の水準だと思う
  • UI の観点では Claude Code より Codex にずっと近く見える。事実上、Codex の正確な複製

    • まったく同意。手のアイコン、テキストフィールドの使い方、サイドバーのスタイルも Codex と 1:1 で同じ。タイトルが誤解を招く。Claude Code に近いわけではない
    • だから Codex を非公開のままにしているのが、なおさら滑稽に見える。ソフトウェアはもはや誰の堀でもない。放っておけばいい
  • 開発作業向けに、プロバイダーをほぼシームレスに切り替えられるプロバイダー中立のターミナル UIやハーネスを使っている人がいるのか気になる
    「ここに 3 つの AI プロバイダーがあって、コーディング作業にはこれを使い、散文の作成にはこれを使い、画像生成にはこれを使う」といったローカルコンテキストが欲しい

    • https://opencode.ai/
      OpenCode は自分が最初に使ったエージェントハーネスで、今も気に入っている。さまざまなプロバイダーを設定でき、オープンソースで、主要コントリビューターも複数いる
      もう一つの選択肢は Pi(Pi エージェントハーネス)だ。軽量な選択肢として優れていて、複数のプロバイダーをサポートしている。ローカルモデルサーバーも使える
    • この 6 か月間、Pi と OpenCode の両方を使ってきたが、同じ期間にプロプライエタリなハーネスである Claude Code、Codex、Cursor は開いたことがない。今は Pi を使っていて、望む任意のプロバイダーの任意のモデルへ、セッションの途中でもシームレスに切り替えられる。ローカルで実行中のモデルを指すようにもできる
      こちらのほうがどれほど便利か、人々はあまり分かっていないように思う。Claude Code と Codex は完全にベンダーロックインに依存していると見ている
    • 自分が作ったモデルルーター role-model で可能だ。役割やタスクなどに基づいてルーティングする。Pi 向けの拡張があり、コーディングエージェントが役割や能力といったリクエストメタデータを指定できる
      https://github.com/try-works/role-model
    • まだ使ったことがないなら、https://pi.dev を一度試してみる価値がある
      ここ数か月は Pi だけを使っていて、拡張もしている: https://a.l3x.in/ai。主に GLM-4.7、その後 5.1、今は 5.2 を使っているが、ほとんどこれ以上望むものはない
      まだ「Github/Forgejo ファースト」ベースのワークフローを磨いている途中だが、すでにかなり満足している。ほとんどのセッションは CI/CD ジョブとして実行され、"/pi" コメントでトリガーされて PR を作成したり、PR にコミットをプッシュしたりする: https://github.com/shaftoe/pi-coding-agent-action
    • Codex と Claude Code 向けにスキルを 1 つ書いた。メインの作業ツリーにオーケストレーターを指定し、N 個の補助作業ツリーにどんな種類の AI ワーカーがいても構わないようにする方式だ
      オーケストレーターは各作業ツリーでどの AI クライアントが実行中かを知っているので、どの作業をどの AI に送るかを指定するのはかなり簡単だ
      各作業ツリーのタブで Claude や Codex を実行する。AI ターミナル UI ごとの指示も少しあり、たとえば Codex は Claude Code に比べて監視が原始的なので、Codex ワーカーには新しい「メール」をきちんと監視する方法を追加で書いておいた
      メイン作業ツリーのオーケストレーターと作業しながら、オーケストレーターにワーカーたちへ仕事を委任させ、小さな質問に答えさせる。結果を引き上げ、必要ならコンテキスト整理も手伝う
      オーケストレーターとワーカーたちは tmp/* 配下の単純な共有ファイルシステムでやり取りし、協力して大規模で多様な作業量を処理できる
      iTerm2 を使っているので、オーケストレーターが入力を修正して送信することでワーカーを「起こしたり」、ターミナル UI がブロックした作業(/clear など)を実行させたりする iTerm2 専用の Python も追加した
  • 安価なトークンを提供する中国のオープンウェイトモデルは好きだが、個人プロジェクトにしか使っていない
    中国には知的財産や営業秘密を盗んできた前歴があり、中国の裁判所は自国企業を優遇してきた。一方、米国には知的財産権を執行できる強力な裁判所がある。会社の知的財産、営業秘密、データを、安いトークン数個のためにリスクにさらしたいなら Z.ai のサービスを使えばいい

    • ちなみに Z.AI のモデルは中国以外のインフラでも使える
    • 米国も同じだ
  • モデルとツールの分離は、立法と司法の分離と同じくらい重要だ。本物のオープンソースではないツールやハーネスは、ただ無視すべきだ。そうしたものは徐々に生活に入り込み、ベンダーロックインで首を絞めるようになる

  • クローズドソースの中国製エージェントシステムは信頼しにくいと思う
    事実上、全ユーザー権限を持つブラックボックスなので、中国所有のサーバーにシステム全体を引き渡すようなもの。OpenCode と GLM プロバイダーを使えば、少なくともどのファイルを読んだか、どのファイルを編集したか、どのコマンドが実行されたかは監視できる
    さらに中国の国家安全法は、企業に対して国家情報機関および防諜活動への協力を法的に義務づけている [0]。企業のワークステーションにこれをインストールしていて、会社の規模が十分に大きいなら、監視される可能性は単なるリスクではなく、ほぼ確実なことに近い
    [0]: https://en.wikipedia.org/wiki/National_Intelligence_Law_of_t...

    • 同意。米国の競合も同じくらい信頼しにくい。ここではオープンソースが答えだと思う
    • 少なくともモデルの重みは公開されている。私は米国人ではないので、可能なあらゆる面でこちらのほうがはるかに信頼できる
      米国の情報機関が善の側であるかのように言っているが、少なくとも私にとってはまったくそうではない
    • 米国のプロバイダーもまったく同じ
    • Opencode の下でコンテナとして実行すればよい。非常によく動くし、私は Pro プランにもアップグレードした(月額約 $60)。コンテナで使いたいなら、私のプロフィールにあるプロジェクトに情報がある。そのコードはすべてオープンソースで、私自身の作業に必要だったので作ったもの。他にも方法はいくらでもあるはず
      ただし会社がどの国にあろうと、どんなエージェントでもベアメタルで実行することには強く反対する。私の論文でもこの点を直接的かつ繰り返し扱っている
      最近、星がいくつかしかないソフトウェアをなぜ実行するのかと詰めてくる人がいたが、そういう理屈についてはあまり言うことがない。私は数万人のユーザーを処理したシステムを設計し構築したことがある。遊びでやっているわけではない。私の作り方は一般的ではないし、他人にまねするよう勧めるつもりもないが、私にはうまく合っていて、複雑なシステムを扱う私の考え方にも合っている
      使うかどうかは自由だが、まともな根拠もなく絡んでくるなら、言い返される覚悟もしておくべきだ。キャリアの中で失敗もたくさんしてきたし、責任を取ることは成長に重要だと思っている。有効で実質的な批判を持ってくる人なら、私のコードを使ううえで喜んで一緒に作業したい
    • だから Deepseek と一緒に Reasonix を使うのが好きだ。キャッシュに当たればリクエストは事実上無料になり、その経路も Digital Ocean や Cloudflare のような補助金なしの米国プロバイダーを通る