確率的エンジニアリングと24/7社員

(timdavis.com)

2 ポイント投稿者 GN⁺ 1 시간 전 | まだコメントはありません。 | WhatsAppで共有

ソフトウェア開発は決定論的システムから確率的システムへと静かに移行しており、AIエージェントが一晩中コードを生成・レビュー・マージする時代に、開発者の役割と組織構造が根本的に変化している
AIネイティブなチームの内部では、役割が上位へ移動する一方で下位へと分化しており、エージェント出力を管理する単純作業が新たな低賃金職種として固定化するリスクがある
コード生成コストがゼロに近づくにつれ、Jevonsのパラドックスのようにコード生産量は爆発的に増えるが、生成は安くなっても検証は安くなっていないという非対称性が中核課題になっている
ジュニアエンジニアがAIに依存して最初から磨かれたコードを出力することで、デバッグ・判断力・職人性の訓練危機がすでに現実化している
現在のモデルは、今後使うモデルの中で最も性能が低いモデルであるため、組織は今の能力ではなく、まだリリースされていない未来のモデルに備えた体制を構築すべきである

確率的エンジニアリングへの移行

ソフトウェア業界は数十年にわたり決定論的契約の上に築かれてきた — コードを書き、テストし、リリースすれば動作するという保証があった
この契約は崩れつつあり、AIネイティブ企業の上位オペレーターの間では、コードベースは「動くと信じる」ものへと変化しており、正確な確率をもはや明示できない状態になっている
Compound Loop というサイドプロジェクトを構築した経験がそのきっかけだった — 複数のフロンティアモデルを互いに競わせてコードを自律的に作成・レビュー・マージするシステム
- 寝る前に実際の問題にこのシステムを走らせると、朝には前夜には存在しなかったPRスタックをトリアージする形になる
- その一部は優秀で、一部は誤っており、一部は聞いてもいない問いを表面化させる
知識労働の歴史上初めて、退勤した人が唯一の脳のコピーを持ち帰らない状況になっている
9-9-6という概念は事実上死んでおり、24/7社員とは24時間働く人ではなく、エージェントが大規模に並列化して作業する人を意味する
2026年の大半のチームでは、依然としてタイピングではなく調整（coordination）にボトルネックがあり、組織再編はまだ初期段階にある

役割の分化 — 上昇と下降が同時に起きる

AIネイティブなチームの内部には、「全員がレベルアップする」というきれいな物語よりもはるかに複雑なパターンがある
上位への移動: 最良のエンジニアはより効果的なPMへ、最良のPMはシステムアーキテクトへ、最良のアーキテクトは流通・成長・市場構造を考える方向へ移っていく
- このグループにとっては、歴史上もっともレバレッジの高い仕事の環境である
下位への分化: 同時に、多くのエンジニアはアーキテクトになるのではなく、仕様書作成者、レビュアー、エージェントのベビーシッターへと転換していく
- 意図を機械が読めるプロンプトへ翻訳し、自分が完全には保有していない基準について機械の作業を採点する役割である
- その一部は重要な仕事だが、一部は新しい用語で包まれた2026年版のデータ入力にすぎない
分化した役割は、より低い給与、より低い評価額、そして多くの場合キャリアの袋小路になる見通しである
エージェント艦隊を効果的に運用する上位3分の1と、成果物を管理する中間層との賃金格差は、以前の時代のエンジニアと営業の給与格差よりも大きくなるだろう
AIインフラにおいて、カーネル性能、コンパイラ設計、ハードウェア抽象化は依然として守りやすいモートとして残る — システムエンジニアリングの最下層レベルでは、なお高い決定論的正確性が必要である

Jevonsのパラドックス — コード版

1865年、経済学者William Stanley Jevonsは、より効率的な蒸気機関が石炭消費を減らすのではなくむしろ増やしたと観察した — 効率性が、エンジンを作る価値のある対象の範囲を拡大したためである
コードを書く単位コストがゼロに近づくにつれ、ソフトウェアも同じ現象を経験している — 少なく書くのではなく、はるかに多く書き、はるかに多く出荷するようになる
スケーリング則が無限だと信じる企業がそれに合わせて構築しており、その企業がべき乗則分布の勝者になる
実際の現場ですでに起きていること:
- エージェントがPRを開き、互いの作業をレビューし、人がキーボードに触れずに閉じる
- 自己修復型テストスイートが、基盤コードの変更時に自ら書き換わる
- 自律的な実験ループが、チームが過去に3件しか実行できなかった間に100の仮説を実行・測定・解体する
- ドキュメントがマージ時に自動更新され、自己改善するAIスキルが活用される
エージェント中心に再構成したチームは、1年前と比べて3倍、5倍、10倍の出力を達成しており、曲線は平坦化するどころか上昇している
Jevonsの第二の教訓: 供給が爆発すると、選別（selection）こそが核心になる
- エージェント艦隊に正しい問題を指示し、出力から価値あるものをフィルタし、結果を一貫したものへ統合するオペレーターが、現在のソフトウェアで最も高いレバレッジの仕事をしている
- 仕事の価値は、もはや生産努力ではなく、方向設定、選別、一貫性によって決まる

決定論的エンジニアリングから確率的エンジニアリングへ

決定論的エンジニアリングは、ソフトウェア史の大半を支配してきた契約である — コードを書き、テストし、レビューすれば、よく理解された範囲の中で動作を把握でき、バグは再現可能な対象だった
確率的エンジニアリングはすでにフロンティアチームに到達している — コードベースの大部分が確率的システムによって生成され、時間圧力の下でレビューされ、単一の人間が設計したわけではない全体へ統合される
核心となる非対称性: 生成は安くなったが、検証は安くなっていない
- エージェントは500行のPRを1分以内に生成できるが、並行性の問題、仕様の誤解、意図と異なる実装のような微妙なバグを見つけるには、シニアエンジニアが1時間以上かかる
- レビューは生成よりスケーリングが遅く、出力量に対して線形より悪くスケールする — より多くのコードベースがエージェントによって書かれるほど、個々の断片を評価するために必要なコンテキストが増える
一定規模を超えると、システムは人間が信頼して評価できる量を超えて生産し、正確性は確率的に変化する
具体例: 10回中9回はテストスイートを通る競合状態、ステージングでは完璧でも想定外のプロンプト分布では失敗する機能、1万行のうち1行を静かに破損し、それが3週間後にようやく見つかるマイグレーション
ProximalとModularは、フロンティアエージェントシステムの基本タスクテストに関する共同研究を発表しており、文書化された失敗パターンはこの現象と直接対応している
失敗モードは劇的な崩壊ではなく、遅く静かな劣化である — 生成の増加、レビュー品質の低下、目立たない欠陥の蓄積、そして顧客・監査・本番インシデントが問題を露呈させるまで続く、信頼の静かな浸食
この問題を適切に解決するツールはまだ存在しない — 小さなマージ、厳格なゲート、磨かれた出力に対する容赦ない懐疑、可観測性、ロールバック規律といった文化的対応は役立つが、文化は一定のチーム規模を超えるとスケールしない
この問題を解決する誰かが、今後10年の本格的なソフトウェア開発のOSを定義することになる

業界ごとの移行速度の違い

決定論的エンジニアリングから確率的エンジニアリングへの移行は一様ではなく、業界とリスクプロファイルごとに階層化される
決定論的レイヤー
- アビオニクス、医療機器、金融取引インフラ、原子力制御システム、決済ネットワークのコアなどの高規制・高リスクドメイン
- エージェント支援は、形式検証、広範なシミュレーション、人間の署名チェーンの背後で慎重に採用される
- これは想像力の欠如ではなく、リスク水準に対する正しい判断である
確率的レイヤー
- コンシューマーソフトウェア、社内ツール、マーケティングシステム、大半のSaaS、コンテンツインフラ、実験的・初期段階の製品
- バグのコストはロールバック・謝罪・ホットフィックスの水準で済み、その代わり決定論的世界では構造的に追いつけない反復速度を得る
- 確率的チームは、四半期ごとに決定論的競合より10倍多く学習できる
収束地帯（Convergence Zone）
- モデルがより賢くなり、ハーネスが改善されるにつれ、「確率的でも十分に安全」な領域のフロンティアは動き続ける
- 保険、ヘルスケア、エンタープライズインフラの一部など、現在は決定論的に見えるドメインにも、確率的手法が下から10%ずつ浸透する
- 確率的エンジニアリングの先行者は、決定論的ガードレールを再構築している — 形式チェック、検証済みのクリティカルパス、確率的生成が決定論的検証によって境界づけられたハイブリッドシステム
今後10年の勝者は、自分がどのレイヤーにいるかを理解しているチームであり、別のレイヤーにいるふりをしたくなる誘惑に抗い、自社スタック内の境界を精密に設定するチームである

エージェント艦隊（Agentic Fleet）

「工場シフト」は適切な比喩ではない — 工場労働者は自動化されるシステムだったが、現在の主体はそうではない
適切な比喩はエージェント艦隊である — ただし「艦隊」が含意する秩序・階層・信頼性は、現実がまだ備えていない水準だ
- 実際に多くのオペレーターが運用しているのは、よく訓練された海軍というより脆弱な請負業者の群れに近い
- エージェントは能力が不均一で、挙動が確率的で、ときに自信満々に間違え、大規模運用ではコストも高い
- オーケストレーション層は壊れ、コンテキストウィンドウは破裂し、推論コストは役員会に見せたくない請求書として現れる
それでも艦隊という概念は有効である: 構成（タスクごとに異なるエージェント）、調整（ハンドオフ、依存関係、エスカレーション）、指揮系統（ミッション決定、交戦規則、結果レビュー）、交代勤務（司令官が眠っていても指示範囲内で作業を続け、朝に報告する）
良い艦隊の定義は、生産量ではなく成果物の一貫性である
新しい働き方:
- 朝にトリアージとマージ
- 日中には高レバレッジな人間の仕事 — 顧客との対話、戦略、プロダクト判断、夜間実行を駆動する仕様書の作成
- 午後に最初のエージェントが戻ってきたら、レビューと方向修正
- 一日の終わりには、前の世代がしていなかったことを行う — ハンドオフ — 作業をキューに入れ、エージェント艦隊に夜間試行する仕様を渡す。その一部は間違い、一部は輝くが、その差を見極められるのは人間だけである

まだリリースされていないモデルのために構築する

ここ数年、一貫して強調してきた点がある: 今日使っているモデルは、今後使うモデルの中で最も愚かなモデルである
ただし、能力向上が滑らかに進む保証はない — コスト、遅延、信頼性、スケーリング限界が曲線を複雑にしうる
それでも、方向性への賭けはインフラ層で観測される事実によって十分に裏づけられている: フロンティア能力は今後6〜12か月で今日を意味のある形で上回るだろうし、現在と1年後の最高モデルの差は、昨年と今年の差よりも大きくなる可能性がある
戦略的含意: 組織は現在のモデルではなく、まだ手元にないモデルを活用する能力を構築しなければならない
- 仕様書の書き方、レビュー文化、可観測性の配線、エージェント艦隊の運用、ジュニアの技能維持のための訓練儀式 — これらすべては2026年の能力ではなく、2027〜2028年に向けた足場である
この足場を今構築する企業は、次の能力ジャンプをレバレッジとして吸収できる。ツールが成熟するまで待つ企業は、アーリームーバーがすでに知っていることを最初の1年間で学ぶことに時間を費やす
現行モデルが要求する以上に、仕様、レビュー、運用規律へ過剰投資する意思が必要である
この時代のirrelevancyは自らを告知しない — 1年前には目立って優れていなかったチームに追いつけなくなる、漸進的な無力化として到来する

失われる筋肉

AIが社会を決定的に階層化するのか、あるいは大筋で民主化するのかという前提以前に — 人間は最小抵抗経路を最適化することに非常に長けている
核心命題: 自分で直接作らなければ、作られたものを評価する能力も失う
すでに現実になっている現象: 初週からAIに依存したジュニアエンジニアは、素早く出荷し、磨かれたコードを生み出すが、モデルが予想しない形で失敗したときにバグを見つけられない — 深夜2時にスタックトレースと100回格闘してはじめて形成されるシステムの内部モデルを育てていないからだ
**センス（taste）**は磨かれたドラフトに承認を押すだけでは学べず、**判断力（judgment）**は難しい問題と午後いっぱい向き合う代わりに機械のもっともらしい答えを5秒で受け入れていては育たず、**職人性（craft）**は他のエージェントの仕事をレビューするだけでは身につかない
これは大半の組織がまだ認識していない訓練の危機である
- ソフトウェアエンジニアリングの徒弟モデル（ジュニアが小さなものを出荷 → シニアがレビュー → ジュニアが赤入れを通じてセンスを吸収する）は崩壊している — ジュニアはエージェント経由で出荷し、シニアは人間の成果物ではなくエージェントの成果物をレビューする
- 次世代の職人性はどこから来るのか。反復なしにどうやってセンスを鍛えるのか。メンティーが最初から書いていないものに対して、メンタリングはどう代替されるのか
ほとんどの伝統的組織において、現在世代のシニアエンジニアは旧来の方法論で完全に訓練された最後のコホートである
バランスの取れた対応策: 意図的に、そして定期的に、重要な何かについて艦隊なしで難しいやり方を自分でやること — 大半の同僚はその筋肉を維持しないだろうし、10年後にはそれが差を生むかもしれない

不安な部分

このエッセイは意図的に楽観論へは収束しない — 変化が来ないふりをしても、その到来は止められない
仕事はすでに永遠に変わっており、AIの速度に合わせて進化的かつ漸進的に変化している
人間は、本当に必要な仕事のために昼を取り戻し、機械は、もともと単純労働でしかなかった仕事のために夜を取り戻すだろう
今後数年間に起こりうるシナリオ:
- レビュー負荷に疲弊した従業員層
- システムが必要としているのに報われない分化した役割の階層
- 現在のシニアが判断に使っている職人性を育てられないジュニア世代
- 出力量を仕事の質と取り違え、インシデントが起きるまでそのギャップを認識できないチーム
- 次のモデルに向けた運用筋力を構築した組織とそうでない組織の間で開き続ける格差
核心メッセージ: まだ手元にないモデルのための組織を構築し、ときには難しいものを自分で作ってやり方を忘れず、夜間の艦隊を派遣し、作業が進んでいることを知ってよく眠るべきだ — ただし、戻ってくるものの一部は、もはや自分が見抜けるよう訓練されていない形で間違っている可能性があることには目を覚ましていなければならない
24/7社員とは約束ではなく、再配置であり、確率的エンジニアリングの未来への賭けである — ループ内の人間が、ループ内にいる価値があるほど鋭く、誠実で、よく訓練されており、その人間を取り巻く組織が今日のモデルではなく、まだリリースされていないモデルのために構築されているという賭けである

確率的エンジニアリングと24/7社員

確率的エンジニアリングへの移行

役割の分化 — 上昇と下降が同時に起きる

Jevonsのパラドックス — コード版

決定論的エンジニアリングから確率的エンジニアリングへ

業界ごとの移行速度の違い

決定論的レイヤー

確率的レイヤー

収束地帯（Convergence Zone）

エージェント艦隊（Agentic Fleet）

まだリリースされていないモデルのために構築する

失われる筋肉

不安な部分

関連記事

まだコメントはありません。