ストーリーポイントは無意味、キューを測定しよう

(brightball.com)

7 ポイント投稿者 GN⁺ 2024-07-17 | 2件のコメント | WhatsAppで共有

ストーリーポイントはまったく信頼できず混乱を招き、関係者にその意味を絶えず思い出させる必要がある
- 低いポイント値はより正確だが、高いポイント値は高い変動性を前提とし、範囲を示すため、正確に合算できない
- ストーリーポイントは時間を表さないが、ベロシティ指標と結び付くと事実上時間を意味するようになり、そもそも数値や範囲を足し合わせる行為を妨げる
ソフトウェア見積もりは難しく、プロセスのアウトプットはインプットに比べて一般に有益ではない
妨害の少ない小規模チームは正確に見積もっているように見えるため、多くの場合、自分たちのやり方がうまくいっているという印象を与える
Capacityが完全に使い切られると、すべての作業の変動性が急増し、あらゆる見積もりとタイムラインに急激な影響を与える
測定されたキューは短期および長期の見積もり問題を解決し、自然にスコープ変更を扱い、不確実性を取り除きながら、大規模チームにとってはるかに価値の高い実践を提供する
測定されたキューは、ベロシティやサイクルタイム関連の指標より20倍速く問題を予測する先行指標を提供する

ストーリーポイントとは何か？

Atlassianによると、ストーリーポイントは、プロダクトバックログ項目またはその他の作業を完全に実装するために必要な総労力の見積もりを表す単位
ポイントは複雑さ、作業量、リスクまたは不確実性、仕事の量を表す
複雑さの測定は相対的な概念であり、チームごとに同じ作業を異なるように評価することがある
ポイントの相対的な性質により、チーム間比較は意味がなく、これは管理レベルでしばしば発生する問題

内在する変動性

ストーリーポイントはフィボナッチ数列を基盤としており、値が高いほど変動性も大きくなることを示す
変動性の大きいポイント値を合算するのは無意味であり、ベロシティ指標でポイントを合算する行為は誤り
グッドハートの法則によれば、測定が目標になった瞬間、その測定は良い測定ではなくなる

既知の問題点

ストーリーポイントの問題は広く知られているが、代替となる見積もり技法も似た問題を抱えているため、依然として使われている
ストーリーポイントの考案者であるRon Jeffriesはこれを否定し、誤用を批判している
Scrumでは"Commitment"を"Forecast"に変更したが、それでもなお誤って使われている
見積もり以上の仕事をこなすと、かえって叱責を受けるという逆説的な状況が生じる

ROIで優先順位を付ける

ビジネスはリソース（時間、お金、ツール、人）を最適化するために作業の優先順位を決める
開発見積もりは投資コストを計算するために必要だが、見積もり自体が難しくコストも高い
Software Estimation: Demystifying the Black Artは見積もりの難しさを扱う優れた書籍

プロセスの出力

ストーリーポイント見積もりの過程には多くの時間を投じるが、出力には価値がない
定期的なグルーミングセッションは時間がかかり、チーム間で一貫性なくさまざまに適用される
ストーリーポイントの代わりに意味のある作業リストを作成するほうが価値がある

代案の提示

Tシャツサイズで見積もることはより良い代案になり得るが、これにも問題がある
時間で見積もることにも同様の問題があり、チームが実際に働く時間とビジネス側が期待する時間は異なる
小規模チームでは時間見積もりがうまく機能することもあるが、チームが大きくなると見積もりの精度は落ちる
ドナルド・ライナートセンの『The Principles of Product Development Flow』で代案が提示されている
- 待ち行列（Queue）管理に焦点を当てて作業のフローを最適化することが核心
- キャパシティ計画を立て、変動性を受け入れられるバッファ容量を確保しなければならない

解決策

チームが一緒に作業を分析し、小さなタスク単位に分割して不確実性を取り除くことから始める
タスクリストは待ち行列（Queue）となり、総タスク数は作業量（Job Size）を表す
Story Pointの代わりに平均タスク完了率（Average Task Rate）を使って見積もる
平均作業速度に基づいて作業を追跡し、作業完了率を計算する
新しい情報やフィードバックに応じてタスクを更新すれば、見積もりは自然に調整される
開発者は見積もりに対する心理的プレッシャーを受けずに済む

待ち行列（Queue）は先行指標

平均タスク完了率、Cycle Time、Velocityなどは後行指標である一方、Queueは先行指標
Queueの規模が増加すれば、問題を事前に認識して対応できる

要約

Story Pointは混乱を招き、信頼できず、失敗するように設計されている
その代わり、チームが一緒に問題を理解し、不確実性を取り除き、タスク単位に分解してQueueを管理することに時間を投じるほうが、有意義で価値がある

GN+の意見

記事で示された待ち行列管理の方式は、アジャイル開発における見積もりの難しさを克服できる現実的な代替案に見える
ただし、タスクを細かく分割する過程で開発者の負担が生じる可能性があり、プロジェクト初期段階ではより時間がかかるかもしれない
また、タスク分析の過程では、開発者の積極的な参加と率直な意見表明が前提となる
一方で、開発チームがビジネス要件を深く理解し、共に考えるという前向きな効果も期待できる

2件のコメント

heal9179 2024-07-19

それってカンバン手法じゃないですか..?

GN⁺ 2024-07-17

Hacker Newsの意見

個人的な経験では、ストーリーポイントの数値自体は重要ではなかったが、チームが作業の複雑さを評価するプロセスは非常に有用だった
- ストーリーポイントを作業時間の予測に使うのは信頼できない指標だった
- チームやドメインの変化、開発以外の作業の変動性など、さまざまな理由からストーリーポイントを避けるようにしていた
- ストーリーポイントを使うチームでは、これを作業理解を共有するためのツールとして使っていた
Scrumガイドで"Commitment"が"Forecast"に変更されたのは2011年ではない
- 2010年版と2011年版のガイドを確認したところ、"Commitment"という単語は2011年以前のバージョンには存在しなかった
- "Forecast"は2020年版ガイドで"Estimate"を置き換えた
作業パッケージを原子的な単位に分解し、キューの長さを測定することは別次元の問題である
- 作業パッケージをチームと一緒に精査しながら、ストーリーポイントを使うことはできる
- すべての作業を1ストーリーポイントに分解するのは非効率だった
- キューの長さと変動性の影響を結び付けるのは興味深い概念である
ウォーターフォール方式と時間単位での見積もりがうまく機能する場合もある
- 小規模な専門サービスチームで、顧客要件を文書化してチームと議論した後、時間の範囲で見積もる
- 顧客が承認すると、詳細設計、開発、QA、リリースのプロセスを進める
- 20年間プロセスは変わっておらず、生産性の高いチームと評価されている
ストーリーポイントは時間単位ではなく、相対的な複雑さと不確実性を表す
- 大きな数値でストーリーを測定できるべきである
- 一部のチームでは7を超えるポイントを付けない
- 他の現場では21、30、50ポイントを付けることもあった
ストーリーポイントはおおよその時間単位だった
- ストーリーポイントを明確な時間単位に合わせるのは誤解を招く
- 開発者が作業にどれだけ時間を使うかを予測することが重要である
- キュー分析が役立つためには、各作業の予想時間を知る必要がある
Scrumを初めて使ったときはRallyを使っていた
- ストーリーポイント、予想時間、実績時間をすべて追跡していた
- Jiraに切り替えた後、時間追跡はなくなった
- 予想時間の精度が上がるにつれて、チームの作業バランスを取りやすくなった
ストーリーポイントは作業の複雑さを議論するときには有用だが、速度を測るには不適切だった
- 新しいエンジニアとして多くのストーリーポイントを処理したが、管理側がそれを調整しようとしていた
- 複雑な作業を適切に評価するのは難しかった
ソフトウェア開発プロジェクトを信頼性高く見積もるのは難しい
- チームと一緒に作業を小さな単位に分解し、時間の範囲を見積もることが重要である
- プロジェクトが進むにつれて、機能一覧と新しい見積もり範囲を報告することが重要である
時間単位で見積もる方がより良い方法である
- ストーリーポイントは結局時間単位に変換される
- Scrumの複雑な手順を避けて作業を完了する方が効率的である

ストーリーポイントは無意味、キューを測定しよう

ストーリーポイントとは何か？

内在する変動性

既知の問題点

ROIで優先順位を付ける

プロセスの出力

代案の提示

解決策

待ち行列（Queue）は先行指標

要約

GN+の意見

関連記事

2件のコメント

Hacker Newsの意見