Atlassian、顧客データのAI学習活用をデフォルトに切り替え
(letsdatascience.com)- Jira、Confluence などの Atlassian Cloud 製品における顧客メタデータとアプリ内コンテンツが、2026年8月17日から Rovo と Rovo Dev の学習にデフォルトで活用される予定
- 料金プランごとにデフォルト設定が異なり、Free・Standard・Premium では メタデータ提供 が常時有効、Enterprise のみメタデータとアプリ内データがデフォルトで無効となり制御権を維持
- 収集対象には、可読性スコア、ストーリーポイント、SLA 値のようなメタデータと、ページ本文、課題説明、コメント、ワークフロー名のようなアプリ内データが含まれる
- 直接識別子の削除や集計などの保護措置が適用されるが、提供データは最大 7年間保持 され、削除またはオプトアウト後はアプリ内データが30日以内に削除され、学習モデルは90日以内に再学習される
- 従来の不使用方針から転換し、業務用ツールにおける データソース と価格帯別の制御水準を変える政策変更として、プライバシー・ガバナンス・コンプライアンス判断への影響が拡大
変更概要
- Atlassian は 2026年8月17日 から、Jira、Confluence、およびその他の Atlassian Cloud 製品の顧客メタデータとアプリ内コンテンツを AI 学習にデフォルトで活用する予定
- 対象 AI 機能として Rovo と Rovo Dev を明記
- 影響対象は約 30万顧客
- データ提供ポリシーの変更に伴い、料金プラン別にデフォルト設定を差別化
- 下位プランではメタデータ収集をオプトアウト不可
- Enterprise プランではメタデータとアプリ内データ収集に対する制御権を維持
- 収集された提供データの保持期間は最大 7年
- 削除またはオプトアウト後、アプリ内データは 30日以内に削除
- 当該データで学習したモデルは 90日以内に再学習 して提供分を除去
技術的詳細
- Atlassian は収集対象を メタデータ と アプリ内データ の2カテゴリに区分
- メタデータには匿名化されたシグナルを含む
- アプリ内データにはユーザー生成コンテンツを含む
- メタデータカテゴリに含まれる項目を具体化
- 可読性 および複雑度スコア
- 作業分類
- 意味的類似度指標
- ストーリーポイント
- スプリント終了日
- Jira Service Management の SLA 値
- アプリ内データカテゴリに含まれる項目を具体化
- Confluence のページタイトルと本文
- Jira 課題のタイトル、説明、コメント
- カスタム絵文字名
- カスタムステータス名
- ワークフロー名
- 学習前の処理として 直接識別子の削除、データ集計、保護措置の適用を明記
プラン別のデフォルト設定と除外対象
- デフォルト設定は組織の 最上位の有効プラン を基準に決定
- Free と Standard の顧客
-
メタデータ提供は常時有効
- メタデータ収集はオプトアウト不可
- アプリ内データ提供はデフォルトで有効だが設定変更可能
- Premium の顧客
- メタデータ提供は常時有効
- アプリ内データ提供は デフォルトで無効
- Enterprise の顧客
- メタデータとアプリ内データの両方が デフォルトで無効
- メタデータのオプトアウトが可能
- 収集対象全体から除外される顧客群を明記
- customer-managed encryption keys を使用する顧客
- Atlassian Government Cloud を使用する顧客
- Atlassian Isolated Cloud を使用する顧客
- HIPAA 義務 がある顧客
-
文脈と重要性
- 今回の方針は、従来の立場とは逆方向への転換
- 以前は顧客データを AI サービスの学習や改善に使用しないと表明していた
- 変化の背景として示された業界動向
- SaaS ベンダーが内部利用シグナルやコンテンツを収集し、モデルのブートストラップ、微調整、評価に活用
- 同時に匿名化と集計ベース分析を約束
- Atlassian が言及した実質的な利点
- 検索関連性 の向上
- より良い要約
- テンプレート提案
- エージェント型ワークフローの最適化
- 現場の実務者視点での影響
- 業務用ツールで使われるモデルの データソース の変化
- 価格帯別のデータ制御水準とコンプライアンス・調達判断基準の変化
リスクとトレードオフ
- Enterprise 以外の顧客に対する 必須メタデータ収集 は、識別子削除の有無にかかわらず、プライバシーとガバナンスへの懸念を引き起こす
- ストーリーポイントや SLA 指標のようなテレメトリが、プロジェクト構造や成果パターンを明らかにする可能性がある
- 匿名化データの 7年間保持 は、時間経過に伴う露出面の拡大につながる
- 長期データ保持監査を求める顧客に追加負担が発生
- 高セキュリティ顧客や customer-managed keys を利用する顧客向けの除外ルートは存在
- ただし、より高額なプランまたは特殊なデプロイ形態への移行が必要
注目ポイント
- 組織ごとに Atlassian テナントの点検が必要
- テナントごとの最上位の有効プランを確認する必要
- デフォルトのデータ提供設定を把握する必要
- ロールアウト期間中に管理設定の更新が必要
- 完全なオプトアウトが必要なら Enterprise または分離型デプロイへの移行を検討する必要
- 製品面での注目点
- Atlassian が 90日再学習 の手続きを実際にどう運用するか確認が必要
- Rovo に使われるダウンストリーム LLM ベンダーが入力値を保持しないと主張しているか確認が必要
- このパターンがエンタープライズ SaaS 全体に広がる場合、顧客の反発と規制監視の可能性に言及
評価根拠
- 今回の変更は、数千のエンタープライズユーザーとデータガバナンスおよびモデル出所管理を担う実務者に実質的な影響を与える
- 最先端モデルや規制上のマイルストーンとは位置づけられない
- チームのデータパイプラインとコンプライアンス上の選択肢を実質的に変える 製品ポリシー変更 と評価される
1件のコメント
Hacker News の意見
私には、Atlassian は失敗の連続を重ねているように感じられる。今でも製品はよく使っているが、P0級のバグに遭遇する頻度が高すぎる。self-hosted Bitbucket workers は特に Docker 周りが古すぎて、応急処置を大量に入れなければならなかった。JIRA では新しいチケットの順序を変えるのに何年も前からリロードが必要だ。ここ数年で JIRA や Bitbucket に追加された新機能もまともに動かなかった。無料トライアルで AI 機能も試したがまったく動かず、解約もオンラインではできなくてサポートチケットを何枚も切る必要があったが、その間にサポート問い合わせフォーム自体も何度も壊れた。なぜここまで機能障害が深刻になったのか、技術的負債なのか、人材流出なのか、その両方なのか気になる。コミュニティを見ると、回避策付きのバグが何百何千と見つかる
もっとよい出典を貼りたいが、現時点での核心は、無料顧客も有料顧客もデフォルトでAI 学習へのデータ提供に opt-in になっているという点だ。Confluence ページや Jira チケットのようなあらゆる内容が対象だ。Atlassian サポート文書 には無効化する方法が書かれているが、うちのインスタンスではその設定自体が見当たらない
Anthropic が Atlassian の買収を協議しており、おそらく学習データが理由だという噂を見た。すでにデータポイズニングの動きも出ているという趣旨の Reddit 投稿 もある
enterprise SaaS では、デフォルト opt-out ではなくデフォルト収集パターンがますます常態化しているように感じる。だが今回は、単なるメタデータではなくアプリ内のすべてのコンテンツにまで範囲が広がっており、しかも opt-out 設定すら表示されないという点が特に深刻だ。ポリシー決定自体は議論できるとしても、この二つが組み合わさると摩擦を意図的に作っているように見える。また、data residency は別問題として押さえておくべきで、多くの購入者はリージョン固定を包括的なプライバシー保証だと受け取っているが、実際には保存場所を意味するだけで、誰がどの目的でアクセスするかまでは保証しない
GitHub、Figma、Adobe、Vercel のように、他の多くの企業もこうしたものをデフォルトで有効化していると思う。だから、どの会社にデータを預けるにしても、基本的にはモデル学習に使われ得ると想定するほうが現実的だと感じる
Anthropic の買収説が本当なら、Atlassian はビジネス業務の周辺にある高シグナルなデータセットを丸ごと買える機会に見えるだろうと思う
private Bitbucket リポジトリのコードやコンテンツまで Atlassian が収集対象にしているのか気になる。ポリシーと FAQ の文言が曖昧なので、イエスかノーかではっきりした答えを聞きたい
昔は金を払わなければ自分が商品だと言われたものだが、今では企業が金まで払って自分自身が商品になるわけで、さらにばかばかしく感じる
Atlassian のdata residency オプションではこの問題を防げない点はぜひ押さえておきたい。データを特定リージョンに固定しても、学習用途に使われること自体はなお可能だ
だからこそ、Atlassian が on-prem 向けのData Center サポート縮小を望んでいた理由が、よりはっきり見えてくると感じる