Atlassian、顧客データのAI学習活用をデフォルトに切り替え

(letsdatascience.com)

5 ポイント投稿者 GN⁺ 9 일 전 | 1件のコメント | WhatsAppで共有

Jira、Confluence などの Atlassian Cloud 製品における顧客メタデータとアプリ内コンテンツが、2026年8月17日から Rovo と Rovo Dev の学習にデフォルトで活用される予定
料金プランごとにデフォルト設定が異なり、Free・Standard・Premium では メタデータ提供 が常時有効、Enterprise のみメタデータとアプリ内データがデフォルトで無効となり制御権を維持
収集対象には、可読性スコア、ストーリーポイント、SLA 値のようなメタデータと、ページ本文、課題説明、コメント、ワークフロー名のようなアプリ内データが含まれる
直接識別子の削除や集計などの保護措置が適用されるが、提供データは最大 7年間保持 され、削除またはオプトアウト後はアプリ内データが30日以内に削除され、学習モデルは90日以内に再学習される
従来の不使用方針から転換し、業務用ツールにおける データソース と価格帯別の制御水準を変える政策変更として、プライバシー・ガバナンス・コンプライアンス判断への影響が拡大

変更概要

Atlassian は 2026年8月17日 から、Jira、Confluence、およびその他の Atlassian Cloud 製品の顧客メタデータとアプリ内コンテンツを AI 学習にデフォルトで活用する予定
- 対象 AI 機能として Rovo と Rovo Dev を明記
- 影響対象は約 30万顧客
データ提供ポリシーの変更に伴い、料金プラン別にデフォルト設定を差別化
- 下位プランではメタデータ収集をオプトアウト不可
- Enterprise プランではメタデータとアプリ内データ収集に対する制御権を維持
収集された提供データの保持期間は最大 7年
- 削除またはオプトアウト後、アプリ内データは 30日以内に削除
- 当該データで学習したモデルは 90日以内に再学習 して提供分を除去

技術的詳細

Atlassian は収集対象を メタデータ と アプリ内データ の2カテゴリに区分
- メタデータには匿名化されたシグナルを含む
- アプリ内データにはユーザー生成コンテンツを含む
メタデータカテゴリに含まれる項目を具体化
- 可読性 および複雑度スコア
- 作業分類
- 意味的類似度指標
- ストーリーポイント
- スプリント終了日
- Jira Service Management の SLA 値
アプリ内データカテゴリに含まれる項目を具体化
- Confluence のページタイトルと本文
- Jira 課題のタイトル、説明、コメント
- カスタム絵文字名
- カスタムステータス名
- ワークフロー名
学習前の処理として 直接識別子の削除、データ集計、保護措置の適用を明記

プラン別のデフォルト設定と除外対象

デフォルト設定は組織の 最上位の有効プラン を基準に決定
Free と Standard の顧客
- メタデータ提供は常時有効
  - メタデータ収集はオプトアウト不可
  - アプリ内データ提供はデフォルトで有効だが設定変更可能
  - Premium の顧客
  - メタデータ提供は常時有効
  - アプリ内データ提供は デフォルトで無効
  - Enterprise の顧客
  - メタデータとアプリ内データの両方が デフォルトで無効
  - メタデータのオプトアウトが可能
  - 収集対象全体から除外される顧客群を明記
  - customer-managed encryption keys を使用する顧客
  - Atlassian Government Cloud を使用する顧客
  - Atlassian Isolated Cloud を使用する顧客
  - HIPAA 義務 がある顧客

文脈と重要性

今回の方針は、従来の立場とは逆方向への転換
- 以前は顧客データを AI サービスの学習や改善に使用しないと表明していた
変化の背景として示された業界動向
- SaaS ベンダーが内部利用シグナルやコンテンツを収集し、モデルのブートストラップ、微調整、評価に活用
- 同時に匿名化と集計ベース分析を約束
Atlassian が言及した実質的な利点
- 検索関連性 の向上
- より良い要約
- テンプレート提案
- エージェント型ワークフローの最適化
現場の実務者視点での影響
- 業務用ツールで使われるモデルの データソース の変化
- 価格帯別のデータ制御水準とコンプライアンス・調達判断基準の変化

リスクとトレードオフ

Enterprise 以外の顧客に対する 必須メタデータ収集 は、識別子削除の有無にかかわらず、プライバシーとガバナンスへの懸念を引き起こす
- ストーリーポイントや SLA 指標のようなテレメトリが、プロジェクト構造や成果パターンを明らかにする可能性がある
匿名化データの 7年間保持 は、時間経過に伴う露出面の拡大につながる
- 長期データ保持監査を求める顧客に追加負担が発生
高セキュリティ顧客や customer-managed keys を利用する顧客向けの除外ルートは存在
- ただし、より高額なプランまたは特殊なデプロイ形態への移行が必要

注目ポイント

組織ごとに Atlassian テナントの点検が必要
- テナントごとの最上位の有効プランを確認する必要
- デフォルトのデータ提供設定を把握する必要
ロールアウト期間中に管理設定の更新が必要
完全なオプトアウトが必要なら Enterprise または分離型デプロイへの移行を検討する必要
製品面での注目点
- Atlassian が 90日再学習 の手続きを実際にどう運用するか確認が必要
- Rovo に使われるダウンストリーム LLM ベンダーが入力値を保持しないと主張しているか確認が必要
このパターンがエンタープライズ SaaS 全体に広がる場合、顧客の反発と規制監視の可能性に言及

評価根拠

今回の変更は、数千のエンタープライズユーザーとデータガバナンスおよびモデル出所管理を担う実務者に実質的な影響を与える
最先端モデルや規制上のマイルストーンとは位置づけられない
チームのデータパイプラインとコンプライアンス上の選択肢を実質的に変える 製品ポリシー変更 と評価される

1件のコメント

GN⁺ 9 일 전

Hacker News の意見

私には、Atlassian は失敗の連続を重ねているように感じられる。今でも製品はよく使っているが、P0級のバグに遭遇する頻度が高すぎる。self-hosted Bitbucket workers は特に Docker 周りが古すぎて、応急処置を大量に入れなければならなかった。JIRA では新しいチケットの順序を変えるのに何年も前からリロードが必要だ。ここ数年で JIRA や Bitbucket に追加された新機能もまともに動かなかった。無料トライアルで AI 機能も試したがまったく動かず、解約もオンラインではできなくてサポートチケットを何枚も切る必要があったが、その間にサポート問い合わせフォーム自体も何度も壊れた。なぜここまで機能障害が深刻になったのか、技術的負債なのか、人材流出なのか、その両方なのか気になる。コミュニティを見ると、回避策付きのバグが何百何千と見つかる
- 私には、無料トライアルの解約をオンラインでできないようにしているのは顧客欺瞞以外では説明がつかないと思える。こういうものは法律で止めるのもとても簡単そうなのに、政府は関心がないようだ。Atlassian はユーザーではなく、そのユーザーの上司に売っている典型的な大企業のように見える。ある規模を超えて品質競争の圧力が弱まると、内部の腐敗や無能さが簡単に広がると感じる
- 私はそこで働いていた者だが、答えはエンジニアリング能力不足と散漫な優先順位、そして意味のない組織再編が重なった結果だと思う。Bitbucket pipelines と workers も実質的には最初に二人が作ったもので、この10年間で積極的に保守していた人員は一人前後しかいなかった可能性が高い。最近レイオフまであったなら、さらにひどかったはずだ。そのオフィスは今では物理的にもなくなり、当時の人たちもみな去った
- 私は原因を一言で言えばFeatureitisだと思う。考えなしに機能だけを押し込み続けるやり方だ。今では AI が書いたコードまで上乗せされている可能性すらありそうだ。中規模プロジェクトでも新機能だけを押し込めば似た状態になり、私が経験したいくつかのプロジェクトも巨大なバックログの中で機能チェックだけが重要だったせいで同じ道をたどった
- 私には Jira の検索機能はずっと使いものにならないレベルだったと感じる。プラットフォーム全体で最悪の部分かもしれないのに、今でも私が絶対に使わない機能追加に注力しているのを見ると虚しくなる
- 私には最近の Jira は同期のもつれのせいで不安定すぎると感じる。スプリントボードではチケットのモーダルが勝手に閉じて、何度も開き直さなければならなかったし、少し前にはどうしてもチケットがそのボードに現れなかったのに、後になってエピックが突然現れ、その後で個別チケットもまた表示されるようになった。いわゆる vibe coding が世の中にもたらす付加価値とはこういうものなのかと思ってしまう
もっとよい出典を貼りたいが、現時点での核心は、無料顧客も有料顧客もデフォルトでAI 学習へのデータ提供に opt-in になっているという点だ。Confluence ページや Jira チケットのようなあらゆる内容が対象だ。Atlassian サポート文書には無効化する方法が書かれているが、うちのインスタンスではその設定自体が見当たらない
- メールで受け取った案内によれば、opt-out 設定は5月から Admin portal に段階的に展開されるという理解だった。Jira、Confluence、Jira Service Management と Atlassian Platform アプリに先に適用され、2026年5月19日まで段階的に Atlassian Administration に表示される予定で、2026年8月17日より前に再度通知すると書かれていた
- Atlassian Administration > Security を含め複数の設定ページをくまなく見たが、Data contribution 項目はまったく見つからなかった。だとすると、今は自動 opt-in なのに、実際には opt-out の方法がない状態なのかと疑問に思う
- FAQ に書かれている範囲を見て衝撃を受けた。ユーザー生成コンテンツとして、Confluence のタイトルと本文、Jira の課題タイトルと説明、コメント、カスタム絵文字名、カスタム状態名、ワークフロー名まで含まれるというのだから、範囲が広すぎる
- 顧客データや非公開チケット、embargoed CVE の修正内容、機微な健康情報のようなセンシティブ情報までモデルに混ぜて学習させ、後で無関係な相手に漏れ出すのではないかと心配だ
- 変更点についての公式説明としては、Atlassian FAQ を参照するのが最も直接的だと思う
Anthropic が Atlassian の買収を協議しており、おそらく学習データが理由だという噂を見た。すでにデータポイズニングの動きも出ているという趣旨の Reddit 投稿もある
- それが本当なら、少なくとも二社はもう Atlassian 製品を使えなくなると私は知っている。プライバシーと規制要件をあまりに軽く見ているというシグナルとして受け取られる
- 以前は GitHub のような場所のソースコードが吸い上げられて AI がコードを生成していたのだとすれば、今は Atlassian のような場所の仕様書が吸い上げられて AI がそれをまた生成する段階に進んでいるように感じる。そうなると次のソースは何なのか、会社のミッション文句や金儲けのスローガンまで対象になるのかという苦い想像をしてしまう
- 株価が下がり続ければ、そうした買収が本当に起こる可能性もあると思う
enterprise SaaS では、デフォルト opt-out ではなくデフォルト収集パターンがますます常態化しているように感じる。だが今回は、単なるメタデータではなくアプリ内のすべてのコンテンツにまで範囲が広がっており、しかも opt-out 設定すら表示されないという点が特に深刻だ。ポリシー決定自体は議論できるとしても、この二つが組み合わさると摩擦を意図的に作っているように見える。また、data residency は別問題として押さえておくべきで、多くの購入者はリージョン固定を包括的なプライバシー保証だと受け取っているが、実際には保存場所を意味するだけで、誰がどの目的でアクセスするかまでは保証しない
- とくに The Register の記事にあった、今すぐ契約を解約しても新しい data contribution 設定は 2026年8月17日まで適用されないという文言が、さらに陰湿に感じられた。つまり、選択肢を検討する時間すら実質的に与えない構造だ
GitHub、Figma、Adobe、Vercel のように、他の多くの企業もこうしたものをデフォルトで有効化していると思う。だから、どの会社にデータを預けるにしても、基本的にはモデル学習に使われ得ると想定するほうが現実的だと感じる
- ひょっとすると今年はself-hosted の年になるかもしれないと思う。プライバシーがそれほど重要でない公開ブログのようなものは引き続きクラウドに置くが、モデル学習や広告販売に使われたくないデータは自分のネットワークで直接ホスティングする方向に移した
Anthropic の買収説が本当なら、Atlassian はビジネス業務の周辺にある高シグナルなデータセットを丸ごと買える機会に見えるだろうと思う
- いっそ Broadcom が Atlassian を買って VMware のときのようにやってくれれば永遠に問題が解決するかもしれない、という皮肉まじりの想像をしてしまう
- Atlassian 内のデータは決してクリーンでも自然でもないデータセットだと思う。地獄のような設計が実際の開発者の仕事をあらゆるノイズで飲み込むように作られた空間のように感じる
- こうした噂がフォーラム上の憶測が回っている段階にすぎないなら、信頼できる情報源が出るまでは信じない。株価をつり上げて売り抜けるための話にも聞こえる
private Bitbucket リポジトリのコードやコンテンツまで Atlassian が収集対象にしているのか気になる。ポリシーと FAQ の文言が曖昧なので、イエスかノーかではっきりした答えを聞きたい
- 数か月前に調べたときは、private repo のコードで AI 学習はしていないと解釈していたが、今回の発表を見てからは、とにかく自分のサーバーに移すつもりだ。クラウドリポジトリは便利ではあるが、誰かがやって来て自分のデータを自分のもののように持っていくのではないかと心配し続けるのは、引き換えにする価値がないと感じる
- 文言が曖昧なら、事実上答えはもう出ているようなものだと思う
昔は金を払わなければ自分が商品だと言われたものだが、今では企業が金まで払って自分自身が商品になるわけで、さらにばかばかしく感じる
Atlassian のdata residency オプションではこの問題を防げない点はぜひ押さえておきたい。データを特定リージョンに固定しても、学習用途に使われること自体はなお可能だ
だからこそ、Atlassian が on-prem 向けのData Center サポート縮小を望んでいた理由が、よりはっきり見えてくると感じる

Atlassian、顧客データのAI学習活用をデフォルトに切り替え

変更概要

技術的詳細

プラン別のデフォルト設定と除外対象

メタデータ提供は常時有効

文脈と重要性

リスクとトレードオフ

注目ポイント

評価根拠

関連記事

1件のコメント

Hacker News の意見