Nicoのデータルーム、Papermarkのコード盗用疑惑が浮上
(twitter.com/mfts0)- Nicoのデータルーム製品が独自に作られた成果物ではなく、Papermarkのオープンソースおよびエンタープライズライセンスのコードから持ってきたものではないかという疑惑が公になった
- 核心的な争点は著作権およびライセンス侵害の有無であり、問題提起者は製品を直ちに公開停止すべきだと要求している
- この件は「素早く動いて壊す」という話ではなく、詐欺に近いという強い批判につながっている
- この製品をめぐる論争によって、Nicoの他の事業にも疑念が広がりかねないとの指摘が含まれている
- Garry Tan、Jared Friedman、Y Combinatorがあわせてタグ付けされ、YCコミュニティの評判の問題にも発展している
Papermarkコード盗用疑惑
- Nicoのデータルーム製品が自社開発されたものではなく、Papermarkのオープンソースおよびエンタープライズライセンスのコードから持ってきたように見えるという公開の疑惑が提起された
- 問題提起者は、これを単なる迅速な製品開発や「vibe coding」とは見なしにくく、著作権およびライセンス侵害の可能性があるとみている
- 要求事項は明確である
- 当該製品は直ちに公開停止すべきだという立場である
- 侵害が事実であれば、単純なミスよりも深刻な行為として受け止められうる
批判の拡大
- 批判はNicoのデータルーム製品ひとつにとどまらず、他の事業全般の信頼性にも疑問を投げかけている
- Garry Tan、Jared Friedman、Y Combinatorがタグ付けされたことで、個人間の紛争を超えてYCコミュニティの評判とも結び付けられている
- 現時点で公開されている内容では、疑惑の提起と要求事項が中心であり、追加の検証や反論の内容は示されていない
1件のコメント
Hacker Newsの意見
Webページのスクリーンショットを Figma Make のようなツールに入れれば、かなり似た複製を作ることはできる
スクリーンショットからはまさにそんな感じがして、非常によく似ているが完全に同じではない。文言がかなり同じなのも、おそらくそのためだろう。文言の書き換えすら生成系テキストツールに任せなかったのは、ただ雑だったということ
別の Twitter コメントを見ると、おそらく AI に Papermark を真似させたのだと思われる
AI のコメントには、ページが “reference” に合わせて整えられたといった痕跡がある
https://xcancel.com/ffumarola/status/2070479755892371713#m
彼らの返答はこうだった:
Nico が本気で「コードを真似していない」を合理的な弁明だと思っていても、あまり驚かない。明確なルールのように見えるからであり、極端な “shape rotator” タイプは法律のような曖昧さのある領域を苦手とすることが多い。実際、著作権侵害はポルノの判別基準のように、見れば分かることが多い
どこかでは、この会社/業界が世界で AI の最も重要な応用先だと主張していたこともある。彼らが真似したことに疑いはなく、少なくとも信用できる人物ではない
https://x.com/nico_laqua/status/2061130574358773852?s=20
もっと訴訟慣れした会社にこれをやっていたなら、かなりの確率で訴えられていたと思うし、勝敗も五分五分くらいはあり得ると思う。これが創作的・芸術的要素のコピーと見なされるのか、単なる動作方法の模倣と見られるのかは判断が難しいが、機能の模倣は許されても、ユーザー体験を丸ごと真似すればすぐ著作権侵害になり得る
文言も、実データルームのソリューションであれば十分にあり得る標準的な内容に近いと思う
このスレッドの背景をもう少し説明してもらえないだろうか? Nicoが誰なのか、Papermarkが何で何をしているのかまったく分からない。
別の話として、人々は既存のソリューションやプロジェクトをバイブコーディングで真似して作るだけでなく、オープンソースのコードを「盗んで」、オープンソースの道徳的・倫理的・法的前提を守らないまま好き勝手に使うことに、より慣れてきているように見える。以前よりオープンソース違反があちこちで増えているのに、大きな法的結果はないように感じる。
しかも、AIだけで入ってきた新しい開発者のかなりの部分は、FOSSがビールのように無料という意味ではなく、自由に関するものだという点を理解していないか、気にしていない。
私はハードウェア音声サンプラーのバイナリデータファイルを解析するGPL3ライブラリを手がけている。ある人が私のライブラリの上にいろいろできるアプリを作り、GPL3ライセンスに従っていた。
ところが最近、誰かがそのアプリを完全にバイブコーディングで複製し、Webサイトと60ドルほどの購入リンクまで公開した。色だけ違い、UIはまったく同じというあまりにも露骨な複製で、GPL3の条件はまったく守られていなかった。運営が投稿を一覧から外して複製アプリの開発者をBANし、フォーラムコミュニティは元のアプリ開発者を支持した。DMCA削除要請も送り、数日後に複製サイトは落ちた。
元のアプリ開発者は、そのメーカー関連の投稿が集まる主要フォーラムが事実上1つしかなく、しかも運営がAI絡みのものを嫌っていたので運が良かった。皮肉なことに、その元のアプリ開発者自身も自分の作業をすべてバイブコーディングしていた。あのフォーラムと運営がなければ、元のアプリ開発者も、GPL3ライブラリ管理者である私も、正直終わっていたと思う。
中央集権化には利点がある。それがなければ、みながプロプライエタリソースに戻るか、他人の作業を尊重しようという議論を強制的に生み出す大衆的な動きでもない限り、代案はあまり見当たらない。これまでは名声とコミュニティの反発システムに頼ってきた。
企業は何をしても逃げ切れることに慣れつつある。「速く動いて壊せ」はもともとテックに関する言葉だったが、今では法に対する態度になっている。Uberがこの流れを大衆化し、今ではみなが同じことをしている。AIが著作権法を壊しているのもその流れの一部だ。
新たな法律は敗者のためのものという考え方のせいで、これから厳しい時期を迎えることになりそうだ。
もはやインターネット上のあらゆるものは、事実上みなが勝手に持っていくものになったと考えるべきだ。
確実に負ける唯一の方法は、そのゲームに参加しないことだからだ。
PapermarkはDocSendのオープンソース代替だ。セルフホストでもホスト型でも使え、DocSendよりはるかにコスト効率が高いため人気がある。
CorgiはYCが出資した保険スタートアップで、他のYCスタートアップに保険を販売している。Nicoはその創業者だ。最近、約30億ドルの評価額で1億ドルを調達し、現在YCが特に強く後押ししている企業の1つだ。
保険の引受審査には多くの文書が必要なため、CorgiはDocSendに毎月数千ドルを払っていた。何らかの理由で、Corgiは12人規模のチームを組んで独自のDocSend代替であるDataroomを作ったようだ。そしてCorgiはこれを月額10ドルから始まる、より安価なDocSendとして位置付け、すでに混み合っている市場でSaaS製品にすることを決めた。
Papermarkは、CorgiのDataroomが自社のオープンソース製品と同じ文言や構成を多く使っていることにすぐ気づいた。そこでCorgiがPapermarkの成果物をクレジットなしで持っていったと判断した。Corgiは、製品間に語単位で一致する部分があるのは単なる偶然だとして否定している。
別のYCスタートアップDelveは、Corgiが疑われていることに加えてさらに多くのことを実際にやっていたことが発覚し、YCから外された。
私には、彼の論理はおおむね2つに見える。
しかし、ここで最大の手がかりは、2つの製品の同一のレイアウトと文言だ。LLMに「この製品を書いて1:1の複製を作れ」と指示するのも、常識的な定義では依然としてコピーだ。何もコピーしていないと主張するのは筋が通らない。
ShadCNはAIが90%以上自動で選ぶ最も人気のあるデザインシステムで、lovableのようなプラットフォームでもほぼデフォルトだ。
GoogleはAPIをコピーしたが、実装はクリーンルームに保ち、これは最終的にフェアユースだと明確に判断された。API再実装のような厳格な対象にもフェアユースが適用されるなら、UIやレイアウトの複製のような、はるかに曖昧な対象にも適用されると見なせる。
なぜいまだに昔のTwitterだったものを真面目に使っているのか分からない。
彼らの言う通りコードをコピーして貼り付けてはいないとしても、実際にはLLMがリポジトリをクロールした結果に基づいて同じコードを再現し、ライセンスを尊重していないことになるのかもしれない。
裁判所が判断するのにふさわしい民事事件になりそうだ。彼らの防御は「私たちはLLMにあなたの作業を再現しろと命じただけで、『私たち』がコードをコピーしたのではない」というものに見える。後味が悪い。
問題のライセンス: https://github.com/papermark/papermark?tab=License-1-ov-file
AGPLであり、基本的にはユーザーがネットワーク経由でソフトウェアとやり取りする場合でも、ソースコードを公開しなければならないという意味。
そのコードを使うプロジェクトも AGPL である必要がある。
分離して回避する方法はある。たとえば AGPL の認証サーバーを使うからといって、ビジネスロジックを含むコードまで影響を受けなければならないわけではない。
特に過去の論争を見ていたなら、製品をライセンスに適合するよう設計する方法を見つけることはできたはず。
ただし実際にコードがコピーされたという前提での話であり、こちらもそれを確実に知っているわけではない。かなり似て見えるが、どう執行されるかはよくわからない。
こうしたモデルに関する 著作権問題 は本当にめちゃくちゃだ。
テック業界は盗用を常態化し、それを イノベーション と呼ぶためなら何でもするだろう。
典型的な YC スタートアップ的な動きだ。