1 ポイント 投稿者 GN⁺ 5 시간 전 | 1件のコメント | WhatsAppで共有
  • 技術業務において オープンLLM には依然として性能・互換性・信頼の面でコストがあるが、最近は差が縮まり、Claude や GPT のような独占的モデルへの依存を下げる余地が大きくなっている
  • かつて Linux は MS Office 互換性、特殊なファイル形式、未成熟なオープンソース生態系のために専門業務ではリスクがあったが、Webアプリの普及とエコシステムの成熟によって犠牲は大きく減った
  • 2026年6月21日時点で Artificial Analysis intelligence leaderboard の上位は Claude や GPT のような独占APIモデルであり、Claude code と主要APIは使いやすさと組織内での信頼の面で依然として優位にある
  • オープンモデルは提供元や OpenRouter のような第三者を通じて利用できるが、個人情報・データ共有への懸念 があり、直接実行すればプライバシーは改善してもコスト・複雑性・速度の負担が生じる
  • Claude の ID verification 導入は上位モデルを使えなくなるコストを改めて見直させたが、オープンモデルは先頭との差が数か月程度まで縮まっており、短期的な生産性低下は決定的な障害ではないかもしれない

Linux への移行コストから見たオープンLLMの現在地

  • 以前は Linux を使うことが、技術業務においても 職業上のリスク を生み得た
    • Word 文書や PowerPoint を正しくレンダリングできないことがあった
    • Open Office のエクスポート結果を信頼しなければならない状況があった
    • 特殊なファイル形式を簡単に開けず、協業が難しくなることがあった
    • 主流ソフトウェアの機能に追いつこうとするオープンソースプロジェクトには粗さが多かった
  • 今では生産性ソフトウェアがWebアプリとして提供されることが多く、Linux とオープンソースソフトウェアの成熟によって差は縮まった
    • CAD のような特定分野のソフトウェアでは依然として Windows が必要な場合がある
    • ただし Linux とオープンソースは、以前のように一般業務全般で大きな 犠牲 を要求しない

オープンモデル利用者が受け入れるべきコスト

  • オープンLLM利用者には、まだ明確な ペナルティ が残っている
    • 2026年6月21日時点で Claude と GPT が Artificial Analysis intelligence leaderboard の上位にある
    • 性能だけでなく、互換性と使いやすさの面でも Claude code と主要APIが強い
    • OpenAI や Anthropic に LLM の問い合わせを送ることは、多くの人が受け入れるレベルの信頼を得ている
  • オープンモデルをAPIとして使う経路には信頼の問題が伴う
    • モデル提供元が直接提供する場合もあれば、OpenRouter のような第三者が提供する場合もある
    • クライアントデータや機密データを含むAPI呼び出しを送るには、個人情報とデータ共有の面でより不安がある
    • Deepseek や OpenRouter などにリクエストを送ると、実際のリスクとは別に、より大きな懸念を招く可能性がある
  • 直接実行はプライバシーの問題を減らすが、コスト・複雑性・速度 の負担が生じる
    • ローカルまたはクラウドで実行できる
    • 直接実行には、高価・複雑・相対的に遅いという問題のうち少なくとも二つが伴う

ClaudeのID確認が生んだ移行の契機

  • Claude の identity verification 導入が移行判断を早めた
    • 最近のモデルにおける新たな保護措置(safeguards)や Mythos に関連する状況も、ユーザー体験が悪化する兆候として受け止められている
    • ID verification を受け入れない場合に上位モデルが使えなくなることによる職業上の損失が、中心的な問題として残る
  • オープンモデルへの移行は、2008年当時の Linux と Windows の差よりもはるかに近い状況だと評価されている
    • すでにローカルやクラウドで複数のオープンモデルを実行できる環境がある
    • オープンモデル向けのコーディングハーネスも存在する
    • オープンモデルは先頭モデルに非常に近づいており、通常は数か月遅れの水準にある
    • 生産性は短期的に落ちるかもしれないが、研究時代に Matlab から GNU Octave へ切り替えるようなもので、決定的な障害ではないと見られている

1件のコメント

 
GN⁺ 5 시간 전
Hacker Newsの意見
  • すべてのリクエストで eurouter.ai に以下のルーティングルールを使っている理由はまさにそこにある

    {  
    "model": "glm-5.2",  
    "models": [  
    "deepseek-v4-pro",  
    "deepseek-v4-flash"  
    ],  
    "provider": {  
    "allow_fallbacks": true,  
    "data_collection": "deny",  
    "data_residency": "EU",  
    "max_retention_days": 0,  
    "eu_owned": true  
    }  
    }  
    

    高価ではあるが、少なくとも法的にはデータプライバシーが保証されていると見ている。Anthropic、OpenAI、OpenRouter よりも信頼している
    個人的には米国の AI ツールを使うことを道徳的に受け入れがたく、彼らに金を払って彼らが関与している犯罪を支えたくない[1]
    [1]: https://news.ycombinator.com/item?id=48512339

  • Anthropic のレッドラインで引っかかるのは「of Americans」という表現だ。では残りの文明世界は好きにしていいのか? 米国外の同盟国を機械学習における操作されたテストやデータ流出で不安定化させても構わないということなのかと思ってしまう
    さらに奇妙なのは、モデルが https://www.anthropic.com/constitution に従い、その内容がモデルに組み込まれていると主張している点だ。ところが Claude Code と cowork のシステムプロンプトはこうした項目を再び繰り返している。本当に組み込まれているなら、その必要はないはずだ
    API 版 Claude に十分なプロンプトエンジニアリングを施せば、ヒトラー支持者のように振る舞わせることができ、これは彼らの主張と真っ向から矛盾する。特に Opus 4.7 は特定の少数派集団を狙ったプロパガンダも進んで作ってくれたが、4.8 ではまだ同じ成功は見ていない。最近はモデルのサイバー能力の悪用のほうに関心があるので、その方向には深く掘り下げていない
    最初からの結論は、Anthropic の戦略は純粋にイメージ管理だということで、会社への支持が殺到したのを見るとかなり成功したと言える

  • eurouter.ai を見てみたが、提案自体がかなりひどく見える
    無料アカウントで15%のマークアップという価格設定もおかしいし、月 40€ を払わなければ月 1000 リクエストの制限がある。しかも、正確にどんな価値を提供しているのか分からない
    DeepSeek-V4-Pro には TensorX という単一プロバイダーしかなく、キャッシュ読み取りコストは DeepSeek より 100 倍以上高い($0.44 vs $0.003625)。特に eurouter.ai ではキャッシュトークンのコスト情報が見つからず、TensorX のウェブサイトまで見に行く必要があった

  • 「犯罪」という言葉でも足りない
    “AI-assisted targeting in the Gaza Strip” - https://en.wikipedia.org/wiki/AI-assisted_targeting_in_the_G...
    “Palantir allegedly enables Israel's AI targeting in Gaza, raising concerns over war crimes” - https://www.business-humanrights.org/de/neuste-meldungen/pal...
    “What The Wounds Are Telling Us” - https://www.volkskrant.nl/kijkverder/v/2025/gunshot-palestin...

  • OpenRouter の他の代替が気になって少し調べてみた
    EURouter(アムステルダム): https://www.eurouter.ai/pricing
    Eden AI(フランス): https://www.edenai.co/pricing
    nexos.ai(リトアニア): https://nexos.ai/pricing/
    Requesty(ドイツ): https://www.requesty.ai/pricing
    Cortecs(オーストリア): https://cortecs.ai/pricing
    Nordference(エストニア): https://nordference.ai/pricing
    本当に雨後の筍のように生えてきている感じだ。実際に使ったわけではないのでどこかを勧めるつもりはないが、必要な人には選択肢があるようだ

  • データセキュリティが本当に心配なら、結局は負担を受け入れて自前でホスティングする以外に解決策はなさそうだ

  • 人々が、オープンウェイトモデルが独占モデルより「数か月遅れている」という理由で除外するのは興味深い。
    LLMの進歩がものすごく速いのはわかるが、数か月前のOpusやGPTが本当に今のオープンウェイトモデル水準だったのなら、乗り換えない理由はない。特に数か月前からそれらのモデルを使っていた人ならなおさらだ。
    コードベースが変わったわけでもないのだから、オープンウェイトモデルを使えばいい。ゴールポストを動かしてはいけない

    • 新しい独占モデルは毎回「画期的」で「他のモデルが解けなかったXタスクを解けた」と宣伝されるが、1か月後には 前世代のいまいちなモデル と呼ばれる。
      だからKimi-2.7、GLM-5.2、Deepseek-v4を使うことにまったく問題はない。すでにかなり天井に近づいていて、今後の改善の大半は推論やツール呼び出しを少し良くするハーネス改善と、わずかに良くなった強化学習から来るように見える
    • オープンモデルをかなり試してきたが、「数か月遅れているだけ」という言い方にはうんざりしている。
      まだ最高のオープンウェイトモデルでさえ、数か月前の Opus と同等だとは確信できない。ベンチマークが何を言っているかは知っているし期待も大きかったが、実際の使用体験はベンチマークと一致しなかった。
      Opus 4.8ですら苦戦する作業を多くやっている。最先端LLMですらまだ完全には到達していない状況で、さらに遅れたモデルへ移る動機は生まれない
    • 今この投稿をHNで読んでいる唯一の理由が Anthropic API障害 だから、これもセルフホスティング寄りに一票だ
    • 「数か月遅れている」より少し正確に言うなら、重要な基準は 2025年11月24日のClaude Opus 4.5 より前か後か、である可能性が高い。そのモデルがクリスマスにOpenClawブームを生んだモデルだった
    • 会社ではDeepseek V4 flashプロバイダーを使っているが、実際に動く業務の 95% を10分の1のコストで処理している。より強いモデルをたまに引っ張り出すことはあるが、それはもう一度考えたあとだ。
      堀はあまりに平坦で、食料+1、生産+1を与える程度だ。道路があればゴールド+1
  • これらのモデルの驚くべき点は、実質的にインターネットを ローカルマシンに載せられる形 に蒸留し、自然言語で問い合わせできるようにしていることだ。
    技術とハードウェアは、蒸留すべき知識基盤の増加速度より速く改善しているので、実用的なローカルモデルが可能になるのは避けられないように見える

  • この投稿の態度にはかなり驚かされる。一方ではLinuxやその他の自由・オープンソースソフトウェアを受け入れた話から始まっているが、FOSSの核心は、ユーザーが自分の実行するソフトウェアを理解し、修正できるようにすることだ。
    ところが残りは、書き手が修正する方法も理解する方法もないツールである LLM を使う話だ。巨大な浮動小数点行列は、よく見積もってもコンパイル済みコードにたとえられる程度で、実際には独占ソフトウェアを逆コンパイルして理解するほうが簡単なことすらある。
    しかもたいていの場合、「オープン」モデルを動かそうとしても負担しきれないハードウェアが必要になる。ソフトウェアの自由を称賛していた場所が、どうしてここまで来たのかわからない

  • タイトルは断定的だが、本文では「最小化されることを望む」と書かれている。
    複数のサブスクリプションを使い、OpenRouter経由でさまざまなLLMプロバイダーをトークン単位で試し、オープンウェイトモデルもローカルで回している。
    まだ同意しがたい。AnthropicとOpenAIのモデルは本当に他よりずっと良い。オープンウェイトモデルは全体的に ベンチマーク最適化 が過剰なようで、実体験はベンチマークが示唆するものと大きく異なる。
    こういう経験を話すと、今人々が聞きたがっている現実ではないためによくダウンボートされるが、複雑な作業では事実だ。
    熟練したユーザーが扱うなら、簡単な作業のかなりの部分はオープンウェイトモデルで十分こなせると思う。少し監督を付ければジュニアに任せられる程度の仕事なら、どのモデルでも可能だ。
    だが私がやっている作業の多くでは、Opus 4.8 Max ですら継続的に注意深く見守り、方向付けし、レビューしなければならない。Fableもそうだったが、程度はもう少し軽かった。
    大きなオープンウェイトモデルを使ってみると、ローカルでは耐えられる量子化レベルで妥当な速度が出ないのでホスティング利用になりがちだが、大きな作業では結局捨てる可能性の高い出力を待ちながらトークンを燃やす時間のほうが長く感じられる。その水準に達してほしいとは思うが、まだそこではない

    • 例はありますか?
  • Claudeは 4.6 に達してから、コーディング用途で実用になるようになった。その後もあると便利な追加機能はあったが、4.6 SonnetとOpusがオープンウェイトだったなら、これ以上必要なものはなかったと思う。
    Fableを少し使ってみて、その考えはさらに強まった

  • ローカル推論にもっと慣れたかったがハードウェアがないので、あまり議論されているのを見ない ローカル協同組合 のようなものを考えるようになった。
    経済性を見れば、何人かで資金を出し合って良いハードウェアとオープンモデルを運用するのは理にかなうかもしれないのに、そういう話を見たことがない。自分が見落としているのかと思う。
    そういう形に参加したい人たちが互いを見つけられるようにするサービスを作れたら、かなり面白そうだ

    • こういう話をあまり見ない理由は、みんな計算してみて、良い取引ではないと気づいて、諦めるからだ。
      今の /r/localllama の上位にも、まさにこの計算についての投稿がある: https://www.reddit.com/r/LocalLLaMA/comments/1ubrcwj/tokenom...
      要するに GLM 5.2 を回すには最低でも約2万ドルかかり、クラウドホスティング版に比べて苦痛なほど遅い。サーバーが24時間トークンを計算し続けるという想定でも、損益分岐まで数年かかる。
      ローカルで回す唯一の理由は、完全なデータプライバシーが最優先の場合だけだ。その代償として高いプレミアムを払うことになる
    • オープンモデルを非常に安い料金で提供しているところは多い。一般には、複数プロバイダーのさまざまな指標を追跡している OpenRouter を見ることを勧める
    • https://news.ycombinator.com/item?id=48524387
    • クラウドでホストされたオープンモデル???
  • そうではあるが、OpenAIも同じ価格だ。z.aiに月額18ドルを払う理由は何だろう、OpenAIは月額20ドルなのに?

    • 私が見た大きな利点の1つは、人々がモデルに愛着を持つことだ。私もその1人だ。オープンモデルなら、自分に完璧に合うモデルを見つけたのに次のバージョンがいまいちだった場合、古いバージョンを永遠に動かし続けられる。自分でやるにせよ、誰かに代行してもらうにせよ可能だ
    • 理由の1つはリクエスト上限かもしれない。OpenAIのChatGPT Plus w/Codex(月額20ドル)は、最悪の場合の5時間あたりのリクエスト上限が、GPT-5.5は15回、GPT-5.4は20回、GPT-5.4-Miniは60回だ
      一方、Z.ai Lite(月額18ドル)はGLM 5.2について最悪の場合でも約80回を提供する。オフピーク基準で、ピークはニューヨーク時間の午前2時〜6時だ。だからZ.aiはより安い価格でより高い上限を提供できる
      (https://codeberg.org/mutablecc/calculate-ai-cost/src/branch/...)
    • https://news.ycombinator.com/item?id=48618455
    • OpenCode Goは月額10ドルで、上限もそれらやCodexよりはるかに余裕がある
    • 価格ページにはもう明記されていないようだが、z.aiのコーディングプランは以前、同価格帯のClaudeプランより使用量が3倍だと主張していた。それが正確かどうかは分からないが、API価格だけ見てもGLMのほうがはるかに安い
  • Linuxが明らかに有能だが、使いやすく磨き上げるにはハックや追加の手間が必要だった時代には、反骨精神でLinuxを使いやすかった
    だが経験上、オープンモデルは能力面でも運用要件の面でも、まだそこまで来ていない。GLM5.2は有能に見えるが、そのレベルで有能に動かすには巨大なGPUクラスターが必要だろう
    ホスティングAPIでオープンモデルにアクセスするのなら、ホスティングAPIでクローズドモデルを使うのと変わらなくなる。15年前にLinuxを使っていた頃と比べると、インセンティブが崩れる
    誤解しないでほしい。ローカルモデルを動かして満足したいが、今はまだその時ではない

    • 「ホスティングAPIでオープンモデルにアクセスするなら、ホスティングAPIでクローズドモデルを使うのと同じ」というわけではない
      要点は、単一の主体に支配されていないため、エンシティフィケーションされないということだ。そういうことはすでに起きていたし、今も起きていて、これからも起きる
      オープンウェイトなら、簡単に排除されたり、ロックインされたり、アクセスを遮断されたりしない。どこかの企業がそうしようとしても、サーバーファームを持つ別の誰かが顧客として受け入れられるし、ワークフローで変えるのはAPI URLとキーだけで済む
      同じ性質と同じ知識を持つ同一モデルと対話することになる
  • 文章の大きな方向性には一部同意するが、2つある
    第一に、私のテストでは、オープンモデルはまだソフトウェア開発・エンジニアリングとその周辺作業で少なくともClaude Opusと張り合える水準ではなかった
    第二に、続いている間は楽しむべきだ。今年の終わりごろまでに、安全保障を口実としてこうしたオープンモデルが「違法」と宣言されなかったら本当に驚くだろう。ここで口実と言ったのは、主な動機が規制の虜化と産業保護主義になるはずだからだ

    • アメリカでモデルを禁止すれば、中国のような競争国だけが強くなる