1 ポイント 投稿者 GN⁺ 4 시간 전 | 1件のコメント | WhatsAppで共有
  • 米国政府による Mythos・Fable 5 へのアクセス制限 が長引く中、日本のSakana AIと中国の360がそれぞれFuguとTulongfeng/Yitianzhenで生じた空白を狙う
  • Sakana AIの Fugu はFable 5・Mythos Previewと競合可能なモデルとして紹介され、複数モデルのAPIを調整するエージェント向けモデルとして設計されている
  • 中国360の Tulongfeng はソフトウェア脆弱性の自動発見、Yitianzhen はサイバー防御とインシデント対応の自動化に焦点を当てる
  • Sakana AIは投入時期は偶然だとしたが、「輸出規制リスクのない frontier capability」を掲げ、日本企業と政府機関を狙う
  • 米国モデルの重要性は依然として残るが、輸出制限は東京と中国の企業が現地の言語と文脈に合った 地域代替 を前倒しで進めるきっかけになっている

Anthropicの輸出制限が生んだモデルの空白

  • 中国のサイバーセキュリティ企業360は水曜日に Tulongfeng を公開したとReutersが報じた
    • 360は、TulongfengがAnthropicのサイバーセキュリティ特化AIモデル Mythos に対抗できると述べた
    • Mythosと、より制限の強いバージョンである Fable 5 は、Trump Administrationの措置により現在は米国人以外のユーザーに提供されていない
  • 同じ週の初めには、東京拠点のSakana AIが日本語でフグを意味する Fugu を公開した
    • Fuguは「AnthropicのFable 5やMythos Previewのような先導的モデルと肩を並べる」と説明されている
    • エージェント向けに設計されており、他モデルのAPIアクセスを調整できる
  • どちらの製品も、米国政府のAnthropic関連命令から2週間後に登場した

Sakana AIのFugu戦略

  • Sakana AIの広報担当者は、Fuguの投入がMythos/Fableの輸出制限と重なったのは「entirely coincidental」だと述べた
    • ただし同社ウェブサイトでは「輸出規制リスクのない frontier capability」を訴求している
    • Sakana AIは、Fuguは昨年から開発しており、関連研究は今年春のICLRで発表したと説明した
  • 同社は2023年にGoogle出身のDavid HaとLlion Jones、MercariとStability AI出身のRen Itoが共同創業した
    • 小規模データセットでもうまく機能し、日本語と日本文化に最適化された低コストの生成AIモデルを作っている
  • Fuguの主要顧客は、強化される輸出規制への露出を減らしたい 日本企業と政府機関
    • Sakana AIは、これをアジアが米国AIから恒久的に離脱する流れとは見ていない
    • 広報担当者は「U.S. models remain important to Asia」と述べた
  • Ren ItoはProject Syndicateへの寄稿で、米連邦政府の第一優先は近しい同盟国のアクセス維持であるべきで、AIは備蓄する技術ではなく共に開発する技術であるべきだと主張した
  • David HaはXで「Orchestration Models are the next frontier, beyond bigger models」と書いた
    • 国家インフラを単一ベンダーに依存するのは危険であり、最近の輸出規制がそのリスクを無視できなくしたとみている
    • 「Access to top models can disappear overnight」と書き、集合知を権力集中に対する実用的なヘッジと表現した

360のセキュリティAIと戦略資産の論理

  • 360はReutersとQuartzの報道ベースで2つの AIセキュリティツール を公開した
    • Tulongfeng: ソフトウェア脆弱性を自動で発見するよう設計されている
    • Yitianzhen: サイバー防御とインシデント対応を自動化するよう作られている
  • 360創業者のZhou HongyiはReuters報道ベースで、脆弱性検知AIを 国家戦略資産 と見なしている
    • 高度な脆弱性検知能力に一部の主体しかアクセスできない「one-way transparency」のリスクを指摘した
  • 360はTechCrunchのコメント要請に応じていない

Anthropicの成長と地域代替の台頭

  • Anthropicは2026年5月、年換算売上高が 470億ドル を超えたと明らかにしていた
    • このうちアジアの企業顧客への依存度がどの程度かは公開されていない
  • 輸出命令の発効後の数週間で、Sakana AIと360はAnthropicモデルへのアクセス制限で生じた空白に参入した
  • 米国企業が禁止措置の終了後に信頼を取り戻せるとしても、現地の言語とニュアンスをよりよく理解するよう訓練された 地域代替 が、すでにその空白を埋めつつある

1件のコメント

 
GN⁺ 4 시간 전
Hacker News の意見
  • Fugu モデルを C# と Unity で MCP、OpenCode を使って実作業に試してみたところ、テーマシステムのレビューと色変更計画の一度だけで、$20 プランの5時間制限をすべて使い切ってしまった
    実装結果を見ようと $100 プランに上げたが、Opus より悪く、ものすごく遅かった。新しい5時間制限も使い切り、週次上限の35%も使ったのに、Opus がはるかに少ない時間と費用でやっていた水準にはほとんど届かなかった
    この情報をどう判断するかは任せるが、金の無駄に見える

    • Fugu は独立したモデルではなく、OpenAI や Anthropic など複数の既存 SaaS モデルを裏で呼び出し、応答を集約して結果を作る構造だ
      複数の AI モデルの結果を組み合わせたうえで、自社の独自モデルで最終結果を作ると、単一のバックエンドモデルより品質が良くなると主張しているが、その自社モデルが本当に存在するのか、十分に有能なのか疑わしい
      たとえ主張が正しいとしても、Claude Code のようなクライアント側で、バックグラウンドモデルと同程度の性能のモデルに最終結果を生成させれば簡単に実装できそうで、サービスには怪しいにおいがする
    • Unity の代わりに Godot 向けに似たサービスを提供している立場からすると、Opus のような上位モデルを使えば、$20 プランが1つのプロンプトで消費されるのはあり得る話だ
      API 料金をそのまま払い、10倍の補助を負担できなければそうなる
    • Cursor で Fable をテストしてみた。作ったデータサイトをあまり「Claude っぽく」見えないようにするアイデアを尋ねたところ、10分で $40 を使いながら、最も役に立たず、最も Claude っぽい CSS スタイリングを吐き出した
      そのウェブサイト自体は Opus で作ったものなので、結果は Opus より悪かったとも言える
      米国モデルでも同じ経験をしたので、もしかするとそれらのアジア系モデルも Mythos 系なのかもしれない
    • どの Unity MCP を使っているのか気になる
      公式 MCP を試しているところだが、ほかの人たちが何を使っているのか知りたい
      有名な coplay のほうではパッケージ競合に遭遇した
    • ウェブ検索/調査でも似たようなもので、Opus と比べると悪かった
      半分は見落とし、残り半分は古い情報だったか、検証していなかった
  • Fugu Ultra は実際にはモデルではなく、複数モデルにルーティングするシステム、クラウドハーネスに近いものに見え、OpenRouter の Fusion に似ている
    「単一の巨大モデルではなく、Fugu は学習済みのマルチエージェント・オーケストレーションシステムである。交換可能な基盤モデルのプールへタスクをルーティングし、自分自身のインスタンスを再帰的に呼び出すよう訓練された言語モデルだ。」 - https://openrouter.ai/sakana/fugu-ultra
    [0] https://sakana.ai/fugu/
    [1] https://openrouter.ai/openrouter/fusion

  • 「Mythos-like」という表現がそろそろうっとうしい
    一般ユーザーにはベンチマークを見る以外に比較する方法がない

    • 「Mythos-like」は単に噂で過剰に宣伝されたという意味で、ここでは正しく使われている表現だ
    • アジアの AI スタートアップも大胆な主張をしている一方で、実際に比較する方法はなく、Trump の介入の核心も Faible を蒸留できないようにすることだったと見られる
    • 公開ベンチマークもないのでは?
  • 信頼できるベンチマークがないなら、これらが Mythos と似ているのは、テキストを入力として受け取りテキストを出力するという意味でしかない

    • もうベンチマークはほとんど見ていない
      新しいモデルが出たら、うちの大規模な独自システムソフトウェアのコードベースと実際のリリース製品、またはいつかリリースされるプロジェクトに直接使ってみる
      どのモデルが作業をよりうまく、あるいは速くしてくれるかはかなり明確で、今は必要なだけ使えるトークン予算があるので恵まれている
      ベンチマーク、評価、マーケティング、システムカードのようなものは不要で、ウェブではヒントや実務上のやり方、リリース情報だけ読む
      同僚とは経験を共有するが、それ以外はすべてノイズだ
    • Mythos のように過剰宣伝されたのなら、それも「Mythos-like」のリストに追加できる
      おそらく欠けているのは、CEO が「われわれのモデルはインターネット上に公開するには危険すぎるので、手遅れになる前に誰かが止めるべきだ」と世間に警告する場面だろう
    • 論文にベンチマークがある: https://arxiv.org/abs/2606.21228
  • 投資家リストが印象的だ: https://sakana.ai/company-info/?lang=en
    数日前には HN の見出しにも上がっていて、コメントは100件を超えていた: https://news.ycombinator.com/item?id=48624782

    • これらの会社は以前にモデルを出したことがあるのか?
      いきなり Mythos 級モデルを出したとは信じがたい
      DeepSeek、Z.ai、Alibaba/Qwen はずっと長く取り組んできており、この18か月間、性能を着実に引き上げたモデルを出し続けてきた
      以前のリリースが何もない新興企業が突然 Mythos 級モデルを出したというのは信じにくい
    • 昨年はかなり屈辱的な撤回もあった
      https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
  • 今年が終わる前に、「安全上の懸念」を理由に外国製 LLM の禁止が出そうな気がする
    実際の性能とは関係ないだろう
    ただし Anthropic は Mythos 系システムの基準線を作ってしまっており、その緩く定義された基準に合うものは一般大衆にとって危険だと扱われそうだ

    • 実際にはどう機能し得るのか?
    • そうなれば米国技術にはさようなら、中国にはようこそ、ということになりそうだ
      誰も待ちはしないし、すでに出てしまったジーニーを瓶に戻すことはできない
    • モデルが進歩しても実際の危険はないかのように話すのは馬鹿げている
      現時点で賢いことを言っているのは Claude だけのように感じる別の現実に住んでいる気分だ
      人間が書いた文章はほとんどすべて、幻覚と見せかけのたわごとのように見える
  • 皮肉な見方をすれば、モデルがまともでさえあれば、Mythos級だという主張に反論するのは難しい
    もうMythosを使えないからだ

    • Mythosみたいなものって何なのか?
      アクセス権がなかった者として気になる
  • 第一印象は「第三者ベンチマークがないなら失せろ」だ
    個人的にはこの2社はどちらも聞いたことがない
    市場最高モデルと肩を並べるという言葉を、そのまま信じろというのか?
    Sakanaは自社モデルを「Orchestration Model」と説明しているが、つまり実際には複数のモデルをつなぎ合わせたものという意味なのか?

    • 良いモデルを作るのは実際それほど難しいのか、それとも学習に投入するリソース規模が核心なのか?
      本当に分からないので聞いている
      もちろん些細なことではないだろうが、既知の既存手法の上に構築するのに、世界最高レベルの秘匿知識が必要なのか?
      まだ探索すべき低くぶら下がった果実が多く、時間とリソースが制約要因という印象だ
    • 最近HNに上がったリリース投稿のコメントでは、実際のモデルというよりOpenRouterに近いと見る雰囲気だった
    • 自分の印象ではその通り
      新しいモデルの混合体というより、何らかの動的な方法でその場で接着剤を塗るような構造だと主張しているように見える
      当時の反応もここで見られる: https://news.ycombinator.com/item?id=48624782(6日前、244ポイント、コメント133件)
    • Anthropicは第三者ベンチマークを出していたのか?
      その時もそう言っていたのか?
      重要ではあるが、その態度は間違っている
  • https://arena.ai/leaderboardベンチマークがなければ100%詐欺だと見る単純な人間だ

    • ARC AGIと比べるとどうなの?
  • ここにある多くのコメントと同じく、自分もFuguと他のいくつかのモデルをテストしたが、かなり高価なモデルだった
    $20ではワークフロー全体を終えるには足りず、Opusでは可能だった
    もちろんOpusでも最高の結果を望むなら、最初からプロンプトをもっと練る必要があるかもしれないが、今のところはそういう経験だ
    次のテストはエージェント型システムで試して、性能を見る予定だ