unsure4000 6 일 전 | 親コメント | トピック: 16進数エディタはバイトを色分けして表示すべき (simonomi.dev) 少なくともフラグがあるほうが、ずっと有用そうですね。最頻値とそれ以外だけを別の表記にしてくれてもいいのではないかと思います。 alfenmage 6 일 전 | 親コメント | トピック: データベースは本当に必要か (dbpro.app) そのレベルというのが具体的にどの程度のレベルなのか、お前がそのレベルだと評価した理由は何なのか、論理・ファクト・科学・統計のうち2つ以上を使って話してみろ うんうん alfenmage 6 일 전 | 親コメント | トピック: データベースは本当に必要か (dbpro.app) 違うと言ったらみんなイルベなのか? 俺、慶尚道の人間なんだけど? tangokorea 6 일 전 | 親コメント | トピック: 16進数エディタはバイトを色分けして表示すべき (simonomi.dev) 2時間もやれば色覚異常になりそうです。 shintwl 6 일 전 | 親コメント | トピック: LLMでできる非定型な仕事 7選 (kdnuggets.com) 悪魔の代弁者のようなものは、GeminiのGemsのような機能で設定しておけると便利そうですね amond 6 일 전 | 親コメント | トピック: AnthropicのClaude Code障害ポストモーテム: 2025年4月23日 (anthropic.com) SWE-Bench-Pro daily benchmark(キュレーションされたセット)でclaude codeを見ると、興味深い点が見える。 4/10〜4/20の区間ではruntimeが半分(653s→345s)、tool callが半分(3.3K→1.8K)、トークンは−18%減ったのに、pass rateはむしろ+16pp上がっている。4つの軸がすべて良い方向に同時に動くのは、よくあるパターンではない。 その過程で起きた事故3件が4/23のpostmortemだが、見ると全部「トークン/latencyを減らそうとして」起きたものだ。 一方、codex(gpt-5.4-xhigh)は同じ期間で数字がほとんど動いていない。pass rateは56%前後で固定、トークン/runtime/tool callもclaude codeの2倍水準のまま click 6 일 전 | 親コメント | トピック: OpenAI、GPT-5.5を発表:「実務のための新たな次元の知能」 (openai.com) 使っている人はいなくても、自分ひとりでせっせと開発している自作の相棒 npm ライブラリを性能最適化中なんですが、 考えていた仮説はベンチマークを回してみたらほとんど全部ダメだという結論になったので、こいつで追加の性能最適化案を一度洗い出してみようと思います skageektp 6 일 전 | 親コメント | トピック: 16進数エディタはバイトを色分けして表示すべき (simonomi.dev) 「そうすべき」というよりは、「そうしたほうがいい」程度ではないでしょうか。 unsure4000 6 일 전 | 親コメント | トピック: AnthropicのClaude Code障害ポストモーテム: 2025年4月23日 (anthropic.com) claude.aiのWebも全体的に細かく使い勝手が落ちている感じ…。トークンを節約するためにメモリも切りました。 xguru 6 일 전 | 親コメント | トピック: AnthropicのClaude Code障害ポストモーテム: 2025年4月23日 (anthropic.com) この告知を見てから、むしろAnthropicをさらに信頼できなくなった感じ。 上に関連記事が2本あるけど、2本は7か月差の投稿です。問題はどちらも同じく3つずつ。 最近のClaude品質低下イシュー3件の事後分析 2025-09-19 最近のClaude Code品質報告に関するアップデート 2026-04-24 colus001 6 일 전 | 親コメント | トピック: AnthropicのClaude Code障害ポストモーテム: 2025年4月23日 (anthropic.com) 障害のポストモーテムではなく、コスト削減のポストモーテムなのでは? colus001 6 일 전 | 親コメント | トピック: AnthropicのClaude Code障害ポストモーテム: 2025年4月23日 (anthropic.com) これが正解なんだけど、言い訳が長いね(笑) skageektp 6 일 전 | 親コメント | トピック: AnthropicのClaude Code障害ポストモーテム: 2025年4月23日 (anthropic.com) 私はたった5ドル分のクレジットくらい腹が立ってる!! kaydash 6 일 전 | 親コメント | トピック: OpenAI、GPT-5.5を発表:「実務のための新たな次元の知能」 (openai.com) opus4.6か.. plumpmath 6 일 전 | 親コメント | トピック: Linux向け Windows 9x サブシステム (social.hails.org) ああ、coLinux(笑) -_- 懐かしい名前。まあ今はWSLがあっても使わないけど、Windows 95+Linux これはちょっと惹かれる。 myc0058 6 일 전 | 親コメント | トピック: データベースは本当に必要か (dbpro.app) 典型的な机上コーディングですね。 crawler 6 일 전 | 親コメント | トピック: AnthropicのClaude Code障害ポストモーテム: 2025年4月23日 (anthropic.com) どうして障害原因の3つ全部がコスト削減と直接関係してるんでしょうねwwwww 性能が低下するほど、GPUリソースが本当にかなり逼迫しているみたいですね…… sudoeng 6 일 전 | 親コメント | トピック: AnthropicのClaude Code障害ポストモーテム: 2025年4月23日 (anthropic.com) 社内スタッフに実際の公開ビルドの使用を義務付け、社内テスト用ビルドとの乖離を減らします。 はははは brainer 6 일 전 | 親コメント | トピック: OpenAI、GPT-5.5を発表:「実務のための新たな次元の知能」 (openai.com) SOTA の座を見つけたのはずいぶん前のことです.. ragingwind 6 일 전 | 親コメント | トピック: GStack: Y Combinator CEOが作ったAIコーディングエージェントフレームワークのYouTube紹介 (youtube.com) 動画で使用されたツール https://www.conductor.build/ コメントをさらに読み込む
少なくともフラグがあるほうが、ずっと有用そうですね。最頻値とそれ以外だけを別の表記にしてくれてもいいのではないかと思います。
そのレベルというのが具体的にどの程度のレベルなのか、お前がそのレベルだと評価した理由は何なのか、論理・ファクト・科学・統計のうち2つ以上を使って話してみろ うんうん
違うと言ったらみんなイルベなのか? 俺、慶尚道の人間なんだけど?
2時間もやれば色覚異常になりそうです。
悪魔の代弁者のようなものは、GeminiのGemsのような機能で設定しておけると便利そうですね
SWE-Bench-Pro daily benchmark(キュレーションされたセット)で
claude codeを見ると、興味深い点が見える。4/10〜4/20の区間ではruntimeが半分(653s→345s)、tool callが半分(3.3K→1.8K)、トークンは−18%減ったのに、pass rateはむしろ+16pp上がっている。4つの軸がすべて良い方向に同時に動くのは、よくあるパターンではない。
その過程で起きた事故3件が4/23のpostmortemだが、見ると全部「トークン/latencyを減らそうとして」起きたものだ。
一方、codex(gpt-5.4-xhigh)は同じ期間で数字がほとんど動いていない。pass rateは56%前後で固定、トークン/runtime/tool callも
claude codeの2倍水準のまま使っている人はいなくても、自分ひとりでせっせと開発している自作の相棒 npm ライブラリを性能最適化中なんですが、
考えていた仮説はベンチマークを回してみたらほとんど全部ダメだという結論になったので、こいつで追加の性能最適化案を一度洗い出してみようと思います
「そうすべき」というよりは、「そうしたほうがいい」程度ではないでしょうか。
claude.aiのWebも全体的に細かく使い勝手が落ちている感じ…。トークンを節約するためにメモリも切りました。
この告知を見てから、むしろAnthropicをさらに信頼できなくなった感じ。
上に関連記事が2本あるけど、2本は7か月差の投稿です。問題はどちらも同じく3つずつ。
最近のClaude品質低下イシュー3件の事後分析 2025-09-19
最近のClaude Code品質報告に関するアップデート 2026-04-24
障害のポストモーテムではなく、コスト削減のポストモーテムなのでは?
これが正解なんだけど、言い訳が長いね(笑)
私はたった5ドル分のクレジットくらい腹が立ってる!!
opus4.6か..
ああ、coLinux(笑)
-_-懐かしい名前。まあ今はWSLがあっても使わないけど、Windows 95+Linux これはちょっと惹かれる。典型的な机上コーディングですね。
どうして障害原因の3つ全部がコスト削減と直接関係してるんでしょうねwwwww
性能が低下するほど、GPUリソースが本当にかなり逼迫しているみたいですね……
社内スタッフに実際の公開ビルドの使用を義務付け、社内テスト用ビルドとの乖離を減らします。
はははは
SOTA の座を見つけたのはずいぶん前のことです..
動画で使用されたツール https://www.conductor.build/