少なくともフラグがあるほうが、ずっと有用そうですね。最頻値とそれ以外だけを別の表記にしてくれてもいいのではないかと思います。

 
alfenmage 6 일 전 | 親コメント | トピック: データベースは本当に必要か (dbpro.app)

そのレベルというのが具体的にどの程度のレベルなのか、お前がそのレベルだと評価した理由は何なのか、論理・ファクト・科学・統計のうち2つ以上を使って話してみろ うんうん

 
alfenmage 6 일 전 | 親コメント | トピック: データベースは本当に必要か (dbpro.app)

違うと言ったらみんなイルベなのか? 俺、慶尚道の人間なんだけど?

 

2時間もやれば色覚異常になりそうです。

 
shintwl 6 일 전 | 親コメント | トピック: LLMでできる非定型な仕事 7選 (kdnuggets.com)

悪魔の代弁者のようなものは、GeminiのGemsのような機能で設定しておけると便利そうですね

 

SWE-Bench-Pro daily benchmark(キュレーションされたセット)でclaude codeを見ると、興味深い点が見える。

4/10〜4/20の区間ではruntimeが半分(653s→345s)、tool callが半分(3.3K→1.8K)、トークンは−18%減ったのに、pass rateはむしろ+16pp上がっている。4つの軸がすべて良い方向に同時に動くのは、よくあるパターンではない。

その過程で起きた事故3件が4/23のpostmortemだが、見ると全部「トークン/latencyを減らそうとして」起きたものだ。

一方、codex(gpt-5.4-xhigh)は同じ期間で数字がほとんど動いていない。pass rateは56%前後で固定、トークン/runtime/tool callもclaude codeの2倍水準のまま

 

使っている人はいなくても、自分ひとりでせっせと開発している自作の相棒 npm ライブラリを性能最適化中なんですが、
考えていた仮説はベンチマークを回してみたらほとんど全部ダメだという結論になったので、こいつで追加の性能最適化案を一度洗い出してみようと思います

 

「そうすべき」というよりは、「そうしたほうがいい」程度ではないでしょうか。

 

claude.aiのWebも全体的に細かく使い勝手が落ちている感じ…。トークンを節約するためにメモリも切りました。

 

この告知を見てから、むしろAnthropicをさらに信頼できなくなった感じ。

上に関連記事が2本あるけど、2本は7か月差の投稿です。問題はどちらも同じく3つずつ。

最近のClaude品質低下イシュー3件の事後分析 2025-09-19
最近のClaude Code品質報告に関するアップデート 2026-04-24

 

障害のポストモーテムではなく、コスト削減のポストモーテムなのでは?

 

これが正解なんだけど、言い訳が長いね(笑)

 

私はたった5ドル分のクレジットくらい腹が立ってる!!

 
plumpmath 6 일 전 | 親コメント | トピック: Linux向け Windows 9x サブシステム (social.hails.org)

ああ、coLinux(笑) -_- 懐かしい名前。まあ今はWSLがあっても使わないけど、Windows 95+Linux これはちょっと惹かれる。

 
myc0058 6 일 전 | 親コメント | トピック: データベースは本当に必要か (dbpro.app)

典型的な机上コーディングですね。

 

どうして障害原因の3つ全部がコスト削減と直接関係してるんでしょうねwwwww
性能が低下するほど、GPUリソースが本当にかなり逼迫しているみたいですね……

 

社内スタッフに実際の公開ビルドの使用を義務付け、社内テスト用ビルドとの乖離を減らします。
はははは

 

SOTA の座を見つけたのはずいぶん前のことです..