使ってみましたが、gpt-5.4自体の性能にはとても満足しているものの、たまに直前のメッセージではなくその前のメッセージに対する返答を生成することがあるなど、そこまで安定しているわけではなく、long contextを使うと needle in the haystack task での性能が50%以下に落ちるというレポートもあるので、あえておすすめしたいとは思いません。とはいえ、needle in the haystack task 自体が long-context 性能の測定に適したベンチマークなのかは分かりません。いずれにせよ、Codex は compaction にもあまり時間がかからず、compact 後も文脈をあまり忘れないので、そのまま使っても特に大きな不便はありませんでした。
App Storeの売上は伸びたのに、開発者にとっては生計維持が難しいというのは、うーん……本当に妥当な分析なんでしょうか? こういうのはたいてい先行者優位が強いので、レビューが多いものから使うことになりませんか? 特に有料ならなおさら……
使ってみましたが、gpt-5.4自体の性能にはとても満足しているものの、たまに直前のメッセージではなくその前のメッセージに対する返答を生成することがあるなど、そこまで安定しているわけではなく、long contextを使うと needle in the haystack task での性能が50%以下に落ちるというレポートもあるので、あえておすすめしたいとは思いません。とはいえ、needle in the haystack task 自体が long-context 性能の測定に適したベンチマークなのかは分かりません。いずれにせよ、Codex は compaction にもあまり時間がかからず、compact 後も文脈をあまり忘れないので、そのまま使っても特に大きな不便はありませんでした。
とても楽しそうに仕事をしているのが伝わってきます
最近の Anthropic のリリース速度はすごいですね。
開発ツールを改善しながら、それによって自社の開発自体もさらに高速化するフライホイールの構築が完成した感じです。
毎日何かをひとつずつ投入してくる、いかにもスタートアップらしい雰囲気が強く感じられます。
OpenAI にかなり刺激を与えていそうです
シャドウブローカー! 久しぶりに『Mass Effect 2』を思い出しました。 https://masseffect.fandom.com/wiki/Shadow_Broker_(enemy)
最近ずっと思っていることですが、まさにぴったりだと思います。
今は本当に、クリックするだけで出てくるソフトウェアが増えてきて、MVP というものはもう古くなってしまった気がします。
アイデアだけで投資を受けられた時代は終わり、頭の中にあるものをコードにするのは当たり前になってしまったので、
少なくともユーザーが「これ、いい感じだな」と思うレベルまで作らないといけなくて、それを MLP と呼ぶのもある程度は理解できます。
Hacker Newsでも Show に投稿が多すぎて中止するかもしれないという話もありますね。
こうしたことを通じて、これからは徐々に、関心を持って見てもらえるプロジェクトがもっと増えていくのでしょう
ハングルフォントはずっと難しいでしょうね?
Hacker Newsのコメントを見て爆笑しましたね
"最初のコミットのzipファイル内で
./frontend/.env.localと./backend/.envが漏洩していた""だから名前がOSINT(Open Source Intelligence)なんだ。全部公開されている"
Show GNには適していないため移動しました。
投稿の際はShowの利用方法を参照してください。
ああ……どうりで私もコンテキストウィンドウが小さすぎると思っていたのですが、別途設定してあげる必要があったんですね。
収穫加速の法則?
Windowsのメモ帳も、Apple Notesも……今ではみんなMarkdownをサポートするようになりましたね。
AIのおかげで、Markdownが世界を支配していっている感じです。
2004年にMarkdownを作った John Gruberは、こんな世界が来ると予想していたのでしょうか?(笑)
Windowsをサポートしてくれないのは、毎回やはり残念ですね。
経営陣はこれを聞いてうなずき、
問題を認め、
優先順位を調整すると言う
> ここから先で詰まる
ThinkPad、好きです。トラックポイントに魅力がありますよね。昔はキーボードもThinkPadキーボードを熱心に使っていたのですが…(泣)
いい文章ですね。
「1. 遅くなることを戦略にする」のようなことを最近ちょうど考えていたので、まさにタイミングのいい文章を読めそうです。
講義資料が古くならないように急いで作って、ユーレカラボの講義をリリースしようとして、ずっと作り続けているみたいです…
ps. 7時間前に AgentHub というのもまた作って公開されましたね 🫢
より古典的に見ると、単に古典的な情報検索技術が、より局所的なレベルで再活用されているようですね
興味深く拝見しました。^^
お金を惜しんではいけない最後の領域なのに、という感じですね(笑)
devoteボタンが必要