どのあたりが呆れるとお感じなのでしょうか

 
jjpark78 23 시간 전 | 親コメント | トピック: DeepSeek V4 Proモデルが期間限定で75%割引に (api-docs.deepseek.com)

はぁ……呆れますね、LLMが私の個人情報を盗んでいくという理屈だなんて……

 

ボードゲームの集まりで撮ったタイムラプスの共有用によく使っていました。
最近はGalaxyとPixelがAirDropのような共有に対応して、少し用途が曖昧になりました。
もちろんデスクトップに送るときは、今でも便利です。

 
xguru 1 일 전 | 親コメント | トピック: GhosttyがGitHubを離れます (mitchellh.com)

Mitchell Hashimoto が HN のコメントでも本当に涙が出たと書いていたので見てみたら、
https://x.com/mitchellh/status/2049213597419774026
GitHub ユーザー1299番で、2008年2月に登録したそうです。

最近は GitHub の問題が多いようですね。数時間前にも GitHubで現在障害発生中 が上がっていました。

 

Windows にインストールして試してみました。

  1. モデル選択リストには ollama のような Local LLM はありませんね。
  2. Warp の説明には自然言語での会話は「英語」で入力するように書かれているので、韓国語の自動翻訳機能のようなものはないということなのか、よく分かりません。
 

こういうものを適用しても、実際にコーディングする場面ではあまり大きな助けにはならない気がしますね……codex のプランを置いてエージェントを回す程度の難易度の開発だから、ということなんでしょうね(笑)

 

1年前ならClaudeを強く勧めていましたが、最近はCodex appを強く勧めます。

 
botplaysdice 1 일 전 | 親コメント | トピック: 自分より優秀な人を採用する方法 (longform.asmartbear.com)

本当に韓国では採用が難題の一つのようですね。選び方を間違えると、解雇もできないし……(この問題で訴訟になる創業者も多いと聞いています;;;)積極的であるべきスタートアップでも、結局は無難な選択をしなければならない状況。

 
kallare 1 일 전 | 親コメント | トピック: GitHub Copilotが従量課金制に移行 (github.blog)

月額20ドルのスタックで月商10Kドルの会社を複数運営する方法 では
「Copilotの核心的なトリック: Microsoftはトークン単位ではなくリクエスト単位で課金し、その『リクエスト』はチャットボックスに入力する1件の内容。エージェントが30分間コードベース全体を分析し、数百のファイルを変更しても約0.04ドルしかかからない」
...が可能だったようですが、もう塞がれたんですね..

 
slowandsnow 1 일 전 | 親コメント | トピック: GitHub Copilotが従量課金制に移行 (github.blog)

安いのが長所で、それ以外は全部短所だったのに、使う理由がなくなった気がする。

 

私もオスマニの話と似たようなものを全部ぶち込んで
アプリを作っていたところにこの話が出てきたので、ちょっと急いで書いたんですが、
オスマニも口で言うだけじゃなくて
Google Antigravityに自分が話したことを入れてくれていたら、もっとよかったんじゃないかと思います。
カパシもそうですが、もうただ作るつもりはなくて文章だけポンと投げて終わるような振る舞いは、うーん……という感じです!です

https://github.com/hang-in/tunaFlow

 

3行要約

  • モデルよりもシステム(ハーネス)が成否を左右する: AIの性能はGPTやClaudeのようなモデル自体よりも、それを取り巻くプロンプト、ツール、サンドボックス、フィードバックループなど「ハーネス」と呼ばれる作業環境の設計によって左右される
  • ミスをルールとして固定する「ラチェット(Ratchet)」原則: AIのミスを単なる偶発的な失敗として片付けず、ルールドキュメント(AGENTS.mdのようなもの)やフックに即座に反映し、時間が経つほどシステムがより堅牢になるよう管理すべきである
  • モデルのせいではなく設定(Skill)の問題: AIがうまく仕事できないのは、モデルの知能不足よりもハーネス設計の不備が原因である場合が多く、望む成果物から逆算して必要な部品と制約条件を設計する工学的アプローチが不可欠である
 

参考にします。ありがとうございます。

 

昔、プロンプトでAをしてくれと明確に書いてあるのに、一定の確率でどうしても守られないので、mrkdwn boldで強調してみたり、二度書いてみたり、英語で書いてみたり、首尾呼応の形で書いてみたり、xmlで書いてみたりと、あれこれ試したのですが、それでも一定の確率でプロンプトを無視するんですよね…

 

でも、プロンプトでAして、Bはしないでと言ったときに、本当にきちんと理解してくれるならこういうアプローチは有効そうですが、AIサーバーの状態によって確率的にプロンプトを実行する場合でも、このアプローチは有効なのでしょうか?

 
aqqnucs 1 일 전 | 親コメント | トピック: GitHub Copilotが従量課金制に移行 (github.blog)

27倍ですか? すごい……

 

性能を下げるようなサイレントパッチを当てても気づかれないと思っているんでしょうけど、実際には人の勘というのも思った以上に鋭いので、自分の勘+コミュニティの人たちの話を総合すると、すぐに答えは出ます。

「それでお前に何ができるんだよw」って話なので、結局は仕方なく使ってるだけです……