人間の確証バイアスや無批判な思考は本当に恐ろしいです

 

じゃあ、公式ドキュメントをLLMに読ませればいいってことだね!

 

ある議論についての主張をGPTに尋ねた内容を、そのまま持ってくるチームメンバーたちを見て、ため息をつく日々を送っています。

 

少なくありませんね……。スレッドを見て回っていると、本当にありとあらゆることをChatGPTに聞く人が思ったよりずっと多いんですよね。しかも、ChatGPTが出力した内容を検証すらせずにそのまま投稿することもあって、代表的なのが法律に関する事柄です。判例のようなものをどんどん載せるのに、いざ検索してみると存在しない判例番号だったり、法令もおかしな内容で載せていたりするのに、プロフィールを見ると専門家の肩書きを付けているんです。
AIゾンビが蔓延しています

 
raykim 2025-04-10 | 親コメント | トピック: Google、Agent2Agentプロトコル(A2A)を発表 (developers.googleblog.com)

ベースモデルのハルシネーションを6シグマ水準で抑えるかたちで、こういうものを作れるとよいですね。マネージング役を担うエージェントや、そのほかコードレベルの補完によって十分に制御可能ということなのでしょうか。

 

RTFM: 公式ドキュメントをちゃんと読みましょう。

 

実際のサイト開発と運営まで、とても貴重な資料をありがとうございます。いつも興味深く拝見しています。

 

トスより大きい会社の話です〜

 

やはりベンチマークに細工はつきものですね。

 

感情への配慮をしない率直なマネージャーと、ラポールを保ちながら親切なマネージャーがいるとして、どちらのタイプのマネージャーがフィードバックを通じてチームメンバーの成長を後押しできるのだろうか。前の記事を読みながら、こんな疑問が湧きました。

私は確率のゲームだと思います。極めて低い確率を突破して成長する人はどこにでもいます。マネージャーは、そういう人をいったん脇に置いて、全体の確率を高めることに努めるべきだと思います。自分なりに確率を高める姿勢だと信じて行動しているマネージャーは、尊重されるに値すると思います。ただ、だからといって、普段からやってきたやり方をそのまま続けるだけでよいわけではありません。

 

Hacker Newsの反応、怖いですね…「1000万件? 冗談でしょ?」

 

チェックリストではないと言いながらも、自分のチェックリストにしなければなりませんね。

 

とても興味深い実験です

 

最近、Gemini の Time to first token が圧倒的に速いと思っていたけど、こういう理由があったのか……

 

公式ドキュメントを必ず見るべきだという点に、とても共感します。

 

コーディングを最初に教えるとき、この人がエラーメッセージを丁寧に読めるかどうかで、プログラマーとしての素質が最初に表れるように思います。

 

すべてではありませんが、ほとんどは共感できる項目ですね。

 

手工業に近いというのはまったく考えたことがありませんでしたが、とても共感しますね。
この観点で考えると、多くの現象が説明される気がします。