skageektp 2025-12-24 | 親コメント | トピック: ローカルコーディングモデルガイド (aiforswes.com) 遠い問題だよ ashbyash 2025-12-23 | 親コメント | トピック: a16zが発行した2025年B2C AIアプリ総括[翻訳記事] (blogbyash.com) Gemini 3はそれでもかなり良かったですね。毎月さらに良いモデルが出てくるので、選ぶのもひと仕事な気がします、本当に ashbyash 2025-12-23 | 親コメント | トピック: a16zが発行した2025年B2C AIアプリ総括[翻訳記事] (blogbyash.com) 詳しくご覧いただき、ありがとうございます。 あ、はい、ハルシネーションで合っているようですね。細かく確認しきれなかった点、ご容赦ください…… ahwjdekf 2025-12-23 | 親コメント | トピック: ローカルコーディングモデルガイド (aiforswes.com) だからMacBook Airが問題なんだ。 laeyoung 2025-12-23 | 親コメント | トピック: a16zが発行した2025年B2C AIアプリ総括[翻訳記事] (blogbyash.com) ashbyashさんにお聞きしたいことがあり、コメントを一つ残します。 Anthropic Claude (3.5 Sonnet) コード生成・論理性能が最強で、Cursor統合により開発者・専門職の40%が好む。安全性を強調しているため企業での採用も増加↑(原文: "Claude 3.5 マルチモーダル統合")。 と要約してくださっていましたが、投稿された翻訳文と原文をどちらも見ても、"3.5 Sonnet" への言及や内容は一つもありませんでした。AI要約を使われたため、ハルシネーションのせいなのでしょうか。多くのFoundation modelのknowledge cutoffが昨年末から今年初めだとすると、Sonnet 3.5がもっともらしく見えるので、AIが空白を埋めてしまったように見えます。(私もGemini Libraryを作るときにAIに任せたら、自分が知っている最新のGemini-1.5を使って作ってきたんですよね……) euphcat 2025-12-23 | 親コメント | トピック: 「AIニュースを1か月見逃すだけで出遅れる」:Google共同創業者セルゲイ・ブリンの告白 (aisparkup.com) そう言われてみれば、そうですね(笑) aqqnucs 2025-12-23 | 親コメント | トピック: Claude CodeにネイティブLSPサポート機能を追加 (github.com/anthropics) serena を使っていましたが、やはりビルトインが正解ですね mammal 2025-12-23 | 親コメント | トピック: 「AIニュースを1か月見逃すだけで出遅れる」:Google共同創業者セルゲイ・ブリンの告白 (aisparkup.com) セルゲイ・ブリンの動画を要約した文章の、さらに翻訳された文章の要約をGeekNewsで消費しています onestone 2025-12-23 | 親コメント | トピック: 自分でキャリアを設計しなければ、誰かが代わりに設計することになる(2014年) (gregmckeown.com) 人生をあまりに忙しく生きていると、方向性を定める余裕がまったくなくなってしまう気がします。 あまり無理をしすぎず、自分自身を一歩引いて十分に見つめ直す時間をつくれたらいいなと思います。 yangeok 2025-12-23 | 親コメント | トピック: さあ、Postgresを自分でホストしてみよう (pierce.dev) ストレージも11ナインを保証してくれるなら、クラウドを使うのと同じようなものですし、運用が難しいからクラウドを使うんですよね(笑) vndk2234 2025-12-23 | 親コメント | トピック: Spotify全体バックアップを公開 (annas-archive.li) 義賊と無法者の間、そのどこか…… crawler 2025-12-23 | 親コメント | トピック: AIの長期タスク遂行能力の測定 (metr.org) とても良いベンチマークのようですね。 最近のAIコーディングツールを見ると、あらかじめPlanを立ててAgentモードで動作させるケースが多いですが、これが本当に長期的な成功率に有意な影響を与えるのかも気になります。 xguru 2025-12-23 | 親コメント | トピック: 2025年末に振り返るAIについての考察 (antirez.com) Andrej Karpathyの2025年LLM年次レビュー とあわせて読むとよいですね xguru 2025-12-23 | 親コメント | トピック: ディズニー・イマジニアリング、次世代ロボットキャラクター「オラフ」を公開 (disneyparksblog.com) 動いている様子は以下の動画で見られます。(2:52から始まるように設定してあります) Olaf: Bringing an Animated Character to Life in the Physical World jungmin1237 2025-12-23 | 親コメント | トピック: Windows 11にアップグレードできないのだから、もう悩ませないでほしい (idiallo.com) さらに腹が立つのは、TPM 2.0に対応しているCPUなのに、アップグレードできないCPUもあることです xguru 2025-12-23 | 親コメント | トピック: 自分でキャリアを設計しなければ、誰かが代わりに設計することになる(2014年) (gregmckeown.com) まったく同感する文章です。 仕事に没頭していると、その仕事にばかり気を取られて、ほかのところをまったく見なくなってしまうことが多いんですよね。 私の場合、そうしてからかなり遅れて別の選択をしたことが何度かあります。 少しずつでも時間を取って、振り返る時間を持つことをおすすめします。 sacru2red 2025-12-23 | 親コメント | トピック: Windows 11にアップグレードできないのだから、もう悩ませないでほしい (idiallo.com) Hacker Newsの意見で、MS Officeに独占的なソフトウェアのような話をするのはもう昔のことですね。 Office 365以降は、Web版もかなり良くなっていますから。 jk34011 2025-12-23 | 親コメント | トピック: a16zが発行した2025年B2C AIアプリ総括[翻訳記事] (blogbyash.com) それぞれのAIについて思っていた印象とだいたい同じですね 人が実際に感じるところは、結局どれも似たり寄ったりなのかもしれません Meta以外は全部使ってみましたが GPT > 価格の割にはこれといった強みがない。性能はまずまず Gemini > 他のAIに比べると専門性がやや弱い。その代わりGoogleのものがいろいろ付いてきて、気軽に使いやすい Claude > いちばん気に入ってるけど…Proプランを使うにはトークンがかなり渋い気がする Perplexity > 検索専用、それ以外にあえて使う必要ある? 最近は他のAIもWeb接続できるのであまり使わない Grok > お遊び用 GPT > Claude > GPT+Cluade > Claude > Gemini の順で使ってみて感じたことです。PerplexityやGrokは途中で1か月くらい試しただけで… mstorm 2025-12-23 | 親コメント | トピック: エンジニアの転職を止める経済的介入の方法 (codegood.co) 同意します。 t7vonn 2025-12-22 | 親コメント | トピック: インターネットの果て (hmpg.net) もうコンピューターの電源を切っても大丈夫です コメントをさらに読み込む
遠い問題だよ
Gemini 3はそれでもかなり良かったですね。毎月さらに良いモデルが出てくるので、選ぶのもひと仕事な気がします、本当に
詳しくご覧いただき、ありがとうございます。
あ、はい、ハルシネーションで合っているようですね。細かく確認しきれなかった点、ご容赦ください……
だからMacBook Airが問題なんだ。
ashbyashさんにお聞きしたいことがあり、コメントを一つ残します。
と要約してくださっていましたが、投稿された翻訳文と原文をどちらも見ても、"3.5 Sonnet" への言及や内容は一つもありませんでした。AI要約を使われたため、ハルシネーションのせいなのでしょうか。多くのFoundation modelのknowledge cutoffが昨年末から今年初めだとすると、Sonnet 3.5がもっともらしく見えるので、AIが空白を埋めてしまったように見えます。(私もGemini Libraryを作るときにAIに任せたら、自分が知っている最新のGemini-1.5を使って作ってきたんですよね……)
そう言われてみれば、そうですね(笑)
serena を使っていましたが、やはりビルトインが正解ですね
セルゲイ・ブリンの動画を要約した文章の、さらに翻訳された文章の要約をGeekNewsで消費しています
人生をあまりに忙しく生きていると、方向性を定める余裕がまったくなくなってしまう気がします。
あまり無理をしすぎず、自分自身を一歩引いて十分に見つめ直す時間をつくれたらいいなと思います。
ストレージも11ナインを保証してくれるなら、クラウドを使うのと同じようなものですし、運用が難しいからクラウドを使うんですよね(笑)
義賊と無法者の間、そのどこか……
とても良いベンチマークのようですね。
最近のAIコーディングツールを見ると、あらかじめPlanを立ててAgentモードで動作させるケースが多いですが、これが本当に長期的な成功率に有意な影響を与えるのかも気になります。
Andrej Karpathyの2025年LLM年次レビュー とあわせて読むとよいですね
動いている様子は以下の動画で見られます。(2:52から始まるように設定してあります)
Olaf: Bringing an Animated Character to Life in the Physical World
さらに腹が立つのは、TPM 2.0に対応しているCPUなのに、アップグレードできないCPUもあることです
まったく同感する文章です。
仕事に没頭していると、その仕事にばかり気を取られて、ほかのところをまったく見なくなってしまうことが多いんですよね。
私の場合、そうしてからかなり遅れて別の選択をしたことが何度かあります。
少しずつでも時間を取って、振り返る時間を持つことをおすすめします。
Hacker Newsの意見で、MS Officeに独占的なソフトウェアのような話をするのはもう昔のことですね。
Office 365以降は、Web版もかなり良くなっていますから。
それぞれのAIについて思っていた印象とだいたい同じですね
人が実際に感じるところは、結局どれも似たり寄ったりなのかもしれません
Meta以外は全部使ってみましたが
GPT > 価格の割にはこれといった強みがない。性能はまずまず
Gemini > 他のAIに比べると専門性がやや弱い。その代わりGoogleのものがいろいろ付いてきて、気軽に使いやすい
Claude > いちばん気に入ってるけど…Proプランを使うにはトークンがかなり渋い気がする
Perplexity > 検索専用、それ以外にあえて使う必要ある? 最近は他のAIもWeb接続できるのであまり使わない
Grok > お遊び用
GPT > Claude > GPT+Cluade > Claude > Gemini の順で使ってみて感じたことです。PerplexityやGrokは途中で1か月くらい試しただけで…
同意します。
もうコンピューターの電源を切っても大丈夫です