dongho42 1 일 전 | 親コメント | トピック: ハーネスエンジニアリング:モデルより重要な作業環境設計の時代 (addyosmani.com) 昔、プロンプトでAをしてくれと明確に書いてあるのに、一定の確率でどうしても守られないので、mrkdwn boldで強調してみたり、二度書いてみたり、英語で書いてみたり、首尾呼応の形で書いてみたり、xmlで書いてみたりと、あれこれ試したのですが、それでも一定の確率でプロンプトを無視するんですよね… dongho42 1 일 전 | 親コメント | トピック: ハーネスエンジニアリング:モデルより重要な作業環境設計の時代 (addyosmani.com) でも、プロンプトでAして、Bはしないでと言ったときに、本当にきちんと理解してくれるならこういうアプローチは有効そうですが、AIサーバーの状態によって確率的にプロンプトを実行する場合でも、このアプローチは有効なのでしょうか? aqqnucs 1 일 전 | 親コメント | トピック: GitHub Copilotが従量課金制に移行 (github.blog) 27倍ですか? すごい…… dicebattle 1 일 전 | 親コメント | トピック: GPT 5.5 vs Opus 4.7、コーディング/プログラミングにより優れたモデルは? (reddit.com) 性能を下げるようなサイレントパッチを当てても気づかれないと思っているんでしょうけど、実際には人の勘というのも思った以上に鋭いので、自分の勘+コミュニティの人たちの話を総合すると、すぐに答えは出ます。 「それでお前に何ができるんだよw」って話なので、結局は仕方なく使ってるだけです…… dicebattle 1 일 전 | 親コメント | トピック: GPT 5.5 vs Opus 4.7、コーディング/プログラミングにより優れたモデルは? (reddit.com) codex専用モデルの5.3のときは、本当に話の前置きがなくて、コーディングだけはうまい部下社員と会話している感じでしたが、 5.4から少しずつしゃべるようになって、5.5からは半分くらいは正気に戻った気がします。 まだAPIを契約と言ったり、たまに英語と韓国語をめちゃくちゃに混ぜて話したりするので、「わかりやすく、できるだけ英語を抜いて話してくれ」と書かなければならないこともありますが。 それでも、コードを出す性能は体感では5.4を境にopusを超えたと思います。opus 4.7は出ましたが、触ってみる気にもなりませんでした。また「Anthropic」式のマーケティングなのが目に見えているので。 sacru2red 1 일 전 | 親コメント | トピック: stitchが流行らせた(?)DESIGN.mdを集めたサイト (getdesign.md) わあ、いいですね。共有ありがとうございます ly0738 1 일 전 | 親コメント | トピック: Tailscale、個人ユーザーは無制限のデバイス接続が可能に (tailscale.com) Tailscaleは神だ.. yungoun 1 일 전 | 親コメント | トピック: ハーネスエンジニアリング:モデルより重要な作業環境設計の時代 (addyosmani.com) でも、ハーネスは先週まではかなり売り込んでいたのに、今週からは静かですね……Anthropicの迷走とCodex 5.5が優れているからでしょうか…… joyfui 1 일 전 | 親コメント | トピック: 私の青はあなたの青と同じですか? (ismy.blue) 「あれ? これ前に見たことがあるような……」と思ったのですが、一緒に読むとよい記事にすぐリンクを付けてくれるんですね(笑) edunga1 1 일 전 | 親コメント | トピック: GitHub Copilotが従量課金制に移行 (github.blog) 何年も使っていますが、エージェントベースに移行していくにつれて、だんだん存在感が薄れてきていますね(笑)。 それでも、個人的なドキュメント作成や手でコーディングすることが多いので、なんだかんだでかなり助かっています。 クォータ増量なしで27倍レートになるなら、エージェント的コーディングは使えないレベルなのでは? xguru 1 일 전 | 親コメント | トピック: VibeVoice - オープンソースの最先端音声AIモデル (github.com/microsoft) VibeVoice - Microsoftの次世代オープンソース音声合成モデル GeekNewsでは初期にすぐ公開されましたが、問題があって VibeVoice-TTS のコードは削除されたようですね。 TTS は VibeVoice-Realtime だけが利用可能な状態のようです。 ここ数日、VibeVoice-ASR のために再び人気を集めているのをあちこちで見かけます。 https://simonwillison.net/2026/Apr/27/vibevoice/ Simon Willison がテストしたところ、Mac で uv と mlx-audio を使って1行のコマンドで実行でき、 1時間分の音声を 128GB M5 Max MacBook Pro で約 8分45秒 で処理したそうです。 話者分離がうまくできる Whisper と見ればよさそうです kurthong 1 일 전 | 親コメント | トピック: ハーネスエンジニアリング:モデルより重要な作業環境設計の時代 (addyosmani.com) 中身のない話をもっともらしく語る上級開発者の文章を、さらに分析までした内容ですね(個人的にGoogleが嫌いなので失礼します)。もちろん、現象への理解という観点からのアプローチは良い試みだと思います。 click 1 일 전 | 親コメント | トピック: ハーネスエンジニアリング:モデルより重要な作業環境設計の時代 (addyosmani.com) SDDみたいなものはもうとっくに hype が終わっていて、これからはハーネスなんでしょうね。 ハーネスで少し不思議なのは、学習データには明らかにないのに、モデルが harness という概念をすぐ理解していたことです。 もともと存在していた単語の意味をそのまま使っているからか、こちらから触れてもいないのに先に「harness を更新します」のような言及までしていました。 kimjoin2 1 일 전 | 親コメント | トピック: ハーネスエンジニアリング:モデルより重要な作業環境設計の時代 (addyosmani.com) だんだんマーケティング用語ばかりがものすごく増えている感じですね。 kaydash 1 일 전 | 親コメント | トピック: GitHub Copilotが従量課金制に移行 (github.blog) 大学生は? unknowncyder 1 일 전 | 親コメント | トピック: GPT 5.5 vs Opus 4.7、コーディング/プログラミングにより優れたモデルは? (reddit.com) 同感です これまで実際の体感とコミュニティの反応が食い違っていて、ずっと乖離感を覚えていましたね click 1 일 전 | 親コメント | トピック: GitHub Copilotが従量課金制に移行 (github.blog) 1年契約していたものを更新しなかったのは大正解でしたね Opusの27倍レートでお金を払って使うくらいなら、いっそClaude APIの料金プランを使うほうがいいと思います。 princox 1 일 전 | 親コメント | トピック: Tailscale、個人ユーザーは無制限のデバイス接続が可能に (tailscale.com) バッジが出た初日に付けました(笑) Tailscaleみたいな製品がもっと増えてほしいです。 wedding 1 일 전 | 親コメント | トピック: GitHub Copilotが従量課金制に移行 (github.blog) とっくに返金しました.. pmc7777 1 일 전 | 親コメント | トピック: Obscura - オープンソースのヘッドレスブラウザ (github.com/h4ckf0r0day) u/Total_Nectarine_3623 が作ったツールのようです。 https://www.reddit.com/r/ClaudeAI/s/9VO1vzO2zp 別の投稿を見ると、ONIST や CTF に関心があるようなので、情報セキュリティに興味がありそうで、巨大な1つのコミットで最初のリリースをしています。これを見るに、元のリポジトリでかなりバイブコーディングをした後、無数のコミットに分割されていて、そのまま公開するのは微妙なので1つにまとめた、という面もありそうですし、GitHub ハンドルも h4ckf0r0day であることを見ると、たいてい ONIST や、やや正攻法ではないタイプのツールは、もともと捨てアカで上げる伝統?のようなものがあります。 オープンソースへの信頼は積み上げていく必要がありますが、特に別の意図はなさそうですね。 コメントをさらに読み込む
昔、プロンプトでAをしてくれと明確に書いてあるのに、一定の確率でどうしても守られないので、mrkdwn boldで強調してみたり、二度書いてみたり、英語で書いてみたり、首尾呼応の形で書いてみたり、xmlで書いてみたりと、あれこれ試したのですが、それでも一定の確率でプロンプトを無視するんですよね…
でも、プロンプトでAして、Bはしないでと言ったときに、本当にきちんと理解してくれるならこういうアプローチは有効そうですが、AIサーバーの状態によって確率的にプロンプトを実行する場合でも、このアプローチは有効なのでしょうか?
27倍ですか? すごい……
性能を下げるようなサイレントパッチを当てても気づかれないと思っているんでしょうけど、実際には人の勘というのも思った以上に鋭いので、自分の勘+コミュニティの人たちの話を総合すると、すぐに答えは出ます。
「それでお前に何ができるんだよw」って話なので、結局は仕方なく使ってるだけです……
codex専用モデルの5.3のときは、本当に話の前置きがなくて、コーディングだけはうまい部下社員と会話している感じでしたが、
5.4から少しずつしゃべるようになって、5.5からは半分くらいは正気に戻った気がします。
まだAPIを契約と言ったり、たまに英語と韓国語をめちゃくちゃに混ぜて話したりするので、「わかりやすく、できるだけ英語を抜いて話してくれ」と書かなければならないこともありますが。
それでも、コードを出す性能は体感では5.4を境にopusを超えたと思います。opus 4.7は出ましたが、触ってみる気にもなりませんでした。また「Anthropic」式のマーケティングなのが目に見えているので。
わあ、いいですね。共有ありがとうございます
Tailscaleは神だ..
でも、ハーネスは先週まではかなり売り込んでいたのに、今週からは静かですね……Anthropicの迷走とCodex 5.5が優れているからでしょうか……
「あれ? これ前に見たことがあるような……」と思ったのですが、一緒に読むとよい記事にすぐリンクを付けてくれるんですね(笑)
何年も使っていますが、エージェントベースに移行していくにつれて、だんだん存在感が薄れてきていますね(笑)。
それでも、個人的なドキュメント作成や手でコーディングすることが多いので、なんだかんだでかなり助かっています。
クォータ増量なしで27倍レートになるなら、エージェント的コーディングは使えないレベルなのでは?
VibeVoice - Microsoftの次世代オープンソース音声合成モデル
GeekNewsでは初期にすぐ公開されましたが、問題があって VibeVoice-TTS のコードは削除されたようですね。
TTS は VibeVoice-Realtime だけが利用可能な状態のようです。
ここ数日、VibeVoice-ASR のために再び人気を集めているのをあちこちで見かけます。
https://simonwillison.net/2026/Apr/27/vibevoice/
Simon Willison がテストしたところ、Mac で
uvと mlx-audio を使って1行のコマンドで実行でき、1時間分の音声を 128GB M5 Max MacBook Pro で約 8分45秒 で処理したそうです。
話者分離がうまくできる Whisperと見ればよさそうです中身のない話をもっともらしく語る上級開発者の文章を、さらに分析までした内容ですね(個人的にGoogleが嫌いなので失礼します)。もちろん、現象への理解という観点からのアプローチは良い試みだと思います。
SDDみたいなものはもうとっくに hype が終わっていて、これからはハーネスなんでしょうね。
ハーネスで少し不思議なのは、学習データには明らかにないのに、モデルが
harnessという概念をすぐ理解していたことです。もともと存在していた単語の意味をそのまま使っているからか、こちらから触れてもいないのに先に「harness を更新します」のような言及までしていました。
だんだんマーケティング用語ばかりがものすごく増えている感じですね。
大学生は?
同感です
これまで実際の体感とコミュニティの反応が食い違っていて、ずっと乖離感を覚えていましたね
1年契約していたものを更新しなかったのは大正解でしたね
Opusの27倍レートでお金を払って使うくらいなら、いっそClaude APIの料金プランを使うほうがいいと思います。
バッジが出た初日に付けました(笑) Tailscaleみたいな製品がもっと増えてほしいです。
とっくに返金しました..
u/Total_Nectarine_3623 が作ったツールのようです。
https://www.reddit.com/r/ClaudeAI/s/9VO1vzO2zp
別の投稿を見ると、ONIST や CTF に関心があるようなので、情報セキュリティに興味がありそうで、巨大な1つのコミットで最初のリリースをしています。これを見るに、元のリポジトリでかなりバイブコーディングをした後、無数のコミットに分割されていて、そのまま公開するのは微妙なので1つにまとめた、という面もありそうですし、GitHub ハンドルも h4ckf0r0day であることを見ると、たいてい ONIST や、やや正攻法ではないタイプのツールは、もともと捨てアカで上げる伝統?のようなものがあります。
オープンソースへの信頼は積み上げていく必要がありますが、特に別の意図はなさそうですね。