- 2025年9月現在、Claude Opus 4.1、GPT-5、Nano Banana などの強力なAIモデルが登場し、ソフトウェア開発の黄金期が到来
- 現在のAI環境を背景に、実在はしないがあったらよい 革新的なAIツール28種 を提案
- 提案されたアイデアは 個人の生産性、コード開発、ヘルスケア、コンテンツ制作 など幅広い分野を含む
- 共通して強調されている特徴は、コンテキスト認識、ユーザーへの適応、自動化された学習とフィードバックループ による改善機能
- 今日の一般的なエージェントの代わりに、特化型の単一目的AIエージェント と、それらを交換できる マーケットプレイス の概念を提案
提案された28のAIツール
1. Nano Bananaベースのカメラアプリ
- 普通のiPhone写真を Leicaで撮影したかのように 変換するアプリ
2. ライト/ダークモード自動追加エージェント
- あらゆるフロントエンドプロジェクトにライトモード、ダークモード、カスタムテーマ対応を自動追加
- ビジョンを使ってUIの変更点を確認し、レンダリング済みUIをもとに 反復的に修正
3. 難読化コードのデコンパイルおよびデバッグエージェント
- minifyされたコードを解読可能なコードベースにデコンパイルしてデバッグ
- 強力な コード-デバッグループ が必要
4. StrongアプリとChatGPTのハイブリッド
- モデルが運動データにアクセスして改善提案やコーチングを実施
- 各セット間の時間まで含む 詳細なコンテキスト を理解したモデルとチャット可能
5. レコメンドエンジン
- 閲覧履歴を分析して、最も長く読んだブログ記事や記事を把握
- 毎晩Webを検索して読むべきコンテンツを探し、朝にリンクダイジェスト を提供
- 良い/悪い推薦へのフィードバックで翌日のダイジェストを改善
6. カロリー追跡チャットアプリ
- 栄養データベースに基づくチャットアプリ
- 食事記録に必要な 認知的負荷を最小化
7. 長文コンテンツ執筆用ミニマルアプリ
- モデルが一節を強調し、余白にコメントを残す
- さまざまな 「ペルソナ」を設定 して書いた内容をレビュー可能
8. 専門AIエージェントビルダーエージェント
- 「コードデコンパイルエージェントを作って」のような作業説明を受けると、超特化型エージェントを自動生成
9. ミニマル電子書籍リーダー
- 電子書籍を読みながら一節を強調すると、モデルが横でより深く説明
- 著者のペルソナを取る
- 別個のチャットインスタンスではなく、本の拡張 のように感じられるべき
10. 数日間推論するDeep Researchエージェント
- 非常に複雑なクエリを与えられる
- 数百のサブエージェントを生成し、3日間推論 したうえで応答を返す
11. ペイント・バイ・ナンバー映画制作アプリ
- 短編映画のアイデアをブレインストーミングし、モデルが詳細な ストーリーボードを生成
- ユーザーはスマートフォンで各ストーリーボードの場面を撮影するだけでよい
- 映画制作の補助輪 として機能
12. 画面録画およびセマンティック要約アプリ
- ローカルモデルを使って、毎日コンピューターで行ったことの 詳細なセマンティック要約 を生成
- チャットアプリにコンテキストとして提供: 「昨日、誰への返信を忘れていたっけ?」
- Rewindを1年間使ったが、期待したほど有用ではない
13. Twitter/X/YouTube向けセマンティックフィルター
- 「腹が立ちそうなツイートを隠す」のような オープンエンドなフィルター を書ける
- 怒りを誘発するコンテンツをフィードから除去
- フィードを形作ることで、私たちは自分自身も形作っている
14. ニッチなテーマ向けカスタムカリキュラム生成エージェント
- 「進歩の科学について私たちが知るすべてを学びたい」のような依頼
- Web上で人物、ブログ、YouTube動画、エッセイ、教科書を検索
- すべてのコンテンツを読み、初心者から専門家まで導くカリキュラム を提供
15. 本当に優れた書籍推薦エンジン
- 過去に読んだもの、目標、好みの読書タイプについて最初に クイズ を実施
- 十分な情報を得たら、別のエージェントがユーザーがメインエージェントの提案をどう感じるかをシミュレーション
- 非常に楽しめる可能性が高い本だけ を表に出す
16. TikTokとInstagram Reels向けセマンティック検索エンジン
- 短尺動画に閉じ込められている 有用な情報にアクセス
- クエリ可能な検索機能が必要
17. 睡眠フィットネスアプリ
- Apple Watch(心拍数、VO₂)、Eight Sleep、Oura Ring、運動アプリのデータを 統合
- 睡眠と回復を改善するための実践的な推薦を提供
- 能動的にメッセージを送る: 「今週はHRVが下がっていますが、オーバートレーニングかもしれませんか?」
18. 大規模コンポーネントライブラリ
- チャットインターフェース内で レンダリングされることを前提に設計
- 既存ライブラリはプリミティブがあまりに低レベル
- カスタマイズ性より高レベルなウィジェット を優先
19. Apple Watch向けミニマル音声アシスタント
- Siriには複雑すぎるがChatGPTには適した質問
- 数語程度の短い応答 を提供
20. 推薦読書リストを提供する執筆アプリ
- 執筆中のテーマについてWeb検索し、役立ちそうな資料の一覧 を構成
- 執筆アプリは ユーザーの代わりに書いてはならない
21. ランニングアプリ
- カスタム計画を生成し、ランニングペースと心拍数を追跡
- 実データにもとづいてトレーニングプログラムを反復調整
22. Nano Banana写真編集スーパーアプリ
- プロンプトを書かずに 数百のテンプレート を提供
- さまざまな髪型を試す、パートナーとの子どもの見た目を予測する、The Rockのように見せる、など
23. Same.energy風のYouTube動画検索
- URLを入力すると 似た雰囲気の動画 を見つける
- 現在のYouTubeアルゴリズムは単に平均的ユーザーのエンゲージメント最大化に注力している
24. 子ども向けSony Walkman風デバイス
- LLMに質問できる 音声ファースト のデバイス
- 説明に集中できる 画面がまったくない デバイス
- オフラインファーストならさらによい
25. 伝記検索エンジン
- 現在直面している問題、人生の段階、分野などに関する アンケートベースのクエリ
- 歴史上の偉人たちの 伝記/自伝の中で類似の状況を扱った章 を結果として提示
26. 画面録画でコンテンツ消費を監査するエージェント
- コンピューターとスマートフォンの使用を観察
- 毎日のコンテンツ消費を監査
- Screen Timeでは十分に具体的ではない
- 消費している トークンの正確な栄養価 を把握する必要
27. ニッチな作業向けAIエージェントのマーケットプレイス
- 汎用エージェントよりも、特定のユースケース向けに設計されたエージェント の方が優れているはず
- サンフランシスコで賃貸アパートを探すようなニッチ作業向け超特化型エージェントのカタログ
- WebやAPI経由で利用できる 数万のエージェント が必要
28. 有名作家に批評を求める機能
- 「Hemingwayならこのブログ記事について何と言うだろう?」
- 彼が 混乱した部分と気に入った部分 を把握
2件のコメント
2、3番は本当にそのまま自動化されるといいですね。
いちいち追加し続けるのが面倒な、反復作業の一つのように思います。
Hacker Newsの意見
「24. 子どもたちがLLMに質問できるSony Walkmanスタイルの機器」については、本当に慎重になるべきだと思う
学校の先生に聞くより、はるかによい結果が得られると思う
一昨日、ChatGPTに6歳の子どもでもわかるように位取り記数法(place-value system)を説明してほしいと頼んだ。ところが位の値と数字の値の概念を取り違えて、誤った説明をした。私はその誤りに気づいてChatGPTも謝ったが、子どもが自分で聞いていたら、この誤りに気づけなかったはずだ。
自分の子どもがこういう機器からどれだけ多くの誤情報を本当だと信じてしまうのか、不安になる
19番については、数週間前にiOS Shortcutで自分で作ってみた
多くのアイデアや記事を見ていて感じるのは、LLMについて「thinking with portals」していないということだ。私たちは「ポータルガン」級の技術を手にしているのに(そう宣伝されているのだから)、ただ少し良いドアとしてしか使っていないように感じる
LLMにできることは、結局のところ論理的に続くテキストの拡張だ。応用範囲は広いが、実際には高度なテキストエディタを超えにくい。たとえば動画編集に活用したいなら、スクリプト言語を作らなければならず、エディタとの機能同期も必要になる。Adobeのような大企業にとっては人員に対する価値が微妙で、スタートアップはAdobeとの長年の機能・ユーザーロックイン競争をしなければならない。どちらにとっても、LLMが本当に革新的でない限り大きなメリットはない。しかもLLMは動画の出力結果を直接見ることができず、現時点では「そこそこ」レベルだ
この見方には同意する。「thinking with portals」について参考になる資料があれば共有してほしい
ポータル的思考の例があるなら、簡単でわかりやすく共有してもらえるとありがたい
22番については、自分のブラウジング履歴を分析して、私が最も長く読んでいるブログや記事のタイプを把握し、毎晩まだ見ていないおすすめコンテンツを探してくれるエンジンがあればいいと思う
ChatGPT Pulseが似たような存在だ。このサービスはブラウザ履歴ではなくChatGPTの記録を使うが、ChatGPTをよく使うユーザーにとっては、むしろ信頼しやすい推薦になる
https://openai.com/index/introducing-chatgpt-pulse/
この記事で提案されているアイデアの大半は、ベースとなるLLMに対してUI/UXをもう少し良くしてほしいという要望に近いと思う
この種の発想には、根本的なカテゴリーミステイク(category mistake)があると感じる
例として「ヘミングウェイなら私の文章をどう評価するだろう?」という機能があるが、実際にはそのAIが生成した答えであって、本物のヘミングウェイの評価ではない
100個のモデルに聞けば100通りの答えが出るだろうし、実際のヘミングウェイの思考様式や性格を、彼の著作数十万語だけで完全に復元することはできない。
結局は「それが本当にその人が言いそうなこととしてもっともらしく聞こえるか」という問題だ
私たちが有名人の評価を聞きたがるのは、生きた本物の人間の視点だからだ。AIの物まねは、本物のサンドイッチの代わりにサンドイッチの写真を食べようとするようなものだ
多くの人がこの幻想にもっと明確な線引きをしないことに、何か不安を覚える
100%同意する
ただ、このコメントを読みながらStar Trek TNGのホロデッキを思い出した。そこではアインシュタインやフロイトのような有名人物が再現されるが、視聴者としては15歳の頃でさえ「これはただコンピュータが吐き出したランダムな答えだ」とは思わなかった
実際のエピソードでは、記録だけをもとに実在人物を再現して失敗する場面があり(https://www.imdb.com/title/tt0708682/)、後になってそれがどれほど違うかも明らかになる(https://www.imdb.com/title/tt0708720/)
要するに、
この記事を見ていろいろ考えさせられた
AI Hemingwayが特に必要ない理由は簡単に説明できる。実際、10年ほど前にはすでにhemingwayappのような優れた文章ガイドが登場している https://hemingwayapp.com/
シンプルなルールベースで文法を修正し、より簡単な表現に言い換えるよう促してくれる。むしろ自動で書き換えない分、自分で学ぶにはその方が良いのかもしれない
「バナナみたいな超小型フォトエディティングアプリ、プロンプトなしで数百のテンプレートを提供…」のような多くのアイデアを見ると、結局は人間がどうにかしてもっと怠けて生きようとしている欲求が見える。「ヘミングウェイなら何を思いついただろう」みたいなものも、同じように感じる
「それが本当にその人らしいもっともらしい返答として人をだませるか」が本質で、実はそれ自体でも有用だ
人間が騙しであることを認識しているなら、それをmake-believe、あるいは不信の停止と呼ぶ
私たちは誰かを演じたり、別の視点から考えようとしたりするたびに、この過程を踏んでいる。実在の人物の記録や小説の登場人物から学ぼうとするときも同じだ
「スティーブ・ジョブズやヘミングウェイの評価を聞きたいのは、本物の人間だからだ」という考えには、むしろ反対だ
実際には対話相手が本物の人間かどうかより、私たちが思い描く有名人やキャラクターの要約された個性の方が重要だ。その人の実像にこだわる人はほとんどいない
神話化された「有名人ヘミングウェイ」そのものの方が魅力的だ。むしろ本物より有用で面白い
だからStar Trek TNGの例のように、そうした仮想人物のシミュレーションは本来の意図どおりにうまく機能していると思う
ファインマンが言った「科学における第一の原則は、自分自身をだまさないことだ」という言葉は、LLMの出力にも当てはまると思う
本当に興味深い
私たちは皆、このリストのデモや似たような技術をたくさん見てきたし、すでに多くのスタートアップが何年もかけて何億ドルも投じて製品を作っている
それなのに、実際に使える製品はほとんど見当たらず、日常で出会うものはデモほどにはうまく動かない
いったい何が起きているのか気になる。
つまり、製品自体は実在しているがほとんど誰も使っていないのか、十分に使えるモデルを使うには高すぎるのか、それとも派手なデモを作る方が実際の製品を作るよりずっと簡単なのか…いろいろな可能性が気になる
フィンテックアプリの広告代理店と話したとき、3か月間で月2万ドル程度の広告費を消化してようやく仕組みが見えてきて、その後で初めてCACが下がり、ターゲットユーザーを獲得できると聞いた
広告を止めた瞬間に製品認知はまた消え、新規ユーザーも途切れる。存在そのものを知らせる方法がなくなってしまう
こうしたアイデアのかなりの部分は、ユーザーの好み、パターン、コミュニケーション、予定、健康情報を把握する必要がある
この分野ではAppleが本当に強みを持てるかもしれない。
スマホとWatchが個人情報を最も多く知っているのだから、Appleならプライバシー保護を前提に、LLMとのさまざまな文脈を賢く組み合わせられるかもしれない
そのリンクをクリックしてみたが、実際のツールではなく、まったく関係のないアプリのアイデア集のようなものだったのでがっかりした
「子どもたちがLLMに音声で質問できるSony Walkmanスタイルの機器」
100%完全一致ではないが、https://www.aliexpress.com/item/1005009196849357.html の製品はかなり近い。
オフラインではないが、ピンポン玉より少し大きいくらいのサイズだ
孫たち(5歳と3歳)には2分で使い方を覚えさせ、その後「ユニコーンのBobの話をして」「犬とサルは友だちになれる?」など、質問を次々に浴びせたが、どれにも数秒でそれらしい答えが返ってきた
こういう製品はクリスマスにはおもちゃに組み込まれた形で出てきそうで、出たらすぐ買うつもりだ