Gemini「ダック」デモ、リアルタイムでも音声でも進行せず (twitter.com/parmy) 1 ポイント 投稿者 GN⁺ 2023-12-08 | 1件のコメント | WhatsAppで共有 関連記事 Googleの最高のAI「Gemini」デモは捏造されていた 10 ポイント · 5件のコメント · 2023-12-08 Gemini 3.0、A/Bテストを通じて公開の場で確認される 5 ポイント · 1件のコメント · 2025-10-17 Show HN: 偽の Google Gemini デモを GPT-4 で再現、今回は実際に動作 2 ポイント · 1件のコメント · 2023-12-12 Gemini CLIにサブエージェント機能を導入 6 ポイント · 1件のコメント · 2026-04-16 Google、歴史的画像描写での問題を受けGeminiの画像生成を中断する決定を発表 4 ポイント · 1件のコメント · 2024-02-23 1件のコメント GN⁺ 2023-12-08 Hacker Newsの意見 最初のコンピュータサイエンスの授業で、Raspberry Pi を使ってコーディング経験や指導なしに「何か」を作れという課題が出された。 3人のチームメンバーは湿度センサーを購入し、洪水検知システムを作って橋の下に設置し、洪水が起きた際に関係者へメールを送るというアイデアを考えた。 デモでは簡単なスクリプトを実行して「湿度待機」「湿度検知」などのメッセージを表示し、メールを送ったかのように演出して、プロジェクトを無事に終えた。 Google が Transformer を発明したにもかかわらず、多くの分野で競合に後れを取っている状況への失望を表している。 Google Docs、クラウドサービス、自動運転技術などで、Microsoft、Amazon、Tesla などに市場を明け渡している。 スンダー・ピチャイが AI モデルに対して真偽の判定が難しい質問をしており、モデルの正確性に疑問を投げかけている。 ベンチマーク結果には大きな改善がなかったが、デモでは正確な情報を提供しているように見える。 マルチモーダルモデルが AI の進歩に重要だとは考えるが、モデルが実際に因果関係をモデリングしているのかについては証明が必要だとしている。 Gemini のWebページや内容が Apple のマーケティングを模倣しているように感じられる。 大げさな表現、多様性の過度な強調、不必要なアニメーションなどが、小さな会社が大企業に見せようとしている試みに見える。 Google のモデル発表では動画と音声の入力を受け取れるとしていたが、実際には編集されたデモだったことを指摘している。 音楽生成の部分も実際のモデル出力ではなく、単なる説明にすぎなかった。 Google がベンチマークとデモを操作し、株主向けの誇張された宣伝にばかり注力していると批判している。 Swype テキスト入力方式を長年使ってきた経験を共有している。 最初は慣れないかもしれないが、使い慣れると非常に効率的だという。 どんな製品も最初は苦労することがあるが、時間が経てば利点が際立つ。 Twitter 経由でつながっていた Bloomberg のページが削除されている状況を報告している。 新しいページでは、一部の内容が操作されていたと言及されている。 動画、音声、画像などが本物かどうかという信頼の問題を提起している。 リモートワーカーが本当に人間なのか、それとも部分的に生成された存在なのかをどう確認できるのかという疑問を示している。 Gemini の機能について誤解があるかもしれないが、リアルタイムのインタラクションはまもなくアプリに含まれるだろうと期待している。 AI 機能に対する誤解があるかもしれないが、動画には編集に関する免責事項がある。 すでに優れた音声認識と音声合成技術が存在するため、この部分は問題ではない。 主な疑問はカップゲームに関する部分で、モデルが短い動画入力を受け取っているのかどうかに関心を示している。
1件のコメント
Hacker Newsの意見
最初のコンピュータサイエンスの授業で、Raspberry Pi を使ってコーディング経験や指導なしに「何か」を作れという課題が出された。
Google が Transformer を発明したにもかかわらず、多くの分野で競合に後れを取っている状況への失望を表している。
スンダー・ピチャイが AI モデルに対して真偽の判定が難しい質問をしており、モデルの正確性に疑問を投げかけている。
Gemini のWebページや内容が Apple のマーケティングを模倣しているように感じられる。
Google のモデル発表では動画と音声の入力を受け取れるとしていたが、実際には編集されたデモだったことを指摘している。
Swype テキスト入力方式を長年使ってきた経験を共有している。
Twitter 経由でつながっていた Bloomberg のページが削除されている状況を報告している。
動画、音声、画像などが本物かどうかという信頼の問題を提起している。
Gemini の機能について誤解があるかもしれないが、リアルタイムのインタラクションはまもなくアプリに含まれるだろうと期待している。
AI 機能に対する誤解があるかもしれないが、動画には編集に関する免責事項がある。