Gemini CLI GitHub Actionsを公開
(blog.google)- GoogleはGemini CLIをベースに、GitHubリポジトリでチーム協業を支援するGemini CLI GitHub Actionsを発表
- Gemini CLIはターミナル上でAI機能を活用できるオープンソースのAIエージェントです
- 今回のGitHub Actions版はチーム単位の協業環境に合わせて設計されており、リポジトリ内に常駐するAI同僚として扱える
- このツールは無料かつオープンソースとして提供され、現在ベータ版として全世界で利用可能です
- GitHubリポジトリで発生するイベント(新規Issue、PR作成など)に応じて自動的に非同期実行され、プロジェクトの全体コンテキストを理解して作業を自動処理します
- 3つの強力なオープンソースワークフローを提供します
- インテリジェントなIssue分類(Intelligent issue triage)
- 新規Issueを分析して自動的にラベル付けと優先度付けを実施
- 開発者が重要な作業に集中できるよう支援
- 高速なPRレビュー(Accelerated pull request reviews)
- コード変更内容に対して即時かつ深いフィードバックを提供
- コード品質、スタイル、正確性を検証してレビュアーの負担を軽減
- オンデマンドコラボレーション(On-demand collaboration)
- IssueやPRで
@gemini-cliをメンションして作業を委任可能 - 例: 「このバグに関するテスト作成」、「上記提案の実装」、「代替ソリューションのブレインストーミング」、「明確に定義されたバグ修正」
- IssueやPRで
- インテリジェントなIssue分類(Intelligent issue triage)
- これらのワークフローをランチパッドと考え、オープンソースであるため独自のワークフローを構築できます
- 繰り返しかつ時間を多く消費する作業を自動化することで開発生産性を向上させ、コードレビューとIssue管理の効率を高め、チーム協業の速度改善を可能にします
1件のコメント
Hacker News のコメント
これがCLIなのか、GitHub Actionなのか、あるいはGitHub Applicationなのか、どれなのか分からない状況でかなり混乱する Julesは元々『コーディングエージェント』と呼ばれていたのに、今は別のツールがその役割を代替しているのか、Googleの自己収縮(セルフカニバリゼーション)事例なのかが分からない この会社は、もっと明確なビジョンを持つリーダーシップが必要だと感じる 13年間Androidのコードを書き、Googleと協業し、Googleデベロッパーコミュニティやカンファレンスでリーダーとして働き、多くのGDEとも交流し、Gemini APIを製品側でも利用している立場であるのに、何をやっているのか全く理解できない 一般顧客からは到底理解しづらいだろう Gemini API接続用のSDKが2つもあり、ドキュメントもあらゆる場所に散らばっているため、特定の機能を実装しようとするとググってコードリポジトリまで漁る必要がある 欲しい機能のほとんどはレート制限がかかったり、非公開テスター向けにしか開放されていない コーディングエージェントも3つある Googleアカウントとスマホへのアクセス権があるのに、Geminiアプリは役に立たない Google Cloudでサービスアカウント追加などの基本的な作業も、UXがわかりにくくて大変 実用的なのはAI Studioだけ。さまざまなモデルの実験ができ、Gemini APIキー発行のDXも向上している 正直、今回のリリースを祝うのは少し難しく、ただ『そこそこ良い』新製品レベルだ
研究文化とソフトウェア文化の間には明確な境界が必要だと感じる 研究環境では複数チームが同時にさまざまな実験を行う混沌がむしろプラスに働くことがあるが、 顧客が直接触れるソフトウェアと製品は別のアプローチが必要
Googleは複数の「インキュベーション」領域を作っており、そのうちいくつかが成功しても既存製品と自然に統合されず、ユーザーに混乱を与えるように見える NotebookLLMの例もある でも個人的には、こうした多様な実験の方が良いと思う NotebookLLMチームも自律的に動く雰囲気だった
Googleアカウントと電話情報へのアクセスはあるのに、Geminiアプリがまったく機能しない点が一番笑える アプリを開くと『Hello, Vasco』とあいさつするのに、実際『あなたの名前は?』と聞くと『ユーザー情報を知ることができない』と答える 仕組みはわかっているが、なんともおかしな状況
JulesはVM内で非同期的に、コードの別チェックアウトで動作する Gemini CLIはローカルでユーザーと同期的に動作する(ただしYOLOモードは例外) この2つは全く違う方式
Google Workspaceの場合はまた事情が違う 組織全体でGemini CLIを有効化しようとすると、喜びと苦悩が同居する作業だ 詳細な説明
GoogleがコーディングAI競争をする必要性を感じているのは理解できるが、気になる点が多い
Geminiはミーティング予約のような単純なカレンダー追加すらできない
Google Docsでは共同編集での修正はできず、挿入のみ可能
DocsやSheetsを管理する中央管理ポイント(MCP)もない
シートの数式ヘルプはGoogle Searchの方がむしろ上手い これら独自領域が多いのに、AIで目立つ結果を出せていないのが残念 以前、Gmailで文字列「remarkable」を正確に検索しようとしたら、「amazing」のような関連語まで結果に出てきた すべての製品で検索機能が後退していてイライラする
実際、私のAndroidスマホで配送予約メールを見て、電源ボタンを長押しするとGeminiがポップアップする 画面のコンテキストを読み込んで『これをカレンダーに入れて』と話すと予定が追加される 完璧には動かない(例:複数日にまたがる場合や場所が変だと抜けることがある)が、少しずつ良くなっている Google Workspaceユーザーなら、Gemini Webアプリとカレンダー、ドライブ連携もサポートされる 文書要約など、さまざまな作業も可能 『予定作成不可』は実際には事実ではない
GoogleがGeminiをドキュメント化して出していないのは、AppleがAIをiPhoneに出していない理由と似ていると思う 信頼性がまだ絶対的でなく、99.99%の一般ユーザー向けに出す段階ではない テック系アーリーアダプターだけが上手く使え、一般には勧めたくないシステムだ
かなり多くの小さくて有用な活用法があるのに、マーケティングが弱い たとえば買い物リストを写真で撮って、Geminiに貼り付け可能な形式へ変換してもらったら、Google Keepへそのまま転記するだけでカテゴリ分類はできなかった チームがもう少し優先順位を置いて磨けば、かなり便利になるだろう OpenAIはTikTokで多様な機能を積極的にマーケティングしているのに、30代以下の若い世代ではGeminiの存在自体を知らない人が多い 実際にはGeminiのほうがChatGPTより実用的だと感じるが、マーケティングがまったく足りない
Google Docsサポートがあまりに制限されているので期待が湧かない
検索は埋め込みベースにだけ変わったため、きちんと機能していないという認識 実際には埋め込み、テキストマッチング、クオリティベクトルなどを組み合わせたハイブリッド検索が必要で、これを拡張性を保って高速に作るのは簡単ではない もしそのようなシステムがあるなら教えてほしい
このサービスが実際に何なのかを把握するには、かなり時間がかかる 宣伝文句と冗長な説明、不要な用語を取り除けば、実体が見えてくる 私の理解ではこれはGitHub Actionだ GitHub workflowのYAMLファイルに入れてGemini CLIを実行し、プロンプト、リポジトリコンテキスト、IssueやPRのdiffといったイベントデータを渡して応答や作業を行わせるラッパー トークンまたはアプリ経由でGitHub APIを使い、リポジトリデータの読み取り/書き込み(ラベル追加、コメント、コード提案など)が可能 Gemini LLM HTTPS APIエンドポイントを標準呼び出し方式で使用
Boris ChernyとCatherine WuがLatent SpaceポッドキャストでAIベースのCLIの意味論的リンティングについて語った動画がある 関連YouTubeインタビュー まだAIベースCLIをCI/CDで本格的に使ったことはないが、セマンティックにpass/failする作業にはかなり興味がある
ドキュメントでは『チャットインターフェースでこれを使え』と書いてあるが、チャットインターフェースとは何なのか気になる
Geminiプラン(Google OneやWorkspaceなど)はウェブベースの製品にのみ適用され、APIベース(Gemini CLIなど)は除外される 開発者向け月額サブスクリプションを1つ払えば、CLI、GitHub Action、Gemini chat、Julesをすべて使えるようにしてくれたら本当に革新的だろう Claudeのような単一の「max」サブスク方式を強く望む
サブスク構造自体を理解するにはAIが必要
Geminiの無料ティアは本当にわかりにくい 複数エージェントで使ってみたが、5〜6回リクエストするだけでレート制限に引っかかる 一方、Webアプリは無制限に使えるように感じる 『寛大な無料枠』があるとされるが、実際は短時間で止まってしまう 単純なテストには適しているが、実務で使うには不足
宣伝スライドの画像テキストで、 『@mini-cli』タグで作業を委任すると、バグ作成から修正まで様々なタスクができるという説明は、かなりおかしい
その文言が今でも直されていないのが驚き もしかしたらかなり率直な表現なのかもしれない
これを『gemini cli』と呼ぶのが本当に正しいのか疑問 たいていGitHub経由で使えば、もはやCLIではないのでは Claude Codeのように『gemini github action』や『run gemini』など、もっと直感的なネーミングのほうがよいのではないか
おそらくGemini CLIチームが開発したため、チームの功績を認めてもらうためか、あまり汎用的に見えないようにする内部圧力でこのネーミングになったと思う
実際にはGitHub ActionのVM内でgemini-cliをインストールし、Issue/PRのコメントをプロンプトとしてgemini-cliに渡す構成になっている
私もネーミングについて同じ悩みを持っていた この点は本当に失望させられる部分だ
完全にローカルで使うGemini CLIに対するアドオン形式
昨年、実際にGitHub PR向けのバウンティプラットフォームを開発した インセンティブのせいで品質の低いPRが大量に投稿され、AIで下書きを簡単に作れるためこのコンセプトはほぼ無意味になった経験がある 主要なオープンソース運用の悩みは『レビュアー/メインテナーの限られたリソース』へ移ったと感じる そのため主要エージェントからPRを自動生成して、レビューと承認・修正プロセスを最適化するフレームワークを実験している 関連ケーススタディをまとめている
多くの設定が必要で、すでに誰でも簡単に使えるGitHub Copilot Agentと比べると説得力がかなり低い Geminiアシスタントが既存ツールより著しく優れていなければ、少しでもユーザー獲得できるレベル
これが本当に無料だというのは逆に疑わしい 学習データ提供が対価になっている可能性もあり、opt-out(オプトアウト)オプションもないため、個人/内部リポジトリでは慎重に使うべきだと思う
Copilot Agentで良い結果をかなり得ている 時々PRを閉じてIssueを整えたり、ローカルでCursorで作業したりはするが、作業開始自体が非常に速くなったので全体として満足度は高い