3行要約

  • Google Chromeが任意のAIプロンプトを「Skills(スキル)」として保存・再利用できる新機能を発表。
  • 特定のWebサイトや複数のタブを跨いで、要約や翻訳、コード変換などの定型処理をワンクリックで実行可能。
  • AIとの対話(チャット)を前提としたUIから、ブラウザ機能の一部としてAIを呼び出す「ワークフロー型」への重要な転換点。

📦 この記事に関連する商品

Logicool MX Master 3S

マシンのボタンにAI呼び出しを割り当てることで、Skills機能をより高速に実行できるため

Amazonで見る 楽天で見る

※アフィリエイトリンクを含みます

何が起きたのか

Googleはデスクトップ版Chromeにおいて、Geminiを活用した新たなワークフロー機能「Skills」の提供を開始しました。これは単にサイドパネルでAIと会話ができるという話ではありません。自分が頻繁に使うお気に入りのプロンプトに名前を付けて保存し、それをあらゆるタブやWebページに対して即座に実行できる「AIのマクロ機能」がブラウザに標準搭載されたことを意味します。

これまで、特定のWebサイトの内容を要約させたり、特定の形式にデータ変換させたりする場合、私たちは毎回プロンプトをコピー&ペーストするか、似たような指示を何度も入力していました。あるいは、特定の拡張機能を作り込んで対応するしかありませんでした。この「Skills」は、その摩擦をゼロにします。

背景にあるのは、ブラウザというプラットフォーム自体を「AIエージェントの実行環境」へと進化させようとするGoogleの強い意図です。私はこれまで数多くの機械学習案件を手がけてきましたが、現場で最も求められるのは「高度な推論」よりも「決まりきった面倒な作業の自動化」でした。

例えば、海外の技術ドキュメントを読みながら「このコードブロックをPython 3.12の最新記法に書き換えて」という指示を、どのサイトを開いていても右クリック一つで呼び出せるようになります。これは、ツールとしてのAIが「検索の代替」から「ブラウザ操作の拡張」へと一歩踏み出した瞬間だと言えます。

Googleがこのタイミングで発表したのには理由があります。Microsoft EdgeがCopilotをサイドバーに統合し、先行してブラウザ内AI体験を提供してきたことに対する、決定的な対抗策です。単なるサイドバーでのチャットではなく「再利用可能なスキル」という概念を導入することで、ユーザーの離脱を防ぎ、Chromeエコシステム内での滞在時間を最大化させる狙いが見て取れます。

技術的に何が新しいのか

従来のブラウザAI機能は、基本的に「その時開いているページ」に対する一過性の対話でした。しかし、今回のSkillsが技術的に優れている点は、プロンプトの「抽象化」と「コンテキスト注入」をユーザー自身が定義できる点にあります。

これまでのブラウザ拡張機能でも同様のことは可能でしたが、それらは各拡張機能のサンドボックス内で動作し、DOM(ドキュメントオブジェクトモデル)へのアクセスやページ情報の取得に制限がある場合もありました。Chrome純正機能としてのSkillsは、ブラウザが持つ「現在アクティブなタブのテキスト情報」をシームレスにGeminiのコンテキストウィンドウへ流し込むパイプラインが最適化されています。

具体的に、技術者が恩恵を受ける設定例を考えてみましょう。以下のようなプロンプトを「PR Review Skill」として保存したとします。

「あなたはシニアエンジニアです。現在表示されているGitHubのPull Requestの差分を確認し、計算量の観点から非効率なコードが含まれていないか指摘してください。回答はMarkdown形式で箇条書きにすること。」

これまではこのプロンプトをクリップボードに常駐させておくか、専用の拡張機能を入れる必要がありました。しかし、Skillsを使えば、GitHubのページを開いている時にこのスキルを選択するだけで、裏側で「現在のページ内容 + 保存されたプロンプト」が統合され、Geminiにリクエストが飛びます。

内部的には、Chromeのブラウザプロセスがアクティブタブのテキスト情報を抽出し、Gemini API(または統合された内部エンドポイント)に対して、ユーザーが定義したシステムプロンプトと共に送信していると考えられます。この際、従来のコピペと異なるのは、トークン制限内での「ページのチャンク化」や「不要な広告・ナビゲーション要素のフィルタリング」がGoogle側で最適化されている可能性が高い点です。

私が実際にGeminiの各モデルで検証してきた感覚では、GoogleはRAG(検索拡張生成)の技術をブラウザのヒストリーやタブ管理に統合し始めています。今回のSkillsは、その「入力側」のショートカットとして機能します。

数字で見る競合比較

項目Chrome Skills (Gemini)ChatGPT Sidebar (拡張機能)Microsoft Edge Copilot
保存可能なプロンプト数無制限(推測)ツールによる限定的
実行までのアクション数1〜2クリック3クリック以上2クリック
ブラウザとの統合度ネイティブ(最高)低(拡張経由)ネイティブ(高)
コンテキスト理解ページ全体(最適化済)クリップボード依存サイドバー連動
利用料金Geminiプランに準拠月額$20〜無料(制限有)/ 有料

この比較からわかる重要な事実は、アクション数の減少が「実務での利用頻度」に直結するという点です。SIer時代に自動化ツールを導入してきた経験から言うと、ツール起動に3ステップ以上かかると現場の人間は使わなくなります。Chrome Skillsは、ブラウザ標準機能として「ほぼ0ステップ」でAIを呼び出せるようにしたことで、他のサードパーティ拡張機能を一掃するポテンシャルを持っています。

また、Gemini 1.5 Proのような巨大なコンテキストウィンドウ(最大200万トークン)を持つモデルがバックエンドにある場合、長いドキュメントを何百ページ分も読み込ませた上で、自作の「抽出スキル」を適用できるのは、ChatGPTのサイドバー機能に対する明確な優位性となります。

開発者が今すぐやるべきこと

まず第一に、自分が日々「同じ指示」をAIに投げているパターンをすべてリストアップしてください。エンジニアであれば、Jiraのチケット要約、Stack Overflowの回答からライブラリバージョンを特定する作業、あるいは特定のセキュリティポリシーに沿ったコードチェックなどが挙げられます。これらをSkillsとして登録する準備を進めるべきです。

第二に、自社サービスを開発している担当者は「Gemini Skillsによって自社サイトがどう解析されるか」を確認してください。AIが読み取りやすいセマンティックなHTML構造(特に<main>タグや適切なヘッダー設定)になっていないと、ユーザーが「Skills」を実行した際に期待通りの結果が得られない可能性があります。これは「AI向けのSEO」とも言える重要な観点です。

第三に、現在AIプロンプトの管理をスプレッドシートやNotionで行っているなら、そのワークフローをChrome Skillsへ移行する検証を始めてください。特に、チーム内で「共有可能なスキルセット」としてこれらを配布できる可能性があるか(現状は個人設定が主ですが、将来的に管理ポリシーでの配布が予測されます)、API連携部分をどう代替できるかを検討する価値があります。

最後に、ローカルLLMを好む層であっても、この「ブラウザ体験の統合」は無視できません。RTX 4090を回してローカルで推論する楽しさはありますが、ブラウザと一体化した利便性には抗いがたいものがあります。Googleの純正機能で何ができて、何ができないのかの「境界線」を今のうちに把握しておくことで、将来的に自前でエージェントを組む際の要件定義が明確になります。

私の見解

正直に言って、これは「ようやく来たか」という感想です。AIチャットボットという「箱」に人間が行くのではなく、人間がいる場所(ブラウザ)にAIが「道具」として溶け込む形こそが正解です。私はChatGPTがサイドバー機能を出し始めた頃から、なぜGoogleはこれをやらないのかと疑問に思っていました。

今回のSkillsは、既存の「AIプロンプト管理ツール」や「小規模なAIブラウザ拡張機能」を開発している企業にとっては、死刑宣告に近いインパクトがあるはずです。GoogleがOSレベル、あるいはブラウザレベルでこうした「マクロ機能」を標準化してしまうと、サードパーティが差別化できるポイントは「特定のドメインに特化したデータの裏付け」くらいしか残りません。

一方で、懸念もあります。GoogleがユーザーのプロンプトをSkillsとして蓄積することで、どのようなワークフローが世界中で行われているかの膨大なデータを取得することになる点です。これは、将来的にGoogleが「さらに高度な自動化エージェント」を開発するための教師データとして利用されるでしょう。

私は、この機能は単なる便利ツールではなく、将来の「AI OS」への布石だと考えています。3ヶ月後には、ユーザーが作成したSkillsを共有できる「Skills Store」のようなものが登場し、優秀なプロンプトエンジニアが作成した「GitHub修正スキル」や「論文査読スキル」を誰でもインポートできるようになっているはずです。

今はまだ「保存して呼び出せる」だけですが、これがGoogle CalendarやGmailのAPIと直接結びついたとき、Chromeは単なるブラウザではなく、私たちの仕事を代行する「自律型エージェントの入り口」に化けます。その第一歩として、このSkills機能は非常に重要な意味を持っています。

よくある質問

Q1: この機能を使うためにGeminiの有料プランは必須ですか?

現時点では無料ユーザーでも一部利用可能ですが、Gemini 1.5 Proなどの高性能モデルを用いた高度なSkills実行には、Google One AI Premiumプランなどのサブスクリプションが必要になる可能性が高いです。

Q2: 会社で利用しているSaaSのデータが学習に使われませんか?

Google Workspaceの法人契約経由で利用している場合、データは学習に使用されないポリシーが適用されますが、個人のGoogleアカウントでSkillsを利用する場合は、設定で「アクティビティの保存」をオフにするなどの注意が必要です。

Q3: 自分で作ったSkillsを他の人と共有することはできますか?

リリース初期段階では個人設定としての保存がメインですが、Googleのこれまでの傾向(Chrome拡張機能やGoogle Colabなど)を考えると、将来的にはURLによる共有や、組織内でのテンプレート配布機能が実装されると予測されます。


あわせて読みたい