3行要約

  • デジタル庁が行政事務に特化したAI基盤「源内(GENNAI)」を構築し、全省庁・自治体への展開を見据えた実証を開始しました。
  • 既存のLLM(GPT-4等)をガバメント・クラウド上の閉域環境で動かし、行政文書に最適化されたRAG(検索拡張生成)を組み合わせるのが技術的骨子です。
  • 行政特有の難解なルールや過去の回答をAIが即座に参照可能になることで、公務員の起案業務や照会対応のコストが劇的に下がる可能性があります。

📦 この記事に関連する商品(楽天メインで価格確認)

RTX 4060 Ti 16GB

行政データ等の機密情報をローカルでRAG検証するのに、16GBのVRAMは必須。

楽天で価格を見る Amazonでも確認

※アフィリエイトリンクを含みます

何が起きたのか

日本の行政における「生成AI活用」が、単なる試用期間を終えて、本格的なインフラ構築フェーズへと移行しました。デジタル庁が発表したガバメントAI「源内」は、平賀源内にちなんで名付けられた、全省庁共通のAI利用基盤です。

これまで、各省庁が個別にChatGPTなどの外部サービスと契約してきましたが、これでは知見が分散し、セキュリティ基準もバラバラになるという課題がありました。源内は、政府の共通基盤である「ガバメント・クラウド(AWS等)」上に構築され、セキュアな閉域網の中でLLMを利用できる環境を提供します。

特筆すべきは、単に「AIを使える」ようにするのではなく、数千万枚にのぼる行政文書をAIに読み込ませ、根拠に基づいた回答を生成させる「行政専用RAG」の構築を主眼に置いている点です。これにより、若手職員が過去30年分の通知文を数時間かけて検索するような非効率な作業を、数秒のプロンプト入力で代替することを目指しています。

技術的に何が新しいのか

源内の本質は、独自のLLMをゼロからスクラッチで開発することではなく、既存の最高性能モデルを「行政という特殊なドメイン」に最適化してデプロイする「マネージド・プラットフォーム」である点にあります。

従来、行政組織で生成AIを使う際の最大の障壁は「ハルシネーション(嘘)」と「機密情報の漏洩」でした。源内では、政府専用のVPC(Virtual Private Cloud)内でAPIを叩く構成をとり、入力データがモデルの学習に利用されないことを保証しています。

技術スタックとして注目したいのは、行政文書の「構造化」です。行政文書は独特の階層構造(第◯条第△項など)を持っており、一般的なRAGのチャンク分割(単純な文字数区切り)では検索精度が著しく低下します。私は以前、法務系RAGの構築に携わったことがありますが、文書の論理構造をメタデータとして保持し、ハイブリッド検索(ベクトル検索 + キーワード検索)を組み合わせる設計が不可欠です。源内もおそらく、こうした行政ドメイン特化のインデクシング技術を基盤に取り入れているはずです。

また、単一のモデルに依存せず、GPT-4oやClaude 3.5 Sonnet、あるいは国産LLMなど、用途に応じて最適なモデルを使い分ける「マルチモデル・セレクター」的な役割も期待されています。これにより、コスト効率と性能のバランスを動的に最適化できるのが、これまでの個別導入との決定的な違いです。

数字で見る競合比較

項目源内(GENNAI)ChatGPT Enterprise自社サーバー(Local LLM)
ネットワーク環境ガバメント・クラウド(閉域)公共インターネット経由完全オフライン(オンプレ)
行政文書の参照(RAG)標準搭載・最適化済みユーザーが自身で構築開発・維持コストが膨大
セキュリティ認証ISMAP(政府認定)準拠SOC 2/3等(国際基準)自己責任(物理管理)
推定レスポンス0.5秒〜2.0秒(最適化想定)0.3秒〜1.5秒ハードウェア性能に依存

この比較から分かる通り、源内の優位性は「行政実務への即応性」にあります。エンジニアが個人的にChatGPTを使う分にはEnterprise版で十分ですが、組織として「行政文書という法的な根拠」を扱う場合、ガバメント・クラウド上でISMAPに準拠した基盤であることは、導入の絶対条件となります。

実務で効いてくるのは、コンテキストウィンドウの管理と検索精度です。行政文書は1つ1つが長大なため、単にGPT-4に放り込むだけではトークン代が跳ね上がります。源内で適切にフィルタリングされたRAGが提供されれば、1リクエストあたりのコストを既存の個別契約より30%以上削減できる可能性があります。

開発者が今すぐやるべきこと

この動きは官公庁の中だけで完結する話ではありません。行政と取引のあるSIerや、自治体向けSaaSを開発しているエンジニアにとって、大きなビジネスチャンスと技術的転換が訪れます。

まず、デジタル庁が公開している「政府公認のプロンプト集」や「生成AI導入ガイドライン」の最新版を読み込むことをおすすめします。源内のインターフェースやAPI仕様はこれらに準拠する可能性が高いためです。

次に、RAGの精度評価(Evaluation)手法を確立しておくべきです。RAGASやDeepEvalのようなフレームワークを使い、特定のドメイン文書に対して「どの程度の検索精度があれば実務に耐えるか」を数値化するスキルは、今後自治体からの案件を受ける際に必須の要件になります。

最後に、行政データの「オープンデータ化」の動向に注視してください。源内が参照するデータの一部がAPI経由で外部の民間サービスからも利用可能になれば、官民連携のAIエージェント開発という新しい市場が生まれます。今のうちに、e-Govなどのサイトからデータをスクレイピングし、自分なりのベクトルデータベースをローカルで作ってみるのが、最も確実な準備となります。

私の見解

正直に言えば、デジタル庁が「独自モデル」に固執せず、プラットフォームとしての「源内」を構築した判断は、極めて実利的で正しいと感じています。私自身、RTX 4090を回して国産モデルも日々検証していますが、汎用的な推論能力では依然としてグローバルなトップモデルに分があります。それらを「いかに安全に、日本の行政というコンテキストで使いこなすか」にリソースを集中するのは、エンジニアの視点で見ても理にかなっています。

ただし、懸念もあります。それは「UI/UXの硬直化」と「データのサイロ化」です。どれほど裏側のRAGが優秀でも、公務員の方々が使いにくいと感じるインターフェースであれば、結局は形骸化してしまいます。また、省庁ごとにデータのフォーマットがバラバラな現状を、源内というシステム側でどこまで吸収できるかが勝負所でしょう。

3ヶ月後には、先行導入された省庁から「国会答弁の作成時間が50%削減された」といった具体的な成功事例が出てくるはずです。その時、我々エンジニアに求められるのは、その基盤をどうハックし、民間サービスと接続して社会全体の効率を底上げするかという視点だと思います。

よくある質問

Q1: 源内は一般の国民も使えるようになりますか?

直接的な利用は想定されていません。基本的には公務員専用の業務ツールです。ただし、源内によって作成された文書や、源内の知見を活用した行政サービスが国民に提供されることで、間接的に恩恵を受けることになります。

Q2: 自治体が独自にAIを導入するのと源内を使うのはどちらが良いですか?

予算とセキュリティ要件によりますが、源内はガバメント・クラウドの恩恵を受けられるため、小規模な自治体にとっては自前でインフラを構築するより圧倒的に低コストかつ安全です。まずは源内の提供機能を待つのが得策でしょう。

Q3: 源内で使われるLLMは固定されているのでしょうか?

いいえ、技術の進歩に合わせて柔軟に入れ替える「モデル非依存」の設計になると予測されます。特定ベンダーにロックインされるリスクを避け、その時々で最もコストパフォーマンスの良いモデルを選択する運用になるはずです。


あわせて読みたい