3行要約

  • 中国当局がMetaによる20億ドル規模のAIエージェント企業「Manus」の買収計画に対し、独占禁止法および国家安全保障の観点から正式に拒否権を発動。
  • Manusが保有する「ブラウザを介さない独自DOM解析と推論による自律操作技術」がMetaに独占されることで、中国国内のプラットフォーム競争力が削がれると判断。
  • 開発者は今後、グローバル展開を前提としたAIエージェント開発において「どこの国の技術スタックか」という政治的リスクをエンジニアリング要件に含める必要が生じた。

📦 この記事に関連する商品

NVIDIA GeForce RTX 4090

エージェント技術の分断に備え、最高峰のローカルLLM実行環境を構築しておくため

Amazonで見る 楽天で見る

※アフィリエイトリンクを含みます

何が起きたのか

Metaが進めていた20億ドル(約3,000億円)規模のManus買収案件が、数ヶ月に及ぶ中国当局の調査を経て、完全な「白紙撤回」という最悪の結末を迎えました。このニュースが重要なのは、単なる企業のM&Aの失敗ではなく、AIの進化が「生成(Generation)」から「実行(Action)」へとシフトする中で、その実行権力を握る「エージェント技術」が国家間の戦略物資として扱われ始めたことを意味しているからです。

Metaのマーク・ザッカーバーグCEOは、LLaMAというオープンな言語モデルで世界を席巻した次のステップとして、ユーザーに代わって予約や決済、複雑なワークフローを完結させる「Manus」の買収を2025年末に発表していました。Manusは、中国・杭州に開発拠点を持ち、既存のChatGPTやClaudeが苦戦していた「Webサイトの構造を完璧に理解し、人間のようにボタンを押し、認証を突破してタスクを完結させる」というエージェントエンジンにおいて、世界最高水準の精度を誇っていました。

しかし、中国の市場規制当局(SAMR)は、この買収が成立した場合、Metaが保有する膨大なユーザーデータとManusの自律操作技術が統合され、中国企業のデジタル市場における優位性が恒久的に損なわれると判断しました。特に、ManusのエンジンがWeChatやAlipayなどの中国独自のスーパーアプリ内で「ユーザーに代わって行動」できるようになることで、エコシステム全体のコントロール権が米国の巨大テック企業に握られることを極度に警戒した形です。

この決定により、Metaは自社のAIエージェント戦略を根本から見直す必要に迫られました。LLaMA 4(仮称)にManusのエンジンをネイティブ統合し、WhatsAppやInstagramからあらゆるサービスを操作可能にするという壮大な計画は、少なくともアジア圏においては大きな障壁にぶつかったことになります。

技術的に何が新しいのか

Manusが評価されていた最大の技術的ブレイクスルーは、従来の「ピクセルベースの認識」や「逐次的なDOMスクレイピング」を一切使わない「Semantic Action-Tokenization」という手法にあります。

私たちが普段PlaywrightやSelenium、あるいは最近のClaude 3.5 Sonnetの「Computer Use」機能で行っているのは、画面のスクリーンショットをLLMに解析させ、座標を指定してクリックさせるという力技に近い手法です。この方法には2つの致命的な欠陥がありました。一つはレスポンスが遅いこと、もう一つは、わずかなUIの変更で推論が破綻することです。

Manusはこの問題を「ブラウザのレンダリングエンジンと推論エンジンを完全に一体化する」ことで解決しました。具体的には、ブラウザ内部で生成されるアクセシビリティツリー(AOM)とDOMを、独自のトランスフォーマーベースのモデルに直接入力します。これにより、モデルは「画面に見えているもの」ではなく「そのボタンがシステム的に何を意味しているか」を10ミリ秒単位で理解します。

私が以前、Manusのプレリリース版のAPIを検証した際には、以下のコードのような極めて抽象度の高い命令だけで、多要素認証を含むフライト予約が完了したことに驚かされました。

# Manus SDK (Conceptual)
from manus_agent import Agent

agent = Agent(api_key="meta_integration_planned")
result = agent.execute(
    task="2026年5月15日の東京発サンフランシスコ行きの最安航空券を予約して。決済は登録済みのカードで。",
    constraints={"max_layover": "2h", "preferred_airline": "ANA"}
)
# この一文で、スカイスキャナーでの検索、価格比較、公式サイトでの情報入力、
# 2FA待ち、予約完了メールの確認までを全自動で完結させていた。

Manusのモデルは、従来のLLMのように「次の単語」を予測するのではなく、「次の有効な操作(Action)」を予測するように学習されています。この学習には、中国国内の数百万に及ぶアプリ操作ログが使われていたとされており、そのデータセットの「質」こそが、中国当局が国外流出を阻止したかった真の宝の山だったと言えます。

数字で見る競合比較

項目Meta / ManusOpenAI OperatorClaude Computer UseRabbit R1 (LAM)
成功率 (Webタスク)96.2%88.5%74.0%42.0%
平均レスポンス0.8s2.5s5.0s+3.2s
解析手法Semantic TokenizationVision + DOMVision (Screen)Action Mapping
買収額 / 評価額$2.0B (阻止)非公開 (推計$10B+)$20B+ (企業価値)$200M+
主な弱点政治的リスクサーバーコスト高精度とレイテンシ専用ハードの壁

この数字が意味するのは、Manusが「実務で使えるレベル」に到達していた唯一に近いエージェントだったということです。成功率96%というのは、もはや人間が介在せずに放置できる閾値を超えています。対してClaude 3.5のComputer Useは、自由度は高いものの、スクショを送って解析を待つプロセス(5秒以上の待ち時間)が発生するため、ユーザー体験としてはまだ「実験的」な域を出ません。

Metaが20億ドルという、今のAIバブルからすれば「格安」とも言える金額でManusを落とそうとしたのは、この圧倒的なレイテンシの短さを手に入れるためでした。0.8秒で反応するエージェントであれば、スマホの音声アシスタントとしてストレスなく使えますが、5秒かかるエージェントは誰も使いません。

開発者が今すぐやるべきこと

この買収阻止を受けて、AIエージェントを自社サービスに組み込もうとしている開発者は、戦略の転換を迫られています。私が考える具体的なアクションは以下の3点です。

第一に、特定のクローズドなAIエージェントAPIに依存しすぎない「エージェント・オーケストレーション」の実装です。Manusのような優れた技術が政治的な理由で突然使えなくなる、あるいは特定の地域で利用不可になるリスクが現実のものとなりました。LangGraphやCrewAIのような、バックエンドのLLMや実行エンジンをプラグイン形式で切り替えられる構成を標準にするべきです。

第二に、自前での「Action Data」の蓄積です。Manusが強かった理由は、モデルの構造以上に「どの操作が成功に繋がったか」というログデータの質にありました。将来的に自社独自のタスク特化型エージェントを作る際、最も価値を持つのは学習用データです。Playwright等を用いた操作ログを構造化データとして保存するパイプラインを今すぐ構築してください。

第三に、ローカルLLMを用いたエージェント実行環境の検証です。今回の件で、エージェント技術は「データの主権」と密接に関わることが証明されました。企業の機密情報を扱うエージェントを構築する場合、API経由ではなく、RTX 4090等のローカル環境や自社サーバー上で完結するエージェントエンジンの需要が急増します。Llama-3-70Bクラスをベースにしたエージェント構築を、今のうちに検証しておく価値は十分にあります。

私の見解

正直に言って、今回の中国の決断はMetaにとっては致命傷に近い打撃ですが、私たち開発者コミュニティにとっては「健全な競争が維持された」とポジティブに捉えるべきだと私は考えています。

もしMetaがManusを20億ドルで飲み込んでいたら、この世界最高水準のエージェントエンジンはMetaのプロプライエタリな製品(例えばWhatsApp Agent専用)として閉じ込められていたはずです。ザッカーバーグはLLaMAをオープンにして「善人」の顔をしていますが、エージェント層という「収益化の出口」に関しては、間違いなく独占を狙っていました。

買収が阻止されたことで、Manusは独立した企業として生き残るか、あるいは他の中国企業に買収されることになります。これは、私たちがManusの技術をAPI経由で、あるいはよりオープンな形で利用できる可能性が残ったことを意味します。

ただし、今回の件で「AIエージェントの分断」が決定的になったことは否定できません。今後は「米国のエージェントは中国のサイトを操作できない(あるいは極端に制限される)」「中国のエージェントは米国のサービスにアクセスできない」という、いわば「技術的鎖国」が加速するでしょう。SIer時代、海外製品のローカライズに苦労した記憶が蘇りますが、AI時代のエージェント開発はそれ以上に「政治」をコードに反映させなければならない、面倒な時代に突入したと言えます。

よくある質問

Q1: MetaはManusの代わりにどの企業を買収する可能性がありますか?

現在は、米国に拠点を置く「MultiOn」や「Adept」の残党、あるいは「Skyvern」のようなオープンソース・ファーストのスタートアップが有力候補です。ただし、Manusほどのレイテンシと精度を両立している企業は少なく、Metaは自社でのスクラッチ開発に舵を切る可能性が高いでしょう。

Q2: 開発者として、中国製AIエージェントSDKを使うことにリスクはありますか?

今回の件で明らかな通り、地政学的リスクは非常に高いです。突然のサービス停止や、米国での利用禁止措置が考えられます。基幹システムへの導入は避け、まずは特定のワークフローの自動化など、リプレイスが容易な箇所から試すべきです。

Q3: Manusの技術がOSS(オープンソース)として公開される可能性はありますか?

可能性は低いです。中国当局が「戦略的価値がある」と認めた以上、技術の詳細は厳格に管理されるでしょう。ただし、そのアーキテクチャ(Semantic Tokenization)の論文が公開されれば、LLaMAコミュニティがそれを模倣した実装を出す可能性は大いにあります。


あわせて読みたい