数兆パラメータ規模のGoogle製Geminiモデルが、Apple独自サーバーに収まらず、Google Cloudへと持ち出される——。Wccftechは2026年6月4日、Appleが新Siriを支えるGoogle Gemini系の巨大モデルを自社サーバーに収めきれず、Google Cloud上で稼働させるかたちで妥協し、その代わりにNVIDIA B200 GPUの組み込み暗号化機能でユーザーデータの保護を担保しようとしているとThe Informationの報道を引用して伝えています。Apple silicon完結という当初方針からの後退を意味する内容であり、現時点ではあくまで報道ベースの情報で、Appleからの公式発表はありません。
Apple silicon 単独運用は断念か——「Private Cloud Compute」に収まらない巨大モデル
Wccftechによると、新Siriは社内で「Apple Foundation Models version 11」と呼ばれるGoogle製の高度なGeminiモデルを活用するとされています。同社はかつて、生成AI処理をApple silicon上で完結させると説明していました。
しかし、ライセンスを受けたGoogleのカスタムGeminiモデルは数兆パラメータ(trillions of parameters)規模に達するとされ、Appleが構築してきた専用サーバー基盤「Private Cloud Compute」に収め切れていないと報じられています。その結果、一部のユーザーリクエストは最適な推論性能を得るためにGoogle Cloud上のGeminiモデルで直接処理されるかたちになると伝えられています。
Gurman氏は同モデルについて、「Gemini 3と競合する水準で、大幅に高性能になることが見込まれる(the model is expected to be competitive with Gemini 3 and significantly more capable)」と評価しており、Wccftechはその比較対象が現行の刷新版Siriを支えているモデルである点を補足しています。Appleはさらに、教師モデルから能力を継承させる「蒸留(distillation)」と呼ばれる手法を使って、より小さな端末上で動く生徒モデル群も並行して訓練していると説明されています。今回の場合、教師モデルにあたるのがライセンスを受けたGoogle Geminiモデルだとされています。
妥協策は NVIDIA B200 の「処理中暗号化」——Google からの吸い上げを防ぐ狙い
Wccftechが引用するThe Informationの報道では、Appleはこの「Google側のサーバーで動くSiri」のプライバシー懸念をやわらげるために、Google社内のサーバーにNVIDIA B200 GPUを配備する方向に傾いているとされています。
選定理由として強調されているのが、B200に搭載されている処理中データの暗号化機能です。NVIDIAは公式に、この機能について次のように説明していると紹介されています。
「Rubin、Blackwell、Hopper GPU上に展開されるAIモデルの機密性と完全性を維持する」
「共有環境やクラウド環境であっても、ほぼネイティブな性能(near-native performance)で機密性の高いAIワークロードを安全かつ大規模に実行できる」
つまり、モデル本体がGoogleのデータセンターで動いていても、推論中のユーザーデータはGPU内で暗号化された状態で扱われ、Google側のソフトウェアから生で参照されないようにする、というのが今回の妥協策の骨子だと読める内容です。
結局Appleは何を諦めたのか
The Informationが伝える内容が事実だった場合、ユーザーから見た新Siriは、表向きは従来通り「Appleのプライバシー基準で守られたアシスタント」として提供されます。一方で、その内部処理は以下のような構成になる可能性があります。
| 処理階層 | 担当 | 役割 |
|---|---|---|
| 端末上の軽量モデル | Apple silicon | 蒸留で学習された小型モデル群 |
| クラウド推論 | Google CloudのNVIDIA B200 | 数兆パラメータ規模のカスタムGeminiモデル |
| プライバシー保護 | B200の組み込み暗号化機能(Rubin/Blackwell/Hopper世代に共通) | 推論中もデータをGPU内で暗号化 |
ユーザー視点で言い換えると、端末上での軽い処理はこれまで通りApple silicon上で完結し、重い処理だけが外部に出るかたちになります。Appleが諦めたのは「クラウド推論まで含めて自社インフラで完結させる」という当初構想の最後のピースであり、外形上のプライバシー約束(生データはGoogleに渡らない)は暗号化機能で担保しようとしている、と読める動きです。
現時点での読み解き
この件は、AppleもGoogleもNVIDIAも公式には認めていない報道ベースの情報です。一次情報はThe Informationが取材したもので、Wccftechがその内容を引用するかたちで伝えています。報道に登場するモデル名「Apple Foundation Models version 11」、Gurman氏のGemini 3との比較コメント、B200採用方針などは、いずれも現段階で公式発表されたものではない点に注意が必要です。
現時点では、「新Siriのクラウド側は完全にApple純正のインフラで完結する」という当初の説明から、「Google Cloud上のNVIDIA B200を借りつつ暗号化で間に合わせる」方向に揺り戻している可能性がある、と受け止めるのが妥当です。最終的な構成は変わる余地もあり、続報を待つ段階といえます。
契約規模は年間約10億ドル——カスタムGeminiは1.2兆パラメータ規模
Apple-Google間の提携の具体的な数字も周辺報道で明らかになりつつあります。複数のメディアによる報道では、契約の規模感とモデル仕様について次の内容が伝えられています。
- Appleは年間約10億ドルをGoogleに支払う方向で調整しているとの報道があります
- Siri/Apple Intelligence向けにカスタマイズされたGeminiモデルは1.2兆パラメータ規模とされています
- このサイズはAppleが従来運用してきた1500億パラメータのクラウドモデルの約8倍に相当します
- 両社は複数年契約として共同声明を発表しています
「Apple Foundation Models version 11」の正体は数兆パラメータと総称されてきましたが、周辺報道では1.2兆パラメータという具体的な数値も示されています。年間10億ドルという支払い規模は、Apple silicon完結という当初構想を維持できなかった事情の大きさをうかがわせる材料となっています。
B200の「処理中暗号化」はNVLink・CPU間経路にも及ぶ多層構造
B200に組み込まれた機密計算機能は、GPUメモリ単体の暗号化にとどまらず、システム全体にわたる多層的な保護を提供する設計となっています。
Confidential Computingモードで保護される範囲
Blackwell世代のCC(Confidential Computing)モードでは、モデル重み・学習データ・推論結果を含むGPUメモリ上のデータがすべて暗号化された状態で扱われます。マルチGPUパススルー構成では、NVLink経由のGPU間通信もハードウェア暗号化の対象となり、CPU-GPU間のトラフィックはbounce bufferを介して暗号化される仕組みです。さらにIntel TDXとNVIDIA双方によるDual Remote Attestationを通じて、ワークロードが正規のハードウェア上で改変されていないコードで動作していることを暗号学的に検証できるとされています。CorvexはHGX B200上での機密計算の本番運用展開を完了したと発表しており、Blackwell世代の機密計算機能が外部事業者の実環境で稼働段階に入っていることを示しています。
Q&A
Q. 新SiriのユーザーデータはGoogleに見られてしまうのですか? The Informationの報道どおりであれば、推論中のデータはB200のGPU内で暗号化された状態で扱われるため、Google側のソフトウェアから生のデータを参照できない設計を狙っているとされています。ユーザーとしての結論を言えば、「報道どおりに実装されれば、従来のSiriに近いプライバシー水準が維持される見込みだが、Apple自身が公式に保証したわけではないため、最終仕様の発表までは様子見が妥当」というのが現時点での落としどころです。
Q. なぜAppleは自社サーバーで完結させなかったのでしょうか? Wccftechによると、ライセンスされたGoogleのカスタムGeminiモデルが数兆パラメータ規模で、Apple独自の「Private Cloud Compute」基盤に収め切れなかったためだと報じられています。最適な推論性能を得るには、Google Cloud側の大規模インフラを使う必要があったとされています。
Q. NVIDIA B200の暗号化機能は新しい技術ですか? B200を含むHopper/Blackwell/Rubin世代のGPUには、AIモデルや処理中データを暗号化された状態で扱うConfidential Computing機能が搭載されているとNVIDIA自身が説明している、と紹介されています。今回の件はその機能がハイパースケーラー間のデータ分離用途に使われる事例として注目されています。
出典
- Wccftech — Apple Quietly Surrenders To A Compromise On The New Siri, Leaning On NVIDIA’s B200 GPU Encryption To Prevent Google From Siphoning Off User Data
- Introl Blog — Apple-Google Gemini Partnership
- Spheron Blog — Confidential GPU Computing on Cloud: Deploy LLMs with NVIDIA TEE and Encrypted VRAM