QualcommがMetaにサーバーCPUを売る — 創業者の推論コストの底がまた動いた

Qualcommが自社データセンターCPU「Dragonfly C1000」を発表し、Metaを初の顧客に据えた。量産は2028年。ワットあたり性能2倍、推論アクセラレータはGPU比で最大8倍だという。NvidiaのGPUとx86の二強構造がカスタムシリコンとARM系サーバーチップへと崩れ始めた。モデルの上に製品を載せる創業者にとって、これは推論コストとベンダーロックインの問題だ。

何が起きたのか

2026年6月24日、Qualcommがデータセンター事業の初めてのチップを発表した。核心は二つ。一つはサーバー向けCPU「Dragonfly C1000」。自社設計のOryonコアを250基以上載せ、動作周波数は5GHzを超える。既存製品比でワットあたり性能が2倍以上というのがQualcommの推定値だ。もう一つは推論専用アクセラレータ「Dragonfly AI300」。既存のGPUベース構造よりワットあたり性能が4倍から8倍優れていると会社は主張する。どちらも2028年に商用化され、Metaが2028年後半からこのCPUを次世代サーバーに採用する。ザッカーバーグ自身が「次世代CPUの設計でQualcommとの協業を続けられて嬉しい」とコメントした。

なぜこれが一社の新製品発表を超えるのか。データセンターの計算は長らく二本の軸で回ってきた。学習と推論はNvidiaのGPUが、それを支えるサーバーの頭脳はIntel・AMDのx86 CPUが握ってきた。Qualcommは両方を同時にねじる。CPUはx86ではなくモバイルで育てた自社コアで、アクセラレータはNvidiaのGPUではなく推論特化のシリコンで攻める。そしてこれはQualcommだけの話ではない。AmazonはGravitonのCPUとTrainiumの学習チップを、GoogleはTPUを、OpenAIはBroadcomと自社推論チップを作っている。巨大事業者が一斉に「汎用GPUとx86」の外へ降りていく流れの一場面だ。

創業者にとっての意味

表向きはチップ各社のプライド争いに見える。だがモデルAPIの上に製品を載せる創業者にとっては、コストの最下層が動く出来事だ。推論はすでにAIネイティブ製品の売上の5分の1以上を食う費用項目だ。その推論を回すシリコンが多様になるのは、長い目で見れば単価下落の圧力であり好材料だ。だがタイミングは冷静に見るべきだ。Dragonflyは2028年量産。今すぐクラウドの請求書が安くなるのではなく、2〜3年後に供給構造が変わるという予告編だ。今日の意思決定にこれをどう織り込むかが分かれ目になる。

日本の創業者には、もう一段遠く感じられるかもしれない。ソニーはイメージセンサーで半導体の上流に強いが、生成AIの推論基盤までは降りていない。LINEヤフーのような大型プラットフォームでさえ、推論は結局、海外事業者のGPUやクラウドに依存する。つまり国内スタートアップの多くは「Nvidia一社依存」という単一リスクの上に事業を建てている。Qualcomm・Amazon・Google・OpenAIがチップを割り始めたということは、その単一依存を崩す選択肢が2028年頃に実際に生まれるという意味だ。問題は、その選択肢を使うには、今からコードが特定のチップ・特定のモデルに釘付けになっていてはいけないことだ。モデルへのアクセス権が堀ではないように、特定シリコンに縛られた推論パイプラインも負債だ。供給が多様化したとき乗り換えられる会社だけが、その単価下落を自社のマージンに取り込める。

今できること

まず推論を一つの事業者、一つのチップに釘付けにするな。同じ処理を別のモデル・別のバックエンドで回せるよう、抽象化レイヤーを一枚かぶせておけ。2028年に供給が多様化したとき、乗り換えられる会社とそうでない会社のマージンが分かれる。第二に、「ワットあたり8倍」という見出しに振り回されず、自社製品のトークン単位の経済を直接数字で開いてみろ。チップが安くなれば自動的に損益が良くなるわけではない。価格を決めるのは依然として事業者だ。第三に、2028年をロードマップに先に書き込め。今、2年のクラウド契約やインフラ判断をするなら、その時点で供給地形が変わることを交渉カードに使え。第四に、堀をチップやモデルではなく、自分が制御する資産の上に建てろ。自社データ、ワークフローに刺さった統合、ドメイン知識 — 誰が推論を半額で解放しても揺るがないものだ。巨大事業者が最下層を統合するほど、特定の産業・言語・規制に特化した狭く深い席はむしろ空いていく。