OpenAIが自社チップを作り始めた — 創業者が見直すべきAIコストの最下層

OpenAIがBroadcomと初の自社推論チップ「ハラペーニョ」を公開した。ワットあたり性能は既存GPUを上回り、コストは約半分だという。モデルAPIの上に製品を載せる創業者にとって、これはチップの話ではなく、推論価格と供給網の支配権が誰の手に渡るかという問題だ。

何が起きたのか

2026年6月24日水曜、OpenAIが自社設計の初の推論専用チップ「ハラペーニョ(Jalapeño)」を発表した。昨年10月に公表したBroadcomとの提携が、わずか9か月で実物のシリコンになった。学習ではなく推論、つまり完成したモデルがユーザーの要求にリアルタイムで応える段階だけに使うチップだ。事前学習は引き続きNvidiaのGPUに任せる。面白いのは、設計そのものをOpenAIのモデルが手伝った点だ。会社が示した初期の数字は二つ。ワットあたり性能が現行最高水準のGPUを明確に上回り、運用コストは一般的なAI向けGPUのおよそ半分。Codexのようなリアルタイムのコーディングモデルを安く回せることを特に強調した。これでOpenAIはチップ・カーネル・メモリ・ネットワーキング・スケジューリング・デプロイまで、スタック全体を自社の手中に収めた。だがこれはOpenAIだけの話ではない。Googleは2015年からTPUを回し、AmazonはTrainiumとInferentia、MicrosoftはMaia、MetaはMTIAを動かす。推論がすでにAI計算の約3分の2を占めるなか、巨大事業者が一斉にNvidia以外のシリコンへ降りていく流れの一場面だ。自社でチップを作らない者でさえ、BroadcomとMarvellという二社が設計市場の約95%を握り、その全てをTSMCが刻んでいる。

創業者にとっての意味

表向きは「Nvidia依存を減らした」という企業戦略の話に見える。だがモデルAPIの上に製品を載せた創業者にとっては、コスト構造の最下層が揺れる出来事だ。推論はすでに、多くのAIネイティブ企業で売上の2割超を食うコスト項目になっている。その推論を回すチップ代が半分になるなら、短期的には朗報だ。しかし本当の signal は、支配権がOpenAI一社へさらに深く集中することにある。モデルも彼らのもの、いまやそのモデルを回すチップも彼らのものだ。価格を下げることも、希少なシリコンを自社優先のワークロードに回すことも、特定モデルを自社ハードに縛ることもできる。他社のフルスタックの上に会社を建てるとは、梯子をまるごと借りることであり、借りた梯子はいつでも外されうる。日本の創業者にはより遠く、より抽象的に感じられるかもしれない。SonyやSoftBankは資本やデータでAIに関わるが、推論を回す現場は結局、海外事業者のGPUやクラウドに依存する。LINEヤフーやメルカリのような大手プラットフォームでさえ、その点は変わらない。つまり国内スタートアップの多くは「Nvidia依存」を超えて「特定の米国モデル事業者依存」という二重の従属に置かれる。チップ単価が下がっても利益が戻るわけではない。誰がその単価を決め、いつ変えるかが、自社の損益を分ける。モデルへのアクセスは堀ではなく、いまやそのモデルが動くインフラまで他人のものだという事実を、価格表の一行に書き込んでおくべきだ。

今できること

まず、推論の供給網を一社に集中させないこと。OpenAIがチップまで垂直統合する今、単一のモデル事業者に縛られた製品は、その相手の価格・方針の変化に無防備だ。同じ処理を別のモデルでも回せるよう、抽象化レイヤーを一枚挟んでおく。次に、「チップ代半分」の見出しに安心せず、自社製品のトークン単位の経済を自分の手で数字に落とすこと。価格を決めるのは自分ではなく事業者だ。前提が変われば損益も変わる。三つ目に、堀をモデルやチップではなく、自分が支配する資産の上に築くこと。自社のデータ、ワークフローに深く刺さった統合、ドメイン知識 — 誰がチップを半額で放出しても揺るがないものだ。四つ目に、垂直統合の流れを機会としても読むこと。巨大事業者が自社スタックに集中するほど、特定の産業・言語・規制に特化した狭く深い席はむしろ空いていく。皆が最下層を統合するとき、創業者の席はその上の薄い応用層ではなく、事業者が入ってこない隅にある。