シリコンバレーが中国モデルに沸くとき — オープンウェイトが書き換える原価表

DeepSeek V4は出力100万トークンあたり3.48ドル。同じ仕事にOpenAIは30ドル、Anthropicは25ドルを取る。重みをダウンロードして自社で動かせる中国モデルにシリコンバレーが沸く今、創業者の問いは「使うか」ではなく「原価表を閉じたAPIに縛り続けるか」だ。

何が起きたか

杭州のDeepSeekが4月にV4を出した。二種類ある。閉じた最上位モデルに匹敵すると謳うV4-Pro、そしてより小さく安いV4-Flash。価格が衝撃だ。V4-Proは出力100万トークンあたり3.48ドル、V4-Flashは0.28ドル。同じ分量をOpenAIは30ドル、Anthropicは25ドルで売る。数パーセントの差ではなく、ほぼ一桁分の一の水準だ。しかもDeepSeekは重みを公開するオープンウェイト路線を続ける。コードをダウンロードして改変し、自社サーバーで直接動かせる。性能はどうか。MITテクノロジーレビューはV4がGPT-5.4とGemini 3.1 Proにわずかに及ばないと見る——最上位との差は三〜六か月。一年前のR1がそうだったように、閉じたモデルとの距離が「越えられない崖」から「数か月の遅れ」に縮んだのが要点だ。HuaweiのAscendチップがDeepSeekモデルを全面サポートすると発表したことも重なり、Nvidia依存を減らす中国発スタックの輪郭が見えてきた。シリコンバレーがこのモデルに沸くのは思想のためではなく、同じ結果を十分の一の価格で出すからだ。

創業者にとっての意味

表面的には「AIがまた安くなった」というニュースだ。だがその下には原価構造の分岐が横たわる。閉じたAPIの上に製品を築いた創業者は、ベンダーの価格表をそのまま写すプライステイカーだ。トークン単価を自分で決められず、モデルが変われば出力も変わり、規約が変われば事業も揺れる。オープンウェイトはこの関係を反転させる。重みを手にすれば、モデルはベンダーのクラウドにある「サービス」ではなく、自社インフラ上で動かす「資産」になる。推論を大量に焚く製品なら、この差がそのまま利益率だ。100万トークンあたり25ドルと3.48ドルの隔たりは、月に数億トークンを焼く会社で黒字と赤字を分ける。ただしタダ飯はない。オープンウェイトを自前で動かすにはGPUを借りてサービングスタックを運用する必要があり、その運用費は小さなトラフィックでは閉じたAPIより高くつくことがある。だからこれは「DeepSeekに乗り換えよ」ではなく「原価表の主導権を誰が握るか」の問題だ。地政学リスクも正直に見るべきだ。重みは手元にあっても、モデルの出自、規制適合性、データ処理方針は別途切り分けて点検する課題だ——とりわけ米国やEUの顧客を相手にし、機微なデータを扱うなら。オープンウェイトが魅力的な理由と危険な理由が同じ出所から来ることを忘れてはならない。

今とれる行動

まず推論呼び出しを抽象化レイヤーの背後に隠せ。一つのモデルにコードを直接縛らず、閉じたAPIとオープンウェイトを同じインターフェースで差し替えられるよう組め。価格や規約が揺れたとき、コードを書き直さずモデルだけを替えられることが本当の交渉力だ。次に、ワークロードを分けろ。品質が決定的な中核経路は最上位の閉じたモデルへ、大量・定型の作業は安いオープンウェイトへ——一つのモデルに全部焚くのが最も高い設計だ。三つめに、オープンウェイトを導入する前に「自前サービング」と「ホスティングAPI」両経路の実際の総コストをトラフィック帯ごとに計算せよ。トークン単価だけ見るのは罠だ。四つめに、モデルの出自とデータ方針をコンプライアンス項目として文書化せよ。安いという理由で入れた結果、規制と顧客の信頼でより大きな代償を払うことがある。