실리콘밸리가 중국 모델에 환호할 때 — 오픈웨이트가 바꾸는 창업 원가표

딥시크 V4가 출력 100만 토큰당 3.48달러다. 같은 일을 시키는 데 오픈AI는 30달러, 앤스로픽은 25달러를 받는다. 가중치를 내려받아 직접 돌릴 수 있는 중국 모델에 실리콘밸리가 환호하는 지금, 창업자의 질문은 ‘쓸 거냐’가 아니라 ‘내 원가표를 닫힌 API에 묶어둘 거냐’다.

무슨 일이 있었나

항저우의 딥시크가 4월 V4를 내놨다. 두 종류다. 닫힌 최상위 모델에 견줄 성능이라는 V4-Pro, 그리고 더 작고 더 싼 V4-Flash. 가격이 충격이다. V4-Pro는 출력 100만 토큰당 3.48달러, V4-Flash는 0.28달러다. 같은 분량을 오픈AI는 30달러, 앤스로픽은 25달러에 판다. 한 자릿수 배가 아니라 거의 한 자릿수 분의 1 수준이다. 게다가 딥시크는 가중치를 공개하는 오픈웨이트 노선을 이어간다. 코드를 내려받아 고치고, 내 서버에서 직접 돌릴 수 있다. 성능은 어떨까. MIT 테크놀로지 리뷰는 V4가 GPT-5.4와 제미나이 3.1 프로에 근소하게 못 미친다고 봤다 — 최상위와 석 달에서 여섯 달 격차. 1년 전 R1이 그랬듯, 닫힌 모델과의 거리가 ‘따라잡을 수 없는 절벽’이 아니라 ‘몇 달짜리 지연’으로 좁혀졌다는 게 핵심이다. 화웨이 어센드 칩이 딥시크 모델을 전면 지원한다는 발표까지 겹치면서, 엔비디아 의존을 줄이는 중국발 스택의 윤곽도 잡혔다. 실리콘밸리가 이 모델에 환호하는 건 애국심의 반대라서가 아니라, 같은 결과를 10분의 1 가격에 주기 때문이다.

창업자에게 의미하는 것

표면적으로는 ‘AI값이 또 내렸다’는 뉴스다. 그런데 그 아래에는 원가 구조의 갈림길이 깔려 있다. 닫힌 API 위에 제품을 세운 창업자는 공급사의 가격표를 그대로 받아 적는 가격수용자다. 토큰값을 내가 정할 수 없고, 모델이 바뀌면 출력도 바뀌고, 약관이 바뀌면 내 사업도 흔들린다. 오픈웨이트는 그 관계를 뒤집는다. 가중치를 손에 쥐면 모델은 공급사의 클라우드에 있는 ‘서비스’가 아니라, 내 인프라 위에서 돌리는 ‘자산’이 된다. 대량으로 추론을 태우는 제품이라면 이 차이가 곧 마진이다. 100만 토큰당 25달러와 3.48달러의 간극은, 월 수억 토큰을 굽는 회사에서 흑자와 적자를 가른다. 다만 공짜 점심은 없다. 오픈웨이트를 직접 돌리려면 GPU를 빌리고 서빙 스택을 운영해야 하고, 그 운영비가 작은 트래픽에선 닫힌 API보다 비쌀 수 있다. 그래서 이건 ‘딥시크로 갈아타라’가 아니라 ‘내 원가표의 주도권을 누가 쥐는가’의 문제다. 지정학 리스크도 정직하게 봐야 한다. 가중치는 내 손에 있어도, 모델의 출신과 규제 정합성, 데이터 처리 정책은 따로 떼어 점검할 문제다 — 특히 미국·EU 고객을 상대하거나 민감 데이터를 다룬다면. 오픈웨이트가 매력적인 이유와 위험한 이유가 같은 출처에서 나온다는 걸 기억해야 한다.

지금 취할 수 있는 행동

먼저 추론 호출을 추상화 계층 뒤로 숨겨라. 모델 한 곳에 코드를 직접 묶지 말고, 닫힌 API와 오픈웨이트를 같은 인터페이스로 갈아끼울 수 있게 짜라. 가격이나 약관이 흔들릴 때 코드를 다시 쓰지 않고 모델만 바꾸는 게 진짜 협상력이다. 둘째, 워크로드를 쪼개라. 품질이 결정적인 핵심 경로는 최상위 닫힌 모델로, 대량·정형 작업은 싼 오픈웨이트로 — 한 모델에 전부 태우는 건 가장 비싼 설계다. 셋째, 오픈웨이트를 도입하기 전에 ‘직접 서빙’과 ‘호스팅 API’ 두 경로의 실제 총비용을 트래픽 구간별로 계산하라. 토큰 단가만 보면 함정이다. 넷째, 모델의 출신과 데이터 정책을 컴플라이언스 항목으로 문서화하라. 싸다는 이유로 들였다가 규제·고객 신뢰에서 더 큰 비용을 치를 수 있다.