DeepSeek가 자사 코드 추론 모델인 deepseek-v4-pro API의 가격을 한시적으로 75% 깎는 프로모션을 발표했다. 동시에 claude-code 같은 외부 코딩 에이전트에서 100만 토큰짜리 context-window를 활성화할 수 있도록 통합 옵션도 함께 풀었다. 적용 기한은 2026년 5월 5일 15:59 (UTC) 까지로, 단기 체험이나 사이드 프로젝트의 모델 비용을 줄여 보려는 개발자라면 한 번쯤 들여다볼 만한 묶음이다.

DeepSeek V4-Pro 공지 이미지

이미지: @deepseek_ai 공식 계정이 올린 V4-Pro 공지 그래픽, 출처: @deepseek_ai on X

무엇이 일어났나

@deepseek_ai 가 X에 올린 짧은 공지의 실질 내용은 세 가지다.

  1. V4-Pro api 가격이 75% 인하된다. 기한은 2026-05-05 15:59 UTC. 가격 구간(입력·출력·캐시) 각각에 어떻게 적용되는지는 공지 본문이 아닌 별도 API 문서에서 확인해야 한다.
  2. Claude Code에서 모델 이름을 deepseek-v4-pro[1m] 으로 지정하면 100만 토큰 컨텍스트가 열린다. 즉, 책 한 권 분량을 한 번에 모델에 던질 수 있다는 뜻이다.
  3. OpenCode는 v1.14.24 이상, OpenClaw는 v2026.4.24 이상으로 업데이트하면 같은 기능을 쓸 수 있다.

왜 중요한가

세 가지 흐름이 동시에 움직였다는 점이 핵심이다.

먼저 가격. 75% 라는 숫자 자체에 현혹되면 안 된다. 평소 가격이 얼마인지, 프로모션이 끝난 뒤 가격이 어떻게 책정될지를 같이 봐야 진짜 절약 폭이 보인다. 다만 큰 작업을 단기간에 시험해 보고 싶었던 사용자에게는 부담이 줄어드는 건 분명한 사실이다.

둘째, context-window 100만 토큰. 한국어 기준으로 대략 책 두세 권 분량이다. 사내 문서 전체를 한 번에 모델에게 읽혀 보거나, 거대한 코드베이스를 통째로 보여 주는 식의 시도가 가능해진다. 다만 "넣을 수 있다" 와 "넣은 만큼 똑똑하게 활용한다" 는 다른 이야기다. 컨텍스트가 길어질수록 모델이 중간 부분 정보를 흘리는 lost-in-the-middle 현상은 이미 잘 알려진 한계다.

셋째, 통합 도구의 동시 업데이트. DeepSeek가 자사 클라이언트만 광고한 게 아니라 claude-code 와 OpenCode, OpenClaw 같은 서드파티 에이전트와의 호환을 함께 발표했다는 점은, 사용자가 굳이 새로운 도구를 깔지 않고도 익숙한 환경에서 이 모델을 바로 시험할 수 있게 됐다는 뜻이다.

더 깊이

이번 공지는 DeepSeek가 폐쇄형 frontier-model 들과 경쟁하는 전형적인 패턴을 보여 준다. Anthropic 의 Claude 나 Google 의 Gemini 가 가격·컨텍스트·도구 통합으로 차별화를 시도해 온 사이, 중국발 공개·반공개 모델들은 보통 가격을 먼저 낮추고 긴 컨텍스트로 따라붙는 방식으로 시장 점유율을 가져왔다. deepseek-v4-pro[1m] 옵션이 명시적으로 제공되는 것도 같은 맥락에서 읽힌다.

다만 "Pro" 같은 접미사가 정확히 무엇을 가리키는지, 기본 모델과 [1m] 변형 사이에 가중치 자체의 차이가 있는지, 아니면 단순히 추론 시 컨텍스트 한도만 늘린 것인지는 별도 문서 확인이 필요하다.

아직 알 수 없는 것

  • 할인 후 평상시 가격이 얼마로 돌아오는지. 5월 5일 이후 가격이 곧장 4배로 회복된다면 실효성은 단기 체험에 그친다.
  • 1M 컨텍스트에서의 실제 성능. 토큰 한도와 활용 능력은 다른 지표다.
  • [1m] 변형의 비용 구조. 컨텍스트가 늘면 단가가 함께 오르는 경우가 일반적이다.
  • OpenClaw 의 정체. 본 공지는 도구의 출처·라이선스를 따로 언급하지 않았다.

5분 실습

  1. 이미 claude-code 를 쓰고 있다면, 설정에서 모델 이름을 deepseek-v4-pro[1m] 로 바꿔 본다.
  2. 사내 위키 한 챕터(약 5-10만 토큰)를 통째로 붙여 넣고 "이 문서에서 서로 모순되는 두 부분을 찾아 줘" 라고 요청한다.
  3. 같은 입력을 평소 쓰는 모델(Claude, GPT 등)에도 던져 비교한다.
  4. 응답의 정확성·속도·비용을 메모해 둔다.