Released2025-02
Developed byAnthropic
TypeTool
Aliasesclaude code
RelatedCodex (OpenAI), GitHub Copilot, Cursor, AI 에이전트, 에이전틱 AI

무엇인가

Claude Code는 Anthropic이 만든 AI 코딩 도우미다. 사람이 키보드로 한 줄씩 타이핑하는 대신, "이 버그를 고쳐줘" 또는 "로그인 기능을 추가해줘"처럼 자연어로 부탁하면 도우미가 직접 파일을 읽고, 수정하고, 테스트까지 돌려본다.

비슷한 도구로 OpenAI의 [[codex]], Microsoft·GitHub의 [[github-copilot]], 별도 스타트업의 [[cursor]]가 있다. 모두 사람의 의도를 받아 스스로 여러 단계를 처리하는 [[ai-agent]] 형태의 코딩 도우미다.

어디서 쓰나

같은 Claude를 네 가지 환경에서 쓸 수 있다.

  • 터미널 (CLI): 명령창에서 claude 한 줄이면 시작된다. 코드가 들어 있는 폴더에서 실행하면 그 코드를 이해한 상태로 대화가 시작된다.
  • VS Code · JetBrains 확장: 편집 중인 파일 옆에 대화창이 뜬다.
  • 웹 앱: claude.ai/code에서 브라우저만 있으면 된다.
  • 데스크톱 앱: Mac과 Windows용으로 따로 설치할 수 있다.

어떻게 일을 하나

  1. 사용자가 자연어로 부탁한다. 예: "결제 페이지에서 카드 번호 검증이 안 되는데 고쳐줘."
  2. Claude Code는 폴더 안 파일을 살펴 관련 코드를 찾는다.
  3. 의심 가는 부분을 수정한다.
  4. 테스트가 있으면 돌려 보고 결과를 보고한다.
  5. 사용자가 승인하면 변경 사항이 저장되고, 필요하면 깃 커밋까지 만든다.

다른 도구와 다른 점

입문자 입장에서 [[github-copilot]]은 "내가 타이핑할 때 옆에서 자동완성을 해 주는 친구"에 가깝다. Claude Code는 "부탁한 일을 처음부터 끝까지 대신 처리하는 비서"에 더 가깝다. 그래서 한 번에 여러 파일을 동시에 고치거나, 새 기능을 통째로 만드는 작업에 적합하다.

대신 사람이 결과를 꼭 살펴봐야 한다. AI가 코드 흐름을 잘못 이해할 수도 있고, 테스트는 통과하더라도 의도와 다르게 동작할 수도 있기 때문이다.

인터페이스 표면

Claude Code는 동일한 모델·세션 모델을 여러 표면에 노출한다.

  • CLI: 가장 기능이 풍부한 진입점. 워크트리, 플랜 모드, 서브에이전트 디스패치, 후크, MCP 서버 연결까지 모두 여기서 다룬다.
  • VS Code · JetBrains 확장: 에디터 안에서 같은 Claude 세션을 띄운다. 파일 변경은 즉시 에디터에 반영된다.
  • 데스크톱 앱: Mac과 Windows.
  • : claude.ai/code.

CLI 외 표면들은 같은 권한·후크·스킬을 공유한다.

모델 선택

기본은 Opus 4.7 또는 Sonnet 4.6 중 작업 성격에 따라 라우팅된다. Haiku 4.5는 비용·속도가 중요한 후크나 서브에이전트에서 자주 지정된다. /fast 명령으로 Opus 4.6 빠른 모드로 전환할 수도 있다. 모델 라우팅은 실무 비용 관리의 핵심 변수다.

확장 메커니즘

  • Skills: 마크다운 + 프론트매터로 워크플로우를 패키지화한다. Skill 도구로 호출되며 자동 디스커버리가 작동한다.
  • Subagents: 메인 컨텍스트를 보호하면서 독립 작업을 위임한다. Explore, general-purpose, Plan, code-reviewer 등이 기본 제공된다.
  • Hooks: settings.json에 정의한 셸 명령이 특정 이벤트(툴 호출 전후, 세션 시작 등)에 자동 실행된다. "앞으로는 매번 X 해줘" 같은 자동 동작은 이 메커니즘으로만 진짜로 구현된다.
  • MCP (Model Context Protocol): 외부 서비스(Atlassian, Notion, Telegram 등)를 도구로 노출한다. [[api]] 호출보다 한 단계 위의 통합 계층이다.
  • Plans · Worktrees: 큰 작업은 플랜 모드로 합의한 뒤 격리된 워크트리에서 실행하는 패턴이 표준이다.

Claude Design 연동

자매 제품 Claude Design에서 만든 디자인 산출물을 structured handoff bundle 형태로 받아 단일 명령에 구현으로 옮기는 design-to-code 파이프라인이 공식 지원된다.

비교

[[github-copilot]]·[[cursor]]가 인라인 자동완성과 페어 프로그래밍에 무게를 두는 데 반해, Claude Code는 장기 호흡(long-horizon) 편집—여러 파일·여러 단계·자율 도구 사용—에 최적화되어 있다. [[codex]]가 가장 가까운 경쟁 제품이며 같은 [[agentic-ai]] 코딩 카테고리에 속한다.

위치

Claude Code는 Anthropic의 [[agentic-ai]] 제품군 중 코딩 도메인 표면이다. 동일한 Claude 모델 가족(Opus 4.7, Sonnet 4.6, Haiku 4.5)을 CLI·IDE·Web·Desktop 등 다중 표면에 노출하며, 단일 세션 모델 위에 도구 사용·후크·서브에이전트·MCP 통합을 얹은 형태다. 모델 자체는 Mixture-of-Experts 계열 아키텍처([[mixture-of-experts]])를 활용하며, 코드 도메인의 사후학습에는 검증 가능 보상([[reinforcement-learning-from-verifiable-rewards]]) 신호가 활용된 것으로 알려져 있다.

에이전트 루프

표준 ReAct 계열이되 몇 가지 차별점이 있다.

  1. Long-horizon execution: 단일 사용자 발화로부터 수십에서 수백 회의 도구 호출과 다중 파일 편집을 자율 수행한다. 컨텍스트 윈도우가 한계에 가까워지면 자동 압축이 작동해 세션을 이어 간다.
  2. Subagent dispatch: 주 에이전트는 독립 작업을 별도 컨텍스트의 하위 에이전트로 위임한다. 결과만 압축해 메인 컨텍스트로 회수하는 방식으로 컨텍스트 오염과 토큰 비용을 동시에 관리한다.
  3. Tool surface: 파일 시스템(Read/Write/Edit/Glob/Grep), Bash, WebFetch/WebSearch, MCP 서버를 통한 외부 시스템(Jira, Notion 등)이 동등하게 노출된다. 모델은 호출 순서·병렬화 여부를 자율적으로 결정한다.

신뢰성 기제

  • Permission modes: 도구 호출은 사용자가 선택한 권한 모드로 실행되며, 자동 허용되지 않은 호출은 명시적 승인을 요구한다.
  • Hooks: settings.json의 셸 명령으로 툴 호출 전후에 정책을 강제할 수 있다(예: 커밋 전 lint, 위험 명령 차단).
  • Plans: 대규모 변경은 사전 합의된 계획에 따라 수행되도록 워크플로우가 제도화되어 있다.

Claude Design과의 결합

Anthropic은 자매 디자인 에이전트(Claude Design)에서 생성한 structured handoff bundle을 Claude Code의 단일 명령으로 수용하도록 인터페이스를 표준화했다. LLM 기반 design-to-implementation 파이프라인의 초기 상용 사례 중 하나다.

한계와 열린 문제

  • Verification gap: 모델이 테스트를 돌려 통과 여부를 보고하지만, 테스트 커버리지가 부족하거나 의도와 어긋나면 무결성을 보장하지 못한다. 사용자 검토가 마지막 안전장치다.
  • Cost-quality trade-off: 자율 실행은 토큰 비용을 빠르게 누적시킨다. 모델 라우팅과 서브에이전트 분배가 실무 비용의 핵심 변수다.
  • [[jagged-frontier]] 효과: 같은 모델이 어떤 코드베이스에서는 거의 사람만큼 동작하다가, 비슷해 보이는 다른 환경에서는 갑자기 실패한다. 표면 수준 데모로는 적용 가능 영역을 예측하기 어렵다.
  • Tool-use safety: 후크와 권한 모드가 있지만 자율 셸 실행은 본질적으로 위험을 동반한다. 격리된 워크트리·컨테이너 사용이 권장된다.
  • 검색 증강과의 관계: 코드 컨텍스트는 [[retrieval-augmented-generation]]이 아닌 능동 파일 탐색(grep/glob)으로 수집된다. 모델 자율성과 정확도 사이의 트레이드오프가 활발한 연구 영역이다.

비교

가장 가까운 경쟁 제품은 OpenAI의 [[codex]]다. 둘 다 long-horizon agentic 코딩을 표방한다. [[github-copilot]]과 [[cursor]]는 인라인 자동완성·페어 프로그래밍 인터랙션 쪽에 좀 더 무게가 있다.

이 용어를 언급한 기사