Codex, '시연으로 가르치기' 기능을 추가하다

Codex macOS 앱이 사용자의 화면 동작을 한 번 관찰해 재사용 가능한 자연어 스킬(skill-md|SKILL.md)을 자동 생성하는 'Record & Replay' 기능을 v26.616에 추가했다. 의도 기반 추론이라 픽셀·셀렉터 기반 rpa|RPA와 결이 다르다.

한눈에녹화 한 번으로 SKILL.md 자연어 명세 자동 생성, 재실행 시 모델이 현재 화면 상태에 맞춰 다시 추론macOS v26.616, ChatGPT Plus/Pro/Business/Enterprise/Edu, computer-use|Computer Use 사전 활성화 필수EEA·UK·스위스 초기 제외 — Computer Use EU 출시(6월 16일)와 맞물린 시차 이슈

실무자: 비용 정산·티켓 자동 생성·반복 데이터 입력 같은 사내 도구 워크플로를 RPA 재검토 없이 Codex 스킬로 흡수할 수 있는지 PoC 후보가 늘었다. 리더: Codex 단일 조직(ChatGPT+Codex+Developer API) 통합 이후 첫 번째 비개발자 타깃 인터페이스로, 엔터프라이즈 예산 공략이 가속된다.

이미지: 발표 주체인 OpenAI 사장 Greg Brockman, 출처: @gdb on X

OpenAI는 2026년 6월 18일 codex|Codex macOS 앱 v26.616 업데이트와 함께 Record & Replay를 정식 출시했다. Greg Brockman은 X에 "you can now teach Codex by demonstration"이라는 한 줄과 함께 데모를 공개했고, @OpenAIDevs 계정은 "Show Codex a workflow once. Reuse it as a skill"이라는 표제로 동시 발표했다. 코딩 보조 도구로 출발한 Codex가 화이트칼라 업무 자동화 플랫폼으로 한 발 더 들어간 분기점이다.

무엇이 일어났나

사용자는 Codex 앱에서 "Plugins → Record a skill"을 선택하고 워크플로 컨텍스트를 짧게 적은 뒤, Codex에 화면 관찰 권한을 부여하고 Mac에서 평소처럼 작업을 수행한다. Codex는 키보드·마우스 액션과 활성 창 내용을 함께 수집하며, 녹화가 끝나면 다음을 담은 SKILL.md를 자동 작성한다.

이 워크플로를 언제 사용해야 하는가
필요한 입력 변수 (날짜·파일·URL 등)
따라야 할 단계
실행 결과 검증 방법

재실행 시에는 픽셀을 재생하지 않는다. 추론 모델이 SKILL.md를 컨텍스트로 읽은 뒤, 현재 화면 상태에 맞춰 동작을 새로 추론한다. 따라서 UI 레이아웃이 살짝 바뀌어도 워크플로가 깨지지 않는 적응형 동작이 가능하다.

함께 출시된 부가 기능도 주목할 만하다. Automations 히스토리에 대한 일괄(bulk) 작업이 추가됐고, 로컬·원격 호스트 간 스레드 핸드오프(thread hand-off) — 동일 세션을 다른 머신으로 넘겨 이어 작업할 수 있는 기능 — 가 함께 들어왔다.

숫자로 보기

출시 버전: Codex macOS v26.616 (2026-06-18)
이용 자격: ChatGPT Plus / Pro / Business / Enterprise / Edu
지역 제외: EEA, UK, 스위스 (Computer Use 6월 16일 EU GA 직후라 시차 이슈로 추정)
플랫폼: macOS 단독 (Windows·Linux·iOS·Android 미지원)
연결 플러그인: 20개 이상 (Google Workspace, Slack, Gmail, Notion, Salesforce, HubSpot, YouTube 포함)
Codex 주간 개발자 사용자: 300만 명 이상 (출시 직전 기준)

왜 중요한가

Record & Replay는 도구 표면이 다층적이라 단순한 매크로 도구가 아니다. ExplainX 분석에 따르면 Codex는 ▲Computer Use 기반 데스크톱·앱 조작, ▲브라우저 자동화(인증 처리 포함), ▲연결된 플러그인의 직접 API 호출, ▲이들을 단일 스킬 안에서 섞어 쓰는 하이브리드 실행을 모두 지원한다. 모델이 매 단계마다 "이 단계는 API 호출이 더 빠르니 API, 저 단계는 UI 조작 필요"를 스스로 결정한다.

엔지니어 관점에서 이는 두 가지 의미가 있다. 첫째, 사내에 자체 RPA 스택(UiPath·Automation Anywhere 등)을 운용하던 팀은 신규 워크플로 추가의 한계 비용이 낮아지므로 마이그레이션 후보를 재검토할 가치가 있다. 둘째, 자체 도구의 공개 API가 없어 RPA로만 자동화 가능했던 레거시 데스크톱 앱도 Codex 한 줄에 묶을 수 있다. SKILL.md 자체가 사람이 읽을 수 있는 산출물이라 코드 리뷰·감사 가능성도 RPA 좌표 스크립트 대비 향상된다.

스킬은 팀 단위로 공유 가능하며, 다수의 스킬과 mcp-protocol|MCP 서버를 함께 패키징하려면 별도 플러그인으로 묶으라는 가이드라인이 공식 문서에 적혀 있다.

누가 이득, 누가 손해

자체 코딩 인프라에 종속되지 않는 비개발자 직군 — 재무·HR·CS·운영 — 이 가장 직접적인 이득을 본다. X 평론가 Kai(@hqmank)는 이 업데이트를 "처음으로 직원 대체가 구체적으로 그려지는 Codex 업데이트"라고 평하며 비용 정산·티켓 생성 등 일상 사무 업무가 직접 영향권에 들어왔음을 강조했다.

압박을 받는 쪽은 ▲좌표·DOM 셀렉터 의존도가 높은 전통 RPA 벤더, ▲단순 클릭·복사 위주 BPO 인력, ▲비개발자용 노코드 워크플로 빌더 일부다. 다만 엔터프라이즈 거버넌스(감사·롤백·롤 기반 제어)에선 기존 RPA 플랫폼의 운영 성숙도가 여전히 우위이므로, 단기적으로는 보완적 도입이 현실적이다.

더 깊이

비교 좌표를 명확히 잡으면 다음과 같다.

Anthropic claude-skills|Claude Skills: 동일하게 자연어 SKILL.md 명세를 쓰지만, 사람이 직접 작성해야 한다. Codex는 작성 부담을 시연으로 대체해 비개발자 진입 장벽을 낮췄다.
Perplexity Brain: 일상 세션에서 수동적으로 학습. 명시성·통제성이 낮은 대신 학습 비용이 0에 가깝다.
전통 RPA(UiPath, Automation Anywhere): 좌표·셀렉터 의존 → UI 변경에 취약. Codex는 의도 캡처로 부드러운 변화에 대응 가능.

OpenAI 공식 문서가 예시로 든 워크플로는 비용 정산서 제출, 주차 예약, 티켓 시스템 양식 이슈 생성, 썸네일·자막을 포함한 YouTube 영상 업로드, 정기 보고서 다운로드, 휴가 신청이다. 즉 "설명하기보다 보여주기가 쉬운" 업무가 명시적 타깃이다. StartupHub.ai는 YouTube 업로드 데모를 집중 조명하며, 메타데이터·썸네일·자막·공개 범위까지 한 번 보여주면 다음 영상부터는 한 줄 지시로 반복된다는 점을 강조했다.

이번 출시는 시점 측면에서도 정확히 들어맞는다. 2026년 4월의 'Codex for (almost) everything' 업데이트로 백그라운드 PC 조작·인앱 브라우저·이미지 생성·메모리·90개 이상 플러그인이 들어왔고, 5월에는 ChatGPT·Codex·Developer API가 Brockman 휘하 단일 조직으로 통합됐다. Record & Replay는 그 통합 라인업에 비개발자 인터페이스를 끼워 넣은 결정타다.

아직 알 수 없는 것

자격증명·보안: 공식 가이드는 "녹화 중 비밀번호·민감정보 입력 금지"라는 수준의 권고에 머문다. 화면 캡처 기반인 만큼 의도치 않은 PII 노출 가능성이 남는다.
시연 품질 의존성: "지저분한 녹화는 지저분한 스킬을 만든다"는 표현이 여러 매체에 인용됐다. 1차 데모의 정확성이 곧 신뢰도다.
취약성 벤치마크 부재: UI 개편·예상 못 한 모달·인증 만료 시 모델이 정말로 복구하는지에 대한 정량 평가는 미공개.
모델 명세 미공개: SKILL.md 해석과 화면 추론을 담당하는 모델 버전이 Codex 자체 모델인지 GPT-5계열 일반 모델인지 명시되지 않았다.
EEA·UK·스위스 제외 사유: Computer Use EU 출시 시차 때문인지, 별도 규제 검토 사안인지 OpenAI가 명시하지 않았다.

5분 실습 (보통 · 5분)

Codex macOS 앱을 v26.616 이상으로 업데이트하고, ChatGPT 유료 구독에서 Computer Use 활성화 여부 확인.
Plugins → "Record a skill" 클릭, 워크플로 설명 한 줄 입력 (예: "GitHub Issues에서 라벨 'bug'인 항목을 추출해 Notion DB에 등록").
화면 녹화 권한 허용 후 평소처럼 실행 — Issues 필터링, 각 이슈 클릭, Notion으로 복사·붙여넣기.
녹화 중지 → Codex가 작성한 SKILL.md를 검토. 변수(label, notion_db_id)가 제대로 추출됐는지 확인.
다음 트리아지 사이클에선 "label='regression'으로 같은 스킬 돌려" 한 줄로 재실행. 단일 녹화·일괄 처리·실패 복구 측면에서 기존 RPA 워크플로와 비교 메모.

더 읽어보기

Record & Replay – Codex (OpenAI Developers) · 2026 · 공식 사용 가이드와 활용 사례
OpenAI Codex Changelog · 2026 · v26.616 변경 내역
The Decoder – Codex can now watch you work once · 2026 · EU 출시 시차 분석 포함
ExplainX – Teach It Your Workflow by Showing It Once · 2026 · Claude Skills·Perplexity Brain·RPA 비교
Crypto Briefing – OpenAI Record & Replay Plugin · 2026 · 엔터프라이즈 예산 로드맵 해석