OpenAI가 이번 주 두 가지 발표를 내놓았다. 하나는 팀 단위로 공유해 쓰는 workspace-agents를 ChatGPT 안에 넣은 것이고, 다른 하나는 개발자 도구였던 codex를 코드 작성 외의 일상 컴퓨터 작업으로 넓힌 것이다. 두 발표는 별개처럼 보이지만, 합치면 '팀 동료처럼 일하는 AI 에이전트'라는 같은 그림을 그린다.

이미지: ChatGPT 워크스페이스 안의 에이전트 디렉터리(Spark, Slate, Tally, Scout 예시), 출처: Workspace agents for business | OpenAI
무엇이 일어났나
워크스페이스 에이전트는 한 사람이 한 번 만들어 회사 전체가 공유해 쓰는 AI 도우미다. 영업팀이 신규 리드(잠재 고객)를 조사하고 점수를 매기는 에이전트를 만들면, 팀 전원이 같은 절차로 일을 처리하게 된다. ChatGPT의 Business·Enterprise·Edu·Teachers 요금제 사용자에게 리서치 프리뷰로 풀렸다.
이 에이전트들은 이메일·문서·채팅·코드를 가로질러 정보를 모으고, 승인된 작업을 직접 실행한다. @OpenAI가 든 예시는 linear 이슈를 업데이트하거나, 새 문서를 만들거나, Slack 메시지에 끼어들어 맥락을 모은 뒤 시스템을 갱신하는 식이다. 사람이 쉬는 동안 백그라운드나 정해진 일정에 따라 알아서 굴러간다는 점이 핵심이다.
같은 주에 OpenAI 사장 Greg Brockman(@gdb)은 Codex의 새 기능을 줄줄이 발표했다. chronicle은 화면을 보고 최근 기억을 가져가는 실험 기능, 자동 리뷰는 guardian-agent가 제안된 작업의 안전성을 평가해 사람의 승인을 줄여주는 기능, Google Sheets용 ChatGPT 플러그인, 기업 단위 도입까지 함께 풀렸다. @gdb는 Codex가 개발자만이 아니라 컴퓨터로 일하는 모든 사람을 위한 도구가 된다고 표현했다.
왜 중요한가
지금까지 AI 도우미는 주로 '내가 묻고, AI가 한 번 답한다'의 일대일 대화였다. 이번 발표가 가리키는 건 '팀 안의 동료처럼 일하는 AI'다. 한 명이 잘 만든 에이전트를 모두가 똑같이 쓸 수 있고, 사람이 자리를 비워도 일이 돌아간다.
비유하자면, 사람이 읽고 따라 해야 하던 종이 매뉴얼이 '공용 매크로'로 바뀌는 변화에 가깝다. 매뉴얼은 사람이 한 줄씩 읽어 실행해야 하지만, 매크로는 버튼만 누르면 돈다. 워크스페이스 에이전트는 그 매크로를 자연어로 만들고 팀에 배포할 수 있게 해준다.
더 깊이
OpenAI 페이지에 따르면 워크스페이스 에이전트의 안전 장치는 세 갈래다. 관리자가 누가 무엇에 접근할지 정하는 role-based-access-control, 에이전트가 무엇을 했는지 추적하는 감사 로그, 메시지 발송이나 레코드 수정처럼 민감한 행동에 사람의 승인을 거치는 게이트. '에이전트가 알아서 다 하게 두자'가 아니라 '권한을 좁히고 발자국을 남기자'는 쪽이다.
Codex의 변화도 같은 방향이다. Chronicle이 화면을 본다는 건 강력하지만 동시에 가장 민감한 부분이다. 자동 리뷰의 가디언 에이전트는 '안전해 보이는 행동은 그냥 통과시키고, 위험해 보이는 것만 사람에게 묻자'는 절충안을 자동화한다. 사람이 끊임없이 '예/아니오'를 누르는 피로를 줄이면서, 정말 중요한 결정에는 사람이 개입하도록 설계된 타협이다.
아직 알 수 없는 것
리서치 프리뷰라는 점이 가장 큰 변수다. 가격, 정식 제공 시점, 무료·Plus 사용자에게도 풀릴지 여부는 공개되지 않았다. 가디언 에이전트가 실제로 얼마나 정확하게 위험한 작업을 가려내는지 수치도 아직 없다. @gdb가 농담처럼 던진 'tenet' 발언은 내부 코드네임을 가리키는 듯하지만, 공개 자료만으로 정확한 의미를 확인하기는 어렵다.
5분 실습
ChatGPT Business 또는 Enterprise 계정이 있다면 작은 워크스페이스 에이전트를 직접 하나 만들어보자. 받은편지함의 고객 지원 메일을 골라 우선순위를 매겨 Slack 채널에 올리는 미니 트리아지 봇이 5분 안에 만들 수 있는 좋은 입문 과제다. 세부 절차는 본문 아래 '5분 실습' 섹션에 정리했다.