와튼의 Ethan Mollick 교수가 경제학 사고실험 하나를 던졌다. AI 서비스 가격을 지금처럼 '토큰' 단위가 아니라 'flop' 단위로 매기자는 것이다. 그의 거친 계산대로라면 4달러짜리 커피 한 잔은 '반(半) exaflop'에 해당한다.
무엇이 일어났나
@emollick은 옛 금본위제(금의 양으로 돈 가치를 재던 제도)에 빗대어 "추론 본위(inference standard)"라는 말을 꺼냈다. 지금은 AI 서비스 비용을 대부분 inference-token으로 매기지만, 대신 FLOP — 컴퓨터가 실제로 수행한 계산 한 번 한 번 — 을 단위로 삼아보자는 제안이다. AI의 도움을 받아 어림잡은 결과, 1달러로 살 수 있는 관리형 llm-inference는 대략 10의 17제곱 FLOP 수준이었다고 그는 적었다. 이 환산을 따르면 4달러짜리 커피는 4 × 10의 17제곱, 즉 1 엑사플롭의 약 절반 값어치다.
왜 중요한가
지금 AI 회사들은 대부분 '토큰' 단위로 요금을 매긴다. 토큰은 모델이 한 번에 읽거나 쓰는 작은 단어 조각이다. 문제는 이 단위가 '모델이 얼마나 똑똑한지'를 거의 반영하지 못한다는 점이다. 작은 모델이 뱉어낸 토큰 1개와, 훨씬 무거운 프론티어 모델이 뱉어낸 토큰 1개는 같은 '1토큰'으로 계산되지만, 그 안에 담긴 계산량과 능력은 자릿수 이상 차이가 난다.
FLOP은 다르다. 컴퓨터가 실제로 몇 번의 곱셈과 덧셈을 수행했는지 세는 단위이기 때문에, 더 큰 모델이 답할 때 자연스럽게 더 많은 FLOP이 든다. 즉 '능력에 비례하는 비용'을 표현할 수 있다.
커피 한 잔 = 0.5 엑사플롭이라는 환산은 AI의 값어치를 피부에 와닿게 한다. 엑사(exa)는 10의 18제곱 — 한국어 단위로 100경(京)이다. 20년 전이라면 세계 최상위 슈퍼컴퓨터를 짧게 빌려야 낼 수 있던 계산량이 지금은 카페 한 번 안 가면 얻을 수 있는 수준이 됐다는 뜻이다.
더 깊이
FLOP은 floating-point operation(부동소수점 연산)의 줄임말로, 소수점이 있는 숫자 두 개를 더하거나 곱하는 연산 한 번을 가리킨다. 현대 AI 모델은 단어 하나를 예측할 때마다 수백억에서 수천억 번의 FLOP을 쓴다. 그래서 한 번의 긴 대화는 쉽게 수조 FLOP을 넘긴다.
Mollick의 숫자는 엄밀한 회계가 아니라 직관용 어림수다. 그는 본인도 "AI의 도움을 좀 받아서" 얻은 값이라고 밝혔다. 실제로 1달러당 FLOP 값은 어떤 모델을 고르느냐, 관리형 API를 쓰느냐 자가 호스팅하느냐에 따라 수십 배씩 움직인다.
아직 알 수 없는 것
이 제안이 얼마나 호응을 받을지는 아직 분명치 않다. 게시물 반응은 좋아요 122, 댓글 28 수준으로 크지 않았다. 또 FLOP이 정말 '능력'을 잘 대변하는가라는 근본 질문도 남는다. 같은 FLOP이라도 강화학습으로 잘 튜닝된 모델과 그렇지 않은 모델은 결과 품질이 크게 다르다. 단위 자체가 공정한 비교를 보장하진 않는다.
5분 실습
- 지난달 AI API 청구서나 자주 쓰는 모델의 가격표를 본다 (예: Anthropic, OpenAI).
- 출력 토큰 100만 개당 달러 가격을 확인한다 (보통 3~15달러).
- 그 모델에 "너는 토큰 하나를 만들 때 대략 몇 FLOP을 쓰니?"라고 물어본다. 정확한 답은 아니어도 자릿수 감을 얻을 수 있다.
- 두 수치를 조합해 '1달러로 몇 FLOP을 사는가'를 직접 계산하고, Mollick의 10의 17제곱과 비교해본다. 자릿수가 맞으면 제안은 적어도 방향으로는 쓸 만하다는 뜻이다.