사카나 AI가 '후구(Fugu)'라는 오케스트레이션 시스템을 공개하며, 단일 거대 모델 대신 여러 모델을 잘 묶어 쓰는 방식이 다음 프론티어라고 주장했다.
한눈에도쿄의 사카나 AI가 orchestration-model '후구'를 공개교체 가능한 모델 풀이 폐쇄형 프론티어 모델 Fable·Mythos와 맞먹는다는 주장미국발 export-controls와 벤더 집중에 대한 실용적 대응이라는 명분
실무자: 단일 모델 API 종속 아키텍처에 라우팅·합의 옵션을 더할 명분이 늘었다. 리더: 국가·기업 인프라가 특정 빅테크 모델에 묶이는 리스크가 정책 의제로 부상하고 있다.

이미지: 사카나 AI 공동 창업자 데이비드 하의 프로필, 출처: @hardmaru on X
인공지능을 발전시키는 가장 흔한 길은 "모델을 더 크게 만드는 것"이었다. 매개변수 수십억 개에서 시작한 언어 모델은 지금 수조 개 단위까지 부풀었고, 학습 비용도 그에 비례해 폭증했다. 그러나 이 외길에 의문을 던지는 흐름이 있다. 혼자 잘하는 모델 하나 대신, 여러 모델을 잘 묶어 쓰는 시스템이 더 강력할 수 있다는 발상이다. 일본 도쿄에 본사를 둔 sakana-ai가 공개한 orchestration-model '후구(Fugu, 복어)'가 이 노선의 대표적인 시도다.
무엇이 일어났나
사카나 AI의 공동 창업자 데이비드 하(@hardmaru)는 후구를 "세계 최고의 모델들을 동적으로 오케스트레이션하는" 시스템이라고 소개했다. 핵심 주장은 단순하다. 잘 조율된 교체 가능한 에이전트 풀(swappable agent pool) 이 폐쇄형 프론티어 모델인 Fable, Mythos 같은 것과 맞먹는 성능을 낸다는 것이다. 이름 그대로 후구는 자기가 직접 답을 만드는 모델이 아니라, 들어온 과제를 여러 모델에 분배하고 결과를 모아 정리하는 일종의 '지휘자'에 가깝다.
하는 인간의 지능이 본질적으로 집단 지성이며, 세대를 거쳐 쌓인 문화 네트워크에 참여함으로써 복잡한 문제를 푼다고 적었다. AI도 같은 길로 가야 한다는 것이 그의 오랜 주장이다. 사카나 AI는 창립 때부터 "가장 강력한 AI 시스템은 협력하는 생태계지 고립된 거대 모델이 아니다"라는 신념을 내세워 왔다.
왜 중요한가
성능 자체보다 더 큰 함의는 공급 리스크다. 하는 특정 회사의 모델 하나에 국가 인프라를 거는 것이 거대한 리스크라고 경고했다. 최근 강화된 미국발 수출 통제가 보여줬듯, 최고의 모델에 대한 접근이 하룻밤 사이에 사라질 수 있다는 것이다. 첨단 AI 칩과 모델에 대한 통제가 강화되면서, 특정 국가나 기업이 어느 날 갑자기 핵심 모델에 접근할 수 없게 되는 시나리오가 현실화하고 있다. 이때 '교체 가능한 풀'은 한 공급선이 막혀도 다른 공급선으로 우회할 수 있는 실용적 대응 수단이 된다.
이 관점은 ai-sovereignty(AI 주권)라는 키워드로 정리된다. 자국 안에서 AI 인프라를 통제·운영할 수 있어야 한다는 정책 담론으로, 일본·유럽·인도 등 여러 국가가 진지하게 검토하고 있다. 사카나 AI는 후구를 "AI 주권에 필요한 회복력 있는 청사진"이라고 위치 짓는다.
누가 이득, 누가 손해
이 변화로 이득을 보는 쪽은 자국 모델·온프레미스 옵션을 갖고 싶은 정부와 대기업, 그리고 여러 모델을 라우팅·합성하는 미들웨어를 만드는 스타트업이다. 반대로 단일 프론티어 모델 한 곳을 표준으로 삼고 락인을 노리던 빅테크 모델 제공사는 협상 우위가 약해질 수 있다. 다만 오케스트레이션이 결국 그 빅테크 모델을 호출해야 한다면, 사용량 자체가 줄지는 않고 가격 협상력만 빅테크 쪽에서 발주자 쪽으로 이동한다고 보는 편이 정확하다.
더 깊이
오케스트레이션이라는 개념은 새롭지 않다. 이미 agentic-ai 흐름 속에서 여러 모델을 묶어 쓰는 패턴이 보편화됐고, 답을 한 모델에게서 받고 다른 모델에게 검증시키는 'judge' 구조도 흔하다. 후구의 차별점은 이를 하나의 '모델'로 포장해 외부에 노출한다는 점, 그리고 그 안에서 어떤 모델을 어떻게 호출할지를 학습으로 결정한다는 점이다. 즉, 라우터 자체가 학습 대상이 된다.
이 사고방식은 사카나 AI의 이전 작업들과도 결이 같다. 사카나는 진화적 알고리즘과 모델 머징(model merging) — 여러 공개 모델의 가중치를 조합해 새로운 모델을 만드는 — 같은 '조합·합성' 중심의 연구로 알려져 왔다. 후구는 그 철학을 추론 단계까지 확장한 셈이다.
아직 알 수 없는 것
후구가 정말로 폐쇄형 프론티어 모델과 "맞먹는다"는 주장은 아직 외부 검증을 거치지 않았다. 어떤 벤치마크에서, 어떤 조건으로 비교했는지, 라우팅에 추가로 드는 지연 시간과 비용은 얼마나 되는지, 호출되는 백엔드 모델들의 API 비용을 모두 합하면 단일 프론티어 모델보다 정말 싼지 — 이 모든 질문이 열려 있다. 또한 '교체 가능한 풀'이라고 해도 그 풀 안에 좋은 모델 몇 개가 반드시 들어 있어야 하므로, 결국 어떤 형태로든 프론티어 모델에 의존하게 된다는 모순도 남아 있다.
5분 실습 (쉬움 · 10분)
오케스트레이션을 직접 체감해 보자. (1) 같은 코딩 질문 하나를 골라 Claude, ChatGPT, Gemini 무료 버전에 각각 같은 프롬프트로 던진다. (2) 세 응답을 하나의 문서에 모은다. (3) 마지막으로 한 모델에 "아래 세 답안의 장단점을 비교하고, 셋을 종합한 최선의 답을 만들어라"라고 입력한다. 결과가 단일 모델보다 나아졌는지, 시간과 비용은 얼마나 더 들었는지 메모해 보자. 이것이 곧 후구가 자동화하려는 워크플로의 축소판이다.