Fugu는 이음새를 숨긴다: 여러 AI를 하나처럼 과금

Fugu는 교체 가능한 LLM 풀을 OpenAI 호환 엔드포인트로 감쌉니다. 설정, 티어 비교, 과금, EU 제한을 정리합니다.

Fugu는 이음새를 숨긴다: 여러 AI를 하나처럼 과금
Share

Sakana AI가 Fugu로 내건 제안은 독특합니다. 더 큰 모델 하나를 계속 쫓는 대신, 다른 모델들을 지휘하는 일을 맡은 모델을 학습시키자는 것입니다. 벤더 사이의 경계는 숨겨지고, 사용자는 하나의 청구서로 하나의 답변만 받습니다.

Sakana Fugu란?

Sakana Fugu는 혼자 모든 일을 처리하는 모델이 아니라 조율자 역할을 하도록 학습된 언어 모델입니다. 요청이 들어오면 Fugu는 작업을 분해하고, 하위 작업을 OpenAI, Anthropic, Google 등을 포함한 가장 적합한 외부 프런티어 LLM으로 라우팅한 뒤, 그 결과를 검증하고 최종 답변으로 종합합니다. 이 모든 과정은 호출자에게 보이지 않습니다 . Sakana는 이를 "단일 모델처럼 동작하는 멀티 에이전트 시스템"이라고 설명하며, 에이전트 풀을 교체할 수 있기 때문에 특정 벤더 종속을 줄이면서도 프런티어급 품질을 목표로 한다고 말합니다 .

두 가지 티어가 제공됩니다. fugu는 더 낮은 지연 시간을 목표로 하며, 풀에 포함할 벤더를 사용자 지정하거나 제외할 수 있고, 인터랙티브 코딩, 코드 리뷰, 챗봇에 적합합니다. fugu-ultra는 고정된 풀을 사용하며, 난도에 따라 1개에서 3개 에이전트 사이에서 라우팅하고, Kaggle 대회, 문헌 검토, 사이버보안 분석처럼 어렵고 여러 단계가 필요한 작업에 맞춰 조정되어 있습니다 .

2026년 6월에 공개된 Fugu는 Sakana AI가 만들었습니다. Sakana AI는 2017년 논문 "Attention Is All You Need"의 공동 저자인 Llion Jones와 Stability AI의 전 리서치 책임자 David Ha가 2023년에 공동 창업한 회사입니다 . Fugu는 Trinity 및 Conductor ICLR 2026 논문과 arXiv:2606.21228 기술 보고서를 기반으로 합니다 . 시작하기 전에 알아둘 점이 하나 있습니다. 2026년 6월 12일부터 적용되는 서비스 약관에 따라, 출시 시점의 Fugu는 GDPR 준수가 완료될 때까지 EU/EEA, 영국, 스위스에서는 사용할 수 없습니다 .

Fugu 연동 전에 확인할 것

Fugu hides the seams: multiple AIs, billed as a whole

설정은 모델을 다운로드하는 일이 아니라 콘솔과 자격 증명을 준비하는 과정입니다. Google 또는 이메일로 Sakana 콘솔에 로그인한 뒤 API 키를 생성합니다. 2026년 6월 12일부터 적용되는 서비스 약관상 만 18세 이상이어야 합니다.

첫 호출 전에 중요한 확인 사항은 두 가지입니다.

  • 지역. GDPR 관련 작업이 계속되는 동안 출시 시점의 Fugu는 EU/EEA, 영국, 스위스에서 차단되므로, 먼저 접근 가능한 지역인지 확인해야 합니다 .
  • 데이터 정책. 하위 작업은 OpenAI, Anthropic, Google의 외부 프런티어 모델로 라우팅되므로, 독점 코드를 보내기 전에 조직의 정책을 검토해야 합니다 .

fugu에서만 가능합니다. 풀이 고정된 fugu-ultra는 제외됩니다. 키 생성 과정이나 콘솔 설정에서 특정 벤더 또는 모델을 제외할 수 있습니다 . 학습 데이터 사용 거부 옵션도 설정에 있습니다. 공개되지 않은 자료를 보내기 전에 활성화해 두는 것이 좋습니다 .

코드베이스에 Fugu 붙이기

Fugu hides the seams: multiple AIs, billed as a whole

Fugu는 OpenAI 호환 방식이므로 통합은 기본 URL만 바꾸면 됩니다. OpenAI SDK가 Sakana를 바라보도록 base_url='https://api.sakana.ai/v1'api_key='YOUR_FUGU_KEY'를 설정한 뒤, 모델 fugu 또는 fugu-ultra를 호출하면 됩니다 . 기존 chat.completions 호출은 그대로 동작합니다. 지원 엔드포인트는 /v1/chat/completions, /v1/responses, /v1/models이며, /v1/models에서는 사용 가능한 모델 ID를 확인할 수 있습니다 .

Sakana는 도구 사용, 멀티모달 입력, 추론 또는 함수 호출 관리를 위해 Chat Completions보다 Responses API, 즉 client.responses.create() 사용을 권장합니다. 다만 Chat Completions도 계속 지원됩니다 . 핵심 개념은 여러 에이전트를 하나의 청구 항목으로 묶는 것입니다. 아래 예시는 실제 라이브 API에서 실행한 것이 아니라 구조를 보여주는 스케치로, Fugu가 보여주는 단일 청구 항목의 형태를 나타냅니다. 하위 작업은 여러 갈래로 퍼지고, 청구는 하나로 돌아옵니다.

class Fugu:
    """One interface that routes work to multiple AIs and returns one bill."""

    prices = {"planner": 0.003, "writer": 0.002, "auditor": 0.001}

    def run(self, task):
        usage = {
            "planner": f"plan({task})",
            "writer": f"draft({task})",
            "auditor": f"check({task})",
        }
        result = " -> ".join(usage.values())
        total = sum(self.prices[name] for name in usage)
        return {"result": result, "bill": f"${total:.3f}", "line_item": "Fugu"}


response = Fugu().run("launch email")
print(response)

놓치면 문제가 되는 런타임 세부 사항이 세 가지 있습니다. reasoning effort는 highxhigh만 허용하며(maxxhigh의 별칭), 다른 값은 모두 거부됩니다 . 복잡한 fugu-ultra 작업은 오래 걸릴 수 있으므로 기본 클라이언트 타임아웃에 걸리지 않도록 timeout=120.0 이상으로 설정하는 것이 좋습니다 . 스트리밍은 일반적인 stream=True로 동작하며, 프로덕션 안정성을 위해서는 유동적인 fugu-ultra 태그보다 날짜가 고정된 별칭 fugu-ultra-20260615를 지정하는 편이 낫습니다 .

에이전트형 코딩을 위해 Sakana는 한 줄로 설치되는 Codex 통합을 제공합니다. curl -fsSL https://sakana.ai/fugu/install | bash를 실행한 뒤 codex-fugu를 시작하면 됩니다 . 이 부트스트랩은 github.com/SakanaAI/fugu~/.fugu로 클론하고, Codex 버전을 고정하며, 설정을 배포하고, 키를 저장합니다. 비대화형 설치에서는 SAKANA_API_KEY--yes를 전달합니다 . 설치 프로그램은 공식적으로 Ubuntu와 macOS만 지원합니다. Windows 사용자는 bash 파이프가 PowerShell에서 실행되지 않으므로 WSL Ubuntu 또는 수동 설정이 필요합니다 . 설치 후 codex-fugu를 찾을 수 없다면 터미널을 다시 열어 PATH를 새로고침하세요 .

Fugu가 감추는 것들

Fugu hides the seams: multiple AIs, billed as a whole

Fugu의 편의성에는 의도적인 불투명성이 따라옵니다. Sakana는 제공자 선택과 라우팅 계획을 독점 정보로 취급합니다. 어떤 질의가 들어오더라도 실제로 어떤 기반 모델이 실행됐는지, 작업이 어떻게 분해됐는지는 공개하지 않습니다 . 사용량 필드는 표시 모델 토큰과 오케스트레이션 토큰을 구분합니다. 그리고 이 오케스트레이션 토큰도 최종 가격에 포함되는 실제 청구 대상 사용량입니다. 하지만 제공자별 세부 내역은 제공되지 않습니다 .

벤치마크도 같은 수준의 의심을 두고 봐야 합니다. 모델 페이지는 Fugu Ultra / Fugu의 점수를 SWE Bench Pro 73.7 / 59.0, Terminal Bench 2.1 82.1 / 80.2, GPQA Diamond 95.5 / 95.5로 보고합니다 . 이는 자체 보고 수치입니다. 기준이 되는 프런티어 모델 점수도 재실행한 결과가 아니라 제공자 보고 수치이며, Fable 5와 Mythos Preview는 공개 접근이 불가능하다는 이유로 Fugu의 에이전트 풀에서 제외됐습니다. 따라서 헤드라인 비교는 완전히 독립적인 동일 조건 감사라고 보기 어렵고, 보고 당시 제3자 재현 결과도 없었습니다 .

도입 전에 더 살펴봐야 할 제약도 두 가지 있습니다. Fugu는 GDPR 준수가 완료될 때까지 EEA, 영국, 스위스 전역에서 완전히 차단되어 있으며, 해당 지역 출시 일정도 제시되지 않았습니다 . 또한 2026년 6월 12일부터 적용되는 서비스 약관에 따르면 Sakana는 정확성, 완전성, 법적 준수에 대해 아무것도 보장하지 않으며, 하위 작업을 OpenAI, Anthropic, Google 같은 외부 모델로 라우팅합니다. 민감한 코드나 독점 코드를 보내기 전에 데이터 처리 의무를 검토해야 합니다 .

Fugu를 더 제대로 활용하기

Fugu를 연결했다면 워크로드에 맞춰 플랜과 티어를 고르세요. 구독은 두 모델을 모두 포함합니다. Standard는 월 $20, Pro는 월 $100(Standard 사용량의 10배), Max는 월 $200(Standard의 30배)이며, 2026년 7월 31일 이전에 구독하면 두 번째 달이 무료입니다. 프로덕션에서는 사용량 기반 종량제 토큰이 월간 플랜 토큰보다 더 높은 라우팅 우선순위를 받기 때문에, 지연 시간에 민감한 트래픽에서는 이 차이가 중요합니다 .

fugu-ultra-20260615≤272K 컨텍스트>272K 컨텍스트
입력 / 100만 토큰$5$10
출력 / 100만 토큰$30$45
캐시된 입력 / 100만$0.50$1.00

오케스트레이션 토큰도 실제로 과금되는 사용량이며, 위 통합 가격에 포함된다는 점을 유의하세요 . 여러 단계의 코드 과제, 특허 조사, 논문 재현, 보안 분석에는 fugu-ultra를 남겨두는 편이 좋습니다. 빠른 대화형 작업에는 fugu가 더 낮은 지연 시간과 직접 제한할 수 있는 제공자 풀을 제공합니다. 기본값으로 고르지 말고 작업 난이도에 따라 티어를 선택하세요.

자주 묻는 질문

Sakana Fugu는 유럽에서 사용할 수 있나요?

아니요. 출시 시점에 Fugu는 EU/EEA, 영국, 스위스에서 제공되지 않습니다. 서비스 약관(2026-06-12 발효)은 Sakana가 GDPR 준수를 준비하는 동안 유럽경제지역, 영국, 스위스를 명시적으로 제외합니다 . 해당 지역 출시 일정은 아직 공개되지 않았으므로, 기다리기보다는 이를 전제로 계획하는 편이 낫습니다.

fugu와 fugu-ultra는 무엇이 다른가요?

두 티어는 지연 시간과 답변 품질 사이에서 선택지가 갈립니다. fugu는 대화형 코딩, 코드 리뷰, 챗봇에 필요한 낮은 지연 시간과 일상적인 품질을 목표로 하며, API 키를 만들거나 수정할 때 풀에서 특정 제공자나 모델을 제외할 수 있습니다 . fugu-ultra는 고정된 풀을 사용하고, 난이도에 따라 1~3개 에이전트 사이에서 라우팅되며, 어렵고 여러 단계가 필요한 문제에 맞춰져 있습니다. 날짜가 붙은 별칭 fugu-ultra-20260615는 표준 컨텍스트에서 100만 토큰당 입력 $5, 출력 $30로 책정됩니다 .

내 요청에 Fugu가 어떤 기반 LLM을 사용했는지 볼 수 있나요?

아니요. Sakana는 제공자 선택과 라우팅 계획을 독점 정보로 취급하며, 어떤 쿼리에서도 이를 공개하지 않습니다 . Fugu Ultra의 사용량 필드는 사용자가 볼 수 있는 모델 토큰과 오케스트레이션 토큰을 분리하지만, 제공자별 세부 내역은 없습니다 . 이런 불투명성은 의도된 설계입니다. 각 하위 작업을 어떤 벤더가 처리했는지 감사 추적이 필요하다면, Fugu는 그 정보를 제공하지 않습니다.

큰 변경 없이 OpenAI Python SDK로 Fugu를 사용할 수 있나요?

네. Fugu는 OpenAI 호환 방식입니다. SDK의 base_urlhttps://api.sakana.ai/v1로 설정하고, Fugu 자격 증명을 api_key로 전달하면 됩니다 . 기존 Chat Completions 호출은 그대로 실행되지만, 도구 사용, 멀티모달 입력, 추론 관리가 필요한 새 연동에는 Sakana가 Responses API를 권장합니다 . 복잡한 작업은 오래 걸릴 수 있으므로 fugu-ultra를 쓸 때는 클라이언트 측 타임아웃을 늘리세요 .

Fugu 설치 프로그램은 Windows에서 작동하나요?

WSL Ubuntu를 통해서만 가능합니다. 한 줄짜리 bash 파이프 설치 명령(curl -fsSL https://sakana.ai/fugu/install | bash)은 PowerShell이나 네이티브 Windows 터미널에서는 실행되지 않으므로, 지원되는 경로는 WSL Ubuntu 또는 수동 설정입니다. macOS와 Ubuntu는 공식 지원됩니다 . 비대화형 설치에서는 SAKANA_API_KEY를 환경 변수로 전달하고 --yes를 붙여 프롬프트를 건너뛰세요. 이후 codex-fugu를 찾을 수 없다면 터미널을 다시 열어 PATH를 새로고침하세요 .