Opus 4 은퇴. Opus 4.8은 67% 저렴 — 토크나이저 주의

Sonnet 4와 Opus 4가 6월 15일 은퇴 — 정확한 모델 ID, 호환성 변경 사항, Opus 4.8 토크나이저 주의사항 해설.

Jun 16, 2026

코드에 claude-opus-4-20250514 또는 claude-sonnet-4-20250514가 아직 고정되어 있다면, 해당 호출은 2026년 6월 15일부터 실패하기 시작했습니다 — 경고도, 폴백도 없이 오류만 발생합니다. 정확히 무엇이 끊겼고 무엇으로 바꿔야 하는지 설명합니다.

6월 15일에 중단된 것들 — 정확한 모델 ID 목록

Anthropic은 2026년 6월 15일 자사 운영 플랫폼에서 Claude Sonnet 4와 Claude Opus 4를 은퇴시켰으며, 유예 기간은 없습니다 — 모델 지원 중단 페이지는 은퇴 모델을 "더 이상 사용할 수 없는" 것으로 정의하며 "은퇴 모델에 대한 요청은 실패할 것"이라고 명시합니다 . 영향을 받는 두 ID는 claude-sonnet-4-20250514와 claude-opus-4-20250514입니다. 두 모델 모두 2026년 4월 14일에 지원 중단(deprecated)이 공지되어 6월 15일 은퇴 일정이 확정되었으며, Anthropic의 60일 사전 공지 정책(약 62일)을 충족합니다 .

"은퇴된 모델에 대한 요청은 실패합니다." — Anthropic, 모델 지원 중단 문서 (source: platform.claude.com)

중단된 것은 날짜 포함 스냅샷만이 아닙니다. 4.6 이전의 편의 별칭인 claude-opus-4, claude-opus-4-0, claude-sonnet-4, claude-sonnet-4-0도 모두 동일한 20250514 스냅샷으로 연결되므로 이것들도 오류가 납니다 . 단순 별칭이 최신 모델로 자동 업데이트될 것이라고 가정했다면, 그렇지 않았습니다.

권장 대체 모델은 Sonnet 4의 경우 claude-sonnet-4-6, Opus 4의 경우 claude-opus-4-8입니다 . 한 가지 의미론적 변화를 기억해야 합니다: 4.6 세대부터 Anthropic은 claude-sonnet-4-6처럼 날짜 없는 형식을 사용하지만, 이것은 상시 최신 포인터가 아닙니다. 각 ID는 하나의 고정 스냅샷에 매핑되므로 ID가 임의로 변경되지 않으며 — 향후 업그레이드 시에는 모델 ID를 다시 명시적으로 변경해야 합니다 .

남아있는 사용처를 찾으려면 두 단계로 감사하세요. 첫째, 코드베이스와 설정 파일에서 20250514 및 위의 네 가지 편의 별칭을 grep합니다. 둘째, Anthropic Console 사용량 페이지에서 API 키와 모델별로 분류된 사용량 CSV를 내보내, 하드코딩되지 않은 호출 — 런타임에 레거시 ID를 참조하는 파이프라인, 노트북, 서드파티 통합 — 을 파악합니다 .

아래 섹션에서는 플랫폼별 타이밍, 각 대체 모델의 주요 API 변경 사항, 그리고 교체 후에도 Opus 4.8 토크나이저가 토큰 계산에 영향을 미칠 수 있는 이유를 자세히 설명합니다.

Anthropic API vs. Bedrock vs. Vertex AI: 플랫폼별 차단 시점

Opus 4 retired. Opus 4.8 costs 67% less — mind the tokenizer

6월 15일 강제 은퇴는 Anthropic 직접 운영 플랫폼 — Claude API, AWS의 Claude Platform, Microsoft Foundry — 에만 적용되며, 이 플랫폼에서는 claude-sonnet-4-20250514 및 claude-opus-4-20250514 호출이 유예 기간 없이 실패합니다 . 파트너 운영 플랫폼은 자체 수명 주기 일정을 따르므로, 동일한 모델 ID가 한 플랫폼에서는 은퇴되고 다른 플랫폼에서는 여전히 호출 가능할 수 있습니다. Amazon Bedrock 또는 Google Vertex AI를 통해 배포한다면 6월 15일 날짜가 자동으로 적용되지 않으며 — 각 파트너의 수명 주기 표를 직접 확인해야 합니다.

2026년 6월 중순 기준, 파트너 표는 엇갈린 상황을 보여줍니다. Sonnet 4는 Bedrock과 Vertex AI 모두에서 여전히 사용 가능(지원 중단 상태)합니다 . Opus 4는 두 플랫폼 간에 차이가 있습니다: Bedrock에서는 은퇴되었지만 Vertex AI에서는 여전히 사용 가능(지원 중단 상태)합니다 . "지원 중단(Deprecated)"은 모델이 요청을 처리하지만 카운트다운 중임을 의미하고, "은퇴(Retired)"는 요청이 완전히 실패함을 의미합니다 .

플랫폼	Sonnet 4 (`claude-sonnet-4-20250514`)	Opus 4 (`claude-opus-4-20250514`)
Claude API (Anthropic)	2026년 6월 15일 은퇴 — 호출 실패	2026년 6월 15일 은퇴 — 호출 실패
Claude Platform on AWS	2026년 6월 15일 은퇴 — 호출 실패	2026년 6월 15일 은퇴 — 호출 실패
Microsoft Foundry	2026년 6월 15일 은퇴 — 호출 실패	2026년 6월 15일 은퇴 — 호출 실패
Amazon Bedrock	사용 가능(지원 중단)	은퇴
Google Vertex AI	사용 가능(지원 중단)	사용 가능(지원 중단)

실질적인 교훈: 블로그 요약이 아닌 플랫폼 표를 진실의 근거로 삼으세요. 이러한 상태는 파트너 일정에 따라 변경되며, 위의 차이는 2026년 6월 중순 기준 스냅샷입니다 . Bedrock에서 Opus 4를 호출하는 경우 이미 중단된 상태이고, Vertex에서 Opus 4를 호출하는 경우 아직 여유가 있지만 표가 바뀌기 전에 마이그레이션해야 합니다. Anthropic은 6월 15일의 정확한 UTC 전환 시각을 공개하지 않으며 — 달력 날짜만 명시합니다 — 따라서 마지막 몇 시간에 맞춰 전환을 예약하기보다 충분한 여유를 두세요 .

소비자용 서비스는 해당 없습니다. Claude.ai와 Claude Code는 모델을 자동으로 선택하며 이번 고정 ID 은퇴의 영향을 받지 않으므로, 사용자에게 보이는 장애는 없습니다 — 장애는 레거시 날짜 ID 또는 4.6 이전 별칭을 하드코딩한 API 코드에만 국한됩니다 . Claude 앱만을 통해 사용한다면 아무것도 바뀌지 않았고, API 호출을 직접 사용한다면 라우팅하는 플랫폼에 따라 6월 15일이 이미 영향을 미쳤는지 결정됩니다.

Sonnet 4.6 마이그레이션: 코드를 깨뜨리는 API 변경 6가지

claude-sonnet-4-20250514를 claude-sonnet-4-6으로 교체하는 건 한 줄 변경이지만, 여섯 가지 API 수준의 차이가 동작하던 코드를 망가뜨리거나 조용히 성능을 떨어뜨릴 수 있습니다. Sonnet 4.6은 동일한 가격 — 입력 토큰 백만 개당 $3, 출력 토큰 백만 개당 $15이며, 컨텍스트 윈도우 100만 토큰에 최대 출력 64k를 지원합니다 — 따라서 이번은 비용이 아닌 동작 방식의 마이그레이션입니다. Anthropic은 마이그레이션 가이드에 각 변경 사항을 문서화했으며 , 실제로 코드 수정이 필요한 내용은 다음과 같습니다.

1. 어시스턴트 메시지 프리필 제거 (HTTP 400). 응답 형태를 강제하기 위해 어시스턴트 턴에 시드를 넣는 방식 — JSON 출력을 제한하는 흔한 기법 — 은 Sonnet 4.6에서 400 오류로 거부됩니다 . output_config.format을 통한 구조화된 출력으로 대체하거나, 제약 조건을 시스템 프롬프트 지시사항으로 옮기세요. 이 변경은 기존 파이프라인을 조용히 중단시킬 가능성이 가장 높습니다. 프리필 패턴은 자체 테스트를 갖추는 경우가 드물기 때문입니다.

2. effort의 기본값이 high로 변경. Sonnet 4와 4.5에는 effort 파라미터가 없었지만, Sonnet 4.6은 이를 도입하고 기본값을 high로 설정했습니다. 따라서 설정하지 않으면 기존 기준 대비 지연 시간이 늘어납니다 . 확장 사고 없이 Sonnet 4.5와 유사한 응답 프로파일을 원한다면, 사고를 비활성화한 상태에서 effort: low로 설정하세요. 에이전트 코딩 워크로드는 medium부터 시작하는 것이 좋습니다. 기본값을 물려받기보다 명시적으로 설정하세요.

"교체 모델을 프로덕션에 배포하기 전에 표준 평가 스위트로 테스트하세요," — Anthropic, 모델 지원 중단 문서 (source: platform.claude.com).

3. 새로운 refusal 중지 이유 처리. 응답 파싱 시 stop_reason: "refusal"을 처리해야 합니다. 이전 Sonnet 4 코드에서는 이 값이 발생하지 않았습니다 . 중지 이유에 따라 분기하거나 모든 완성이 사용 가능한 텍스트라고 가정하는 코드는 거부 응답 처리 경로가 필요합니다.

4. 확장 사고는 여전히 작동하지만 지원 중단 예정. budget_tokens를 활용한 확장 사고는 Sonnet 4.6에서 계속 작동하지만, effort 파라미터를 통한 적응형 사고 방식으로 대체 예정입니다 . 당장 마이그레이션할 필요는 없지만, 새 코드는 effort를 표준으로 사용해야 합니다.

5. GA된 베타 헤더 제거 및 output_format 이름 변경. fine-grained-tool-streaming-2025-05-14 베타 헤더가 이제 정식 출시되었으므로 요청에서 제거하세요. 별도로, 지원 중단된 output_format 파라미터는 output_config.format으로 마이그레이션됩니다 . 둘 다 정리 작업으로 동작 위험은 없지만, 이름이 바뀐 파라미터는 놓치기 쉽습니다.

6. 커스텀 도구 호출 JSON 파싱 점검. Sonnet 4.6에서 도구 호출 파라미터의 JSON 문자열 이스케이핑이 달라질 수 있습니다 . 표준 JSON 파서는 새로운 이스케이핑을 깔끔하게 처리하므로 대부분은 문제없습니다. 위험에 노출된 것은 도구 인수를 제대로 역직렬화하지 않고 원시 문자열로 파싱하는 코드입니다. 커스텀 문자열 기반 파서를 작성했다면 배포 전에 점검하세요.

각각은 단독으로 큰 변화가 아니지만, 합쳐서 보면 새 Sonnet이 기존 출력 형태를 유지한다고 신뢰하기보다 자체 평가 스위트를 통해 교체를 검증해야 함을 시사합니다. 프리필과 effort 변경은 프로덕션에서 팀들이 가장 자주 예상치 못하게 마주치는 두 가지입니다.

Opus 4.8로 마이그레이션: 두 세대에 걸친 호환성 변경 사항

Opus 4 → Opus 4.8 전환은 Sonnet보다 까다롭습니다. Opus 4는 4.7 세대 이전 모델이기 때문에, 모델 ID 교체에 더해 Opus 4.7의 누적된 호환성 변경 사항까지 함께 적용해야 합니다 . ID를 claude-opus-4-8로 교체한 뒤, SDK가 잡아주지 못하는 서버 측 오류 세 가지를 순서대로 처리해야 합니다. 이 오류들은 타입 검사 시점에는 드러나지 않으며, 모두 런타임에 400 오류로 나타납니다 .

한눈에 보기: Opus 4에서 claude-opus-4-8로 마이그레이션하면 Opus 4.7의 변경 사항도 함께 적용됩니다. 기본값이 아닌 temperature/top_p/top_k, 수동 extended thinking, assistant prefill은 모두 400 오류를 반환합니다. 동작 제어는 프롬프트와 adaptive thinking으로 전환하고, effort의 기본값이 이제 high로 바뀌었으므로 명시적으로 설정하세요.

첫 번째 함정은 샘플링 파라미터입니다. temperature, top_p, top_k를 기본값이 아닌 값으로 설정하면 Opus 4.7 이후 버전에서 400 오류로 거부됩니다. SDK는 이 필드들을 유효한 타입으로 검사하므로 코드 컴파일은 정상적으로 통과하지만 , API가 서버 측에서 이 규칙을 강제하기 때문에 실제 프로덕션에서 실패합니다. 해당 필드를 제거하고 프롬프트를 통해 동작을 제어하세요.

두 번째는 thinking과 prefill입니다. 수동 extended thinking(thinking: {type: "enabled", budget_tokens: N})과 assistant prefill은 Opus 4.7 이후에서 모두 400 오류를 반환합니다 . output_config.effort를 통한 adaptive thinking으로 전환하세요. Opus 4.8에서 effort의 기본값이 high로 변경되었으므로 명시적으로 설정하는 것이 중요합니다. 최대 추론이 필요하지 않은 워크로드에서 값을 지정하지 않으면 지연 시간과 비용이 증가할 수 있습니다 .

다음으로 응답 파싱을 업데이트하세요. stop_reason: "refusal"을 처리하고 stop_details.category를 읽도록 하며, 도구 호출 JSON을 역직렬화하지 않고 raw 문자열로 취급하는 코드가 있다면 재검토하세요 .

Opus 4.8에는 전환을 수월하게 해주는 하위 호환 신기능도 포함되어 있습니다. 대화 중간에 삽입하는 시스템 메시지, 공개 문서화된 거부 stop_details, 1,024토큰으로 낮아진 프롬프트 캐시 최솟값, 거부된 요청을 다른 모델로 자동 재시도하는 옵트인 fallbacks 베타 파라미터, 그리고 프리미엄 가격으로 최대 2.5배 높은 출력 토큰/초를 제공하는 Fast Mode 리서치 프리뷰가 추가되었습니다 . 특히 fallbacks 파라미터는 새로운 거부 처리 방식과 잘 맞습니다.

배포 환경별로 주의할 점도 있습니다. 컨텍스트 윈도우 크기가 플랫폼마다 다릅니다. Opus 4.8은 Claude API, Amazon Bedrock, Vertex AI에서 기본적으로 1M 토큰 컨텍스트 윈도우와 128k 최대 출력을 지원하지만, Microsoft Foundry에서는 컨텍스트가 200k로 제한됩니다 . 멀티 클라우드 환경에서는 Claude API 경로에서 처리 가능한 프롬프트를 Foundry 경로에서도 동일하게 처리할 수 있다고 가정하지 마세요.

변경 사항	상태	조치
기본값 아닌 `temperature`/`top_p`/`top_k`	호환성 변경 (400)	제거 후 프롬프트로 제어
수동 `thinking` + assistant prefill	호환성 변경 (400)	`output_config.effort`로 adaptive thinking 전환
`effort` 기본값	이제 `high`	비용/지연 시간 제어를 위해 명시적으로 설정
컨텍스트 윈도우	1M / 128k 출력 (API, Bedrock, Vertex)	Microsoft Foundry는 200k — 사전 계획 필요

토크나이저 함정: Opus 4.8이 요금을 부풀릴 수 있는 이유

Opus 4 → 4.8 마이그레이션에서 가장 쉽게 놓치는 변경 사항은 어떤 파라미터가 아닌 토크나이저입니다. Opus 4.7부터 Anthropic은 동일한 입력 텍스트에 대해 약 1배~1.35배, 즉 동일한 프롬프트에서 최대 약 35% 더 많은 토큰을 생성할 수 있는 토크나이저로 전환했습니다 . 코드에서는 아무런 오류도 발생하지 않으므로, 미리 재기준을 잡아두지 않으면 이 영향은 사용량 지표와 청구서에서만 드러납니다.

토큰 수가 변동하면 여러 하위 가정도 함께 달라집니다. 운영 수치를 신뢰하기 전에 다음 각 항목을 Opus 4.8 기준으로 재설정하세요:

max_tokens 예산 — Opus 4에서 상한선에 여유 있게 맞던 프롬프트가 이제는 상한에 가까워지거나, 예상보다 일찍 잘릴 수 있습니다.
클라이언트 측 토큰 추정 — 구 토크나이저에 맞춰 보정된 로컬 카운터나 휴리스틱은 과소 보고하게 되어, 사전 점검 및 라우팅 로직이 틀어집니다.
비용 예측 — 요청당 지출은 문자가 아닌 토큰 수에 따라 결정되므로, 예측에 새로운 입력값이 필요합니다.
지연 시간 목표 — 요청당 토큰이 많아지면 생성·스트리밍해야 할 양도 늘어나, 구 수치에 맞춰 설정한 SLA가 미끄러질 수 있습니다.
압축 트리거 임계값 — 토큰 경계에서 컨텍스트를 요약하거나 잘라내는 로직이 대화의 다른 시점에 발동됩니다.

순 비용 영향은 자동으로 결정되지 않으며, 바로 이 지점에서 마이그레이션 수식이 직관에 반하게 됩니다. Opus 4.8은 토큰당 가격을 크게 낮춥니다 — 기존 Opus 4의 입력/출력 백만 토큰당 $15/$75에서 Opus 4.8의 $5/$25로 인하되었습니다 . 그러나 35% 더 무겁게 토크나이즈되는 프롬프트는 그 인하분을 일부 상쇄합니다. 표면적인 가격 인하와 토큰 인플레이션은 서로 반대 방향으로 작용하므로, 실제 절감액은 정가만 보고 판단하기보다 프롬프트 내용과 길이 분포에 따라 달라집니다. 전액 절감을 단정하기 전에 실제 트래픽으로 직접 계산해 보세요.

중요한 점은, 인플레이션이 입력 유형에 따라 균일하지 않다는 것입니다. 소스 코드, JSON, XML, 압축 설정 파일 같은 문자 집약적 페이로드는 자연어 산문과 토크나이즈 방식이 매우 다를 수 있으며, 1배~1.35배라는 범위가 넓어 어디에 해당하는지가 중요합니다. 대용량 diff와 구조화된 도구 출력을 처리하는 에이전틱 코딩 워크로드는 채팅 형식의 요약 작업과 다른 배율이 나타날 수 있습니다. 합성 벤치마크가 아닌 실제 페이로드로 측정하세요. 로그에서 대표적인 요청을 뽑아 Opus 4.8로 토큰 수를 세고, 과거 Opus 4 수치와 비교해 보세요.

Anthropic의 공식 가이드는 토크나이저와 API 제약이 함께 변경되었으므로 교체 모델을 자체 평가 항목으로 운영 전에 테스트하라고 명시하고 있습니다 . 토큰 재기준 설정은 사후 정리 작업이 아닌 해당 평가 과정의 일부로 다루세요.

가격 한눈에: 67% 인하가 실제로 의미하는 것

Opus 워크로드 마이그레이션은 단순한 파라미터 정리가 아니라 가격 인하입니다. 기존 Opus 4 티어는 입력 백만 토큰당 $15, 출력 백만 토큰당 $75였으며, Opus 4.8(claude-opus-4-8)은 각각 $5, $25로 — 입력·출력 모두 67% 인하되고, 캐시 쓰기 및 캐시 적중 가격도 추가로 낮아졌습니다 . 앞 섹션의 주의사항은 여전히 유효합니다. 그 표면적 인하는 토큰당 기준으로 계산되며, 새 Opus 토크나이저는 동일한 텍스트에 대해 최대 ~35% 더 많은 토큰을 생성할 수 있으므로, 재기준을 잡기 전까지 실질 절감액은 67% 아래에 머뭅니다.

Quick Answer: Opus 4.8은 정가를 입력/출력 백만 토큰당 $15/$75에서 $5/$25로 인하합니다 — 두 요금 모두 67% 할인되며, 캐시 읽기·쓰기도 저렴해집니다. Sonnet 4.6은 Sonnet 4와 동일하게 $3/$15를 유지합니다 .

Sonnet의 요금 구조는 변동이 없습니다. Sonnet 4.6(claude-sonnet-4-6)은 Sonnet 4와 동일하게 입력 백만 토큰당 $3, 출력 백만 토큰당 $15를 유지하므로, Sonnet 사용자에게 이번 마이그레이션은 정가 변동 없는 기능·API 업그레이드입니다 . 두 교체 모델 모두 Claude API에서 1M 토큰 컨텍스트 창을 공유하지만, 출력 상한은 다릅니다. Opus 4.8은 최대 출력 토큰 128k를 지원하는 반면 Sonnet 4.6은 64k로, 단일 턴에서 긴 구조화 응답을 생성하는 경우 이 차이가 중요합니다 .

사양	Opus 4 (지원 종료)	Opus 4.8	Sonnet 4 (지원 종료)	Sonnet 4.6
입력 / 백만 토큰	$15	$5	$3	$3
출력 / 백만 토큰	$75	$25	$15	$15
최대 출력	—	128k	—	64k
컨텍스트 창 (Claude API)	—	1M	—	1M

이번 마이그레이션 이후에도 지속되는 의미론적 변경이 하나 있습니다. 4.6 세대부터 Anthropic은 claude-sonnet-4-6, claude-opus-4-8처럼 날짜 없는 ID를 사용하지만, 이는 최신 릴리스를 추적하는 롤링 포인터가 아니라 하나의 고정 모델에 매핑되는 고정 스냅샷입니다 . ID가 예고 없이 바뀌지 않아 재현성에는 유리하지만, 그만큼 다음 Opus나 Sonnet 업그레이드 시에도 명시적인 모델 ID 변경과 또 한 번의 마이그레이션이 필요합니다 . 날짜 없는 문자열이 코드를 미래 대비 완료 상태로 만든다고 가정하기보다, 이 반복적인 교체 작업을 일정에 포함해 두세요.

마이그레이션 검증: 평가(Eval), Claude Code 헬퍼, 그리고 다음 데드라인

운영 환경으로 승격하기 전에 자체 평가(eval)로 모든 마이그레이션을 반드시 검증하세요 — 공개된 벤치마크는 기준선일 뿐, 출력 스타일이나 토큰 수가 마이그레이션 후에도 유지된다는 보장이 아닙니다. Anthropic은 Claude Code 내부에 마이그레이션 헬퍼를 제공합니다: /claude-api migrate this project to claude-opus-4-8 (또는 claude-sonnet-4-6)을 실행하면 스킬이 모델 ID를 교체하고, 앞서 다룬 호환성 깨짐 파라미터 변경 사항을 적용하며, 수동 검증 체크리스트를 출력합니다 . Bedrock, Vertex AI, Microsoft Foundry, AWS의 Claude Platform 클라이언트 형식을 자동으로 감지하므로, 혼합 배포 코드베이스에서도 대상별로 올바른 수정이 적용됩니다 .

최초 Claude 4 벤치마크는 약속이 아니라 회귀 참조 기준으로 취급하세요. Anthropic은 2025년 5월 22일 출시 시점에 Sonnet 4는 SWE-bench 72.7%, Opus 4는 72.5%를 기록했다고 발표했습니다 . 이 수치는 은퇴한 모델의 성능을 나타낼 뿐, 4.6이나 4.8이 여러분의 프롬프트에서 정확한 포맷팅, 툴 호출 형태, 토큰 경제성을 재현하는지는 알 수 없습니다. 공식 가이드라인은 이 점을 명확히 밝힙니다:

"동작 방식, 토크나이저, API 제약이 변경되었으므로 운영 배포 전에 반드시 대체 모델을 자체 평가(eval)로 테스트하세요," — Anthropic, 모델 마이그레이션 가이드 (source: platform.claude.com).

몇 가지 샘플 완성을 눈으로 확인하는 대신, JSON 스키마, 중단 이유, 출력 길이 분포 등 구조를 검증하는 도메인 eval을 구축하세요. 토크나이저 변경만으로도 기존 max_tokens 상한값과 비용 예측을 실제 트래픽 기준으로 다시 산정해야 합니다.

Opus 4.1만 호출한다면 여유 기간이 조금 더 있습니다. 레거시 ID claude-opus-4-1-20250805는 2026년 6월 5일에 지원 중단이 예고되었으며 2026년 8월 5일에 은퇴하고, 동일하게 claude-opus-4-8로 대체됩니다 . 여유 기간에 방심하지 마세요 — 마이그레이션 작업이 Opus 4 경로와 동일하므로 한 번에 같이 처리하는 것이 깔끔합니다.

검증된 동작을 잃을까 걱정하는 팀에게 한 가지 안심할 부분: 은퇴는 API 사용 불가를 의미할 뿐, 삭제가 아닙니다. Anthropic은 공개 출시된 모델의 가중치를 최소한 회사 존속 기간 동안 보존하겠다고 약속했습니다 . 스냅샷은 여전히 존재하며, 다만 claude-opus-4-20250514나 claude-sonnet-4-20250514로는 더 이상 운영 트래픽을 라우팅할 수 없습니다.

핵심 실천 사항: Claude Code 마이그레이션 스킬을 실행해 ID 및 파라미터 교체를 자동화한 뒤, 배포 전에 자체 eval로 결과를 검증하세요. 8월 5일 Opus 4.1 전환도 같은 작업에 포함시키고, 새 토크나이저 기준으로 토큰 사용량과 비용을 재측정한 뒤, 다음 마이그레이션을 로드맵에 기재해 두세요 — 날짜 없는 ID는 최신 모델이 아닌 특정 스냅샷에 고정되기 때문입니다.

최종 업데이트: 2026-06-16. 은퇴 날짜 기준으로 공개된 Anthropic 모델 지원 중단 및 마이그레이션 문서를 검토하여 작성되었습니다.

자주 묻는 질문

Claude.ai나 Claude Code를 직접 사용하는 경우 업데이트가 필요한가요?

아니요. Claude.ai와 Claude Code 같은 소비자용 서비스는 모델을 자동으로 선택하며, 2026년 6월 15일부로 시행된 고정 ID 서비스 종료 정책의 적용을 받지 않습니다. 이 변경 사항은 API 수준에만 해당합니다. 즉, claude-opus-4-20250514나 claude-sonnet-4-20250514 같이 날짜가 포함된 특정 모델 ID, 또는 4.6 이전의 편의 alias를 코드에 하드코딩한 경우에만 영향을 미칩니다. 자체 API 통합에서 해당 ID를 호출하지 않는다면 마이그레이션할 필요가 없습니다.

claude-sonnet-4-6은 향후 Sonnet 버전으로 자동 업데이트되는 상시 alias인가요?

아니요. 4.6 세대부터 Anthropic은 claude-sonnet-4-6이나 claude-opus-4-8처럼 날짜 없는 형식으로 전환했지만, 이는 상시 포인터가 아닌 고정 스냅샷으로 — 각각 하나의 고정된 모델에 매핑됩니다 . 장점은 모델이 사용자 모르게 변경되지 않는다는 것이고, 단점은 향후 업그레이드마다 명시적인 모델 ID 교체와 추가 평가 테스트가 필요하다는 것입니다. 마이그레이션을 일회성 작업이 아닌 반복 작업으로 계획하세요.

Amazon Bedrock이나 Vertex AI를 사용합니다. 6월 15일 서비스 종료가 저에게도 적용되나요?

자동으로 적용되지는 않습니다. 6월 15일 날짜는 Anthropic이 직접 운영하는 플랫폼(Claude API, AWS의 Claude Platform, Microsoft Foundry)에만 해당하며, 파트너 운영 플랫폼은 자체 수명 주기 일정을 설정합니다 . 2026년 6월 중순 기준 파트너 테이블에서 Sonnet 4는 Amazon Bedrock과 Vertex AI 모두에서 여전히 이용 가능(deprecated 상태)으로 표시되었으며, Opus 4는 Bedrock에서 서비스 종료되었지만 Vertex AI에서는 계속 이용 가능합니다. 조치를 취하기 전에 플랫폼별 모델 수명 주기 테이블을 반드시 확인하세요.

코드베이스에서 서비스 종료된 ID를 아직 사용 중인 곳을 어떻게 모두 찾나요?

두 가지 보완적인 방법을 함께 활용하세요. 첫째, Anthropic Console 사용 현황 페이지에서 API 키와 모델별로 분류된 사용 CSV를 내보내 어떤 서비스 종료 ID가 아직 트래픽을 받고 있는지 확인하세요 . 둘째, 코드베이스에서 20250514 문자열과 해당 스냅샷에 매핑된 편의 alias — claude-opus-4, claude-sonnet-4, claude-opus-4-0, claude-sonnet-4-0 — 를 grep으로 검색하세요. CSV는 정적 검색에서 놓칠 수 있는 런타임 사용(구성 파일, 환경 변수, 서드파티 호출자)까지 포착합니다.

Opus 4.8이 Opus 4보다 67% 저렴한데 — 가격 인하가 성능 저하를 의미하나요?

아니요. Anthropic은 Opus 4.8을 복잡한 추론, 장기적 자율 코딩, 고자율 작업에 가장 뛰어난 Opus 티어 모델로 포지셔닝하며, 가격은 Opus 4의 입력/출력 토큰 100만 개당 $15/$75에서 Opus 4.8의 $5/$25로 인하되었습니다 . 이 인하는 성능 저하가 아닌 새 모델의 효율성 향상을 반영합니다. 다만, 새 토크나이저는 동일한 텍스트에 대해 최대 약 35% 더 많은 토큰을 생성할 수 있으므로 실제 비용을 다시 측정하고, 배포 전 자체 평가를 실행해 특정 워크로드에서 성능이 유지되는지 확인하세요.