ByteDance는 베이징에서 열린 Volcano Engine FORCE 컨퍼런스에서 Seedance 2.5를 발표했다. 이 비디오 모델은 30초짜리 단일 클립을 한 번에 렌더링한다고 전해졌다. 다만 이를 기반으로 무언가를 만들려는 사람에게 중요한 단서가 있다. 현재 기준으로, ByteDance의 자체 문서에는 그 내용이 아직 존재하지 않는다.
Seedance 2.5, 어디까지 직접 확인할 수 있나?
2026년 6월 23일 기준으로 짧게 답하면, 거의 없다. ByteDance의 공식 채널에는 Seedance 2.5 모델 카드도, API 모델 ID도, arXiv 프리프린트도, 벤치마크 점수도 없다 . Seed 모델 페이지에는 여전히 Seedance 2.0이 올라와 있고, Seed 블로그 인덱스에도 2.5 출시 항목은 보이지 않는다 .
핵심 사양으로 보도된 내용은 모두 하나의 행사, 즉 FORCE 키노트에서 나와 2차 기술 매체를 통해 전달된 것이다. 여기에는 30초 네이티브 클립, 최대 50개의 멀티모달 레퍼런스 입력, 프롬프트 준수율 약 20% 향상 주장 등이 포함된다 . 아직 이 수치를 뒷받침하는 독립 벤치마크, 동료 검토 보고서, 1차 모델 카드는 없다 .
지금 이 발표를 읽는 가장 솔직한 방식은, 문서로 확인된 것과 보도로 알려진 것을 나누어 보는 것이다.
| 항목 | Seedance 2.0(문서 확인) | Seedance 2.5(보도) |
|---|---|---|
| arXiv 모델 카드 | 2026년 4월 15일 제출 | 없음 |
| 공식 출시 글 | 2026년 2월 12일 Seed 블로그 게시 | 없음 |
| 클립 길이 | 4~15초 | 약 30초(주장) |
| API 모델 ID / 가격 | 공개됨 | 공개되지 않음 |
따라서 Seedance 2.5는 보도는 됐지만 아직 확인되지 않은 모델로 봐야 한다. ByteDance는 Volcano Engine을 통한 2026년 7월 초 출시를 설명하고 있으며, 전 세계 기업 대상 베타가 이미 진행 중이라고 전해졌다 . 릴리스 노트, 모델 ID, 테스트 가능한 출력물이 포함될 그 출시가 다음 실제 검증 지점이다. 그전까지 30초 주장은 직접 실행할 수 있는 산출물이 아니라 컨퍼런스 보도에 기대고 있다.
Seedance 2.0: arXiv 모델 카드가 설명하는 것

이 검증 지점이 중요한 이유는 확인 가능한 기준선이 2.5가 아니라 Seedance 2.0이기 때문이다. ByteDance의 Seed 블로그에는 2026년 2월 12일 "Seedance 2.0 Official Launch"가 올라와 있으며 , 기술적 세부 내용은 Team Seedance와 공동 저자 170명이 2026년 4월 15일 제출한 arXiv 모델 카드에서 나온다 . 이것이 구체적이고 인용 가능한 사양을 담은 문서다. 2.5에는 아직 이런 산출물이 없다.
해당 모델 카드에 따르면 2.0은 통합 멀티모달 오디오-비디오 아키텍처다. 텍스트, 이미지, 오디오, 비디오를 입력으로 받고, 480p와 720p를 네이티브로 지원하면서 4~15초 길이의 오디오-비디오 출력을 직접 생성한다 . 연출은 레퍼런스 예산에서 갈린다.
| 사양 | Seedance 2.0(문서 확인) |
|---|---|
| 입력 모달리티 | 텍스트, 이미지, 오디오, 비디오 |
| 출력 길이 | 4~15초 |
| 네이티브 해상도 | 480p, 720p |
| 레퍼런스 슬롯 | 최대 비디오 클립 3개, 이미지 9장, 오디오 클립 3개 |
| 저지연 버전 | Seedance 2.0 Fast |
| 벤치마크 | 내부 SeedVideoBench-2.0 |
개발자가 봐야 할 주의점은 두 가지다. 첫째, 평가는 ByteDance 내부 SeedVideoBench-2.0에서 수행된다. 외부 리더보드 항목이 없기 때문에 점수는 벤더가 보고한 수치다 . 둘째, 배포는 TikTok 통합이 아니라 Dreamina와 Doubao를 통해 이뤄지며, 출시 보도는 오디오와 멀티모달 프롬프팅을 포함한 최대 15초 클립을 설명했다 .
이 15초 상한을 기억해 둘 필요가 있다. 보도된 30초 원샷 생성이 사실이라면, 문서로 확인된 이 수치를 거의 두 배로 늘리는 셈이기 때문이다.
30초를 끊지 않고 만들기: 이음새 없는 광고 조립
네이티브 30초 클립이 중요해지는 이유는, 조각이 아니라 완성 단위에 가까워지기 때문이다. 현재 현장은 짧은 길이에 머물러 있다. Seedance 2.0은 대략 15초 클립을 생성하고 , Google의 Veo 3.1은 4~8초 범위의 출력을 만든다 . 표준 30초 광고 슬롯을 채우려면 제작자는 두 개에서 네 개의 별도 생성물을 하나의 타임라인으로 이어 붙여야 한다.
30초는 실제로 배포되는 대부분의 숏폼 상업 영상 작업을 포괄한다.
- 15~30초로 운영되는 소셜 광고(Reels, Shorts, TikTok 인피드).
- 앱스토어 프로모션 영상과 기능 티저.
- 제품 데모와 브랜드 하이라이트 영상.
그 길이라면 한 번의 생성이 완성 초안이 된다. 그보다 짧으면 여전히 조립해야 할 조각일 뿐이고, 조립에는 사양표가 잘 말하지 않는 비용이 붙는다.
이어 붙이는 지점에서 이음새가 드러난다. 독립적으로 생성한 결과물을 연결하면 경계에서 보이는 컷, 세그먼트를 지나며 어긋나는 오디오 싱크, 색을 맞추고 타이밍을 다시 잡고 전환부를 마스킹하는 추가 후처리가 생긴다. 각 클립은 다른 클립을 모른 채 생성되므로 움직임과 조명이 저절로 맞아떨어지는 경우는 드물다.
이 단계를 없애면 숏폼 콘텐츠의 경제성이 달라진다. 보도된 한 번의 생성 패스가 가장 흔한 광고 길이에서 생성, 트리밍, 매칭, 스플라이스, 수정으로 이어지는 멀티 클립 편집 체인을 대체할 수 있기 때문이다. 보도된 2.5 수치는 문서로 확인된 15초 상한을 약 30초로 거의 두 배 늘리며, 그 단일 구간 안에 장면 전환과 템포 변화까지 포함한다고 한다 . 7월 출시 이후에도 이 수치가 유지된다면 사라지는 것은 두 번째 렌더만이 아니라 이음새를 제거하는 단계 자체다. 다만 이 "만약"은 중요하다. 30초 주장은 아직 모델 카드가 아니라 컨퍼런스 보도에 기대고 있다.
참조 50개와 4개: 연출 복잡도는 이렇게 달라집니다

참조 입력 한도는 2.5에서 보고된 변화가 가장 큰 부분입니다. Seedance 2.0의 문서화된 아키텍처는 출시 플랫폼 기준으로 동영상 클립 최대 3개, 이미지 9개, 오디오 클립 3개까지, 총 15개의 참조 슬롯을 받습니다 . 6월 23일 컨퍼런스 보도에서는 2.5가 이미지, 오디오, 스타일 가이드, 3D 모델을 아우르는 약 50개의 동시 "풀 모달" 입력으로 이를 늘렸다고 설명합니다 .
생성 파이프라인을 구성하는 개발자에게 슬롯 수는 제어 가능성의 상한입니다. 참조가 많을수록 모델이 임의로 만들어내는 요소는 줄고, 반드시 맞춰야 할 요소는 늘어납니다. 입력이 50개라면, 원칙적으로 캠페인이 이미 보유한 자산을 한 번의 패스로 묶을 수 있습니다.
- 로고, 팔레트, 타이포그래피 스타일 가이드로 이루어진 브랜드 키트를 시각적 기준점으로 사용.
- 보이스오버 트랙을 재합성하지 않고 오디오 참조로 제공.
- 3D 제품 목업으로 지오메트리와 카메라 프레이밍을 구동 .
이는 지금은 순차 합성으로 처리되는 작업, 즉 렌더링한 뒤 후반 작업에서 브랜드와 오디오를 얹는 과정을 하나의 생성 단계로 압축합니다. 30초 주장과 같은 구조적 논리입니다. 결과물을 이어 붙이는 대신 단계를 합치는 것입니다.
단서도 그대로 따라옵니다. 50개 입력이라는 수치는 전적으로 컨퍼런스 발언에 근거합니다. 이 아키텍처 주장을 뒷받침하는 기술 논문이나 절제 연구는 없고, ByteDance의 1차 채널은 여전히 2.0만 문서화하고 있습니다 . 모델 카드가 나오기 전까지는 이 숫자를 마케팅 사양으로 봐야 합니다. 7월 출시 때 확인할 보정 지점은 실제 슬롯 수를 Runway Gen-4 및 Kling 2.0과 비교해, "50"이라는 숫자가 단독으로 서지 않고 경쟁 모델의 상한과 나란히 놓이도록 하는 것입니다.
주체 교체와 장면 블로킹: 단순 텍스트-투-비디오를 넘어서
2.5의 편집 기능은 모델을 일회성 텍스트-투-비디오에서 재사용 가능한 변형 제작과 사전 렌더링 계획 단계로 밀어 올립니다. 핵심 기능으로 내세운 것은 주체 교체입니다. 원본 클립의 움직임, 카메라 경로, 조명은 유지하면서 주체만 바꾸는 방식입니다 . 제품 광고라면 승인된 마스터 영상을 하나 촬영한 뒤, 시장별로 주인공 제품만 다시 입히는 일이 가능하다는 뜻입니다. 현재는 각 변형마다 다시 렌더링하거나 다시 촬영해야 하는 현지화 워크플로입니다.
여기에 3D "화이트박스" 프리뷰가 결합됩니다. 팀이 전체 렌더링 컴퓨트를 투입하기 전에 검증하는 저충실도 공간 블로킹 초안입니다 . 핵심은 비용 통제입니다. 구성, 프레이밍, 타이밍을 저렴하게 확인한 뒤 한 번만 렌더링하는 것입니다. 보도는 브랜드 키트, 보이스오버, 3D 목업을 하나의 클립으로 융합하는 멀티모달 합성 단계도 함께 설명합니다 .
이 도구들은 독립형 비디오 모델이 아니라 제품군의 일부로 등장합니다. FORCE 컨퍼런스에서 ByteDance는 Seedream 5.0 Pro(이미지), Seed-Audio 1.0(오디오), Doubao 2.1 Pro LLM도 함께 소개했습니다 . 하나의 도구라기보다 생성부터 편집까지 이어지는 전체 스택으로 포지셔닝한 것입니다.
길이와 참조 입력 주장에 붙었던 같은 단서가 여기에도 적용됩니다. 모든 편집 기능은 컨퍼런스 보도에 근거합니다. API 표면, 파라미터 이름, SDK 문서는 아직 나오지 않았고, ByteDance의 1차 채널은 여전히 Seedance 2.0만 게시하고 있습니다 . 모델 카드나 릴리스 노트가 나오기 전까지는 주체 교체와 화이트박스 블로킹을 출시된 기능 세트가 아니라 로드맵으로 봐야 합니다.
Seedance 2.0 초상권 논란 이후의 IP 리스크

Seedance 2.5의 상업적 매력은 아직 해결되지 않은 권리 분쟁과 정면으로 부딪힙니다. Business Insider가 보도한 서한에 따르면, Netflix는 ByteDance가 Seedance를 통해 자사 카탈로그에서 무단 2차 저작물을 생성했다고 주장하며 해당 도구에서 자사 타이틀을 제외하라고 요구했습니다 . 유료 작업에 2.5를 검토하는 팀이라면 법적 노출면은 기능 목록만큼 중요합니다.
압박은 Seedance 2.0이 유명인 초상과 저작권 캐릭터를 닮은 결과물로 입소문을 탄 뒤 이어졌습니다. The Verge에 따르면, 스튜디오들이 이의를 제기한 뒤 ByteDance는 안전장치를 강화하겠다고 밝혔습니다 . 이의를 제기한 쪽으로는 할리우드 스튜디오, SAG-AFTRA, Motion Picture Association, 미국 의원들이 모두 거론됐습니다.
ByteDance가 FORCE에서 내놓은 답은 라이선싱 전략이었습니다. ByteDance는 AI 저작권 및 상업화 플랫폼을 발표했고, 감독 주성치를 초기 협업자로 내세워 사용자가 Douyin과 Qianchuan 전반에서 그의 고전 클립을 기반으로 승인된 2차 버전을 만들 수 있게 했습니다. Volcano Engine 사장 Tan Dai는 당일 생성물이 1만 건을 넘었다고 말했습니다 .
"당일 생성물이 1만 건을 넘었습니다." ByteDance Volcano Engine 사장 Tan Dai의 말입니다 (source: AIbase).
개발자 입장에서 이 승인된 2차 저작물 경로는 특정 권리자 한 명의 문제를 다룰 뿐, 프롬프트가 재현할 수 있는 작품 카탈로그 전체를 해결하지는 못합니다. 2.5에서 지켜봐야 할 노출 지점은 다음과 같습니다.
- 초상 필터링: 2.5가 알아볼 수 있는 얼굴과 캐릭터를 기본적으로 차단하는지, 아니면 프롬프트 작성자에게 맡기는지.
- 문서화된 약관: 상업적 사용 권리와 면책이 컨퍼런스 설명이 아니라 문서로 제시되는지.
- 출처 정보: 다운스트림 게시 중단 방어에 쓸 수 있는 귀속 정보가 출력물에 포함되는지.
2.5의 약관이 이를 문서로 다루기 전까지는 상업적 Seedance 출력물에는 정량화되지 않은 IP 책임이 따른다고 봐야 합니다. 안전장치는 문서화된 통제가 아니라 아직 표명된 의도에 머물러 있습니다.
7월 출시 때 확인할 것
보도된 2026년 7월 초 Volcano Engine 출시 시점에는 , 다음 네 가지를 확인해야 실제 제품과 콘퍼런스용 발표를 구분할 수 있다. 먼저 1차 출처부터 보자. 2026년 6월 23일 현재 ByteDance의 공식 채널에는 여전히 Seedance 2.0만 표시되어 있으며, 2.5 모델 카드, API ID, 가격, 30초 사양은 없다 .
- API 모델 ID: Volcano Engine에 문서화된 Seedance 2.5 모델 ID가 나오는지, 그리고 현재
/seedance2_0URL에 대응하는seed.bytedance.com/en/seedance2_5페이지가 생기는지 확인한다 . - 독립 벤치마크: 콘퍼런스 슬라이드에서 읽은 것으로 보이는 약 20% 프롬프트 준수율 주장 이 아니라, 2026년 4월 15일 제출된 Seedance 2.0 arXiv 카드처럼 재현 가능한 방법론을 갖춘 기술 프리프린트가 나오는지 봐야 한다 .
- 재현 여부: 크리에이터와 독립 평가자가 눈에 띄는 이어붙임 흔적 없이 네이티브 30초 클립을 만들 수 있는지 확인한다.
- 가격과 지역: 엔터프라이즈 베타 조건을 ByteDance가 시장 기준으로 언급한 Seedance 2.0 과 비교하고, 중국 외 지역에서 API 접근이 가능한지도 확인한다.
요약하면 이렇다. 모델 ID, 방법론, 깨끗한 30초 재현이 모두 확인되기 전까지 Seedance 2.5는 신뢰할 만한 로드맵 신호일 수는 있어도, 바로 의존해 구축할 수 있는 출시 제품은 아니다. 이를 기반으로 개발하기 전 출시 시점에 다시 검증해야 한다.
최종 업데이트: 2026-06-23. 이 날짜 기준 Seedance 2.0만 표시한 ByteDance 1차 출처와 대조해 검토했다.
자주 묻는 질문
Seedance 2.5를 지금 API로 사용할 수 있나?
아니다. 2026년 6월 23일 현재 Seedance 2.5의 공식 API, 모델 ID, 가격은 없다. ByteDance는 Volcano Engine을 통한 2026년 7월 초 엔터프라이즈 베타를 설명했으며, 발표 당시 전 세계 엔터프라이즈 테스터에게 열릴 것으로 보도됐다 . 통합하기 전에는 언급된 기간 이후 seed.bytedance.com과 Volcano Engine 문서를 확인해야 한다.
Seedance 2.5는 Seedance 2.0과 무엇이 다른가?
Seedance 2.0은 공개 문서가 있지만, 2.5는 그렇지 않다. arXiv 모델 카드에 따르면 2.0은 4~15초 클립을 생성하고, 네 가지 입력 모달리티(텍스트, 이미지, 오디오, 비디오)를 지원하며, 최대 3개 비디오, 9개 이미지, 3개 오디오 레퍼런스를 받을 수 있다 . 콘퍼런스 보도는 2.5가 단일 생성 길이를 약 30초로 늘리고 최대 50개 레퍼런스 입력을 지원한다고 말한다 . 두 2.5 수치 모두 행사 보도에만 근거하며, 공식 모델 카드는 없다.
Seedance 2.5가 정말 이어붙임 없이 30초 클립을 생성할 수 있나?
확인되지 않았다. 2026년 6월 23일 FORCE 콘퍼런스에서 매끄러운 네이티브 30초 클립이 가능하다는 주장이 나왔지만, ByteDance 공식 Seed 페이지는 여전히 15초 상한의 Seedance 2.0만 설명하고 있다 . 독립 재현은 7월 출시 이후를 기다려야 한다. 클립 경계에서 템포나 조명 불연속을 찾는 크리에이터 커뮤니티의 이어붙임 감지 테스트가 첫 실무 신호가 될 것이다.
ByteDance는 왜 버전 2.1을 건너뛰었나?
보도에 따르면 ByteDance는 계획된 2.1을 건너뛰고 2.0에서 2.5로 바로 넘어갔다 . 공식 설명은 없었다. 콘퍼런스 발표는 버전 차이를 건너뛸 만큼 큰 기능 도약으로 포지셔닝하지만, 릴리스 노트가 나오기 전까지는 문서화된 근거가 아니라 공급사 서사로 봐야 한다.
Seedance 출력물을 상업적으로 사용할 때 IP 위험은 무엇인가?
중요하고 아직 정리되지 않은 문제다. Seedance 2.0 출시 이후 Netflix는 ByteDance가 무단 2차 저작물 제작을 가능하게 했다며 삭제를 요구했고 , ByteDance는 스튜디오들의 이의 제기 이후 보호 조치를 강화하겠다고 밝혔다 . 브랜드 콘텐츠에 Seedance를 쓰는 팀은 2.5 약관이 공개되기 전에, 특히 인물 초상과 가상 캐릭터에 대한 출력 필터링 정책을 검토해야 한다.