Omni의 대화형 영상 편집기, 데모만큼 실제로도 좋을까?

Google Flow의 Gemini Omni: 크레딧 비용, 지역 제한, 반복 편집 — 아직 호출 가능한 API 없음.

Omni의 대화형 영상 편집기, 데모만큼 실제로도 좋을까?
Share

Gemini Omni의 데모 영상은 너무나 간단해 보입니다. 영상을 요청하고, 원하는 장면이 나올 때까지 계속 대화하면 됩니다. 개발자들의 관심사는 이 대화형 루프가 무대 시연 밖에서도 실제로 작동하는지, 그리고 기존 Veo 워크플로와 비교해 무엇이 실질적으로 달라졌는지입니다.

Veo에 없던 Omni의 차별점

Omni의 핵심 추가 기능은 상태(state) 유지입니다. Veo는 원샷 렌더링 방식이었습니다. 각 프롬프트마다 이전 내용에 대한 기억 없이 새로운 클립을 생성했습니다. Gemini Omni는 대화 전반에 걸쳐 컨텍스트를 유지하므로, 세 번째 턴에서 카메라 앵글을 바꿔도 첫 번째 턴에서 설정된 캐릭터와 조명을 그대로 유지하며 장면을 처음부터 다시 시작하지 않아도 됩니다 . 2026년 5월 19일 Google I/O에서 발표된 첫 번째 출시 모델인 Gemini Omni Flash는 Gemini 앱의 영상 생성 기능으로 Veo를 대체합니다 .

제품 디렉터 Nicole Brichtova는 이를 "미디어 모델의 렌더링 능력과 Gemini의 지능을 결합하는 다음 단계"로 표현했습니다 — DeepMind의 비공식 표현을 빌리면 '영상용 Nano Banana'로, 대화형 이미지 편집을 동영상까지 확장한 것입니다.

두 가지 주장은 냉정하게 살펴볼 필요가 있습니다. Google은 "중력, 운동 에너지, 유체 역학 같은 물리 법칙에 대한 직관적 이해"를 광고하지만, 이러한 물리 동작은 현재 Google 데모와 크리에이터 영상에만 근거하며 출시 시점에 제3자 벤치마크는 공개되지 않았습니다 . 또한 실제 출력 품질에서 독립 리뷰어들은 Omni의 생성 품질이 Veo 3.1과 비슷한 수준이지 확연히 뛰어나지는 않다고 평가합니다 . 차별점은 반복적 편집 루프와 Gemini 기반 추론이지, 새로운 렌더 엔진이 아닙니다.

시작 전 확인: 유료 멤버십·지역·연령

Is Omni's conversational video editor as good as the demos?

Omni 접근은 유료 Google AI 요금제와 몇 가지 필수 자격 조건 뒤에 잠겨 있으므로, 프롬프트를 입력하기 전에 먼저 확인하세요. Gemini Omni Flash는 Google AI Plus, Pro, Ultra 구독자를 위해 Gemini 앱과 Google Flow에서 열리며, Plus는 월 $7.99부터 시작합니다 . 무료로 테스트하고 싶다면, 출시 시 YouTube ShortsYouTube Create 앱에서 무료로 생성을 이용할 수 있습니다 .

개발자들이 놓치기 쉬운 두 가지 제약 사항:

  • 연령 및 계정 유형. 만 18세 이상이어야 하며, 아바타 생성은 개인 Google 계정(Workspace 불가)이 필요하고 현재 영어 전용입니다 .
  • 지역. 업로드 영상 편집과 아바타 생성은 EEA(유럽경제지역), 스위스, 영국 및 일부 미국 주에서 이용할 수 없습니다 .

아직 프로그래밍 방식의 접근 경로는 없습니다. 개발자·기업용 API는 출시 후 "수 주 내 제공 예정"으로 명시되어 있어, 코드에 고정할 안정적인 공개 모델 ID가 존재하지 않습니다 . 현재로서는 유료 요금제 하에서 Gemini 앱이나 Flow를 통해 작업해야 합니다.

턴마다 클립 만들고 다듬기

Is Omni's conversational video editor as good as the demos?

Omni에서 클립을 만들려면 여섯 단계를 거칩니다. 서비스 선택, 영상 만들기 열기, 프로덕션 브리프 형식의 프롬프트 작성, 참고 자료 첨부, 턴별 대화 수정, 그리고 Flow에서는 캐릭터 고정과 장면 연결까지입니다. 워크플로는 모든 서비스에서 동일한 대화형 루프이며, 달라지는 것은 비용과 제어 수준입니다. 실행 가능한 경로를 소개합니다.

1단계 — 서비스 선택. 현재 세 가지 옵션이 있습니다. YouTube Shorts와 YouTube Create 앱은 Omni를 무료로 실행하며 Flow 크레딧을 소모하지 않아 프롬프트 루프를 익히기에 적합합니다 . Gemini 앱(Google AI Plus 이상)은 표준 대화형 편집기를 제공합니다. Google Flow(역시 Plus 이상)는 캐릭터 고정, 음성 고정, 파워 유저용 에이전트 모드를 추가로 제공합니다 .

2단계 — 영상 만들기 열기. 데스크톱에서는 파일 추가 → 영상 만들기를 클릭하고, 모바일에서는 파일 추가 → 동영상을 탭합니다. 프롬프트 입력 전에 선택적으로 템플릿을 고를 수 있습니다(영상: Google).

3단계 — 프로덕션 브리프 형식의 프롬프트 작성. 프롬프트를 문장이 아닌 촬영 목록처럼 작성하세요. Google의 프롬프트 가이드는 샷 구도, 움직임, 스타일, 조명, 장소, 동작을 구체적인 영상 촬영 용어로 명시할 것을 권장합니다. 클로즈업, 와이드앵글, 고정 샷, 푸시 인, 달리 줌, 스마트폰 자연스러운 줌 같은 용어들입니다 . 구체적인 용어가 모호한 설명보다 일관되게 더 나은 결과를 냅니다(영상: Google).

4단계 — 참고 자료 첨부. Gemini 앱의 영상 프롬프트는 업로드 동영상 하나와 이미지 최대 다섯 장을 허용합니다 . 텍스트만 입력하면 기본으로 가로 비율이 적용되며, 이미지나 동영상을 첨부하면 출력 화면 비율이 업로드 파일에서 자동으로 상속됩니다.

5단계 — 대화로 수정하기. 이것이 Omni의 핵심 차별점입니다. 장면을 다시 설명하지 않고 턴마다 하나의 좁은 지시만 전달하세요. "나비를 벌로 바꿔줘", "어깨 너머 샷으로 전환해", "음악에 맞춰 조명을 동기화해" 같은 식으로 입력하면 Omni가 이전 턴의 캐릭터, 조명, 시간적 연속성을 그대로 이어갑니다 .

6단계(Flow 전용) — 고정 및 연결. Flow에서는 텍스트 프롬프트나 참고 이미지로 캐릭터를 만들고, 외모와 음성을 고정한 다음, 동영상·오디오·이미지를 Ingredients에 입력하고 첫/마지막 프레임을 설정합니다(영상: King Charles Tv). 에이전트 모드는 10초 이하의 클립을 계획하고 연결해 더 긴 시퀀스로 만들며, 자동 생성 또는 직접 승인 대기 설정을 선택할 수 있습니다 .

크레딧 소비, 클립 길이 제한, 워터마크 동작 방식

Is Omni's conversational video editor as good as the demos?

Omni의 과금 체계는 Flow 크레딧으로 계산되며, 편집은 항상 생성보다 비용이 많이 듭니다. 신규 생성 시 4초 클립은 15크레딧, 6초는 20크레딧, 8초는 25크레딧, 10초는 30크레딧이 소요됩니다. 반면 업로드하거나 생성한 영상은 길이에 관계없이 편집 시 일괄 40크레딧이 부과됩니다 . 즉, 대화형 편집 한 번이 베이스 클립 생성보다 더 비싸므로, 여러 턴에 걸쳐 반복 작업할 때는 이 점을 염두에 두어야 합니다.

월간 크레딧 한도는 요금제에 따라 달라집니다:

요금제크레딧 지급량
무료 (미구독)50 / 일
Google AI Plus200 / 월
Pro1,000 / 월
Ultra ($100)10,000 / 월
Ultra ($200)25,000 / 월

업스케일링은 별도로 과금됩니다. 1080p 업스케일링은 Plus, Pro, Ultra에서 무료이지만, 4K 업스케일링은 Ultra 전용이며 클립당 50크레딧이 소요됩니다 . 10초 클립 생성에 30크레딧이 드는 만큼, Plus 사용자의 월 200크레딧으로는 편집 전 기준 약 6개의 풀레스 클립을 만들 수 있습니다 — 이를 고려해 예산을 계획하세요.

10초 제한도 미리 감안해야 할 제약입니다. TechCrunch에 따르면 이는 기술적 한계가 아닌 소비자 채택을 위한 의도적 선택이며, 더 긴 영상 지원은 계획 중이나 일정은 미정입니다 . 당장은 제한이 늘어나기를 기다리기보다 Flow의 에이전트 모드에서 클립을 연결해 사용하는 것이 낫습니다.

출처 추적 측면에서, 모든 Omni 출력물에는 Google의 SynthID — 눈에 보이지 않는 기계 검증 가능한 워터마크 — 와 함께 Gemini, Flow, YouTube 전반의 C2PA 콘텐츠 크리덴셜이 내장됩니다 . 한 가지 주의할 점은, 직접 다운로드한 파일에는 보이지 않는 SynthID 레이어 위에 추가로 눈에 보이는 워터마크도 포함된다는 것입니다 . 깔끔한 편집이 필요한 영상이라면 이 점을 미리 고려하세요.

다음 단계 실험 방향

효과가 쌓이는 패턴은 단순합니다. 베이스 클립을 생성하거나 업로드하고, 매 턴마다 작은 변경 하나씩만 적용한 뒤, 장면이 확정되면 한 번만 내보내세요. 처음부터 다시 시작하면 크레딧과 함께, Omni가 캐릭터·조명·움직임을 일관되게 유지하는 데 활용하던 대화 컨텍스트까지 모두 날아갑니다. 멀티샷 작업에는 Flow의 에이전트 모드를 활용하면 스크립트 작성부터 이미지·영상 자동 생성까지 순서대로 진행되며, 각 단계마다 승인을 받은 뒤에 계속하도록 설정할 수도 있습니다 .

데모 결과가 실제 영상과 얼마나 일치하는지 가늠하려면, 아래 간단한 테스트 코드처럼 직접 실행 결과를 채점해 보세요 — 예시용이지만 오류 없이 실행됩니다 (exit 0):

from dataclasses import dataclass


@dataclass
class Trial:
    task: str
    asked: int
    completed: int
    manual_fixes: int


trials = [
    Trial("cut filler words", 18, 17, 1),
    Trial("insert b-roll from prompt", 8, 6, 2),
    Trial("reframe speaker shots", 12, 9, 3),
    Trial("sync captions", 10, 10, 0),
]

score = sum(t.completed - t.manual_fixes for t in trials) / sum(t.asked for t in trials)
print(f"real-world score: {score:.0%}")
print("verdict:", "demo-like" if score >= 0.85 else "promising, but verify on your footage")

앞으로 주목할 두 가지가 있습니다. Google은 개발자 API가 "몇 주 내" 공개된다고 밝혔으며, T2VA·I2VA·R2VA 및 영상 편집 평가용 모델 카드는 API 공개 시점에 함께 발표됩니다 — 따라서 공개 모델 ID를 코드에 하드코딩하는 것은 보류하세요. Omni Pro 티어도 개발 중이나 출시 일정은 미정이며, 4K 업스케일링과 현재 10초 제한을 넘는 긴 클립 지원이 가장 유력한 단기 추가 기능으로 언급되고 있습니다 . 솔직한 핵심 정리: 대화형 워크플로우가 진짜 업그레이드입니다 — 릴 영상만 믿지 말고 직접 클립으로 테스트해 보세요.

자주 묻는 질문

Gemini Omni는 Veo와 어떻게 다른가요?

Omni는 상태를 유지하며 멀티턴 방식으로 동작합니다. 각 지시가 이미 구성된 장면 위에 쌓이기 때문에, 카메라 각도를 바꾸거나 오브젝트를 교체해도 이전 캐릭터·조명·구도를 그대로 유지한 채 렌더링을 처음부터 다시 시작할 필요가 없습니다 . Veo는 매번 처음부터 다시 생성해야 하는 원샷 출력물을 만들었습니다. Omni는 2026년 5월 19일부로 Gemini 앱의 동영상 생성 기능에서 Veo를 대체했습니다 . 독립적인 리뷰어들은 원시 생성 품질을 Veo 3.1과 비슷한 수준으로 평가했으며, 확실히 앞선다고 보지는 않았습니다. 진짜 차별점은 픽셀 품질이 아닌 반복적 편집 루프에 있습니다 .

개발자가 지금 바로 호출할 수 있는 Gemini Omni API가 있나요?

아니요. 출시 시점에는 공개 개발자 또는 엔터프라이즈 API가 없습니다. Google은 "몇 주 내로" 제공될 예정이라고 밝혔으며, 모델 카드에는 API가 출시될 때 T2VA·I2VA·R2VA·동영상 편집·이미지 생성 평가가 게시될 것이라고 명시되어 있습니다 . 아직 고정할 수 있는 안정적인 공개 모델 ID가 없으므로, 하드코딩은 피하는 것이 좋습니다 . API가 출시될 때까지 개발자들은 유료 플랜의 Gemini 앱 또는 Google Flow를 통해 Omni에 접근할 수 있습니다.

Flow 크레딧으로 Omni 10초 클립은 얼마인가요?

Flow에서 Gemini Omni Flash로 10초짜리 영상을 생성하면 30크레딧이 소요됩니다. 짧은 클립은 15크레딧(4초), 20크레딧(6초), 25크레딧(8초)입니다 . 해당 클립 또는 길이에 관계없이 업로드된 동영상을 편집하면 40크레딧이 필요하고, 4K 업스케일링은 50크레딧이 추가되며 Ultra 전용입니다. 1080p 업스케일링은 Plus·Pro·Ultra 요금제에서 무료입니다 . 무료 비구독 계정은 하루에 50 Flow 크레딧을 받습니다 .

유럽에 거주해도 Gemini Omni를 사용할 수 있나요?

부분적으로 가능합니다. 텍스트 또는 이미지 프롬프트로 동영상을 생성하는 기능은 유럽 대부분을 포함한 많은 국가에서 이용할 수 있습니다 . 그러나 업로드된 동영상 편집과 아바타 생성은 EEA·스위스·영국에서 차단되어 있습니다 . 일부 명시되지 않은 미국 주에서도 업로드된 동영상 편집이 차단되어 있으며, Google은 어떤 주인지 밝히지 않았습니다 . 영어를 권장하지만, 한국어·일본어·중국어·힌디어·프랑스어·독일어·스페인어·포르투갈어도 프롬프트 언어로 지원됩니다.

Gemini Omni는 생성하는 모든 콘텐츠에 워터마크를 삽입하나요?

네, 두 가지 머신 검증 레이어로 삽입됩니다. 모든 Omni 출력물에는 Google의 보이지 않는 SynthID 워터마크와 C2PA Content Credentials이 Gemini·Flow·YouTube 전반에 걸쳐 삽입되며, Gemini 앱·Chrome의 Gemini·Google 검색을 통해 출처를 확인할 수 있습니다 . 다운로드하는 파일에는 SynthID 위에 보이는 워터마크도 함께 포함됩니다 . Google은 2026년 5월 19일 기준으로 SynthID 검증이 전 세계적으로 5,000만 회 이상 사용되었다고 보고했습니다 .