Gemini Omni Flash 참조 이미지-투-비디오
- Gemini Omni Flash (gemini-omni-flash-reference-to-video) 모델은 참조 이미지-투-비디오 모드를 지원하며, 1~6장의 참조 이미지와 텍스트 프롬프트를 기반으로 네이티브 오디오가 포함된 영상을 생성합니다
- 참조 이미지 입력:
image_urls로 전달하며, 1~6장을 지원하고 영상 속 주체, 스타일 또는 요소를 제약하는 데 사용됩니다 - 길이 제어:
duration으로3~10초의 정수 길이를 지정하거나auto를 전달하여 모델이 자체적으로 결정하도록 합니다 - 화면 비율:
aspect_ratio로16:9,9:16또는auto를 선택합니다 - 네이티브 오디오: 모델이 화면에 맞는 동기화 오디오를 자동으로 생성하며, 별도의 매개변수가 필요하지 않습니다
- 네거티브 설명:
prompt에 직접 작성하며(예:No dialogue), 본 모델은 별도의 네거티브 프롬프트 매개변수를 제공하지 않습니다 - 비동기 처리 모드이며, 반환된 작업 ID를 사용하여 조회하세요
- 생성된 영상 링크는 24시간 동안 유효하므로 즉시 저장하세요
인증
##모든 API는 Bearer Token 인증이 필요합니다##
API Key 받기:
API Key 관리 페이지를 방문하여 API Key를 받으세요
요청 헤더에 추가:
Authorization: Bearer YOUR_API_KEY본문
모델 이름, gemini-omni-flash-reference-to-video로 고정
gemini-omni-flash-reference-to-video "gemini-omni-flash-reference-to-video"
영상 생성을 위한 텍스트 프롬프트로, 한국어와 영어를 지원합니다
사용 권장 사항:
- 참조 이미지 속 주체가 영상에서 취하는 동작, 카메라 움직임, 장면 분위기 등을 설명합니다
- 네거티브 요구 사항은 프롬프트에 직접 작성하며(예:
No dialogue,텍스트가 나타나지 않도록), 본 모델은 별도의 네거티브 프롬프트 매개변수를 제공하지 않습니다
"새끼 고양이가 장난스럽게 실뭉치를 툭툭 건드린다"
참조 이미지 배열, 1~6장 지원
지원 형식:
- HTTP/HTTPS 이미지 URL
data:image/...;base64,...형식의 data URL- 순수 base64 이미지 문자열
형식 요구 사항: png, jpeg, webp 지원
1 - 6 elements[
"https://example.com/character.png",
"https://example.com/scene.png"
]영상 길이(초), 기본값 10
값 설명:
- 정수: 범위
3 ~ 10초 auto: 모델이 출력 길이를 자체적으로 결정
과금 설명: 실제 차감 금액은 생성된 영상의 사용량을 기준으로 합니다
3 <= x <= 106
영상 화면 비율, 기본값은 16:9입니다
값 설명:
16:9: 가로 화면9:16: 세로 화면auto: 모델이 화면 비율을 자체적으로 결정
16:9, 9:16, auto "16:9"
작업 완료 후 HTTPS 콜백 주소
콜백 타이밍:
- 작업이 완료(completed), 실패(failed) 또는 취소(cancelled)될 때 트리거됨
- 과금 확인 완료 후 전송
보안 제한:
- HTTPS 프로토콜만 지원
- 내부 IP 주소로의 콜백 금지 (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x 등)
- URL 길이는
2048자를 초과할 수 없음
콜백 메커니즘:
- 타임아웃:
10초 - 실패 시 최대
3회 재시도 (실패 후 각각1초/2초/4초 후 재시도) - 콜백 응답 본문 형식은 작업 조회 API 응답 형식과 동일
- 콜백 주소가 2xx 상태 코드를 반환하면 성공으로 간주, 다른 상태 코드는 재시도를 트리거
"https://your-domain.com/webhooks/video-task-completed"
응답
영상 작업 생성 성공
작업 생성 타임스탬프
1757169743
작업 ID
"task-unified-1757169743-7cvnl5zw"
실제 사용된 모델 이름
"gemini-omni-flash-reference-to-video"
특정 작업 유형
video.generation.task 작업 진행률 (0-100)
0 <= x <= 1000
작업 상태
pending, processing, completed, failed "pending"
비디오 작업 상세 정보
작업 출력 유형
text, image, audio, video "video"
사용량 및 과금 정보