Kling O3: 참조 기반 동영상 생성.일관된 캐릭터.
캐릭터 정체성 고정, 네이티브 오디오, 및 멀티샷 스토리보딩으로 영화 같은 클립 생성 — 하나의 통합 멀티모달 모델에서.
전 세계 10만 명 이상의 창작자 및 스튜디오로부터 신뢰받는
Kling O3 실제 동작
참조 이미지와 텍스트 프롬프트로 생성된 캐릭터 일관성 스토리텔링, 고품질 오디오 장면, 및 다중 샷 시퀀스.




Kling O3 — 잠그는 옴니 모델
캐릭터를 제자리에
Kling O3(Video 3.0 Omni)는 Kling 3.0의 참조 기반 확장입니다. 최대 4개의 캐릭터 참조 이미지를 업로드하면, 모델이 비디오 전체에서 일관되게 유지되는 ID 임베딩을 구축합니다. 카메라 변경, 조명 변화, 및 다중 캐릭터 장면에서도 마찬가지입니다.
기존 텍스트-비디오 생성 방식과 달리, O3는 참조 입력물과 텍스트 프롬프트, 오디오 생성, 시각적 사고 과정을 단일 통합 패스로 결합합니다. 제작사는 시리즈 제작, 브랜드 콘텐츠, 그리고 샷 간에도 캐릭터의 모습이 동일하게 유지되어야 하는 모든 워크플로에 이를 활용합니다.
참조-비디오 생성 (Ref2V)
이미지나 동영상 클립을 업로드하여 모든 프레임에서 캐릭터 정체성, 의상, 특징을 고정합니다.
단일 패스 내 native 오디오
대사, 환경음, 음악이 비디오와 동시에 생성됩니다. 별도의 사후 제작 오디오 파이프라인이 필요 없습니다.
시각적 사고 과정
내장된 장면 추론 기능이 샷 간, 액션 간, 환경 간의 논리적 연속성을 보장합니다.
최대 6개 샷/생성
단일 렌더링에서 각 컷마다 별도의 프롬프트, 지속 시간 및 카메라 이동을 설정할 수 있습니다.
Kling O3: 참조 이미지부터
완성된 장면을 몇 분 안에
Kling O3의 통합 멀티모달 엔진을 활용해 캐릭터 일관성과 오디오 동기화된 비디오를 생성하는 세 가지 단계.
참조 업로드 및 구성
1-4개의 캐릭터 참조 이미지 또는 참조 비디오를 업로드하세요. 장면, 카메라 이동, 오디오 의도를 설명하는 텍스트 프롬프트를 추가하세요. O3가 자동으로 아이덴티티 임베딩을 구축합니다.
최적의 캐릭터 고정을 위해 정면 및 측면 프로필 참조 사진을 사용하세요.
오디오와 함께 생성
O3는 단일 패스로 비디오와 동기화된 오디오를 렌더링합니다. 3~15초 길이를 선택하고, 최대 6개의 샷을 선택하며, 대화를 위한 5개 이상의 언어 중에서 선택할 수 있습니다. 최종 렌더링 전에 프레임을 미리 볼 수 있습니다.
최적의 품질을 위해 5~10초 클립으로 시작한 다음 확장하세요.
검토 및 내보내기
원본 오디오로 클립을 재생하세요. 개별 샷을 편집하고, 참조를 교체하거나, 전체 시퀀스를 다시 생성하지 않고 프롬프트를 조정할 수 있습니다. MP4/WebM 형식으로 최대 1080p로 내보내세요.
배치 내보내기를 사용하여 전체 스토리보드 시리즈를 한 번에 렌더링하세요.
Kling O3: V3가 하는 모든 것,
캐릭터 메모리 포함.
Kling O3는 Kling 3.0의 시네마틱 엔진 위에 참조 기반 생성을 추가합니다 — 이를 통해 Omni 모델을 만드는 주요 기능입니다.
캐릭터 정체성 고정
캐릭터당 최대 4개의 참조 이미지를 업로드하세요. O3는 얼굴, 의상 및 특징을 모든 샷과 카메라 앵글에서 유지하는 지속적인 임베딩을 구축합니다 — 심지어 장면에 여러 캐릭터가 있어도.
캐릭터는 결코 변하지 않습니다.
내장형 오디오 생성
대사, 환경 소리 및 배경 음악이 자동 립싱크와 함께 한 번에 생성됩니다. 영어, 중국어, 일본어, 한국어, 스페인어를 지원합니다.
오디오는 내장되어 있습니다.
멀티 샷 스토리보드
최대 6개의 개별 샷을 정의할 수 있습니다, 각각 고유의 프롬프트, 지속 시간 및 카메라 움직임을 가집니다. O3는 모든 컷에서 시각적 일관성을 자동으로 유지합니다.
시퀀스를 연출하세요, 클립만이 아닙니다.
시각적 사고 연쇄
O3의 내장 추론 엔진은 장면 논리가 일관성을 유지하도록 보장합니다. 캐릭터가 자연스럽게 상호작용하고, 물리가 올바르게 동작하며, 샷 간 전환이 시각적으로 의미 있습니다.
모델이 렌더링하기 전에 생각합니다.
정밀한 물리 모션
고급 물리 시뮬레이션은 중력, 균형, 변형, 충돌 및 관성을 처리합니다. 물체와 캐릭터는 실제 세계의 무게와 운동량으로 움직입니다.
실제감 있는 동작
다국어 대화
미국, 영국, 인도 영어 등 악센트 옵션이 포함된 5개 이상의 언어로 음성을 생성하세요. 각자가 다른 언어를 구사하는 다중 캐릭터 장면을 만들어보세요.
글로벌 스토리, 현지 목소리
비디오 요소 참조
정적 이미지 참고 자료를 넘어 — 영상 클립을 업로드하여 움직임 패턴, 연기 스타일, 카메라 무빙을 생성물에 전달하면서 캐릭터 일관성을 유지합니다.
시각 자료는 무엇이든 참고하세요.
유연한 지속 시간 제어
프레임 수준 정밀도로 클립당 3~15초를 생성하세요. 다중 샷 모드와 결합하여 품질을 유지하면서 확장된 시퀀스를 만들 수 있습니다.
3초 후크에서 15초 스토리까지.
제작자들이 선택하는 곳 Kling O3
참고 기반 생성과 캐릭터 일관성이 차별화되는 여섯 가지 워크플로우.
영화 제작자
반복 등장 캐릭터의 시리즈
에피소드 전체에서 주인공 외형을 일관되게 유지하세요. 재촬영 없이 배우, 의상, 배경이 동일한 프리비즈를 생성합니다.
소셜 미디어
브랜드 캐릭터 시리즈
모든 게시물, 릴, 스토리에서 동일하게 유지되는 인지도 높은 마스코트나 인플루언서 아바타를 구축하세요.
광고
다중 변형 광고 캠페인
대변인의 얼굴과 복장은 50개 이상의 변형에서 완벽히 일관되게 유지하고, 배경, 제품, 문안만 바꾸세요.
게임 스튜디오
에셋으로 만든 시네마틱 컷신
인게임 캐릭터 모델과 환경을 참조하여 3D 렌더링 없이 일관된 시네마틱과 트레일러를 생성하세요.
콘텐츠 스튜디오
대규모 에피소드 콘텐츠
고정된 캐릭터와 설정으로 일일 또는 주간 에피소드를 제작할 수 있습니다. O3의 참조 시스템이 연속성 오류를 제거합니다.
교육
일관된 강사 아바타
전체 코스 시리즈에서 모습과 음성이 동일한 AI 강사를 생성하세요. 네이티브 오디오 내레이션을 제공합니다.
창작자들이 선택한 Kling O3
일관성을 위해
“O3의 캐릭터 고정 기능이 우리 워크플로우를 완전히 변경했습니다. 동일한 주인공으로 10부작 시리즈를 제작하며, 렌더링 간 연속성 오류는 더 이상 발생하지 않습니다.”
“네이티브 오디오 생성 기능은 동영상마다 시간을 절약해 줍니다. 입싱크, 앰비언스 사운드, 대화가 모두 한 번의 렌더링으로 완성되어, 이제 포스트 팀은 오디오를 거의 다루지 않습니다.”
“우리는 같은 브랜드 앰버서더를 사용해 하루에 60개의 광고 버전을 운영합니다. O3는 그녀의 얼굴, 의상, 말투를 고정시킨 채 다른 요소들을 모두 바꿀 수 있습니다.”
“렌더링당 6컷의 멀티샷 스토리보딩으로 한 번의 생성으로 전체 장면을 연출할 수 있습니다. 이는 AI 촬영 감독을 두는 것과 거의 같습니다.”
로 생성 시작하기
Kling O3
캐릭터를 고정하고, 자연스러운 음성을 생성하며, 멀티샷 장면을 연출하세요 — 모두 하나의 통합 모델로.
신용카드 불필요. 무료 생성 포함.
전체 정보
Kling O3
Kling O3 (Video 3.0 Omni)는 V3에 Reference-to-Video 기능을 추가했습니다. 캐릭터 이미지나 비디오 클립을 업로드하여 여러 생성에서 정체성을 고정할 수 있습니다. V3는 프롬프트 기반이고, O3는 참조 자료 기반입니다. O3는 또한 더 높은 해상도의 출력을 지원하며 오디오 생성을 최적화했습니다.
캐릭터의 참조 이미지 1~4장을 업로드하세요. O3는 얼굴, 의상, 특징을 모든 샷과 카메라 앵글에서 보존하는 정체성 임베딩을 구축합니다. 이 기능은 동일한 장면에서 여러 캐릭터를 동시에 처리할 수 있습니다.
O3는 생성당 최대 6개의 샷을 지원하며, 각 샷마다 고유한 프롬프트, 지속 시간(3~15초), 카메라 움직임을 설정할 수 있습니다. 모델은 모든 컷 간의 시각적 일관성을 자동으로 유지합니다.
O3는 영어, 중국어, 일본어, 한국어, 스페인어로 음성을 생성하며, 액센트 옵션으로 미국식, 영국식, 인도식 영어가 포함됩니다. 다중 캐릭터 대화 장면에서는 각 캐릭터마다 다른 언어를 사용할 수 있습니다.
네. O3는 V3와 동일한 기본 API 구조를 공유합니다 — 모델 ID만 변경하면 됩니다. 추가적인 선택적 매개변수를 통해 참조 이미지와 동영상 클립을 전달할 수 있습니다. 공식 Kling API 및 타사 제공업체를 통해 이용 가능합니다.
표준 모드에서는 720p로, 프로 모드에서는 1080p로 출력됩니다. 한 번 생성 시 재생 시간은 3초에서 15초입니다. 최적 품질은 5-10초 사이입니다.
O3는 오디오와 비디오를 한 번에 통합 생성하여, 후처리 방식보다 립싱크가 더 정확합니다. 대부분의 경우에서 결과가 좋으며, 업데이트할 때마다 꾸준히 개선되고 있습니다.
네. 모든 플랜에는 생성된 콘텐츠에 대한 상업적 라이선스가 포함됩니다. 구체적인 사용 한도와 우선 지원 옵션은 귀하의 작업 공간 티어를 확인하세요.
아직 질문이 있으신가요? 팀에 문의하기