Référence de personnage

Audio natif

Multi-plans (6 coupes)

Synchro labiale

Sortie 4K

Raisonnement visuel

Kling O3

Kling O3 : génération vidéo basée sur des références.Personnages cohérents.

Générez des clips cinématographiques avec le verrouillage d'identité des personnages, un audio natif et un storyboarding multi-plans — le tout à partir d'un seul modèle multimodal unifié.

Essayez Kling O3 gratuitement

Approuvé par plus de 100 000 créateurs et studios à travers le monde

Ref2VGénération vidéo à partir de références

6Séquences par génération

♪Audio et synchronisation labiale intégrés

5+Langues supportées

Vitrine

Kling O3 en action

Récits avec personnages cohérents, scènes audio natives et séquences multi-plans générées à partir d'images de référence et de prompts textuels.

Qu'est-ce que Kling O3 ?

Kling O3 — le modèle Omni qui verrouille

vos personnages en place.

Kling O3 (Video 3.0 Omni) est l'extension de Kling 3.0 basée sur des références. Téléchargez jusqu'à 4 images de référence de personnages, et le modèle crée un embedding d'identité qui perdure dans toute votre vidéo, même lors de changements de caméra, de variations d'éclairage et de scènes avec plusieurs personnages.

Contrairement à la génération vidéo standard à partir de texte, O3 fusionne les références visuelles avec les prompts textuels, la génération audio et le raisonnement visuel en une seule passe unifiée. Les studios l'utilisent pour la production de séries, le contenu de marque et tout flux où les personnages doivent conserver une apparence identique d'un plan à l'autre.

Reference-to-Video (Ref2V)

Téléchargez des images ou des clips vidéo pour ancrer l'identité du personnage, ses vêtements et ses traits distinctifs sur chaque plan.

Native audio in one pass

Dialogues, ambiance sonore et musique générés simultanément avec la vidéo — aucun pipeline audio en post-production.

Visual chain-of-thought

Le raisonnement scénique intégré garantit une continuité logique entre les plans, les actions et les environnements.

Jusqu'à 6 plans par génération

Définissez des prompts, durées et mouvements de caméra distincts pour chaque plan dans un seul rendu.

Comment ça marche

Kling O3 : des images de référence à

des scènes finales en quelques minutes.

Trois étapes pour générer une vidéo cohérente au niveau des personnages et synchronisée audio grâce au moteur multimodal unifié de Kling O3.

Importer des références et composer

Déposez 1 à 4 images de référence des personnages ou une vidéo de référence. Ajoutez votre prompt textuel décrivant la scène, le mouvement de caméra et l'intention audio. O3 génère automatiquement des embeddings d'identité.

Utilisez des photos de référence de face et de profil pour un verrouillage optimal des personnages.

Générer avec audio

O3 rend la vidéo et l'audio synchronisé en une seule passe. Choisissez une durée de 3 à 15 secondes, sélectionnez jusqu'à 6 plans, et choisissez parmi plus de 5 langues pour le dialogue. Prévisualisez les images avant le rendu final.

Commencez avec des clips de 5 à 10 secondes pour une qualité optimale, puis prolongez.

Réviser et exporter

Lisez votre clip avec l'audio natif. Modifiez des plans individuels, échangez des références, ou ajustez les prompts sans régénérer toute la séquence. Exportez en MP4/WebM jusqu'à 1080p.

Utilisez l'export par lots pour rendre une série complète de storyboard en une fois.

Fonctionnalités

Kling O3 : tout ce que V3 fait,

plus la mémoire de personnage.

Kling O3 ajoute la génération basée sur des références au moteur cinématique de Kling 3.0 — les fonctionnalités clés qui en font le modèle Omni.

Verrouillage de l'identité des personnages

Chargez jusqu'à 4 images de référence par personnage. O3 génère des embeddings persistants qui préservent le visage, les vêtements et les caractéristiques sur tous les plans et angles de caméra, même avec plusieurs personnages en scène.

Vos personnages ne dérivent jamais.

Génération audio native

Dialogue, ambiances sonores et musique de fond générés en une seule passe avec synchronisation labiale automatique. Compatible avec l'anglais, le chinois, le japonais, le coréen et l'espagnol.

L'audio est conçu de base, pas ajouté en表面的后.

Storyboard multi-plans

Définissez jusqu'à 6 plans individuels, chacun avec son propre prompt, sa durée et son mouvement de caméra. O3 maintient automatiquement la cohérence visuelle sur toutes les prises.

Réalisez une séquence, pas seulement un clip.

Raisonnement visuel par étapes

Le moteur de raisonnement intégré d'O3 garantit que la logique des scènes reste cohérente — les personnages interagissent naturellement, la physique se comporte correctement et les transitions entre les plans ont un sens visuel.

Le modèle réfléchit avant de générer.

Mouvement fidèle à la physique

Une simulation physique avancée gère la gravité, l'équilibre, la déformation, les collisions et l'inertie. Les objets et les personnages se déplacent avec le poids et la quantité de mouvement réels.

Un mouvement qui paraît réel.

Dialogue multilingue

Générez de la parole en plus de 5 langues avec des options d'accent incluant l'anglais américain, britannique et indien. Créez des scènes avec plusieurs personnages où chacun parle une langue différente.

Des histoires globales, des voix natives.

Référencement des éléments vidéo

Au-delà des références d'images statiques — importez des séquences vidéo pour transférer des schémas de mouvement, des styles d'interprétation ou des mouvements de caméra dans votre génération, tout en maintenant la cohérence du personnage.

Référencez tout contenu visuel.

Contrôle flexible de la durée

Générez de 3 à 15 secondes par clip avec une précision image par image. Combinez avec le mode multi-shot pour des séquences étendues qui maintiennent la qualité tout au long.

Des accroches de 3s aux récits de 15s.

Cas d'utilisation

Là où les créateurs choisissent Kling O3

Six workflows où la génération pilotée par référence et la cohérence des personnages font la différence.

Réalisateurs

Des séries avec des personnages récurrents

Verrouillez l'apparence du protagoniste sur tous les épisodes. Générez des prévisualisations avec des acteurs, costumes et décors constants, sans besoin de retourner des scènes.

Médias sociaux

Série de personnages de marque

Créez une mascotte ou un avatar d'influenceur reconnaissable qui reste identique sur chaque publication, reel et story.

Campagnes publicitaires multi-variantes

Échangez les arrière-plans, produits et textes tout en conservant le visage et la tenue du porte-parole parfaitement constants sur plus de 50 variantes.

Studios de jeux

Cinématiques issues des ressources du jeu

Référencez les modèles de personnages et environnements du jeu pour générer des cinématiques et bandes-annonces cohérentes sans rendu 3D.

Studios de contenu

Contenu épisodique à grande échelle

Produisez des épisodes quotidiens ou hebdomadaires avec des personnages et des décors verrouillés. Le système de référence d'O3 élimine les erreurs de continuité.

Éducation

Avatars d'instructeurs cohérents

Créez un instructeur IA qui conserve la même apparence et la même voix dans toute une série de cours, avec une narration audio native.

Témoignages

Les créateurs choisissent Kling O3

pour la cohérence.

“Le verrouillage des personnages d'O3 a complètement transformé notre flux de travail. Nous produisons une série de 10 épisodes avec le même protagoniste — finis les cauchemars de continuité entre les rendus.”

David Park

Directeur d'animation, Storyforge Studios

“La génération audio native nous fait gagner des heures par vidéo. Le lip-sync, le son ambiant et les dialogues sortent d'un même rendu — notre équipe post-production touche à peine à l'audio maintenant.”

Nina Vasquez

Responsable de la production, SonicWave Media

“Nous générons 60 variantes de publicité par jour avec la même ambassadrice. O3 verrouille son visage, sa tenue et ses mimiques pendant que nous changeons tous les autres éléments.”

Tom Khalil

Responsable de la performance, Catalyst Agency

“Le storyboard multi-séquence avec 6 plans par rendu signifie que je peux diriger une scène entière en une seule génération. C'est l'équivalent le plus proche d'avoir un cinéaste IA.”

Rina Oshima

Cinéaste indépendant & YouTuber

Commencez à créer avec

Kling O3

Verrouillez vos personnages, générez de l'audio natif et mettez en scène des plans multiples — le tout à partir d'un seul modèle unifié.

Aucune carte de crédit nécessaire. Générations gratuites incluses.

Essayez Kling O3 gratuitement Découvrez nos tarifs

Plus de 100 000 créateurs utilisent Kling·Note moyenne des créateurs : 4,9/5·Usage commercial inclus·Support mondial et accès à l'API

FAQ

Tout savoir sur

Kling O3

Kling O3 (Video 3.0 Omni) améliore V3 en ajoutant la fonction Référence vidéo : vous pouvez téléverser des images de personnage ou des extraits vidéo pour figer l'identité sur plusieurs générations. V3 est basé sur des prompts ; O3 est basé sur des références. O3 prend également en charge une résolution de sortie supérieure et bénéficie d'une génération audio optimisée.

Téléversez 1 à 4 images de référence d'un personnage. O3 crée un embedding d'identité qui préserve le visage, les vêtements et les caractéristiques sur tous les plans et angles de caméra. Cela fonctionne simultanément avec plusieurs personnages dans la même scène.

O3 prend en charge jusqu'à 6 plans par génération, chacun avec son propre prompt, sa durée (3 à 15 secondes) et son mouvement de caméra. Le modèle maintient automatiquement la cohérence visuelle entre toutes les coupes.

O3 génère de la parole en anglais, chinois, japonais, coréen et espagnol, avec des options d'accents incluant l'anglais américain, britannique et indien. Les scènes de dialogue à plusieurs personnages peuvent avoir des langues différentes par personnage.

Oui. O3 partage la même structure d'API de base que V3 — il suffit de changer l'identifiant du modèle. Des paramètres optionnels supplémentaires vous permettent de passer des images de référence et des clips vidéo. Disponible via l'API officielle Kling et des fournisseurs tiers.

Le mode Standard sort en 720p, le mode Pro en 1080p. La durée va de 3 à 15 secondes par génération. La qualité optimale est dans la plage de 5–10 secondes.

O3 génère l'audio et la vidéo en une seule passe unifiée, ce qui permet une synchronisation labiale plus précise que les approches post-traitées. Les résultats sont excellents pour la plupart des cas d'utilisation, avec des améliorations continues à chaque mise à jour.

Oui. Les forfaits incluent une licence commerciale pour le contenu généré. Vérifiez le niveau de votre espace de travail pour les limites d'utilisation spécifiques et les options de support prioritaire.

Vous avez encore des questions ? Contactez notre équipe