Kling O3 : génération vidéo basée sur des références.Personnages cohérents.
Générez des clips cinématographiques avec le verrouillage d'identité des personnages, un audio natif et un storyboarding multi-plans — le tout à partir d'un seul modèle multimodal unifié.
Approuvé par plus de 100 000 créateurs et studios à travers le monde
Kling O3 en action
Récits avec personnages cohérents, scènes audio natives et séquences multi-plans générées à partir d'images de référence et de prompts textuels.




Kling O3 — le modèle Omni qui verrouille
vos personnages en place.
Kling O3 (Video 3.0 Omni) est l'extension de Kling 3.0 basée sur des références. Téléchargez jusqu'à 4 images de référence de personnages, et le modèle crée un embedding d'identité qui perdure dans toute votre vidéo, même lors de changements de caméra, de variations d'éclairage et de scènes avec plusieurs personnages.
Contrairement à la génération vidéo standard à partir de texte, O3 fusionne les références visuelles avec les prompts textuels, la génération audio et le raisonnement visuel en une seule passe unifiée. Les studios l'utilisent pour la production de séries, le contenu de marque et tout flux où les personnages doivent conserver une apparence identique d'un plan à l'autre.
Reference-to-Video (Ref2V)
Téléchargez des images ou des clips vidéo pour ancrer l'identité du personnage, ses vêtements et ses traits distinctifs sur chaque plan.
Native audio in one pass
Dialogues, ambiance sonore et musique générés simultanément avec la vidéo — aucun pipeline audio en post-production.
Visual chain-of-thought
Le raisonnement scénique intégré garantit une continuité logique entre les plans, les actions et les environnements.
Jusqu'à 6 plans par génération
Définissez des prompts, durées et mouvements de caméra distincts pour chaque plan dans un seul rendu.
Kling O3 : des images de référence à
des scènes finales en quelques minutes.
Trois étapes pour générer une vidéo cohérente au niveau des personnages et synchronisée audio grâce au moteur multimodal unifié de Kling O3.
Importer des références et composer
Déposez 1 à 4 images de référence des personnages ou une vidéo de référence. Ajoutez votre prompt textuel décrivant la scène, le mouvement de caméra et l'intention audio. O3 génère automatiquement des embeddings d'identité.
Utilisez des photos de référence de face et de profil pour un verrouillage optimal des personnages.
Générer avec audio
O3 rend la vidéo et l'audio synchronisé en une seule passe. Choisissez une durée de 3 à 15 secondes, sélectionnez jusqu'à 6 plans, et choisissez parmi plus de 5 langues pour le dialogue. Prévisualisez les images avant le rendu final.
Commencez avec des clips de 5 à 10 secondes pour une qualité optimale, puis prolongez.
Réviser et exporter
Lisez votre clip avec l'audio natif. Modifiez des plans individuels, échangez des références, ou ajustez les prompts sans régénérer toute la séquence. Exportez en MP4/WebM jusqu'à 1080p.
Utilisez l'export par lots pour rendre une série complète de storyboard en une fois.
Kling O3 : tout ce que V3 fait,
plus la mémoire de personnage.
Kling O3 ajoute la génération basée sur des références au moteur cinématique de Kling 3.0 — les fonctionnalités clés qui en font le modèle Omni.
Verrouillage de l'identité des personnages
Chargez jusqu'à 4 images de référence par personnage. O3 génère des embeddings persistants qui préservent le visage, les vêtements et les caractéristiques sur tous les plans et angles de caméra, même avec plusieurs personnages en scène.
Vos personnages ne dérivent jamais.
Génération audio native
Dialogue, ambiances sonores et musique de fond générés en une seule passe avec synchronisation labiale automatique. Compatible avec l'anglais, le chinois, le japonais, le coréen et l'espagnol.
L'audio est conçu de base, pas ajouté en表面的后.
Storyboard multi-plans
Définissez jusqu'à 6 plans individuels, chacun avec son propre prompt, sa durée et son mouvement de caméra. O3 maintient automatiquement la cohérence visuelle sur toutes les prises.
Réalisez une séquence, pas seulement un clip.
Raisonnement visuel par étapes
Le moteur de raisonnement intégré d'O3 garantit que la logique des scènes reste cohérente — les personnages interagissent naturellement, la physique se comporte correctement et les transitions entre les plans ont un sens visuel.
Le modèle réfléchit avant de générer.
Mouvement fidèle à la physique
Une simulation physique avancée gère la gravité, l'équilibre, la déformation, les collisions et l'inertie. Les objets et les personnages se déplacent avec le poids et la quantité de mouvement réels.
Un mouvement qui paraît réel.
Dialogue multilingue
Générez de la parole en plus de 5 langues avec des options d'accent incluant l'anglais américain, britannique et indien. Créez des scènes avec plusieurs personnages où chacun parle une langue différente.
Des histoires globales, des voix natives.
Référencement des éléments vidéo
Au-delà des références d'images statiques — importez des séquences vidéo pour transférer des schémas de mouvement, des styles d'interprétation ou des mouvements de caméra dans votre génération, tout en maintenant la cohérence du personnage.
Référencez tout contenu visuel.
Contrôle flexible de la durée
Générez de 3 à 15 secondes par clip avec une précision image par image. Combinez avec le mode multi-shot pour des séquences étendues qui maintiennent la qualité tout au long.
Des accroches de 3s aux récits de 15s.
Là où les créateurs choisissent Kling O3
Six workflows où la génération pilotée par référence et la cohérence des personnages font la différence.
Réalisateurs
Des séries avec des personnages récurrents
Verrouillez l'apparence du protagoniste sur tous les épisodes. Générez des prévisualisations avec des acteurs, costumes et décors constants, sans besoin de retourner des scènes.
Médias sociaux
Série de personnages de marque
Créez une mascotte ou un avatar d'influenceur reconnaissable qui reste identique sur chaque publication, reel et story.
Publicité
Campagnes publicitaires multi-variantes
Échangez les arrière-plans, produits et textes tout en conservant le visage et la tenue du porte-parole parfaitement constants sur plus de 50 variantes.
Studios de jeux
Cinématiques issues des ressources du jeu
Référencez les modèles de personnages et environnements du jeu pour générer des cinématiques et bandes-annonces cohérentes sans rendu 3D.
Studios de contenu
Contenu épisodique à grande échelle
Produisez des épisodes quotidiens ou hebdomadaires avec des personnages et des décors verrouillés. Le système de référence d'O3 élimine les erreurs de continuité.
Éducation
Avatars d'instructeurs cohérents
Créez un instructeur IA qui conserve la même apparence et la même voix dans toute une série de cours, avec une narration audio native.
Les créateurs choisissent Kling O3
pour la cohérence.
“Le verrouillage des personnages d'O3 a complètement transformé notre flux de travail. Nous produisons une série de 10 épisodes avec le même protagoniste — finis les cauchemars de continuité entre les rendus.”
“La génération audio native nous fait gagner des heures par vidéo. Le lip-sync, le son ambiant et les dialogues sortent d'un même rendu — notre équipe post-production touche à peine à l'audio maintenant.”
“Nous générons 60 variantes de publicité par jour avec la même ambassadrice. O3 verrouille son visage, sa tenue et ses mimiques pendant que nous changeons tous les autres éléments.”
“Le storyboard multi-séquence avec 6 plans par rendu signifie que je peux diriger une scène entière en une seule génération. C'est l'équivalent le plus proche d'avoir un cinéaste IA.”
Commencez à créer avec
Kling O3
Verrouillez vos personnages, générez de l'audio natif et mettez en scène des plans multiples — le tout à partir d'un seul modèle unifié.
Aucune carte de crédit nécessaire. Générations gratuites incluses.
Tout savoir sur
Kling O3
Kling O3 (Video 3.0 Omni) améliore V3 en ajoutant la fonction Référence vidéo : vous pouvez téléverser des images de personnage ou des extraits vidéo pour figer l'identité sur plusieurs générations. V3 est basé sur des prompts ; O3 est basé sur des références. O3 prend également en charge une résolution de sortie supérieure et bénéficie d'une génération audio optimisée.
Téléversez 1 à 4 images de référence d'un personnage. O3 crée un embedding d'identité qui préserve le visage, les vêtements et les caractéristiques sur tous les plans et angles de caméra. Cela fonctionne simultanément avec plusieurs personnages dans la même scène.
O3 prend en charge jusqu'à 6 plans par génération, chacun avec son propre prompt, sa durée (3 à 15 secondes) et son mouvement de caméra. Le modèle maintient automatiquement la cohérence visuelle entre toutes les coupes.
O3 génère de la parole en anglais, chinois, japonais, coréen et espagnol, avec des options d'accents incluant l'anglais américain, britannique et indien. Les scènes de dialogue à plusieurs personnages peuvent avoir des langues différentes par personnage.
Oui. O3 partage la même structure d'API de base que V3 — il suffit de changer l'identifiant du modèle. Des paramètres optionnels supplémentaires vous permettent de passer des images de référence et des clips vidéo. Disponible via l'API officielle Kling et des fournisseurs tiers.
Le mode Standard sort en 720p, le mode Pro en 1080p. La durée va de 3 à 15 secondes par génération. La qualité optimale est dans la plage de 5–10 secondes.
O3 génère l'audio et la vidéo en une seule passe unifiée, ce qui permet une synchronisation labiale plus précise que les approches post-traitées. Les résultats sont excellents pour la plupart des cas d'utilisation, avec des améliorations continues à chaque mise à jour.
Oui. Les forfaits incluent une licence commerciale pour le contenu généré. Vérifiez le niveau de votre espace de travail pour les limites d'utilisation spécifiques et les options de support prioritaire.
Vous avez encore des questions ? Contactez notre équipe