Nano Template Creator Tools Video Dubbing Content Automation Learning & Education DS & AI Engineering AI Strategy

Comment préserver les caractéristiques faciales dans la génération IA : le guide ultime pour des personnages cohérents

27 avril 2026•15 min de lecture•Outils pour créateurs

Le plus grand défi dans la création de personnages IA

Si vous avez déjà essayé de créer des bandes dessinées IA, des storyboards ou des actifs de marque cohérents, vous avez rencontré le mur : générer le même personnage de manière cohérente à travers différentes scènes et angles. C'est le plus grand point de douleur pour les créateurs travaillant avec la génération d'images IA.

Ce qui suit est le véritable manuel. Syntaxe de prompt concrète, les paramètres API que la plupart des guides omettent, et trois grilles de modèles en direct qui prouvent que les techniques fonctionnent à travers neuf scènes par personnage.

Pourquoi la cohérence des personnages échoue (et comment y remédier)

Le problème fondamental

Les modèles IA ne "se souviennent" pas de votre personnage. Chaque génération est une nouvelle interprétation basée sur votre prompt. Sans ancrage précis des caractéristiques faciales, vous obtiendrez des variations qui ressemblent à des cousins, pas à des jumeaux.

⚠️ Tueurs de cohérence courants

Descriptions vagues: "Une femme avec des cheveux bruns" contre "Une femme avec des cheveux châtain clair aux épaules, des yeux noisette chauds et une petite marque de beauté au-dessus de sa lèvre gauche"
Ancrages de caractéristiques manquants: Ne pas spécifier d'identifiants uniques comme des cicatrices, des grains de beauté ou des proportions faciales distinctives
Stylisation incohérente: Changer de coiffure, de maquillage ou d'éclairage entre les générations
Dérive du modèle: Utiliser différents modèles IA ou paramètres pour le même personnage

La solution Nano Banana

Nano Banana maintient un visage lorsque vous lui donnez trois choses : un plan facial précis à l'avance, une graine fixe dans l'appel API, et des poids ciblés sur les caractéristiques qui continuent de dériver. Les quatre sections suivantes couvrent chaque levier.

Le cadre de verrouillage des caractéristiques faciales

Architecture faciale de base

Commencez par une structure fondamentale. C'est le cadre squelettique de votre personnage qui ne change jamais.

Ce modèle établit la structure faciale fondamentale. Incluez la forme du visage, la position des yeux, le pont du nez et les bases de la mâchoire.

Identifiants de caractéristiques uniques

Ce sont des marques distinctives qui rendent votre personnage reconnaissable même en silhouette.

Ajoutez des caractéristiques distinctives comme des marques de beauté, des cicatrices, des taches de rousseur ou des proportions uniques qui rendent votre personnage instantanément reconnaissable.

3. Règles de cohérence des expressions

Définissez comment le visage de votre personnage bouge et exprime des émotions. Cela empêche le problème de "personne différente" lors du changement d'expressions.

Définissez comment des caractéristiques faciales spécifiques se déplacent lors des expressions. Cela garantit que votre personnage ressemble à la même personne qu'il sourit, fronce les sourcils ou est surpris.

Techniques de prompting Nano Banana

La Méthode des Couches

Construisez vos prompts en couches, en commençant par le visage principal et en ajoutant du contexte. Cela garantit que l'IA privilégie la cohérence faciale par rapport aux détails de l'environnement.

Mauvaise Approche

"Une femme dans un café,\nportant une robe rouge,\ns'assoit près de la fenêtre,\nla lumière du matin entrant"

L'environnement domine, le visage est secondaire

Méthode Nano Banana

Sujet : femme de 28 ans, mâchoire carrée marquée, yeux noisette enfoncés, nez aquilin, grain de beauté proéminent sur la pommette gauche, cheveux bruns foncés à la longueur de la clavicule séparés au milieu.
Scène : lumière du matin à travers de grandes fenêtres de café, angle trois-quarts, compression de lentille de 85 mm, regardant hors caméra vers la gauche.

Visage d'abord, environnement ensuite

La Chaîne d'Images de Référence

Utilisez votre meilleure génération comme référence pour la suivante, créant une chaîne de cohérence.

🔗 Processus de Chaîne de Référence

Génération 1 : Créez un portrait de personnage de base avec un maximum de détails
Génération 2 : Utilisez Gen 1 comme référence, ajoutez un nouvel angle/expression
Génération 3 : Utilisez Gen 2 comme référence, changez l'environnement
Continuez : Chaque génération s'appuie sur la cohérence précédente

La Formule d'Adaptation de l'Angle

Différents angles nécessitent différents ajustements de prompt. Voici comment maintenir la cohérence à travers les vues.

Angle	Ajustements Clés	Priorité de Cohérence
Vue de Face	Accent sur la symétrie, alignement des yeux	Distance entre les yeux, centre du nez
Vue de Profil	Pont du nez, courbe de la mâchoire	Projection du menton, crête sourcilière
Vue 3/4	Perspective des yeux, profondeur faciale	Ratio de taille des yeux, volume des joues

Les Mécanismes Derrière le Verrou

La structure du prompt vous amène à 70 % du chemin. Les 30 % restants sont les paramètres du modèle que la plupart des guides de prompt omettent — les choses que vous changez dans l'appel API, pas le prompt. Ces trois leviers sont comment les équipes de production maintiennent réellement un visage à travers un lot de 9 images.

1. Fixez la graine avant d'itérer

Chaque génération commence à partir d'une graine aléatoire. Si vous ne la fixez pas, le modèle relance — même prompt, visage différent. Passez une `seed` explicite dans l'appel API de Gemini (ou définissez-la une fois dans le panneau avancé de Google AI Studio) et la structure osseuse de votre sujet reste verrouillée à travers les tours. Variez le prompt ; gardez la graine constante. C'est le plus grand levier mécanique et presque personne ne le mentionne.

# Gemini API — pin a seed across every face generation
client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=[face_prompt],
    config={"seed": 42, "image_config": {"aspect_ratio": "3:4"}},
)

Une fois qu'une graine vous donne un visage que vous aimez, copiez cet entier dans chaque appel de suivi. Le visage tiendra même si vous changez l'éclairage, la garde-robe et l'angle.

2. Pesez les caractéristiques sur lesquelles le modèle continue de dériver

Nano Banana respecte la syntaxe d'emphase — `(yeux noisette enfoncés:1.3)` indique au modèle de consacrer plus de budget d'attention à cette phrase. Utilisez cela de manière chirurgicale : si la couleur des yeux continue de dériver à travers les régénérations, pesez-la. Si la mâchoire s'adoucit, pesez-la. Ne pesez pas tout ou le prompt s'effondre — choisissez les 2-3 caractéristiques qui échouent le plus souvent et élevez-les à 1.2-1.4.

Sarah, sharp square jawline, (deep-set hazel eyes:1.3), aquiline nose, (mole on left cheekbone:1.2), collarbone-length dark brown hair, three-quarter angle, soft window light.

Les poids supérieurs à 1.5 déforment. Commencez à 1.2, augmentez seulement si la caractéristique dérive encore. Le grain de beauté et la couleur des yeux sont les deux délinquants de dérive les plus courants sur les sujets de portrait.

3. Dites-lui ce qu'il NE FAUT PAS changer

Les négatifs génériques (`mauvaise qualité, mauvaise anatomie`) sont des cultes de cargaison et déplacent à peine l'aiguille. Les négatifs ciblés qui nomment le mode d'échec que vous avez réellement observé sont différents — `pas de mâchoire arrondie` ou `pas d'yeux bleu clair` contrebalancent directement la dérive que vous avez observée se produire dans le dernier lot. Écrivez vos négatifs après avoir vu ce que le modèle se trompe, pas avant.

Negative: no rounded jawline, no light-blue eyes, no symmetric face (right cheekbone mole must remain), no glasses, no aged-up skin.

Un modèle utile : exécutez deux générations, notez ce qui a dérivé, puis ajoutez ces dérives spécifiques à la ligne négative. La troisième génération atterrit généralement.

À quoi ressemble réellement le verrouillage d'identité

Trois grilles de modèles en direct qui maintiennent le même visage à travers neuf scènes — ouvrez-en une, copiez le prompt, changez le sujet. The lifestyle-photo-grid template renders a 9-image grid — the same face across nine scenes — so it's the cleanest live demo of every technique in this post.

Same face across 9 Met Gala red-carpet scenes

Met Gala red-carpet grid

Same subject, 9 poses, identity locked.

Same face across 9 Paris Fashion Week scenes

Paris Fashion Week grid

Wardrobe + setting vary; face holds.

Wedding-day grid

Veil, lighting, angle — features intact.

Open any grid and you can copy the exact template prompt, swap the subject, and ship a 9-image identity-locked set in under five minutes. The four techniques below are what the template bakes in.

Techniques de cohérence avancées

La Méthode de Transfert de Style

Maintenez les caractéristiques faciales tout en changeant les styles artistiques. Parfait pour l'adaptation de marque ou les variations de bande dessinée.

Formule de Transfert de Style

28-year-old woman, sharp square jawline, deep-set hazel eyes, aquiline nose, mole on left cheekbone, collarbone-length dark brown hair parted down the middle, rendered in cel-shaded anime, line art emphasizes the same jaw and nose geometry, hazel eyes kept as one of the two anchor colors, vibrant flat-shaded palette, three-quarter angle.

"Le plan de visage de Sarah, rendu dans un style anime, maintenant sa marque de beauté distinctive et ses yeux noisette, avec un art de ligne propre et des couleurs vives"

Prêt à Construire Votre Cadre de Cohérence ?

Le cadre ci-dessus est ce que vous coderiez si vous écriviez chaque prompt à froid. Chemin plus rapide : copiez un modèle qui l'encode déjà.

The fastest path from this article to a working identity-locked set: open lifestyle-photo-grid, pick the scene closest to yours, copy the template prompt, and substitute your subject blueprint for the one already in there. For style transfer across illustrated formats, the fashion-inspired-gown-design-sheet template ships the angle + lighting scaffold pre-baked; you swap the subject and aesthetic tag.

For browsing more identity-locked references first, the portrait and photorealistic tag pages collect prompts that hold a face well across variations.