Comment préserver les caractéristiques faciales dans la génération IA : le guide ultime pour des personnages cohérents

Le plus grand défi dans la création de personnages IA
Si vous avez déjà essayé de créer des bandes dessinées IA, des storyboards ou des actifs de marque cohérents, vous avez rencontré le mur : générer le même personnage de manière cohérente à travers différentes scènes et angles. C'est le plus grand point de douleur pour les créateurs travaillant avec la génération d'images IA.
Ce qui suit est le véritable manuel. Syntaxe de prompt concrète, les paramètres API que la plupart des guides omettent, et trois grilles de modèles en direct qui prouvent que les techniques fonctionnent à travers neuf scènes par personnage.
Pourquoi la cohérence des personnages échoue (et comment y remédier)
Le problème fondamental
Les modèles IA ne "se souviennent" pas de votre personnage. Chaque génération est une nouvelle interprétation basée sur votre prompt. Sans ancrage précis des caractéristiques faciales, vous obtiendrez des variations qui ressemblent à des cousins, pas à des jumeaux.
⚠️ Tueurs de cohérence courants
- Descriptions vagues: "Une femme avec des cheveux bruns" contre "Une femme avec des cheveux châtain clair aux épaules, des yeux noisette chauds et une petite marque de beauté au-dessus de sa lèvre gauche"
- Ancrages de caractéristiques manquants: Ne pas spécifier d'identifiants uniques comme des cicatrices, des grains de beauté ou des proportions faciales distinctives
- Stylisation incohérente: Changer de coiffure, de maquillage ou d'éclairage entre les générations
- Dérive du modèle: Utiliser différents modèles IA ou paramètres pour le même personnage
La solution Nano Banana
Nano Banana maintient un visage lorsque vous lui donnez trois choses : un plan facial précis à l'avance, une graine fixe dans l'appel API, et des poids ciblés sur les caractéristiques qui continuent de dériver. Les quatre sections suivantes couvrent chaque levier.
Le cadre de verrouillage des caractéristiques faciales
Architecture faciale de base
Commencez par une structure fondamentale. C'est le cadre squelettique de votre personnage qui ne change jamais.
Ce modèle établit la structure faciale fondamentale. Incluez la forme du visage, la position des yeux, le pont du nez et les bases de la mâchoire.
Identifiants de caractéristiques uniques
Ce sont des marques distinctives qui rendent votre personnage reconnaissable même en silhouette.
Ajoutez des caractéristiques distinctives comme des marques de beauté, des cicatrices, des taches de rousseur ou des proportions uniques qui rendent votre personnage instantanément reconnaissable.
3. Règles de cohérence des expressions
Définissez comment le visage de votre personnage bouge et exprime des émotions. Cela empêche le problème de "personne différente" lors du changement d'expressions.
Définissez comment des caractéristiques faciales spécifiques se déplacent lors des expressions. Cela garantit que votre personnage ressemble à la même personne qu'il sourit, fronce les sourcils ou est surpris.
Techniques de prompting Nano Banana
La Méthode des Couches
Construisez vos prompts en couches, en commençant par le visage principal et en ajoutant du contexte. Cela garantit que l'IA privilégie la cohérence faciale par rapport aux détails de l'environnement.
Mauvaise Approche
"Une femme dans un café,\nportant une robe rouge,\ns'assoit près de la fenêtre,\nla lumière du matin entrant"
L'environnement domine, le visage est secondaire
Méthode Nano Banana
Sujet : femme de 28 ans, mâchoire carrée marquée, yeux noisette enfoncés, nez aquilin, grain de beauté proéminent sur la pommette gauche, cheveux bruns foncés à la longueur de la clavicule séparés au milieu. Scène : lumière du matin à travers de grandes fenêtres de café, angle trois-quarts, compression de lentille de 85 mm, regardant hors caméra vers la gauche.
Visage d'abord, environnement ensuite
La Chaîne d'Images de Référence
Utilisez votre meilleure génération comme référence pour la suivante, créant une chaîne de cohérence.
🔗 Processus de Chaîne de Référence
- Génération 1 : Créez un portrait de personnage de base avec un maximum de détails
- Génération 2 : Utilisez Gen 1 comme référence, ajoutez un nouvel angle/expression
- Génération 3 : Utilisez Gen 2 comme référence, changez l'environnement
- Continuez : Chaque génération s'appuie sur la cohérence précédente
La Formule d'Adaptation de l'Angle
Différents angles nécessitent différents ajustements de prompt. Voici comment maintenir la cohérence à travers les vues.
| Angle | Ajustements Clés | Priorité de Cohérence |
|---|---|---|
| Vue de Face | Accent sur la symétrie, alignement des yeux | Distance entre les yeux, centre du nez |
| Vue de Profil | Pont du nez, courbe de la mâchoire | Projection du menton, crête sourcilière |
| Vue 3/4 | Perspective des yeux, profondeur faciale | Ratio de taille des yeux, volume des joues |
Les Mécanismes Derrière le Verrou
La structure du prompt vous amène à 70 % du chemin. Les 30 % restants sont les paramètres du modèle que la plupart des guides de prompt omettent — les choses que vous changez dans l'appel API, pas le prompt. Ces trois leviers sont comment les équipes de production maintiennent réellement un visage à travers un lot de 9 images.
1. Fixez la graine avant d'itérer
Chaque génération commence à partir d'une graine aléatoire. Si vous ne la fixez pas, le modèle relance — même prompt, visage différent. Passez une `seed` explicite dans l'appel API de Gemini (ou définissez-la une fois dans le panneau avancé de Google AI Studio) et la structure osseuse de votre sujet reste verrouillée à travers les tours. Variez le prompt ; gardez la graine constante. C'est le plus grand levier mécanique et presque personne ne le mentionne.
# Gemini API — pin a seed across every face generation
client.models.generate_content(
model="gemini-3-pro-image-preview",
contents=[face_prompt],
config={"seed": 42, "image_config": {"aspect_ratio": "3:4"}},
)Une fois qu'une graine vous donne un visage que vous aimez, copiez cet entier dans chaque appel de suivi. Le visage tiendra même si vous changez l'éclairage, la garde-robe et l'angle.
2. Pesez les caractéristiques sur lesquelles le modèle continue de dériver
Nano Banana respecte la syntaxe d'emphase — `(yeux noisette enfoncés:1.3)` indique au modèle de consacrer plus de budget d'attention à cette phrase. Utilisez cela de manière chirurgicale : si la couleur des yeux continue de dériver à travers les régénérations, pesez-la. Si la mâchoire s'adoucit, pesez-la. Ne pesez pas tout ou le prompt s'effondre — choisissez les 2-3 caractéristiques qui échouent le plus souvent et élevez-les à 1.2-1.4.
Sarah, sharp square jawline, (deep-set hazel eyes:1.3), aquiline nose, (mole on left cheekbone:1.2), collarbone-length dark brown hair, three-quarter angle, soft window light.
Les poids supérieurs à 1.5 déforment. Commencez à 1.2, augmentez seulement si la caractéristique dérive encore. Le grain de beauté et la couleur des yeux sont les deux délinquants de dérive les plus courants sur les sujets de portrait.
3. Dites-lui ce qu'il NE FAUT PAS changer
Les négatifs génériques (`mauvaise qualité, mauvaise anatomie`) sont des cultes de cargaison et déplacent à peine l'aiguille. Les négatifs ciblés qui nomment le mode d'échec que vous avez réellement observé sont différents — `pas de mâchoire arrondie` ou `pas d'yeux bleu clair` contrebalancent directement la dérive que vous avez observée se produire dans le dernier lot. Écrivez vos négatifs après avoir vu ce que le modèle se trompe, pas avant.
Negative: no rounded jawline, no light-blue eyes, no symmetric face (right cheekbone mole must remain), no glasses, no aged-up skin.
Un modèle utile : exécutez deux générations, notez ce qui a dérivé, puis ajoutez ces dérives spécifiques à la ligne négative. La troisième génération atterrit généralement.
À quoi ressemble réellement le verrouillage d'identité
Trois grilles de modèles en direct qui maintiennent le même visage à travers neuf scènes — ouvrez-en une, copiez le prompt, changez le sujet. The lifestyle-photo-grid template renders a 9-image grid — the same face across nine scenes — so it's the cleanest live demo of every technique in this post.



Open any grid and you can copy the exact template prompt, swap the subject, and ship a 9-image identity-locked set in under five minutes. The four techniques below are what the template bakes in.
Techniques de cohérence avancées
La Méthode de Transfert de Style
Maintenez les caractéristiques faciales tout en changeant les styles artistiques. Parfait pour l'adaptation de marque ou les variations de bande dessinée.
Formule de Transfert de Style
28-year-old woman, sharp square jawline, deep-set hazel eyes, aquiline nose, mole on left cheekbone, collarbone-length dark brown hair parted down the middle, rendered in cel-shaded anime, line art emphasizes the same jaw and nose geometry, hazel eyes kept as one of the two anchor colors, vibrant flat-shaded palette, three-quarter angle.
"Le plan de visage de Sarah, rendu dans un style anime, maintenant sa marque de beauté distinctive et ses yeux noisette, avec un art de ligne propre et des couleurs vives"
Prêt à Construire Votre Cadre de Cohérence ?
Le cadre ci-dessus est ce que vous coderiez si vous écriviez chaque prompt à froid. Chemin plus rapide : copiez un modèle qui l'encode déjà.
The fastest path from this article to a working identity-locked set: open lifestyle-photo-grid, pick the scene closest to yours, copy the template prompt, and substitute your subject blueprint for the one already in there. For style transfer across illustrated formats, the fashion-inspired-gown-design-sheet template ships the angle + lighting scaffold pre-baked; you swap the subject and aesthetic tag.
For browsing more identity-locked references first, the portrait and photorealistic tag pages collect prompts that hold a face well across variations.

