Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Formation Débutant Midjourney

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 53

Les bases de Midjourney : formation

La première chose que vous devriez faire lorsque vous commencez sur Midjourney est de créer votre
salon privé pour pouvoir travailler tranquillement sans voir vos créations noyées par celles des autres.
Voici l’une de mes vidéos qui expliquent pas à pas comment faire en 2 minutes chrono :

https://www.youtube.com/watch?v=TacKrswCd6w

Créez ensuite votre premier prompt en utilisant la commande /imagine suivi de la description de
l'image que vous souhaitez obtenir. Un prompt est le terme utilisé pour désigner la description que
vous allez renseigner sur Midjourney pour obtenir un résultat. Exemple de prompt : « /imagine a
flower ». Je demande à Midjourney de me créer une fleur.
Voici un schéma pour mieux comprendre l'ordre des résultats obtenus dans la grille de quatre :

U + chiffre = "upscale" ou "mise à l'échelle". Cette action permet d'agrandir l'une des images obtenues
en la détaillant encore plus. Vous obtiendrez l'une des quatre images sélectionnées de façon
individuelle et avec un niveau de détails encore plus élevés que sur la grille initiale.

Upscale de la deuxième image de la grille vue précédemment


V + chiffre = "variation". Vous obtiendrez une nouvelle grille de quatre images plus ou moins similaires
à l'image de référence que vous aurez choisie. En cliquant sur "V1", vous obtiendrez quatre nouvelles
images assez similaires à la première image de la grille initiale. Certains détails seront un peu différents,
ce qui peut faire la différence dans certains cas.

Variation de la première image de la grille vue précédemment

Emoji des deux flèches bleues = "reroll". Ce bouton va relancer une génération d'image. Vous
obtiendrez quatre nouvelles images avec le même prompt ("a flower" dans notre exemple)
Vous pouvez ensuite enregistrer vos images en cliquant dessus, puis clic droit "enregistrer l'image
sous"

Chaque action consomme du temps (GPU time = Graphics processing unit). Les différents forfaits
proposés par Midjourney octroient un certain nombre de minutes ou heures. Toutes les actions ne
demandent pas le même "temps de bot" ou "GPU time".

La fonction "max upscale" n'est pas disponible avec la version 4

J’ai réalisé une vidéo sur ma chaîne pour vous expliquer comment économiser votre temps de bot et
ainsi pouvoir générer plus d’images :

https://www.youtube.com/watch?v=QBQJHvoQzgU
Respectez certaines règles élémentaires pour ne pas voir votre compte banni :

 N'essayez pas de créer des images violentes / gore (cannibalisme, sang, corps démembré,
meurtre etc.)
 Pas d'images NSFW (organes sexuelles, scènes X, personnes dans la douche, gros plan sur
parties intimes etc.) Bon OK j’ai essayé dans cette vidéo…
 Pas d'images offensantes (racisme, homophobie, p***philie etc.)

Certains mots-clés sont bannis pour éviter la créations d'images qui sortent du cadre. N'insistez pas
pour ne pas risquer de perdre votre compte. Certains mots comme "69" ou l'emoji pêche sont bannis,
même si ça pourrait être utilisé dans un contexte normal. Disons que Midjourney ne prend pas de
risques...

Les prompts
La structure de vos prompts peut s'articuler de plusieurs manières :

 Un texte seul
 Un ou plusieurs emojis
 Un texte + un ou des emojis
 Deux images
 Une image seule + du texte ou un paramètre
 Du texte et un ou des paramètres
 Une ou plusieurs images + du texte + un ou des paramètres

Et beaucoup d'autres combinaisons du type "image + emoji + texte + paramètre" etc.

Voici quelques séparateurs que vous pouvez utiliser pour structurer vos prompts :

 Virgule
 Deux double points "::"
 Des crochets []
 Des traits d'union

Généralement nous utilisons des virgules et les "::"


Les prompts les plus longs ne sont pas ceux forcément ceux qui donnent les meilleurs résultats. Plus
vous ajoutez d'informations dans vos prompts, plus vous risquez de rendre confus l'IA. Restez
concentrez sur les éléments les plus importants de votre prompt. Exemple :

/imagine portrait of a native american, older person, wearing an indian hat with feathers, white
beard, brown clothes and red necklace, brown eyes, ultra realistic photo, HD, the face is lit, brown
background --uplight --c 10 --style 4b --no weapon --ar 3:2

/imagine portrait of a Native American, Nikon D750, 35mm Lens --ar 3:2

Le second prompt est bien plus court, pourtant je préfère nettement la deuxième image ! J’ai créé
une vidéo sur « comment obtenir des images ultra réalistes » si ça vous intéresse.
Vous pouvez utiliser des prompts négatifs pour enlever certains éléments d'une image ou prévenir
une image d'avoir certains éléments indésirables. Exemple :

/imagine a fishing harbour

Comme nous pouvions nous y attendre, il y a des oiseaux sur certaines images (en bas notamment).
Si vous voulez une image sans oiseaux, vous pouvez ajouter la commande « --no bird » à la fin de
votre prompt. Voici une vidéo dédiée aux prompts négatifs :
https://www.youtube.com/watch?v=g67tW-TfyJA

Voyons le résultat lorsque l’on recommence avec le même prompt mais avec le paramètre « --no
birds »

/imagine a fishing harbour –no birds


Il n’y a plus d’oiseaux sur ces images. Si l’une des images de la première grille vous plait et que vous
voulez enlever les oiseaux, cliquez sur « V » et ajoutez « --no birds » à la fin du prompt (il vous faudra
activer le « remix mode », on en reparle plus tard).

Upscale de l’image 3 de la grille initiale, adieu les oiseaux !


Les styles
Il est possible d'attribuer à vos images différents styles.
Les époques
Les émotions
Les environnements / lieux
La fonction « blend »
Elle permet de mixer jusqu'à 5 images. Vous pouvez également choisir trois types de formats :

 Carré
 Portrait
 Paysage

Il n'est pas possible de rajouter du texte dans un prompt avec la commande /blend. Je trouve cette
fonctionnalité un peu limitée, même si elle peut donner de beaux résultats dans certains cas.

La fonction blend est intéressante pour mixer un background, un style avec un personnage par
exemple. En revanche ne vous attendez pas à des miracles lorsqu'il s'agira de mixer deux personnages.
Vous obtiendrez une fusion des deux individus, pas une image avec les deux personnes ensemble.
Voici une vidéo plus détaillée sur le sujet : https://www.youtube.com/watch?v=Avh5EEDazW0
Pensez à autorisez le Midjourney bot à vous envoyer des messages privés !

Clic droit sur l'icône du serveur Midjourney, "paramètres de confidentialité" puis cochez "autoriser les
messages privés en provenance des membres de ce serveur".

Cela vous permettra notamment de recevoir en message privé (en haut à gauche de votre écran), les
images que vous avez créées. Pour ce faire, cliquez sur "ajoutez une réaction" en haut à droite du
message contenant les images qui vous intéresse, puis sélectionnez l'emoji « enveloppe »
Le message une fois dans notre boîte de réception :
Les différentes versions de Midjourney
Il existe différentes versions de Midjourney que vous pouvez spécifier à la fin de vos prompts pour
obtenir des résultats différents :

 --v 1 (pour la version 1)


 --v 2
 --v 3
 --v 4
 --style 4a (légère variation de la V4 que nous utilisons de base)
 --style 4b (légère variation de la V4 que nous utilisons de base)
 --niji (utile pour les images de style manga)
 --v 5 (nous y reviendrons plus tard, elle n’est pas officiellement sortie lorsque j’écris ce texte)
Les différences entre les trois premières versions et la V4 sont énormes !
Voir ci-dessous les versions beta upscale et light upscale de l’image 2

Les dimensions des images


Light upscale (une variation de l’upscale en moins bonne qualité)

Beta upscale redo (un upscale qui permet d’obtenir une image en 2048 x 2048)
Les commandes les plus utiles (selon moi)
La commande "/info" permet d'obtenir de nombreuses informations sur votre compte perso :

Vous y trouverez les infos suivantes :

 Le forfait que vous avez choisi


 Le mode dans lequel vous vous trouvez actuellement (fast ou rapide)
 Le mode de visibilité (public généralement)
 Il faut un plan "pro" pour avoir le mode furtif qui permet de garder « privé » toutes ses
créations
 Le temps qu'il vous reste (forfait restant)
 Le nombre d'images que vous avez générées en relax et en fast mode
 Le nombre de génération d'images que vous avez en attente ou en cours

Cliquer sur "go to your feed" vous emmène directement sur votre page de profil Midjourney (espace
perso)

Vous pouvez utiliser la commande /settings pour accéder à plusieurs paramètres utiles :
La première ligne concerne les différentes versions de Midjourney. Seule la 4 donne vraiment des
résultats concluants, les deux premières sont catastrophiques. Le Niji Mode quant à lui peut servir pour
créer des scènes de type manga.

Les "test" sont des versions d'essai proposées par Midjourney afin de recueillir des avis de la
communauté. Les résultats obtenus varient un peu de la V4. Vous pouvez les tester pour vous faire
votre propre avis.

a blue car --test

J’ai publié une vidéo dédiée aux différentes versions de Midjourney sur ma chaîne. C’est une vidéo
assez légère dans laquelle nous découvrons ensemble certains résultats (catastrophiques) proposées
par les anciennes versions… Inutile de dire qu’il y a eu du progrès depuis ! Voici le lien :

https://www.youtube.com/watch?v=xwbgBKutjRA
Half quality : équivaut à un paramètre de 0.5 (--q .5). Autant dire une qualité moindre mais qui vous
coutera moins de GPU time

Base quality : la qualité de base lorsque vous ne renseignez aucun paramètre de qualité (équivaut à --
q 1)

High quality : équivaut à un paramètre --q 2, soit une qualité supérieure mais qui vous coutera plus de
GPU time (disponibles seulement avec les versions antérieures à la 4)

/imagine a blue car --q 0.5


Public mode : le mode utilisé par 90% des utilisateurs. Cela signifie que toutes vos images apparaissent
dans la galerie Midjourney. Il y a tellement d'images générées que vous passez totalement inaperçu,
mais sachez que tout le monde peut vous retrouver si besoin !

Stealth mode : le mode furtif en français. Disponible uniquement pour ceux ayant pris un forfait pro.
Il permet de garder "secrète" toutes ses créations. Vos images ne sont pas visibles dans la galerie.
Surement utile pour les entreprises qui utilisent l'outil pour leurs projets.

Remix mode : utile lorsque vous cliquez sur "variation" (V1, 2, 3 ou 4). Une fenêtre s'affiche et vous
pouvez modifier votre prompt de base tout en repartant d'une image générée précédemment.

Fast mode : le mode qui vous permet de générer vos images rapidement. Vos créations passent en
priorité et vous attendez rarement plus d'une minute pour obtenir un résultat. Le fast mode est limité
en revanche. Votre nombre de "fast hour" dépend du forfait que vous avez choisi. Vous pouvez accéder
au fast mode grâce à la commande /fast

J’ai publié une vidéo pour expliquer en détails les fast et relax modes :

https://www.youtube.com/watch?v=FiN7AILXTlo

Relax mode : disponible uniquement pour les plans standards et pros. Il vous permet de générer des
images à l'infini ! Attention toutefois, vos actions ne sont plus prioritaires. Vous devrez attendre un
peu plus longtemps avant d'avoir vos images. Vous pouvez accéder au relax mode grâce à la commande
/relax

Le champ « remix », disponible lorsque vous cliquez sur « V » en-dessous d’une grille d’images
Les paramètres de style influencent la composition de votre image, les formes, les couleurs etc. Vous
pouvez utiliser cette commande de style avec le paramètre "--s" suivi d'un nombre compris entre 0
et 1 000 (avec la V4). Voici à quoi correspondent les différentes appellations :

 Style Low = --s 50


 Style Med = --s 100
 Style High = --s 250
 Style Very High = --s 750

Plus le nombre renseigné sera élevé, plus le résultat obtenu sera "éloigné" de votre prompt.

/imagine a blue car --s 999

Utilisons le remix mode en cliquant sur V4 en dessous de cette grille pour obtenir un remix de cette
même image. Nous allons ajouter « red » à notre prompt via la fonction « remix ».
Les principaux emoji à utiliser lors d'une "réaction" à vos messages

https://www.midjourney.com/app/feed/bookmarks/

La Seed
La "seed" nous permet de donner un point de départ pour la création des images (le bruit de départ).
Mais ce n'est pas parce que le point de départ est le même que le résultat final sera le même.

Dans les exemples à venir nous garderons la même seed (777) pour obtenir des résultats
« similaires ».
Le mot « blue » a été ajouté avant « robot ». Les images restent assez similaires à celles de base
La commande /show vous permet faire apparaître l'image de votre choix dans le channel que vous
voulez. Vous devez simplement écrire /show et renseigner le job ID de votre image reçue en message
privé grâce à l'emoji « enveloppe ».

Les formats
Le format de base proposé par Midjourney est le format carré (1:1) La taille de mise à l'échelle (upscale)
par défaut est de 1024 x 1024 pixels. Pour définir le format que vous voulez pour vos images,
renseignez --ar x:y à la fin de votre prompt (x et y correspondent à des chiffres). Voici les formats que
vous pouvez utiliser sur Midjourney avec la version 4 :

Vous pouvez aussi utiliser les formats 1:2 et 2:1


Format paysage – panorama (1 :2)

Format allongé (2 :1), utile pour les images où l’on souhaite voir tout le corps
Le paramètre « --chaos » ou « --c » influence le degré de variation des grilles initiales de l'image. Des
valeurs élevées de « --chaos » produiront des résultats et des compositions plus insolites et inattendus.
Des valeurs de « --chaos » plus faibles donnent des résultats plus similaires et constants. Si on ne
renseigne pas de paramètre « --c » dans un prompt, la valeur de base est 0. Les valeurs possibles pour
ce paramètre vont de 0 à 100.

Revoici notre image de tout à l’heure. Ajoutons une petite valeur de « chaos » pour voir la différence :

Avec une valeur de 10 en chaos (voir à la fin du prompt), nous obtenons déjà des images assez
différentes de la grille initiale. Voyons à présent avec une valeur encore plus élevée !
Avec une valeur maximale de 100, les nouvelles images sont très éloignées de la grille initiale !

Le paramètre de qualité
Le paramètre de qualité « --q » indique au bot combien de temps il doit passer à générer vos images.
Moins il y passera de temps, moins l’image sera détaillée (mais elle consommera moins de GPU time).
La valeur de base est « --q 1 » si vous ne renseignez rien dans votre prompt. Vous pouvez aussi utiliser
« --q .25 » et « --q .5 ». Une image moins détaillée n’est pas forcément moins jolie !
Entre le quatuor d’images de références et la dernière en --q .25, nous voyons bien la différence de
détails notamment pour l’image en haut à droite. Les images moins détaillées semblent davantage
brumeuses, comme si Midjourney camouflait le manque de détails par du brouillard.
Le paramètre –stop

Il permet de stopper la génération d'une image au pourcentage que vous voulez. Utile si vous voulez
faire des tests et vérifier que MJ va bien vous donner le résultat que vous espérez. Cela pourrait vous
permettre d'économiser un peu de GPU time (budget de bot). Faire un upscale d'une image générée à
50% créera forcément une image moins détaillée que si vous aviez laissé le paramètre de base.

/imagine Zidane from back –stop 50

J’ai bien fait d’utiliser le paramètre --stop dans ce cas précis car même avec des images inachevées, je
vois que les résultats n’allaient pas me convenir. Le numéro derrière le maillot n’est pas le bon et les
écritures ne correspondent pas au nom « Zidane ».
Les images dans les prompt

Vous pouvez utiliser des images dans vos prompts en renseignant leurs URLs en début de prompt. Les
formats acceptés sont png, gif ou jpeg.

Vous pouvez mettre plusieurs images dans un prompt, il n'y a pas de limite.

Pour uploader une image sur Midjourney cliquez sur le "+" dans le coin gauche du champ texte ou
glissez / déposez une image directement dans ce même champ.

Pour les exemples qui suivent, j’ai upscale l’une des images de forêt vue précédemment :

J’ai upscale celle en --q .25 pour vous montrer que même avec un faible niveau de détails, les images
pouvaient être très belles et totalement exploitables ! Il vous suffit ensuite de copier l’URL de votre
image et de l’ajouter au début de votre prochain prompt.
J’ai créé un prompt avec l’URL de l’image de forêt auquel j’ai ajouté « a tiger in a forest ». J’ai ensuite
upscale la 4e image de la grille. Nous retrouvons bien le chemin au milieu, l’arbre courbé à droite, les
deux arbres à gauche. MJ s’est clairement inspiré de l’image de référence pour y intégrer le tigre.
Utilisons cette image de Brad Pitt dans un prompt basique « URL de l’image + portrait of a man »

Ce « man » ressemble drôlement à Brad Pitt vous ne trouvez pas ?


Le poids dans les prompts
Il est possible d'indiquer à Midjourney quel segment aura le plus d'importance dans votre prompt en
indiquant un chiffre derrière "::". Ainsi, Midjourney mettra plus ou moins en avant certains éléments
en fonction de votre demande.

Aucun poids spécifié dans ce prompt ci-dessus

Le poids de « 2 » ajouté sur « full moon » incite MJ a mettre plus en évidence la Lune

Il y a un poids de trois dans ce prompt (1 + 2). La Lune compte pour 66% du prompt, 33% seulement
pour les premiers éléments (2/3 = 0.66%) (modifié)
Attention toutefois de ne pas créer trop de déséquilibre dans vos prompts sous peine de voir certains
éléments disparaître au profit d'autres !

3/4 = 0.75. Le feu compte pour 75% du prompt ici, pas étonnant que nous ayons perdu les campeurs
sur la quatrième image (et presque sur la première)
/imagine Campers sleeping in a field, starry sky::2 campfire::3

3/5 = 0.6 Le feu compte pour 60% contre 40% pour le reste du prompt. Nous avons retrouvé nos
campeurs et le feu est plus intense que sur la première image comme espéré.

Le Niji Mode
C'est le fruit d'une collaboration entre Midjourney et une autre plateforme appelée Speelbrush. Très
utile pour créer des scènes dans un style manga. Ce mode est particulièrement bon pour les scènes
d'action.

Il faut ajouter le paramètre --niji à la fin d'un prompt pour y accéder.


Les forfaits
Pour souscrire un forfait proposé par Midjourney, vous devez renseigner la commande /subscribe sur
Discord puis cliquer sur le lien proposé par le bot. Vous pourrez ensuite choisir entre un forfait « basic
» à 10$ par mois, un forfait « standard » à 30$ par mois et un forfait « pro » à 60$ par mois.

Attention, vous devrez ajouter 20% de TVA lors de votre achat ! Il est aussi possible de souscrire des
forfaits annuels pour que la mensualité vous revienne 20% moins cher par rapport aux tarifs énoncés
précédemment (8$ le basic, 24$ le standard, 48$ le pro).

Quelques points en plus :

 Pour souscrire un abonnement, vous pouvez utiliser la commande /subscribe sur Discord
 Il est possible d'acheter des fast hours supplémentaire si besoin (4$ / heure)
 Il est possible de passer d'un plan mensuel à un plan annuel (ou vice versa)
 Il est possible de se faire rembourser dans certaines conditions : basic plan = si vous avez
dépensé moins de 1% de votre forfait. Standard et pro = si vous avez dépensé moins de 9
minutes
 Même si vous prenez un plan annuel, vous êtes renouvelé chaque mois. Vous n'avez pas
d'office toutes vos heures pour l'année.
 Les fast hours non utilisées ne sont pas renouvelées d'un mois sur l'autre
 Vous pouvez annuler votre abonnement à tout moment

Voici l’une de mes vidéos qui explique en détails les différents forfaits :
https://www.youtube.com/watch?v=rjpKx1eaUqM
Gagner des heures gratuites
Vous pouvez gagner une heure de fast time quotidiennement en votant pour des images générées
par d'autres utilisateurs. Rendez-vous sur votre espace perso Midjourney pour commencer :
https://www.midjourney.com/app/

Choisissez l'option de vote qui vous convient le mieux. Si vous faites partie des 1 000 meilleurs votants
du jour, vous gagnerez une heure de fast time (l'heure bonus expire au bout de 30 jours si vous ne
l'avez pas dépensée).

Si vous faites partie du top 1 000, vous recevrez un message privé du bot Midjourney :

Premières infos sur la V5


Des prompts plus précis

La V5 serait nettement plus « détachée » de nos prompts pour fournir une plus grande diversité de
résultats. Cette nouvelle version serait plus difficile à utiliser car elle demandera une plus grande
précision dans nos prompts. A priori il sera plus efficace d’écrire une phrase bien construite et détaillée
plutôt que des mots-clés séparés par des virgules.

Les prompts seront donc plus difficiles à maîtriser, mais ils offriront de meilleurs résultats lorsqu’ils
seront rédigés de façon très précises.

Faisons un test avec un prompt « à l’ancienne » et un nouveau style de prompt plus « rédigé ».
Le système d’upscale

Les images générées dans la grille sont déjà upscale en 1 024 x 1 024, c’est la raison pour laquelle la
génération d’un upscale est ultra rapide pour le moment. Les images auront une résolution deux fois
supérieure à celles de la V4, autant dire une bien meilleure qualité.

Les mains et les dents

La version 5 s’est grandement améliorée au niveau des mains et des dents ! On se souvient qu’avec la
version 4, les modèles créés avaient souvent beaucoup plus de dents qu’un individu normal… Il y a eu
de gros progrès sur ce point :
Enfin une main normale !

Le paramètre de mosaïque « --tile »

C’est un ancien paramètre qui existait sur les versions 2 et 3. Le paramètre « --tile » permet de créer
des mosaïques pour créer des motifs homogènes. Très sympa pour des motifs de type « papier peint ».
Le paramètre « --q 2 » est de retour

Je ne reviens pas sur le paramètre « quality », sachez simplement que la V5 permettra à nouveau
d’avoir des images en excellente qualité via la commande « --q 2 ». Cela vous coutera deux fois plus de
GPU time par contre.

Retour du poids des images

Enfin ! Il sera à nouveau possible d’utiliser un paramètre de poids pour nos images grâce à la
commande « --iw ». Les valeurs iront de 0.5 à 2 à priori.

Les formats sont libres

Vous pourrez utiliser les « aspect ratio » que vous voudrez toujours sous la forme de « –ar X :Y »
Les images générées de base ont changé de style

La V5 fournira davantage d’images dans un style photographique réaliste si on ne spécifie rien dans
notre prompt. Pour plus de folie, vous pouvez jouer avec le paramètre « style » (valeur max : 1 000)

Les textes… toujours pas !

Midjourney est toujours nul pour écrire du texte. Peut-être moins pour les chiffres comme en
témoigne cette horloge que j’ai créée très facilement ?
V6 dans les deux prochains mois ?

La V6 devrait arriver très rapidement, peut-être en juin ou juillet 2023 !

Vous aimerez peut-être aussi