Guide : utiliser l'intelligence artificielle pour générer des images - vintage road trip : voitures & motos anciennes

Apparus depuis peu de temps, les IA de génération d’images, telles que Midjourney, sont capables de créer des images réalistes à partir de descriptions textuelles en moins de 60 secondes. D’autre part, il existe également des IA d’agrandissement d’images, telles que Let’s Enhance ou Giga Pixel, conçues pour augmenter la résolution des images en utilisant des techniques de deep learning. Elles peuvent être très utiles pour restaurer des photos anciennes ou améliorer la qualité des images en basse définition. Adobe lance aussi son IA générative d’images. Ces IA apportent un nouvel outil aux métiers créatifs, cela permet de gagner du temps autant du côté décisionnel que du côté exécutif.

Générer des images avec Midjourney

Midjourney utilise un système de neurone pour générer des images de qualités depuis la version 5 les aberrations que l’on pouvait rencontrer comme 6 doigts et 32 dents aux personnages sont corrigées. Midjourney permet de générer environ 25 images dans la version gratuite mais pour le moment Midjourney a décidé d’arrêter cette fonctionnalité. Au-delà des 25 images générées, Midjourney propose un plan basic à 3h20 de temps CPU à 10$ par mois.

Pour utiliser Midjourney,il faut avoir un compte Discord. Accédez à Midjourney.com puis cliquez sur Join the Beta ou accédez directement par le serveur Midjourney Discord.

Guide : utiliser l'intelligence artificielle pour générer des images

Pour générer des images il faut :

trouver une chaîne débutant # newbie-
tapez la commande dans la barre /imagine puis une fenêtre contextuelle apparaît et il faut cliquer sur Prompt
tapez la description de l’image en anglais
tapez sur entrée pour envoyer la commande au Bot

Midjourney prend environ 60 secondes pour générer 4 propositions au format carré. Sur les salon Newbies, il y a beaucoup d’utilisateurs en même temps, il ne faut donc pas perdre de vue son image.

Une fois la génération de l’image avec les 4 propositions faites deux rangées de boutons apparaissent. Les boutons U agrandissent l’image souhaitée tandis que les boutons V créent 4 variantes de l’image choisie. Le boutons re-roll relance une génération de 4 propositions à partir du prompt.

Après avoir générer son image en 1024 x 1024 pixels vous pouvez soit cliquer sur l’image et l’ouvrir sur une page web qui vous permet de l’enregistrer ou utiliser l’un des boutons qui se trouvent sous l’image :

Pour créer une nouvelle variante de l’image avec 4 nouvelles propositions
Pour agrandir l’image en 2048 x 204 pixels avec Beta Upscale

La commande /blend permet de combiner des images existantes entre elles.

Les prompts

Pour créer des images, il est nécessaire d’utiliser une description en anglais qui précise le lieu, l’époque et le style souhaités. Ensuite, des mots spécifiques séparés par des virgules peuvent être ajoutés à la description principale pour préciser des éléments de l’image et les dimensions de l’image. Les images et les personnes sur les images n’existe pas et n’ont jamais existé en dehors de la génération par Midjourney.

Exemples de prompts

1980, volkswagen beetle on the street, palm tree, neon light, cyberpunk, photorealistic –q 2 –ar 2:3

Photorealistic permet d’avoir une photo réaliste
Néon light et Cyber Punk donne l’aspect années 80 à
l’image
— q 2 correspond à la qualité de l’image
— ar 2:3 donne la dimension de l’image

Porsche 911 on the road with palm tree, dramatic light, photorealistic q 5 –ar 16:9
Dramatic light donne une ambiance pluvieuse

Vous pouvez aussi spécifier le cadrage : contre-plongée, plongée, portrait, macro photo, vue aérienne,
tilt-shift etc. Vous pouvez également définir l’objectif utilisé et la focale.

portrait of beautiful woman in france, 50 mm, f 1:8, photorealistic –ar 4:3

photography aerial view road on the seaside, cars, ultra realistic, photorealistic –ar 4:3

macro photography beautiful flowers, natural light, photorealistic –ar 4:3

photography of woman 40 years old middle blond hair brown eyes eyeglasses with a volkswagen yellow beetle in meeting of vintage cars in alps, photorealistic, cinematic, sunset –v 5 –ar 2:3

–v 5 correspond à la 5ème version de midjourney

watercolor, volkswagen bus on the seasidel

Les IA d’agrandissements d’images

Les images créées avec Midjourney ont une résolution de 72 dpi et une taille maximale de 2048 pixels, ce qui signifie qu’elles ne peuvent pas être imprimées en grand format. Cependant, il est possible d’augmenter la résolution de l’image sans perdre en qualité en utilisant des IA d’augmentation de résolution. Contrairement à Photoshop, qui agrandit simplement les pixels, ces IA utilisent des réseaux neuronaux pour ajouter des détails photoréalistes aux images.

Let’s Enhance est une IA d’agrandissement d’image qui offre 10 images gratuitement en test. Les options payantes vont de 10 $ par mois pour 100 crédits à 34 $ par mois pour 500 crédits. Giga Pixel peut être utilisé en plugin sur Photoshop permettant un agrandissement jusqu’à 600% tout en améliorant les détails de l’image. Il coûte 100 $ sans abonnement mensuel.

C’est beau, c’est merveilleux et les pros dans tout ça ?

Les IA de génération d’images sont des outils utiles pour les créateurs visuels qui ont besoin de produire des images rapidement et à moindre coût. Ces outils utilisent des algorithmes de machine learning pour créer des images photoréalistes ou illustratifs en fonction d’une description donnée, ce qui permet aux utilisateurs de générer des images avec peu ou pas de compétences en matière de conception graphique. L’IA reste toujours plus qualitatif que le copain de la voisine qui annonce savoir faire du graphisme puisque son frère est graphiste. Cependant, les IA de génération d’images ont encore des limites et ne peuvent pas remplacer complètement les compétences d’un professionnel qu’il soit photographe, graphiste, illustrateur ou encore designer.

Adobe lance aussi son IA

Adobe vient d’annoncer ce mardi 21 mars 2023 son IA générative d’images baptisé Firefly. Une version béta est en cours de test. L’IA d’Adobe est prometteuse outre la possibilité de générer des photos, elle permet également de générer des images vectorielles modifiables, de texturer des modèles 3D, de créer des post pour les réseaux sociaux, d’appliquer des textures sur du texte tout ça à partir d’une simple description textuel. Mais Adobe ne s’arrête pas là, il offre des solutions tant attendu dans Photoshop avec la possibilité d’agrandir des images sans destruction et d’étendre des images en créant des décors. Il permet aussi de combiner des images et offre les outils déjà disponible dans Neural Filters. Adobe conçoit Firefly pour donner à tous les créateurs des super-pouvoirs pour travailler à la vitesse de leur imagination.

« L’IA générative est la prochaine évolution de la créativité et de la productivité basées sur l’IA, transformant la conversation entre le créateur et l’ordinateur en quelque chose de plus naturel, intuitif et puissant », a déclaré David Wadhwani, président, Digital Media Business, Adobe. « Avec Firefly, Adobe apportera des « ingrédients créatifs » génératifs basés sur l’IA directement dans les flux de travail des clients, augmentant ainsi la productivité et l’expression créative de tous les créateurs, des professionnels de la création haut de gamme à la longue traîne de l’économie des créateurs. »