Bernardin-Mukunzi TP 34566
Bernardin-Mukunzi TP 34566
Bernardin-Mukunzi TP 34566
1.définition.............................................................................................................................................2
1. définition
L'intelligence artificielle générative ou IA générative (ou GenAI) est un type de système
d'intelligence artificielle (IA) capable de générer du texte, des images ou d'autres médias en
réponse à des invites (ou prompts en anglais). Les modèles génératifs apprennent les
modèles et la structure des données d'entrée, puis génèrent un nouveau contenu similaire
aux données d'apprentissage mais avec un certain degré de nouveauté (plutôt que de
simplement classer ou prédire les données) 1.
Les cadres les plus importants pour aborder l'IA générative comprennent les réseaux
antagonistes génératifs (GAN) et les transformateurs génératifs pré-entraînés (GPT) 2.Les
GAN se composent de deux parties : un réseau générateur qui crée de nouveaux échantillons
de données et un réseau discriminateur qui évalue si les échantillons sont réels ou faux. Les
deux réseaux sont formés ensemble dans le cadre d'un processus concurrentiel, le réseau
générateur essayant continuellement de produire des échantillons de meilleure qualité et
plus réalistes, tandis que le réseau discriminateur s'efforce d'identifier avec précision les faux
échantillons. Les GPT sont des réseaux de neurones artificiels fondés sur l'architecture du
transformateur, pré-entraînés sur de grands ensembles de données de texte non étiqueté et
capables de générer un nouveau texte de type humain 3. Ils utilisent de grands modèles de
langage (abrégés LLM, pour large language model) pour produire des données fondées sur
l'ensemble de données d'entraînement qui a été utilisé pour les créer.
Les systèmes d'IA génératifs notables incluent ChatGPT (et sa variante Bing Chat), un
chatbot (agent conversationnel programmable) construit par OpenAI à l'aide de ses grands
modèles de langage fondateurs GPT-3 et GPT-4, et Bard, un chatbot construit par Google à
l'aide de son modèle fondateur LaMDA. D'autres modèles d'IA générative incluent des
systèmes artistiques d'intelligence artificielle tels que Stable Diffusion, Midjourney et DALLE 5.
L'IA générative a des applications potentielles dans un large domaine d'industries, parmi
lesquelles le développement de logiciels, le marketing et la mode. L'investissement dans l'IA
générative bondit au début des années 2020, avec de grandes entreprises telles que
Microsoft, Google et Baidu ainsi que de nombreuses petites entreprises développant des
modèles d'IA générative6
2. Modalités
Un système d'IA générative est construit en appliquant un apprentissage automatique
non supervisé ou auto-supervisé à un ensemble de données. Les capacités d'un système d'IA
générative dépendent de la modalité ou du type d'ensemble de données utilisé.
▪ Texte : les systèmes d'IA générative formés sur des mots ou des jetons de mots
(tokens) incluent GPT-3, LaMDA, LLaMA, BLOOM, GPT-4 et d'autres. Ils sont capables de
traiter du langage naturel, de faire de la traduction automatique et de générer du
langage naturel et peuvent être utilisés comme modèles de base pour d'autres tâches.
Les principaux ensembles de données sont BookCorpus, Wikipédia et d'autres.
▪ Code : Outre les textes en langage naturel, de grands modèles de langage peuvent être
entraînés sur du texte en langage de programmation, ce qui leur permet de générer du
code source de nouveaux programmes informatiques.
4
« Risques de cybersécurité liés à l'IA générative » [archive], sur powerdmarc.com, 26 juillet 2023 (consulté le
27 août 2023)
5
Roose, « A Coming-Out Party for Generative A.I., Silicon Valley's New Craze » [archive], The New York Times,
21 octobre 2022 (consulté le 14 mars 2023)
6
Yang et Gokturk, « Google Cloud brings generative AI to developers, businesses, and governments » [archive],
14 mars 2023
▪ Images : Les systèmes d'IA générative formés sur des
ensembles d'images avec des légendes textuelles comprennent
Imagen, DALL-E, Midjourney, Stable Diffusion et autres. Ils sont
couramment utilisés pour la génération de texte en image et le
transfert de style neuronal 7. Les jeux de données sont
notamment LAION-5B et d'autres.
▪ Molécules : Les systèmes d'IA générative peuvent être entraînés sur des séquences
d'acides aminés ou des représentations moléculaires telles que SMILES représentant
l'ADN ou les protéines. Ces systèmes, comme AlphaFold, sont utilisés pour la prédiction
de la structure des protéines et la découverte de médicaments. Les ensembles de
données comprennent divers ensembles de données biologiques.
▪ Musique : les systèmes d'IA générative tels que MusicLM peuvent être formés sur les
formes d'ondes sonores de la musique enregistrée avec des annotations textuelles afin
de générer de nouveaux échantillons musicaux fondés sur des descriptions de texte
telles qu'« une mélodie de violon apaisante soutenue par un riff de guitare distordu ».
▪ Vidéo : L'IA générative entraînée sur une vidéo annotée peut générer des clips vidéo
cohérents dans le temps. Des IA comme Gen1 par RunwayML19 et Make-A-Video de
Meta20 peuvent générer des vidéos de cette manière.
7
Aditya Ramesh et Mikhail Pavlov « Zero-shot text-to-image generation » (2021) — « (ibid.) », dans
International Conference on Machine Learning, PMLR, p. 8821–8831
8
« Explainer: What is Generative AI, the technology behind OpenAI's ChatGPT? », Reuters, 17 mars 2023 (lire
en ligne [archive], consulté le 17 mars 2023)
Code Grands modèles Génération de Texte en langage
de langage code source de programmation
Images Imagen, DALL-E, Génération de LAION-5B, etc.
Midjourney, Stable texte en image,
Diffusion, etc. transfert de style
Molécules AlphaFold Prédiction de la Ensembles de
structure des données biologiques
protéines, découverte
de médicaments
Musique MusicLM Génération de Formes d'ondes
musique basée sur des sonores de la musique
descriptions de texte enregistrée
Vidéo Gen1, Make-A- Génération de Vidéo annotée
Video clips vidéo cohérents
dans le temps
Multimodal GPT-4 d'OpenAI Accepte à la fois
les entrées de texte et
d'image
3. Articles connexes
Arts de l'intelligence artificielle Réseau antagoniste génératif Transformateur génératif
pré-entraîné Grand modèle de langage 7