Chapitre2 ML
Chapitre2 ML
Chapitre2 ML
Support de cours
APPRENTISSAGE ARTIFICIEL
(« Machine-Learning »)
Année universitaire 2019/2020
Pr. Mohammed OUANAN
1
L’analyse de la régression et la
classification
L’analyse de la régression est une méthode statistique qui
permet d’étudier le type de relation pouvant exister entre
une certaine variable (dépendante) dont on veut expliquer
les valeurs et une ou plusieurs autres variables qui servent à
cette explication (variables indépendantes)
◦ Régression linéaire simple: une variable indépendante
– dite simple si elle permet de prédire les valeurs d’une variable dite
dépendante (expliquée (Y)) à partir des valeurs prises par une autre
variable dite indépendante (explicative (X)).
Diagramme de dispersion
10
9
8
7
6
5
4
3
2
1
0
0 2 4 6 8 10
Heures d'études
Objectif d’une analyse de régression simple
Y f (X )
On essaie de trouver la forme mathématique de la fonction f
Objectif d’une analyse de régression simple
Diagramme de dispersion
10
9
8
7
6
5
4
3
2
1
0
0 2 4 6 8 10
Heures d'études
Définition: Nous appelons régression linéaire
l’ajustement d’une droite au nuage statistique d’une
série de couples de données.
Y 0 1 X 1 2 X 2 ... p X p
Les termes de l’équation
0
y1 1 x1,1 x1, p 1
1
yn 1 x1,n xn , p n
p
y X
Jusqu’à présent, nous avons appris comment résoudre des problèmes
de régression. Au cours du chapitre 1, j’ai parlé des problèmes de
classification, qui consistent par exemple à classer un email en tant
que ‘spam’ ou ‘non spam’.
Dans ce genre de problème, on aura un Dataset contenant une variable
Target y pouvant prendre 2 valeurs seulement, par exemple 0 ou 1
si y=0, alors l’email n’est pas un spam
si y= 1, alors l’email est un spam
u b0 b1 x1 b2 x2 bp x p
1
yˆ
1 eu
Pour la régression linéaire, la Fonction Coût donnait une courbe
convexe (qui présente un unique minima). C’est ce qui fait que
l’algorithme de Gradient Descent fonctionne.
En revanche, utiliser cette fonction pour le modèle Logistique ne
donnera pas de courbe convexe (dû à la non-linéarité) et l’algorithme
de Gradien Descent se bloquera au premier minima rencontré, sans
trouver le minimum global.
y Y yˆ Y ( y yˆ )
n n n
2 2 2
i i i i
i 1 i 1 i 1
Les coefficients de détermination
◦ Le coefficient de détermination R2
R2 = SCR/SCT
Il exprime le pourcentage de la variance de Y expliquée par le
modèle. Il donne une idée globale de l'ajustement du modèle.
◦ Le R2 ajusté se calcule en fonction du R2 :
n 1
2
aR 1 (1 R 2 )
n p 1
Il traduit à la fois la qualité de l’ajustement (liaison entre Y et les Xi)
et la complexité du modèle (nombre de variables explicatives).