Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Pfe BK

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 130

République Algérienne Démocratique et Populaire

Ministère de l’Enseignement Supérieur et de la Recherche Scientifique

Université des Sciences et de la Technologie Houari Boumediene

faculté de mathématiques

Département de Probabilités et Statistique

mémoire
En vue de l’obtention du diplôme de MASTER

Spécialité : Mathématiques Financières

Thème

Scoring de rentabilité des clients en portefeuille (cas de


compagnie d’assurance )

Réalisé par : BENHAMMADI Yassine Encadré par : Dr HAFFAR Adlane


KANDI Nadir
Remerciements

Avant tout, nous tenons à remercier le Dieu tout puissant pour la patience et la force
qui nous a permis de dépasser toutes les difficultés.

Nous tenons aussi à exprimer notre profonde reconnaissance à nos chères encadrants
M.HAFFAR Adlane et Mme.BELHADJ Fazia qui ont partagé avec nous leurs expériences
et qui ont toujours été présentes avec nous avec leurs conseils et leur aide précieuse tout
au long de la période de travail.

Nous exprimons nos sincères remerciements à l’ensemble des membres du jury pour
leurs présence et pour avoir examiné notre travaille.

On remercie également tous nos enseignants qui étaient présents durant nos années
d’études et qui nous ont soutenu dans la poursuite de nos études.

Nous tenons nos sincères remerciements a nos parents et nos familles et proches a qui
ont est profondément reconnaissant pour leurs aides morales.

Enfin, on remercie nos collègues et nos amis qui ont partagé avec nous nos dures périodes
pour aboutir a ce modeste travaille .
Dédicace

Je dédie ce travail à :

Mes chers parents à qui je dois ce que je suis aujourd’hui grâce à leur amour, leurs
sacrifices et leur patience. Que Dieu, le Tout-Puissant, les protège et les préserve, et leur
accorde santé et longue vie pour que je puisse les combler de bonheur et de gratitude.

Ma soeur Hidayet et mon frère Fares pour leur appui et leur encouragement et à qui
je souhaite un avenir brillant ainsi que tout le bonheur du monde.

Mon cher binôme Kandi Nadir avec qui j’ai travaillé pour ce projet et durant mon
cursus.

Mes chers amis Imad , Billel , Abdou qui m’ont soutenu et qui ont toujours été là
pour moi.

M. HAFFAR Adlane et Mme. BELHADJ Fazia qui ont été une source d’inspira-
tion.

À tous mes collègues et mes amis et à toute personne ayant aidé de près ou de loin à
l’aboutissement de ce projet .

Benhammadi Yassine
Je tiens de dédier ces quelques mots à :

Mes chers parents, votre soutien indéfectible, votre amour inconditionnel et vos en-
couragements constants ont été les piliers solides sur lesquels j’ai pu bâtir mon parcours
d’études.

M. HAFFAR Adlene, vos précieux enseignements m’ont ouvert les portes du savoir
et ont façonné ma pensée avec sagesse. Vous avez été bien plus qu’un professeur, vous
êtes devenu un véritable guide, toujours prêt à partager votre savoir et à nous inspirer à
donner le meilleur de nous-mêmes.

Mme. BELHADJ Fazia, je suis profondément reconnaissante de votre présence à


mes côtés tout au long de ce stage. Votre encadrement rigoureux et votre volonté de
partager vos connaissances ont été des atouts précieux dans ma formation.

Je suis reconnaissant d’avoir pu compter sur BENHAMMADI Yassine à mes côtés.


Votre dévouement, votre enthousiasme et votre travail acharné ont été une source d’ins-
piration pour moi. Nous avons formé une équipe formidable, et je suis fier des résultats
que nous avons obtenus ensemble.

À mes chers frères, Amir, Mehamed, Abd Elwahab, et ma sœur Lyna, vous avez
été mes compagnons de route, mes soutiens infaillibles. Vos encouragements constants et
votre amour inconditionnel ont été des sources de motivation et de force tout au long de
mon parcours.

Et enfin, à mes chers amis, qui ont partagé avec moi tant de moments inoubliables,
de rires, de joies et de peines, vous avez été mes alliés.

KANDI Nadir
Table des matières

Table des matières i

Liste des figures v

Liste des tableaux vii

Liste des abréviations x

Introduction générale 1

1 Généralités sur les assurances 3


Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1 Mécanismes techniques de gestion des risques . . . . . . . . . . . . . . . . 3
1.1.1 Les assurances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Les réassurances . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.3 Les Coassurances . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Contrats d’assurance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.1 Les conditions générales . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.2 Les conditions particulières . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.3 Les parties prenantes au contrat . . . . . . . . . . . . . . . . . . . . 8
1.3 Outils financiers de gestion des risques . . . . . . . . . . . . . . . . . . . . 11
1.3.1 La prime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2 La limite d’indemnisation en assurance . . . . . . . . . . . . . . . . 12
1.3.3 La franchise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4 Formes d’assurance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

i
Table des matières

1.4.1 L’assurance conventionnelle . . . . . . . . . . . . . . . . . . . . . . 16


1.4.2 L’assurance takaful . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.3 La titrisation assurantielle . . . . . . . . . . . . . . . . . . . . . . . 19
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2 Le marché des assurances 22


Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1 Historique des assurances en Algérie . . . . . . . . . . . . . . . . . . . . . . 22
2.1.1 L’étape no 1 : 1962-1966 . . . . . . . . . . . . . . . . . . . . . . . . 23
2.1.2 L’étape no 2 : Monopole de l’État . . . . . . . . . . . . . . . . . . . 23
2.1.3 L’étape no 3 : 1995 à nos jours : . . . . . . . . . . . . . . . . . . . . 24
2.2 Acteurs de marché . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.1 Les campagnes d’assurance et réassurance . . . . . . . . . . . . . . 25
2.2.2 Le courtier d’assurance et réassurance . . . . . . . . . . . . . . . . 27
2.2.3 Les autres acteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3 Indicateurs du marché des assurances . . . . . . . . . . . . . . . . . . . . . 29
2.3.1 L’évolution du chiffre d’affaires . . . . . . . . . . . . . . . . . . . . 29
2.3.2 L’analyse des différents acteurs du marché d’assurance . . . . . . . 33
2.3.3 L’analyse des différents acteurs du marché de réassurance . . . . . . 38
2.4 Canaux de commercialisation . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4.1 Les canaux traditionnels . . . . . . . . . . . . . . . . . . . . . . . . 40
2.4.2 Les canaux des intermédiaires . . . . . . . . . . . . . . . . . . . . . 40
2.4.3 Les approches modernes . . . . . . . . . . . . . . . . . . . . . . . . 41
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3 Techniques d’assurance 43
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1 La loi des grands nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1.1 Le principe de la mutualisation et le transfert des risques . . . . . . 44
3.1.2 Comprendre la loi des grands nombres dans l’assurance . . . . . . . 46
3.1.3 Le théorème central limite . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 Asymétrie d’information . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

ii
Table des matières

3.2.2 Les asymétries d’information et la théorie des jeux . . . . . . . . . 49


3.2.3 Les effets de l’asymétrie d’information sur le système d’assurance. . 50
3.3 Anti sélection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3.2 Naissance de la notion d’anti-selection . . . . . . . . . . . . . . . . 52
3.3.3 Les mécanismes de réduction de la sélection adverse . . . . . . . . 53
3.4 Aléa moral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.4.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.4.2 Naissance de la notion d’aléa moral . . . . . . . . . . . . . . . . . . 56
3.4.3 La façon de faire face aux aléas moraux . . . . . . . . . . . . . . . . 56
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4 Techniques de classification 58
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.1 Apprentissage automatique (ML) . . . . . . . . . . . . . . . . . . . . . . . 58
4.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.1.2 Les types d’apprentissage automatisé . . . . . . . . . . . . . . . . . 59
4.1.3 L’apprentissage automatisé dans le secteur de l’assurance . . . . . 67
4.2 Algorithmes de classification automatique (Ségmentation) . . . . . . . . . 68
4.2.1 L’algorithme K-means (K-moyenne) . . . . . . . . . . . . . . . . . . 68
4.2.2 L’algorithme de classification hiérarchique ascendante (AHC) . . . 71
4.2.3 L’algorithme de DBSCAN . . . . . . . . . . . . . . . . . . . . . . . 74
4.3 Mesure de la qualité de la classification . . . . . . . . . . . . . . . . . . . 76
4.3.1 L’indice de silhouette . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.3.2 L’indice de Dunn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.3.3 L’indice de Calinski-Harabasz . . . . . . . . . . . . . . . . . . . . . 79
4.4 Détection de fraude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.4.1 Types de fraudes à l’assurance automobile . . . . . . . . . . . . . . 80
4.4.2 L’apprentissage automatique pour la détection de la fraude . . . . . 81
4.4.3 La technologie derrière la détection des fraudes . . . . . . . . . . . 82
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

iii
Table des matières

5 Classification des clients en portefeuille en fonction de la rentabilité 85


Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.1 La présentation de l’organisme d’accueil . . . . . . . . . . . . . . . . . . . 86
5.1.1 Textes de loi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.1.2 Organisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.1.3 Missions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.2 La présentation de la base de données . . . . . . . . . . . . . . . . . . . . . 87
5.2.1 La présentation des variables . . . . . . . . . . . . . . . . . . . . . . 88
5.2.2 Le prétraitement des données . . . . . . . . . . . . . . . . . . . . . 90
5.2.3 Quelques statistiques sur la base de donnée . . . . . . . . . . . . . . 93
5.3 Calcul des rentabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.3.1 Les hypothèses de travail . . . . . . . . . . . . . . . . . . . . . . . . 97
5.3.2 Les formules de calculs . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3.3 Les indicateurs de rentabilité pour un client . . . . . . . . . . . . . 100
5.4 L’application des algorithmes de classification . . . . . . . . . . . . . . . . 101
5.4.1 L’algorithme K-means . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.4.2 L’algorithme AHP . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.4.3 L’algorithme DBSCAN . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.5 Le calcule des indices de bonne classification . . . . . . . . . . . . . . . . . 110
5.5.1 L’algorithme K-means . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.5.2 L’algorithme AHP . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.5.3 L’algorithme DBSCAN . . . . . . . . . . . . . . . . . . . . . . . . . 111
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

Conclusion générale 113

Bibliographie 115

iv
Table des figures

1.1 Les différents niveaux de l’assurance . . . . . . . . . . . . . . . . . . . . . 5


1.2 Branches d’assurance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3 Mécanisme de l’assurance Takaful . . . . . . . . . . . . . . . . . . . . . . 18
1.4 Schéma d’une structure type de titrisation en assurance . . . . . . . . . . 20

2.1 Évolution du chiffre d’affaires (2004-2022) . . . . . . . . . . . . . . . . . . 31


2.2 Structure du marché . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3 production du marché des assurances au 31/12/2022 . . . . . . . . . . . . 32
2.4 Structure du marché de l’assurance dommages . . . . . . . . . . . . . . . 33
2.5 Structure des assurances de personnes au 31/12/2022 par branche . . . . . 35
2.6 Structure TAKAFUL générale au 31/12/2022 . . . . . . . . . . . . . . . . 38

3.1 La mutualisation en assurance . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.1 Apprentissage Automatique . . . . . . . . . . . . . . . . . . . . . . . . . . 59


4.2 Les types de l’apprentissage automatique . . . . . . . . . . . . . . . . . . 59
4.3 Apprentissage Supervisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.4 Apprentissage non-supervisé . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.5 Apprentissage par renforcement . . . . . . . . . . . . . . . . . . . . . . . . 64
4.6 Apprentissage semi-supervisé . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.7 Schématisation de l’algorithme K-means . . . . . . . . . . . . . . . . . . . 69
4.8 Méthode de classification ascendante hiérarchique . . . . . . . . . . . . . . 72
4.9 Méthode DBSCAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.10 Indice de Silhouette . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

v
Liste des figures

4.11 Indice de Dunn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

5.1 Analyse descriptive des primes et des indemnisations par an . . . . . . . . 88


5.2 Ecart inter-quartile(IQR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.3 La boite à moustache avant la suppression des valeurs aberrantes . . . . . 92
5.4 La boite à moustache après la suppression des valeurs aberrantes . . . . . . 92
5.5 Statistiques de la Variable Rent . . . . . . . . . . . . . . . . . . . . . . . . 94
5.6 Statistiques de la Variable Rent par rapport aux Codes Catégories . . . . 94
5.7 Statistiques de la Variable Rent par rapport aux Genre . . . . . . . . . . . 95
5.8 Statistiques de la Variable Rent par rapport à l’âge des conducteurs . . . 96
5.9 Statistiques de la Variable Rent par rapport à l’ancienneté du permis des
conducteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.10 Statistiques de la Variable Rent par rapport à l’âge mécanique des véhicules 97
5.11 Dispersion des clients dans les classes (Rentabilité Moyenne) en utilisant
k-means . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.12 Dispersion des clients dans les classes (Rentabilité Totale) en utilisant k-
means . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.13 Dispersion des clients dans les classes (Rentabilité Valeur assuré) en utili-
sant K-means . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.14 Dispersion des clients dans les classes (Rentabilité moyenne) en utilisant
L’AHP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.15 Dispersion des clients dans les classes (Rentabilité totale) en utilisant L’AHP105
5.16 Dispersion des clients dans les classes (Rentabilité valeur assuré) en utili-
sant L’AHP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.17 Dispersion des clients dans les classes (Rentabilité moyenne) en utilisant
DBSCAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.18 Dispersion des clients dans les classes (Rentabilité totale) en utilisant DBS-
CAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.19 Dispersion des clients dans les classes (Rentabilité valeur assuré) en utili-
sant DBSCAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

vi
Liste des tableaux

2.1 Marché mondial de l’assurance : évolution du chiffre d’affaires par continent


(2010-2020) en millions USD . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2 Production des assurances de dommages au 31/12/2022 par branche . . . . 35
2.3 Production des assurances de personnes au 31/12/2022 par branche . . . . 37
2.4 Production des assurances de TAKAFUL au 31/12/2022 . . . . . . . . . . 37
2.5 État de production de la réassurance au 31/12/2022 . . . . . . . . . . . . 39
2.6 Structure du réseau de distribution (En Million) au 31/12/2021 . . . . . . 40
2.7 Activité de la bancassurance par société . . . . . . . . . . . . . . . . . . . 41

5.1 Statistiques descriptives des primes et indemnisations par exercice . . . . 87


5.2 Variables de la partie assuré . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.3 Variables de la partie contrat d’assurance . . . . . . . . . . . . . . . . . . 89
5.4 Variables de la partie indemnisation . . . . . . . . . . . . . . . . . . . . . 90
5.5 Valeur des primes et sinistres du client par année . . . . . . . . . . . . . . 100
5.6 Tableau des fréquences et moyennes par cluster / Rentabilité moyenne . . 101
5.7 Tableau des fréquences et moyennes par cluster / Rentabilité totale . . . . 102
5.8 Tableau des fréquences et moyennes par cluster / Rentabilité valeur assuré 103
5.9 Tableau des fréquences et moyennes par cluster / Rentabilité moyenne . . 104
5.10 Tableau des fréquences et moyennes par cluster / Rentabilité totale . . . . 105
5.11 Tableau des fréquences et moyennes par cluster / Rentabilité valeur assuré 106
5.12 Tableau des fréquences et moyennes par cluster / Rentabilité Moyenne . . 107
5.13 Tableau des fréquences et moyennes par cluster / Rentabilité Totale . . . 108
5.14 Tableau des fréquences et moyennes par cluster / Rentabilité valeur assuré 109

vii
Liste des tableaux

5.15 Indices de classification pour l’algorithme K-means . . . . . . . . . . . . . 110


5.16 Indices de classification pour l’algorithme AHP . . . . . . . . . . . . . . . 110
5.17 Indices de classification pour l’algorithme DBSCAN . . . . . . . . . . . . 111

viii
ix
Liste des abréviations

Liste des abréviations

AGA Agent Général D’assurances


AHC Agglomerative Hierarchical Clustering
AL Average Linkage
BST Bureau Specialisé de Tarification en Assurance
BUA Bureau Unifié Automobile Algérien
CSA Commission de Supervision des Assurances
CL Complete Linkage
CNA Conseil National des Assurance
DASS Direction des Assurances
DBI Davies-Bouldin Indice
DBSCAN Density-Based Spatial Clustering of Applications with Noise
DGT Direction Générale du Trésor
DI Dunn Indice
EPS Epsilon
GDI Generalised Dunn Indice
GMM Gaussian Mixture Models
IA Intelligence Artificielle
MinPts Minumum Points
ML Machine Learning
RM Rentabilité Moyenne
RT Rentabilité Totale
RVA Rentabilité par rapport à la Valeur Assurée
SL Single Linkage
UAR Union Algérienne des sociétés d’Assurance et de Réassurance
VRC Variance Ratio Criterion
x
Introduction générale

L’optimisation de la rentabilité des clients en portefeuille représente un enjeu pri-


mordial pour les compagnies d’assurance. Elle nécessite une évaluation rigoureuse de la
performance financière des clients existants, ainsi qu’une identification précise des seg-
ments les plus rentables afin de prendre des décisions stratégiques éclairées. Dans ce
contexte, notre mémoire se concentre sur le thème spécifique du scoring de rentabilité des
clients en portefeuille, en mettant l’accent sur son application au domaine des compagnies
d’assurance.
La problématique centrale de ce mémoire concerne l’identification des méthodes de
classification les plus appropriées pour évaluer la rentabilité des clients en portefeuille. En
effet, les compagnies d’assurance doivent faire face à des volumes de données massifs et
complexes, nécessitant des outils et des techniques adaptés pour analyser et classifier ces
données de manière efficace. Ainsi, la question principale de cette étude est la suivante :
Quelles sont les méthodes de classification les plus adaptées pour le scoring de rentabilité
des clients en portefeuille dans le contexte des compagnies d’assurance ?
Pour répondre à cette question, plusieurs questions secondaires seront explorées :

• Quelles sont les méthodes de classification les plus couramment utilisées dans le
domaine du scoring de rentabilité des clients en portefeuille ?
Hypothèse : Les méthodes de classification couramment utilisées sont les méthodes
de classification automatisées .

• Quels sont les critères et les variables les plus pertinents pour évaluer la rentabilité
des clients en portefeuille ?
Hypothèse : Le critère et variable les plus pertinents sont la rentabilité totale car
elle procure une visibilité plus profonde sur le comportement d’un client dans le

1
Liste des abréviations

portefeuille .

• Peut on avoir une classification de bonne qualité en appliquant des méthodes de


classification non-supervisé ? Hypothèse : Les indices de Dunn, de silhouette et de
Calinski-Harabasz sont les plus appropriés pour évaluer la qualité de la classification
non-supervisé des clients en portefeuille.

Ce mémoire est structuré en plusieurs chapitres :


Le premier chapitre présente les généralités sur les assurances en mettant l’accent sur
les mécanismes techniques de gestion des risques , le contrat d’assurance ainsi que les
outils financiers de gestion des risques et les formes d’assurance.
Le deuxième chapitre détaille le marché des assurances y compris l’historique des
assurances en Algerie , les acteurs du marché ainsi que les indicateurs du marché et les
canaux de commercialisation.
Le troisième chapitre présente les techniques d’assurance tel que la loi des grands
nombre , l’asymétrie d’information , l’anti-selection et l’aléa moral.
Le quatrième chapitre met en évidence les techniques de classification en se basant
sur l’apprentissage automatique et en introduisant les algorithmes de classification ainsi
que les mesures de qualité de classification comme il introduit la détection des fraude en
assurance tout en utilisant des algorithme d’apprentissage automatisé.
Enfin , le cinquième chapitre présente l’organisme d’accueil du stage du projet de
fin d’étude ainsi que la base de données fournie par cette organisme , il montre aussi
l’application des algorithmes des classification sur la base d’apprentissage ainsi que les
indices pour la qualité de la classification.

2
Chapitre 1
Généralités sur les assurances

Introduction
Dans ce chapitre nous aborderons le mécanisme technique de gestion des risques liés
aux assurances et cela en définissant les assurances , réassurance et les coassurance et en
mettant l’accent sur le contrat d’assurance .Nous mentionnerons aussi les outils financiers
en introduisant la prime , la limite d’indemnisation et la franchise en assurance , au final
nous métrerons en avant les grandes formes et catégories d’assurance .

1.1 Mécanismes techniques de gestion des risques

1.1.1 Les assurances

a Définition

D’une manière générale , l’assurance peut être définie comme : une réunion de per-
sonnes qui , craignant l’arrivée d’un événement dommageable pour elles , se cotisent à
ceux qui seront frappés par cet événement, de faire face à ses conséquences .
D’une manière plus précise , selon M.Joseph Hémard : l’assurance est une opération par
laquelle une partie , l’assuré, se fait promettre, moyennant une rémunération (la prime
), pour lui ou pour un tiers, en cas de réalisation d’un risque , une prestation par une
autre partie, l’assureur qui, prenant en charge un ensemble de risques , les compense
conformément aux lois de la statistique .

3
Chapitre 1 Généralités sur les assurances

b l’inversion du cycle de production

l’assurance se caractérise par ce qu’il est convenu de dénommer l’inversion du cycle de


production.
Contrairement aux autre branches d’activités, l’assureur perçoit nécessairement sa rému-
nération (la cotisation ) avant d’effectuer son hypothétique prestation , en cas de sinistre.
Habituellement, hors assurance, l’entreprise livre le produit ou assume la prestation avant
que le prix lui en soit acquitté.
Cette inversion engendre des avantages de trésorerie. A contrario , elle présente un grave
inconvénient : au moment où l’assureur fixe la cotisation, c’est à dire lorsqu’il effectue la
production d’assurance, il ne connaît pas son coût réel.
L’inversion du cycle de production implique aussi la nécessité, pour les assureurs, de
constituer des provisions afin d’être en mesure de faire face à leurs engagements futurs.

1.1.2 Les réassurances

a Définition

La réassurance est une opération financière dans laquelle une compagnie d’assurance,
appelée réassureur, indemnisera une autre compagnie d’assurance, appelée cédante, contre
tout ou partie de la perte qu’elle pourrait subir en vertu de sa police ou polices d’assurance.
En d’autres termes, la réassurance est une assurance pour les assureurs.
Le mécanisme de la réassurance permet à l’assureur cédant de transférer une partie de son
risque d’assurance à une tierce partie, le réassureur. Ainsi, l’assureur cédant peut limiter
son exposition à une perte financière importante, en répartissant le risque sur plusieurs
entités.
L’objectif fondamental de la réassurance est de répartir le risque afin qu’aucune entité
ne se retrouve aux prises avec une charge financière dépassant sa capacité de paiement.
La réassurance est donc un outil de transfert de risque qui permet de lisser les bilans et
résultats financiers des cédantes d’une année sur l’autre.
En plus de son rôle de transfert de risque, le réassureur joue également un rôle de conseil
auprès de ses clients. Il peut aider à l’analyse des risques, à la tarification des polices
d’assurance, à la gestion des sinistres et à la création de nouveaux produits d’assurance.

4
Chapitre 1 Généralités sur les assurances

b Les bases et fondamentaux de la réassurance

Afin de mieux comprendre le mécanisme de la réassurance, on définit les différents


niveaux de l’assurance et les relations entre ces niveaux (figue 1.1) :

Figure 1.1 – Les différents niveaux de l’assurance

Source : Association des professionnels de la réassurance en France, 2021

— Relation assuré-assureur : un assuré peut avoir différents contrats avec différents


assureurs. Il est fréquent d’avoir recours à la coassurance dans le cas des grands
risques.

— Relation assureur-réassureur : Souvent, pour les contrats de réassurance im-


pliquant des engagements significatifs, il est fréquent de les céder à un consortium
de réassureurs. L’un des membres du groupe est généralement chargé de la rédac-
tion du contrat et de toutes les négociations nécessaires. Cette approche collective
permet de mieux répartir le risque et d’optimiser les résultats pour tous les acteurs
impliqués.

— Relation réassureur-rétrocessionnaire : Les rétrocessionnaires sont également


des compagnies de réassurance. Dans certains cas, un réassureur peut transférer une
partie ou l’ensemble de son risque à un autre réassureur, appelé le rétrocessionnaire.
Ce processus est connu sous le nom de rétrocession. Dans la pratique,il est possible de
parler de Coréassurance ou de pool de réassurance en cas de cession proportionnelle.

5
Chapitre 1 Généralités sur les assurances

1.1.3 Les Coassurances

La coassurance est une opération d’assurance qui implique plusieurs assureurs, chacun
prenant une partie du risque assuré. Cette pratique est utilisée pour partager le risque
entre plusieurs compagnies d’assurance, plutôt que de l’assumer seul. La coassurance peut
être utilisée pour réduire les pertes financières pour chaque assureur individuel, ainsi que
pour augmenter la capacité globale d’assurance.
Dans la coassurance, chaque assureur impliqué dans l’opération est appelé « coassureur ».
Ils partagent la prime d’assurance et les pertes correspondantes selon les termes et condi-
tions spécifiés dans leur accord de coassurance. En général, les coassureurs travaillent
ensemble pour fixer les termes de l’opération d’assurance, déterminer les primes et les
limites de couverture.

1.2 Contrats d’assurance

1.2.1 Les conditions générales

Les conditions générales d’un contrat d’assurance sont un ensemble de clauses et de


termes standardisés qui définissent les règles générales régissant la couverture d’assurance
et les droits et obligations des parties impliquées. Elles sont fournies par la compagnie
d’assurance et constituent une partie essentielle du contrat d’assurance. Bien que les
conditions générales puissent varier d’une compagnie à l’autre et d’un type d’assurance à
un autre. Il existe donc des éléments couramment inclus :

— Objet du contrat : Les conditions générales commencent généralement par une


clause décrivant l’objet du contrat d’assurance, c’est-à-dire la nature de la couverture
d’assurance offerte.

— Définitions des termes : Les conditions générales incluent souvent une section
avec des définitions des termes utilisés tout au long du contrat. Cela garantit une
compréhension commune des mots et des expressions utilisés dans le document.

— Étendue de la couverture : Les conditions générales décrivent les risques couverts


par l’assurance, ainsi que les limites et les exclusions de la couverture. Elles indiquent
également les garanties spécifiques offertes par l’assureur.

6
Chapitre 1 Généralités sur les assurances

— Obligations de l’assureur : Les conditions générales précisent les responsabilités


et les obligations de l’assureur, telles que l’obligation de fournir la couverture d’as-
surance demandée, de traiter les réclamations de manière équitable et rapide, et de
respecter les lois et réglementations applicables.

— Obligations de l’assuré : Les conditions générales énoncent les obligations de


l’assuré, notamment l’obligation de payer les primes à temps, de fournir des infor-
mations exactes et complètes lors de la souscription et de signaler les changements
importants pendant la période de couverture.

— Modalités de paiement : Les conditions générales indiquent les modalités de


paiement des primes, y compris les échéances, les méthodes de paiement acceptées
et les conséquences du non-paiement.

— Durée du contrat : Les conditions générales précisent la durée du contrat d’assu-


rance, y compris la date de début et de fin de la couverture, ainsi que les modalités
de renouvellement du contrat.

— Règlement des sinistres : Les conditions générales énoncent les procédures à


suivre en cas de sinistre, y compris les délais de déclaration, les documents à fournir
et les modalités de règlement des réclamations.

[1]

1.2.2 Les conditions particulières

Les conditions particulières d’un contrat d’assurance sont les termes spécifiques qui
s’appliquent à un contrat individuel, adaptés aux besoins et aux caractéristiques parti-
culières de l’assuré et de la situation assurée. Les éléments couramment inclus dans les
conditions particulières d’un contrat d’assurance sont :

— Identité de l’assuré : Les conditions particulières indiquent l’identité de l’assuré,


y compris son nom, son adresse et toute autre information pertinente pour son
identification.

— Biens assurés : Les conditions particulières spécifient les biens couverts par l’as-
surance, tels qu’un véhicule, une propriété ou des biens personnels. Elles peuvent
inclure des détails spécifiques tels que la marque, le modèle, le numéro d’immatri-
culation, l’adresse de la propriété, etc.

7
Chapitre 1 Généralités sur les assurances

— Montants de garantie : Les conditions particulières précisent les montants de ga-


rantie convenus pour chaque type de risque assuré. Par exemple, pour une assurance
habitation, les montants de garantie peuvent inclure la valeur de reconstruction de
la propriété, la responsabilité civile, les biens personnels, etc.

— Franchises : Les conditions particulières indiquent les montants des franchises qui
s’appliquent en cas de sinistre. La franchise est le montant que l’assuré doit supporter
avant que l’assureur ne commence à indemniser les pertes.

— Période de couverture : Les conditions particulières précisent la période pendant


laquelle le contrat d’assurance est en vigueur. Cela peut inclure une date de début
et une date de fin spécifiques, ou une indication de la durée de couverture.

— Modifications du contrat : Les conditions particulières permettent d’apporter des


modifications spécifiques au contrat d’assurance, telles que l’ajout ou la suppression
de couvertures, l’ajustement des montants de garantie ou des franchises, etc. Ces
modifications sont généralement convenues entre l’assuré et l’assureur.

— Prime d’assurance : Les conditions particulières indiquent le montant de la prime


d’assurance spécifique au contrat individuel. La prime est le montant payé par l’as-
suré à l’assureur en échange de la couverture d’assurance.

— Conditions spéciales : Les conditions particulières peuvent inclure des clauses


spéciales ou des dispositions spécifiques convenues entre l’assuré et l’assureur pour
répondre à des besoins particuliers. Cela peut inclure des extensions de couverture,
des limitations spécifiques, des conditions particulières pour des situations spéci-
fiques, etc.

[1]

1.2.3 Les parties prenantes au contrat

a L’assuré

L’assuré est une personne physique ou morale qui souscrit une police d’assurance au-
près d’une compagnie d’assurance. Il peut également être désigné comme le titulaire de
l’assurance ou le bénéficiaire de la police d’assurance. En contrepartie du paiement d’une
prime d’assurance, l’assuré est couvert contre un risque ou une perte qui pourrait survenir
dans l’avenir, en fonction des termes et des conditions énoncés dans la police d’assurance.

8
Chapitre 1 Généralités sur les assurances

En d’autres termes, l’assuré est celui qui transfère le risque à l’assureur. Il peut être un
particulier, une entreprise ou une organisation qui cherche à se protéger contre une perte
ou un dommage financier. Par exemple, une personne peut souscrire une assurance auto-
mobile pour se protéger contre les pertes financières liées à un accident de voiture, tandis
qu’une entreprise peut souscrire une assurance responsabilité civile pour se protéger contre
les réclamations de tiers en cas de dommages causés à des tiers.
Relation assuré-assureur : Il est important de noter que l’assuré a des obligations envers
l’assureur, telles que la déclaration exacte et honnête des informations lors de la sous-
cription de la police d’assurance. L’assuré doit également payer les primes d’assurance à
temps pour éviter l’annulation de la police. En cas de sinistre, l’assuré est tenu de signaler
le dommage à l’assureur dans les délais impartis et de fournir les preuves nécessaires pour
pouvoir bénéficier de l’indemnisation prévue dans la police d’assurance.

b L’assureur

L’assureur est une entité commerciale spécialisée, telle qu’une compagnie d’assurance,
qui offre des contrats d’assurance pour protéger les individus, les entreprises et les biens
contre certains risques spécifiés.
Son rôle principal consiste à assumer les risques financiers associés à des événements
incertains. En échange du paiement de primes par les assurés, l’assureur s’engage à fournir
une compensation financière en cas de réalisation des risques couverts. Pour ce faire, il
évalue les risques présentés par les assurés, détermine les termes et les conditions de
la couverture, fixe les primes correspondantes et gère les réclamations lorsqu’un sinistre
survient.
L’assureur joue également un rôle crucial dans la gestion des risques, en utilisant des
méthodes d’évaluation des risques, des modèles actuariels et des outils statistiques pour
déterminer la tarification adéquate et la gestion globale des risques. Il doit se conformer
aux réglementations et aux normes régissant l’industrie de l’assurance pour assurer la
stabilité du marché et protéger les intérêts des assurés. [2]

c Le bénéficiaire

Le bénéficiaire en assurance est la personne ou l’entité désignée pour recevoir les pres-
tations d’un contrat d’assurance en cas de réalisation du risque couvert par le contrat.

9
Chapitre 1 Généralités sur les assurances

Le bénéficiaire peut être désigné par l’assuré au moment de la souscription du contrat d’as-
surance ou à tout moment ultérieur. Il peut s’agir d’une personne physique, telle qu’un
membre de la famille, un ami, un partenaire commercial, ou d’une personne morale, telle
qu’une entreprise ou une organisation.
Dans certains cas, le bénéficiaire désigné peut être le propre souscripteur du contrat d’as-
surance, notamment pour les contrats d’assurance-vie. Le bénéficiaire peut également être
une personne différente du souscripteur, selon les termes du contrat et les préférences de
l’assuré.
En cas de sinistre couvert par le contrat d’assurance, le bénéficiaire a droit aux presta-
tions prévues par le contrat. Ces prestations peuvent prendre différentes formes, telles
qu’un versement en espèces, la prise en charge de frais médicaux ou de réparation, ou le
remboursement de pertes financières.
Les Caractéristiques du bénéficiaire en assurance :

— Désignation : Le bénéficiaire est désigné par le souscripteur de l’assurance et doit


être mentionné dans le contrat d’assurance.

— Rôle : Le bénéficiaire a droit aux prestations prévues dans le contrat d’assurance


si l’événement assuré se produit. Les prestations peuvent être versées sous forme de
capital, de rente ou d’autres avantages.

— Modification : Le souscripteur a la possibilité de changer le bénéficiaire à tout


moment, à moins que la désignation ne soit irrévocable.

— Décès : Si le bénéficiaire meurt avant que le risque couvert ne survienne, le bénéfice


de l’assurance revient à la succession du souscripteur ou à un autre bénéficiaire
désigné.

— Droit de renonciation : Dans certains cas, le bénéficiaire peut renoncer à ses


droits sur les prestations d’assurance au profit d’une autre personne ou de l’assureur
lui-même.

d Le souscripteur

Un souscripteur en assurance est un professionnel qui travaille pour une compagnie


d’assurance ou une agence d’assurance et qui est chargé d’évaluer les risques associés à une
demande d’assurance et de décider si la compagnie d’assurance doit accepter ou refuser

10
Chapitre 1 Généralités sur les assurances

la demande. Le souscripteur est également responsable de déterminer les primes d’assu-


rance, c’est-à-dire le montant que le demandeur d’assurance devra payer pour obtenir une
couverture d’assurance.
Le rôle du souscripteur est crucial dans le processus d’assurance, car il doit évaluer les
risques de manière précise et déterminer le montant approprié de prime pour chaque
demande d’assurance. Pour ce faire, le souscripteur analyse les données du demandeur,
notamment son historique de sinistres, son âge, sa profession et d’autres facteurs perti-
nents qui peuvent affecter le risque d’assurance. Le souscripteur doit également connaître
les politiques de la compagnie d’assurance en matière de risques et de tarification.
En plus d’évaluer les demandes d’assurance, les souscripteurs sont également responsables
de surveiller les portefeuilles de clients existants et de proposer des modifications ou des
ajustements de couverture si nécessaire. Ils peuvent également travailler en étroite colla-
boration avec les agents d’assurance pour fournir des conseils sur les produits d’assurance
et les politiques de la compagnie d’assurance.

1.3 Outils financiers de gestion des risques

1.3.1 La prime

a Définition

La prime en assurance est le montant d’argent que l’assuré doit payer à la compa-
gnie d’assurance en échange de la couverture d’assurance. C’est le coût de l’assurance
pour l’assuré. La prime est généralement payée périodiquement, qu’il s’agisse d’une prime
mensuelle, trimestrielle, semestrielle ou annuelle, en fonction des modalités du contrat
d’assurance.
La prime d’assurance est calculée en tenant compte de plusieurs facteurs, tels que le risque
d’assurance, la probabilité de sinistre, l’étendue de la couverture, les caractéristiques per-
sonnelles de l’assuré et les caractéristiques de l’objet assuré. La compagnie d’assurance
utilise des méthodes actuarielles pour évaluer ces facteurs et déterminer la prime appro-
priée pour chaque assuré. [3]

11
Chapitre 1 Généralités sur les assurances

b Calcul du montant de la prime

Les principaux éléments qui influent sur le montant de la prime d’assurance sont les
suivants :

1. Le niveau de risque : Plus le risque d’un événement couvert est élevé, plus la
prime d’assurance sera élevée. Par exemple, une prime d’assurance automobile sera
plus élevée pour un conducteur novice et inexpérimenté par rapport à un conducteur
expérimenté.

2. La valeur de l’objet assuré : Si la valeur de l’objet assuré est élevée, la prime


d’assurance sera également plus élevée pour garantir une indemnisation adéquate
en cas de sinistre.

3. L’étendue de la couverture : Si l’assuré choisit une couverture plus étendue, la


prime d’assurance sera plus élevée pour refléter la valeur de la protection supplé-
mentaire.

4. L’historique de sinistres : Si l’assuré a un historique de sinistres antérieurs, la


prime d’assurance peut être plus élevée pour tenir compte de ce risque plus élevé.

5. Les caractéristiques personnelles de l’assuré : Des facteurs tels que l’âge, le


sexe, l’état de santé, l’occupation professionnelle, etc., peuvent influencer le montant
de la prime d’assurance.

1.3.2 La limite d’indemnisation en assurance

La limite d’indemnisation en assurance désigne le montant maximum que l’assureur


est disposé à payer en cas de sinistre ou de dommage couvert par le contrat d’assurance.
Elle est également connue sous le nom de limite de responsabilité ou de somme assurée.
La limite d’indemnisation peut varier en fonction du type de couverture et des conditions
spécifiques du contrat d’assurance. Par exemple, dans une assurance automobile, il peut
y avoir une limite distincte pour les dommages matériels, les blessures corporelles ou le
vol. De même, dans une assurance habitation, il peut y avoir des limites spécifiques pour
les dommages causés par le feu, les catastrophes naturelles ou le vol.
l est important de noter que la limite d’indemnisation peut être définie pour chaque
sinistre ou pour une période donnée, comme une année d’assurance. Une fois que la limite

12
Chapitre 1 Généralités sur les assurances

est atteinte, l’assureur n’a plus l’obligation de verser d’indemnisation, à moins qu’une
nouvelle période d’assurance ne débute. [4]

a Les formes de limite d’indemnisation en assurance

Il existe plusieurs forme de limite d’indemnisation dont on va citer les plus pertinentes :

— La limite d’indemnisation en valeur : cette forme fait référence à un mon-


tant maximal préétabli jusqu’au-quel l’assureur est disposé à indemniser en cas de
sinistre. Cette limite représente le montant maximum que l’assureur paiera pour
couvrir les pertes ou les dépenses admissibles liées à un événement assuré.
Lorsqu’une limite d’indemnisation en valeur est appliquée, cela signifie que l’assu-
reur ne versera pas d’indemnisation au-delà de ce montant fixé, même si les pertes
ou les dépenses dépassent ce seuil. Ainsi, si les dommages ou les réclamations at-
teignent ou dépassent la limite d’indemnisation en valeur, l’assuré devra assumer
les coûts supplémentaires.

— La limite d’indemnisation en pourcentage : cette forme fait référence à une


limite spécifiée en pourcentage du montant assuré ou de la valeur de la réclama-
tion. Elle détermine le pourcentage maximal jusqu’au-quel l’assureur est disposé à
indemniser en cas de sinistre.

Lorsqu’une limite d’indemnisation en pourcentage est appliquée, cela signifie que


l’assureur ne couvrira qu’un certain pourcentage des pertes ou des dépenses admis-
sibles, tandis que le reste sera à la charge de l’assuré. Cette limite peut s’appliquer à
différents types d’assurances, tels que l’assurance habitation, l’assurance automobile,
l’assurance santé, etc.

— La limite d’indemnisation de distance : Malgré que cette forme n’est pas


une forme de limite d’indemnisation couramment utilisée en assurance.Cependant,
il est possible qu’une compagnie d’assurance spécifique ait mis en place une forme
particulière de limite d’indemnisation de distance pour des situations spécifiques ou
dans certains contrats d’assurance. Cette limite pourrait être basée sur la distance
géographique parcourue ou sur une distance spécifique à partir d’un lieu de référence.

13
Chapitre 1 Généralités sur les assurances

— La limite d’indemnisation temporelle : Elle fait référence à une limite de temps


spécifiée pendant laquelle une indemnisation peut être réclamée pour un sinistre
donné. Elle définit la période pendant laquelle l’assuré peut soumettre une demande
d’indemnisation à l’assureur après la survenance de l’événement assuré.

Cette limite d’indemnisation temporelle peut varier en fonction du type d’assurance


et des conditions spécifiques du contrat. Elle peut être définie en termes de jours,
de semaines, de mois ou d’années à compter de la date de l’événement. Au-delà
de cette limite temporelle, l’assuré perd généralement son droit à demander une
indemnisation.

1.3.3 La franchise

La franchise en assurance est un terme utilisé pour désigner la part des dommages ou
des pertes qui reste à la charge de l’assuré. Il s’agit d’un montant fixe ou d’un pourcentage
de la réclamation, déterminé au préalable dans le contrat d’assurance.
La franchise sert à plusieurs fins en assurance. Tout d’abord, elle permet de réduire les
coûts pour les assureurs en les exemptant de traiter les petits sinistres. Elle incite égale-
ment les assurés à faire preuve de prudence et à éviter les réclamations mineures.

a Les formes de franchise en assurance

En assurance, il existe plusieurs formes spécifiques de franchises utilisées pour diffé-


rents types de contrats d’assurance :

— La franchise fixe : La franchise fixe en assurance est une forme de franchise où


un montant prédéterminé est établi. Si un sinistre se produit et que les pertes sont
inférieures à ce montant, l’assuré doit supporter la totalité de ces pertes. L’assureur
n’intervient que lorsque les pertes dépassent le montant de la franchise fixe, indem-
nisant alors le montant excédentaire.
La franchise fixe peut être utilisée dans divers types d’assurances, tels que l’assu-
rance habitation, l’assurance automobile, l’assurance santé, etc. Le montant de la
franchise fixe est généralement convenu lors de la souscription du contrat et est spé-

14
Chapitre 1 Généralités sur les assurances

cifié dans les conditions particulières.

— La franchise en pourcentage : Cette franchise est exprimée en pourcentage du


montant assuré ou de la valeur de la réclamation. Contrairement aux franchises fixes
où un montant spécifique est déterminé, la franchise en pourcentage impose à l’as-
suré de payer un pourcentage spécifié des pertes avant que l’assureur n’intervienne
pour indemniser le reste. La franchise en pourcentage est souvent utilisée dans les
contrats d’assurance habitation, où le pourcentage peut être appliqué à la valeur de
la propriété assurée ou au montant des dommages réclamés.

— La franchise de distance : La franchise de distance est une forme spécifique de


franchise qui est généralement utilisée dans les contrats d’assurance automobile. Elle
est également appelée "franchise kilométrique". La franchise de distance est basée
sur la distance parcourue par le véhicule assuré
La franchise de distance fonctionne de la manière suivante : si un sinistre se produit,
l’assuré doit payer une franchise basée sur le nombre de kilomètres parcourus depuis
le dernier sinistre ou depuis le début de la période d’assurance.

— La franchise temporelle : La franchise temporelle en assurance est une forme


de franchise qui impose un délai pendant lequel les pertes ne sont pas couvertes
après la survenance d’un événement assuré. Cela signifie que l’assuré doit attendre
un laps de temps spécifié avant de pouvoir faire une réclamation et recevoir une
indemnisation.
La franchise temporelle peut varier en fonction du type d’assurance et des conditions
spécifiques du contrat.

1.4 Formes d’assurance


La figure ci-dessous illustre les différentes formes d’assurance, notamment l’assurance
vie et ses branches spécifiques, ainsi que l’assurance non-vie et ses branches associées.
Cette représentation visuelle permet de visualiser de manière concise et claire la structure
globale de l’industrie de l’assurance, en mettant en évidence les différentes catégories et
sous-catégories d’assurance.

15
Chapitre 1 Généralités sur les assurances

Figure 1.2 – Branches d’assurance

Source : https: // fr. wikipedia. org/ wiki/ Assurance_ automobile

1.4.1 L’assurance conventionnelle

a Définition

L’assurance conventionnelle, également connue sous le nom d’assurance classique ou


assurance traditionnelle, est un système d’assurance basé sur des principes commerciaux
et juridiques standard.

b Branches d’assurance conventionnelle

Dans le cadre de l’assurance conventionnelle, il existe deux principales branches :

1. Assurance Vie :L’assurance vie est une branche de l’assurance conventionnelle qui
vise à fournir une protection financière en cas de décès, de survie ou d’événements
liés à la vie de l’assuré. Les caractéristiques de l’assurance vie comprennent :

— Assurance décès

— Assurance en cas de vie

— Assurance mixte

— Assurance épargne-retraite

16
Chapitre 1 Généralités sur les assurances

2. Assurance Non-Vie : L’assurance non-vie, également appelée assurance dom-


mages ou assurance générale, concerne la couverture des biens matériels et des res-
ponsabilités. Les principaux types d’assurance non-vie comprennent :

— Assurance automobile

— Assurance habitation

— Assurance responsabilité civile

— Assurance santé

— Assurance voyage

1.4.2 L’assurance takaful

a Définition

L’assurance Takaful est un concept d’assurance basé sur les principes de la finance
islamique. Il vise à fournir une protection financière aux individus et aux entreprises tout
en respectant les principes éthiques de l’islam.
En Algérie, l’assurance Takaful est également présente et proposée par certaines com-
pagnies d’assurance conformes aux exigences de la Charia. Elle permet aux clients de
bénéficier de solutions d’assurance conformes aux principes de l’islam, en évitant les pra-
tiques interdites, telles que les intérêts, la spéculation et l’incertitude (gharar).
Les opérations d’assurance Takaful en Algérie sont supervisées par l’Autorité de Contrôle
des Assurances et de la Prévoyance Sociale (ACAPS), qui veille à ce que les compagnies
d’assurance Takaful se conforment aux principes de la Charia et respectent les normes
réglementaires en vigueur.
[5]

17
Chapitre 1 Généralités sur les assurances

Figure 1.3 – Mécanisme de l’assurance Takaful

Source : AMEF Consulting : Africe & Middel East finance

b Les branches de l’assurance Takaful

En Algérie, les branches vie et non-vie de l’assurance Takaful sont proposées par
certaines compagnies d’assurance conformes aux principes de la finance islamique, il existe
deux principales branches :

— Assurance Takaful Vie :L’assurance Takaful Vie offre une protection financière
pour les risques liés à la vie et à la santé de l’assuré. Les produits d’assurance Takaful
Vie en Algérie peuvent inclure :

— Assurance vie

— Assurance santé

— Assurance Takaful Non-vie : L’assurance Takaful Non-vie, également connue


sous le nom d’assurance générale ou d’assurance dommages, couvre les risques ma-
tériels et financiers autres que ceux liés à la vie et à la santé. Les produits d’assurance
Takaful Non-vie en Algérie peuvent inclure :

— Assurance automobile

— Assurance habitation

— Assurance responsabilité civile

18
Chapitre 1 Généralités sur les assurances

1.4.3 La titrisation assurantielle

a Définition

La titrisation en assurance est une technique financière qui consiste à transférer des
risques d’assurance à des investisseurs opérant sur les marchés financiers internationaux.
Ce transfert est effectué en regroupant puis en transformant ces risques en titres financiers
négociables sur les marchés des capitaux.
Le principe général de la titrisation en assurance inclut donc deux éléments :

— a transformation des liquidités générées par les souscriptions en titres financiers


négociables sur les places financières.

— le transfert des risques souscrits vers les marchés financiers par le biais d’échanges
de titres Le premier élément relève de l’engineering financière, construction banale
dans le monde bancaire.

Le second aspect consiste à dévier le placement des risques souscrits par l’assureur du
marché traditionnel de la réassurance étroit, où peu d’acteurs opèrent, vers les principales
places financières mondiales où des millions d’intervenants opèrent chaque jour.

Ceci est possible grâce à l’achat et à la vente de produits financiers dont les cash flows
(paiements des intérêts et du principal) sont liés à la couverture d’assurance à laquelle ils
sont rattachés. La réalisation ou non de l’élément assuré va influer sur les résultats des
titres sous-jacents.
[6]

19
Chapitre 1 Généralités sur les assurances

Figure 1.4 – Schéma d’une structure type de titrisation en assurance

Source : Atlas Magazine , Schéma d’une structure type de titrisation en assurance

b Les branches de la titrisation en assurance

— La titrisation dans l’assurance vie : Dans la branche vie, la titrisation est


principalement un outil de gestion des fonds propres. En effet, en transférant une
partie de leurs risques à des investisseurs, les assureurs vie améliorent la rentabilité
de leurs fonds propres.

La titrisation renforce l’efficacité du capital car les besoins en fonds propres de-
viennent moins importants. Les obligations sont un des outils de titrisation qui
permettent la monétisation d’actifs incorporels tels que les frais d’acquisition repor-
tés et la valeur actualisée des bénéfices, ce qui constitue une source de financement.
De plus la titrisation permet aux compagnies d’assurance vie de transférer les risques
de nature catastrophique (mortalité extrême due à une pandémie par exemple) vers
les marchés financiers : c’est notamment le cas des obligations vie. Enfin, certaines
opérations de titrisation dégagent des avantages fiscaux pour l’assureur.

— La titrisation dans l’assurance non vie : En assurance non vie, le marché


étant volatile, les assureurs possèdent un vaste arsenal d’outils permettant d’opérer
un transfert de risque en plus de ceux permettant la gestion des fonds propres.
Parmi ces outils on peut noter : les obligations catastrophes naturelles, les swaps

20
Chapitre 1 Généralités sur les assurances

catastrophes naturelles, les garanties selon pertes du secteur, le capital conditionnel,


les side cars ou encore les options cotées en bourse. [6]

Conclusion
Durant ce chapitre nous avons tout d’abord évoqué le mécanisme technique de gestion
des risque et cela en définissant les assurances , les réassurances et les coassurances tout en
mettant l’accent sur le contrat d’assurance . Nous avons aussi introduit les outils financiers
tel que les prime , la limite d’indemnisation et la franchise en assurance .Au final nous
avons mentionné les grandes formes et catégories d’assurance.
Le chapitre qui suit, présentera le marché des assurances, abordera l’historique , les acteurs
les indicateurs et les canaux de communication du marché d’assurance en Algérie .

21
Chapitre 2
Le marché des assurances

Introduction
Dans ce chapitre, nous allons présenter la réalité du marché des assurances en Algérie
et ces évolutions les plus importantes , ainsi que les décisions et lois les plus pertinentes
prises par l’État pour développer ce secteur tout au long de son histoire. nous allons aussi
identifier ces acteurs . Nous allons analyser les indicateurs financiers les plus essentiels
du marché de l’assurance ainsi que les secteurs qui le composent, afin de fournir une
vision générale du marché de l’assurance en Algérie. Nous allons aborder les canaux de
distribution agréés par les compagnies d’assurance et leur rôle dans ce marché.

2.1 Historique des assurances en Algérie


Le secteur des assurances a été introduit en Algérie par l’administration coloniale
avec la création de la Compagnie Coopérative d’assurances en 1861. Le monopole du
secteur des assurances en Algérie s’est poursuivi par les compagnies françaises même après
l’indépendance, le monopole des opérations d’assurance étant exercé par 270 entreprises
françaises dont 30 % implantées à l’étranger.
L’évolution de l’assurance en algérie après l’indépendance s’est effectuée progressivement
à travers les étapes suivantes :

22
Chapitre 2 Le marché des assurances

2.1.1 L’étape no 1 : 1962-1966

Après l’indépendance de l’Algérie en 1962, l’activité d’assurance automobile était régie


par la loi française du 27 février 1958 relative à l’obligation d’assurance automobile [7].
Cependant, les compagnies d’assurance étrangères, notamment françaises, dominaient lar-
gement le secteur de l’assurance en Algérie. Afin de garantir l’indépendance économique
et financière du pays, la Caisse Algérienne d’assurance et de Réassurance CAAR a été
créée par "la loi n° 63-197 du 8 juin 1963". Cette loi rendait obligatoire la réassurance
pour toutes les opérations d’assurance effectuées en Algérie et obligeait toutes les sociétés
d’assurance à céder une part de 10% des primes encaissées à la CAAR [8]. Par ailleurs,
la Société Algérienne d’assurance SAA a été créée par arrêté le 12 décembre 1963,
avec 39% de son capital détenu par les Égyptiens [8].

2.1.2 L’étape no 2 : Monopole de l’État

Cette période est divisée en trois phases, caractérisées par le monopole de l’état sur le
secteur des assurances et la nationalisation d’entreprises étrangères.

a L’étape no 1 1966-1975

Entre 1966 et 1974, l’Algérie a connu un vide juridique en matière de législation des
assurances , qui n’a pris fin qu’avec la promulgation de "l’ordonnance 74-15 du 30
janvier 1974 " relative à l’assurance automobile. Cette ordonnance a instauré le prin-
cipe d’indemnisation des accidents corporels pour toute victime [7], même si elle n’est pas
considérée comme un tiers vis-à-vis de la personne civilement responsable de l’accident.
Pendant cette période, l’état a institué un monopole sur l’exploitation de toutes les opé-
rations d’assurance, réservant leur exploitation aux entreprises nationales. Parmi les 17
sociétés qui existaient en 1966, seule la SAA a été nationalisée, tandis que toutes les autres
entreprises ont été liquidées, sauf celles qui ont la forme mutuelle. L’ancienne législation
française régissant l’assurance a été abrogée par "l’ordonnance 72-29 du 5 juillet
1973 dès le 5 juillet 1975" [8].

23
Chapitre 2 Le marché des assurances

b L’étape no 2 : 1975-1988 :

Pendant cette période, "la loi 88-31 de 1988" a été promulguée pour préciser les
modalités d’indemnisation et réviser le barème en vigueur en maintenant le principe d’in-
demnisation existant. Bien que la protection des victimes des accidents de la route reste
une préoccupation majeure des pouvoirs publics, une réflexion est engagée pour adapter
le dispositif aux nouvelles données économiques du pays.
Les pouvoirs publics ont également décidé d’organiser le marché de l’assurance en répar-
tissant la couverture des risques entre les quatre sociétés existantes.

— CAAR : pour l’assurance des risques industriels , des risques de construction et


des risques transports dévolues ensuite à la CAAT, à compter de 1986 .

— SAA : pour l’assurance automobile, les risques de masse et les assurances de per-
sonnes .

— CNMA : assurance automobile et assurance risques agricoles.

— MAATEC : assurance automobile (uniquement)[7].

c L’étape no 3 étape 1988-1995 :

Elle se caractérise par :


- Les transformations ou les réformes apportées au secteur des assurances en 1988 en-
traînent la concurrence entre les compagnies existantes : la SAA, CAAR, CAAT, MAA-
TEC et la CNMA.
- La promulgation de "la loi 90-10 "relative à la monnaie et au crédit constitue un
dispositif législatif pour la transition vers l’économie de marché et a permis au secteur des
assurances de connaître un nouvel essor[8].

2.1.3 L’étape no 3 : 1995 à nos jours :

cette période a été connue par la promulgation de la l’ordonnance n°95-07 et modifiée


en 2006 par "La loi n° 06-04 du 20 février 2006", qui venue pour supprimer le
monopole du secteur des assurances par l’état et permettre au secteur privé d’investir
dans ce secteur.

24
Chapitre 2 Le marché des assurances

a 1995-2006

En 1989, la parution des textes relatifs à l’autonomie des compagnies publiques en-
traîne la dé-spécialisation. A compter de cette date, les sociétés ont pu souscrire dans
toutes les branches Cependant, ce n’est qu’après l’adoption de "l’ordonnance n°95-
07 du 25 janvier 1995", supprime le monopole de l’État sur le marché d’assurance et
permet la création de sociétés privées algériennes, Cette ordonnance a aussi entraîné la
réduction de nombre de garanties dont la souscription est obligatoire. C’est ainsi que la
liste ne comprend plus principalement que les assurances de responsabilité civile visant à
garantir le paiement des réparations des victimes d’accidents.[8]
au début de septembre 2004. Une assurance obligatoire (Cat-Nat) contre les catastrophes
naturelles a été mise en application , conformément "l’ordonnance présidentielle n°
03-12 du 26 octobre 2003 " adoptée le 7 octobre 2003 par l’assemblée populaire na-
tionale (APN) et le 14 du même mois par le sénat, ainsi que par le conseil des ministres.[8]

b étape 2006 à nos jours :

"La loi n° 06-04 du 20 février 2006" a apporté des modifications à "l’ordonnance


n° 95-07 du 25 janvier 1995", qui régule le marché de l’assurance en Algérie.

2.2 Acteurs de marché

2.2.1 Les campagnes d’assurance et réassurance

Le marché algérien de l’assurance est divisé en deux segments principaux : le secteur


public représente la majorité du marché avec 60% du revenu total des primes et 40 %
pour le secteur privée.
Selon UAR l’union algérienne des société d’assurance et réassurance Il existe actuellement
(13) compagnies d’assurance endommage (non-vie) en algérie et (8) compagnies de vie.

a Compagnies d’assurance de dommages :

D’après les données de CNA en 2021, les trois compagnies publiques d’assurance dom-
mages (SAA, CAAT, CAAR,CASH) règnent en maîtres sur le marché de l’assurance

25
Chapitre 2 Le marché des assurances

en Algérie, avec une part de marché de 48,67%. Les autres acteurs présents sur le marché,
qu’ils soient de petites compagnies privées et publiques, détiennent la part restante.

— Société publiques :

1. Compagnie Algérienne d’Assurance et de Réassurance.

2. Compagnie Algérienne des Assurances.

3. Compagnie d’Assurance des Hydrocarbures.

4. Société Nationale d’Assurance.

— Société privée :

1. L’Algérienne des Assurances.

2. ALLIANCE Assurances .

3. Compagnie Internationale d’Assurance et de Réassurance.

4. Société Générale Assurance Méditerranéenne.

5. SALAMA Assurances Algérie.

6. TRUST Algeria d’assurance et de réassurance.

— Sociétés mutuelles :

1. Caisse Nationale de Mutualité Agricole.

2. Mutuelle d’Assurance Algérienne des Travailleurs de l’Éducation et de la Culture.

— Société mixte :

1. AXA Assurance Algérie Dommage-SPA.

b Compagnies d’assurance vie :

Le marché de l’assurance-vie en Algérie connaît une croissance rapide, les primes de-
vant atteindre 2 milliards de dollars d’ici 2026 selon le ministère des finances. Le marché
est dominé par cinq sociétés représentant plus de 70% de part de marché.

— Société publiques :

1. CAARAMA Assurance.

2. TAAMINE LIFE ALGERIE SPA.

26
Chapitre 2 Le marché des assurances

— Société privée :
1. Macir Vie-SPA.

2. CARDIF El-Djazair.
— Sociétés mutuelles :
1. Le Mutualiste.
— Société mixte :
1. Algerian Gulf Life Insurance Company-SPA.

2. AXA Algérie Assurances Vie-SPA.

3. Société d’Assurance de Prévoyance et de Santé-SPA.

c Compagnie de réassurance :

La Compagnie Centrale de Réassurance (CCR), est la seule compagnie habilitée à


pratiquer la réassurance en Algérie.

d Compagnies d’assurance spécialisées :

Selon UAR Il existe deux (02) compagnies d’assurances habilitées à pratiquer les as-
surances dites Spécialisées, qui assurent le « Crédit ».

Ces deux compagnies sont :

1. Compagnie Algérienne d’Assurance et de Garantie des Exportations.

2. Société de Garantie du Crédit Immobilier.

2.2.2 Le courtier d’assurance et réassurance

Selon CNA il existe plusieur courtier d’assurance et de réassurance :

a Courtier d’assurance :

Le réseau de courtage au titre de l’exercice 2021 est composé de 48 courtiers agréés,


dont 41 en activité. Au titre de l’exercice 2021, le chiffre d’affaires réalisé par ce type d’in-
termédiaires a connu une évolution importante de l’ordre de 43% par rapport à l’exercice
précédent. Passant de 9 milliards de DZD en 2020 à 12,9 milliards de DZD en 2021, sa
part dans la production globale du marché des assurances est de 9%.

27
Chapitre 2 Le marché des assurances

b Courtier de réassurance :

Selon UAR les seuls courtiers en réassurance en algérie sont des courtiers étrangers.
Liste des courtiers de réassurance étrangers, autorisés à exercer sur le marché algérien des
assurances, par arrêté du 3 novembre 2022 (JORA n°84 du 14 décembre 2022) :

1. Gallagher – London.

2. Marsh Management Services (MENA) Limited – Dubaï(UAE).

3. Brokerage Business Development Consulting(BBDC) – France.

4. France Assurance Consultants (F.A.C) – France.

2.2.3 Les autres acteurs

— Conseil National des assurance ( CNA ) :– est un organe institué par le Mi-
nistère des Finances et présidé par le Ministre chargé des finances.[9]

— Union algérienne des sociétés d’Assurance et de Réassurance (UAR) :


est une association professionnelle créée en 1995, constituée et régie conformément
aux dispositions de la loi, notamment l’Ordonnance n° 95/07 du 25 Janvier 1995
relative aux assurances Le siège de l’Union est fixé à Alger, elle exerce son activité
sur l’ensemble du territoire national. L’(UAR) réunit en son sein les compagnies
d’assurance et de réassurance ainsi que les succursales de sociétés étrangères prati-
quant l’assurance et la réassurance.[9]

— Bureau Spécialisé de Tarification en assurance ( BST ) : est un bureau créé


sous l’égide de Ministère des Finances par Décret exécutif N° 09-257 du 20 Chaâ-
bane 1430 correspondant au 11 août 2009 fixant la composition,l’organisation et le
fonctionnement de l’organe spécialisé en matière de tarification des assurances.[9]

— Commission de supervision des assurances (CSA) : est responsable du contrôle


de l’État sur l’activité d’assurance et de réassurance. Elle agit en tant qu’adminis-
tration de contrôle par le biais de la structure chargée des assurances au ministère
des Finances.[9]

28
Chapitre 2 Le marché des assurances

— Direction Générale du Trésor ( DGT ) : sous l’égide de Ministère des Finances


est chargée d’initier tout texte législatif ou réglementaire relevant de son champ de
compétence, de contribuer à la définition des politiques de gestion d’intervention du
Trésor dans le secteur économique et d’en assurer le suivi et l’évaluation.[9]

— Direction des Assurances ( DASS ) : du Ministère des Finances fait partie


intégrante de la Direction générale du Trésor (DGT) qui est composée, en sus de
la DASS, de quatre autres directions (Dette publique, Trésorerie de l’Etat, Parti-
cipations, et Banques publiques et Marché Financier).[9]

— Bureau Unifié Automobile Algérien (BUA) :est une Société par actions (SPA),
pourvue d’un capital social de 13 millions de dinars. Il a pour principale mission la
délivrance de la carte orange, et ce, pour la prise en charge des sinistres automobiles
causés ou subis par des algériens au cours de leurs déplacements dans les pays arabes
signataires de la Convention collective des sociétés d’assurance de 1975.[9]

2.3 Indicateurs du marché des assurances

2.3.1 L’évolution du chiffre d’affaires

Le chiffre d’affaires (ou CA) d’une entreprise est la somme des ventes de biens ou de
services facturées sur un exercice.

a Chiffre d’affaires du marché mondial

L’assurance est un mastodonte de l’économie. Trois places fortes dominent le marché


mondial : le marché asiatique, le marché européen et le marché nord-américain. A eux
seuls, en 2018, ce trio concentre 94,6% du secteur de l’assurance. Le marché asiatique
est en tête avec 32,4%, suivi de près par le marché européen et ses 31,6% de part des
cotisations mondiales d’assurance. Enfin, le marché nord-américain ferme la marche de ce
podium avec 30,6%

29
Chapitre 2 Le marché des assurances

Table 2.1 – Marché mondial de l’assurance : évolution du chiffre d’affaires par continent
(2010-2020) en millions USD

Source : Atlas Magazine

b L’analyse globale de marché des assurances en Algérie

D’après les notes conjoncture trimestrielles de (cna) Le marché algérien des assu-
rances a enregistré un chiffre d’affaires de 162,6 milliards de dinars algériens en 2022,
en hausse de 5,9% par rapport à l’année précédente. Cette croissance a été tirée par les
bonnes performances du segment de l’assurance dommages qui a vu son chiffre d’affaires
progresser de 4.7% à 139,6 milliards DZD. L’assurance de personnes s’est également bien
comportée, avec une progression de 19.7% de son chiffre d’affaires à 16,1 milliards DZD.

30
Chapitre 2 Le marché des assurances

Figure 2.1 – Évolution du chiffre d’affaires (2004-2022)

Source : https: // cna. dz/ notes-de-conjoncture/

avec une augmentation de 5,9 % en 2022 et de 5,7 % en 2021 Le marché algérien de


l’assurance s’est beaucoup amélioré et s’est de nouveau redressé après l’impact négatif de
la pandémie de COVID-19 en 2020.
Le marché algérien de l’assurance est dominé par l’assurance dommages, qui représente
85,9 % de part de marché. L’assurance de personnes est le deuxième segment le plus im-
portant, avec une part de 9,9 %. Le takaful, une forme d’assurance islamique, représente
une part de marché faible mais croissante, avec 4,2%. Les acceptations internationales, qui
correspondent aux primes de réassurance cédées à des réassureurs étrangers, représentent
également 4,2 % de part de marché[10].

31
Chapitre 2 Le marché des assurances

Figure 2.2 – Structure du marché

Source : https: // cna. dz/ notes-de-conjoncture/

Figure 2.3 – production du marché des assurances au 31/12/2022

Source : https: // cna. dz/ notes-de-conjoncture/

32
Chapitre 2 Le marché des assurances

2.3.2 L’analyse des différents acteurs du marché d’assurance

a Assurance Dommages

La production de l’assurance dommages en 2022 a augmenté de 4,7%, atteignant un


chiffre d’affaires de 139,6 milliards de DZD. Cette augmentation est principalement tirée
par la croissance des branches automobile et IRD, qui représentent 91% de la production
totale[10].

Figure 2.4 – Structure du marché de l’assurance dommages

Source : https: // cna. dz/ notes-de-conjoncture/

— AUTOMOBILE :L’assurance automobile, représentant 46,5 % de la production


totale de l’assurance dommages, a réalisé un chiffre d’affaires de près de 65 mil-
liards de DZD au 31 décembre 2022. Cela correspond à une augmentation de 4,7 %
par rapport à la même période de l’année précédente. Cette hausse est principale-
ment due à la croissance des risques non obligatoires, qui représentent 80,7 % du
portefeuille de la branche et progressent de 7,7% [10].

— INCENDIE ET RISQUES DIVERS :La production cumulée en assurance "In-


cendie et risques divers" a atteint, à fin 2022, un chiffre d’affaires de 62,2 milliards
DZD, contre 59,9 milliards DZD en 2021, ce qui représente une hausse de 3.7%. Cette

33
Chapitre 2 Le marché des assurances

augmentation est principalement attribuable à la croissance de la sous-branche "In-


cendie, explosion et éléments naturels", qui représente 78,7% de la production totale
de la branche[10].

— AGRICOLE :La branche agricole du secteur des assurances en Algérie a enregistré


une valeur ajoutée de 250,9 millions de DZD en 2022, représentant une croissance
de 11,6 % par rapport à 2021. Cette croissance a été stimulée par les trois sous-
branches suivantes : "Incendie et multirisque agricole", "Production végétale" et
"Production animale". La sous-branche "Multirisques incendie et agricole" affiche
le taux de croissance le plus élevé, atteignant 28,4 %. Ceci est attribué à la signature
de nouveaux contrats, grâce au programme d’importation de bétail lancé par l’état
en 2022. La sous-branche "Production végétale" a connu une progression de 12 %,
tandis que la sous-branche "Production animale" a enregistré une hausse de 21,3 %
[10].

— TRANSPORT :La branche transport de l’industrie algérienne des assurances a


enregistré un chiffre d’affaires de 7,2 milliards de DZD en 2022, soit une hausse de
8,2 % par rapport à 2021. Cette croissance a été soutenue par les sous-secteurs du
transport aérien et du transport maritime, qui ont progressé respectivement de 18,4
% et de 4,7 %. La croissance de la branche des transports est attribuable à la reprise
de l’activité dans les secteurs du transport aérien et maritime après la pandémie de
COVID-19. Cela a entraîné une augmentation de la demande d’assurance pour ces
activités[10].

— CRÉDIT :La branche crédit de l’industrie algérienne des assurances a affiché un


total de 2,8 milliards de DA de primes émises en 2022, soit une hausse de 11,2% par
rapport à 2021. Cette croissance a été tirée par les hausses du poste « Insolvabilité
générale » (+16,2%), des sous-branches « Crédit immobilier » 3,1% et « Crédit
export » 34,3%.[10]

b ASSURANCES DE PERSONNES :

Les sociétés d’assurances de personnes en Algérie ont réalisé un chiffre d’affaires de


16,17 milliards de DA au 31 décembre 2022 contre 13.5% milliards de DA, avec un hausse

34
Chapitre 2 Le marché des assurances

Table 2.2 – Production des assurances de dommages au 31/12/2022 par branche

Source : https: // cna. dz/ notes-de-conjoncture/

de 19,7% par rapport à la même période de l’année précédente. Cette croissance a été ti-
rée par des développements positifs dans toutes les branches de l’assurance de personnes,
l’assurance-vie décès étant la branche la plus importante, avec 45.1% du chiffre d’affaires
total de marche.

Figure 2.5 – Structure des assurances de personnes au 31/12/2022 par branche

Source : https: // cna. dz/ notes-de-conjoncture/

— ACCIDENT :La branche Accident totalise un chiffre d’affaires de 1,8 milliard de


DZD, au terme de l’exercice 2022, contre 1,6 milliard de DZD, à fin 2021, soit une
progression de 9,7%. Cette évolution est générée, essentiellement, par le renouvelle-

35
Chapitre 2 Le marché des assurances

ment des affaires en portefeuille, ainsi qu’à l’acquisition de nouvelles affaires, pour
la majorité des sociétés d’assurance.

— MALADIE :Le diagnostic de la branche « Maladie » fait ressortir une croissance


de 14,1% de son chiffre d’affaires, passant de 55,6 millions de DA, au 31/12/2021, à
63,4 millions de DA, à fin 2022. Cela représente une production additionnelle d’un
montant de 7,8 millions de DZD liée, principalement, au retour à la normale des
activités socioéconomiques (Post-Covid), ainsi qu’à l’augmentation des réalisations
du produit « Complémentaire Santé » qui affiche une évolution de 181% par rapport
à 2021. Le nombre de contrats souscrits se rapportant audit produit passe de 153,
en 2021, à 738, à fin 2022.

— ASSISTANCE :La plus importante évolution est marquée par la branche « As-
sistance », avec un taux de plus de 109% et un chiffre d’affaires de 1,7 milliard de
DA, à fin 2022, contre seulement 836,3 millions de DA pour la même période de
l’exercice 2021. Cette remarquable évolution est, notamment, due au retour à la
normale et à la reprise des voyages, en particulier, ce qui a causé l’augmentation
de la demande en garantie « Assistance Voyage », qu’elle soit souscrite en formule
individuelle (+119,3%) ou collective (+87%)[10].

— VIE-DÉCÈS :Affectée par le renouvellement des affaires en portefeuille et l’ac-


quisition de nouvelles affaires, la branche «Vie-Décès» marque une évolution d’un
montant de 431,8 millions de DZD, soit un bond de 7,1%, passant ainsi de près de
6 milliards de DZD, au 31/12/2021, à 6,5 milliards de DZD, au terme de l’exercice
2022.

— PRÉVOYANCE COLLECTIVE :La branche « Prévoyance collective » enre-


gistre, en 2022, un chiffre d’affaires de plus de 6 milliards de DZD, contre 4,9 mil-
liards de DZD, à fin 2021, soit une progression, en valeur, d’un montant de 1,1
milliard DZD. Néanmoins, le nombre de contrats souscrits est en baisse. Il passe de
8 335, en 2021, à 7 970, en 2022[10].

— CAPITALISATION :Avec une production de 286 000 DZD, réalisée en 2021,


la branche «Capitalisation» marque un repli de 100%, n’enregistrant ainsi aucune
production, au terme de l’exercice 2022[10].

36
Chapitre 2 Le marché des assurances

Table 2.3 – Production des assurances de personnes au 31/12/2022 par branche

Source : https: // cna. dz/ notes-de-conjoncture/

c Assurance takaful

Le marché de l’assurance Takaful en Algérie est encore au stade initial de son dévelop-
pement. La première société Takaful, Salama Assurances Algérie, a été fondée en 2008.
Cependant, ce n’est qu’en 2022 que la première société publique Takaful, GAM Takaful,
a été lancée. Cela s’est produit après la publication du décret exécutif no. 21-81 par le
gouvernement algérien en 2021, qui établit les conditions et les modalités pour l’exercice
de l’assurance Takaful.

Table 2.4 – Production des assurances de TAKAFUL au 31/12/2022

Source : https: // cna. dz/ notes-de-conjoncture/

En 2022, la valeur totale du marché Takaful en Algérie était estimée à 48,4 millions de
dollars, enregistrant une augmentation significative de 136,4 % par rapport à la production
totale de l’année 2020. Toutefois, le marché Takaful en Algérie demeure relativement petit,
représentant seulement 0,0002 % du marché global de l’assurance.
Le chiffre d’affaires de l’assurance Takaful est généré uniquement par le guichet d’une seule
compagnie opérant en tant que "Takaful Général". Les autres sociétés agréées et fenêtres

37
Chapitre 2 Le marché des assurances

n’ont pas encore commencé à commercialiser leurs produits à ce jour, à l’exception de


quelques rares contrats inauguraux.

Figure 2.6 – Structure TAKAFUL générale au 31/12/2022

Source : https: // cna. dz/ notes-de-conjoncture/

2.3.3 L’analyse des différents acteurs du marché de réassurance

Le marché de la réassurance en Algérie représente environ 4,2 % du marché global de


l’assurance. Bien qu’il soit relativement petit, ce marché connaît une croissance constante.
En 2022, sa valeur s’élevait à environ 6,8 milliards de DZD, enregistrant une hausse
de 2,3 % par rapport à 2021. Cette évolution est principalement due aux branches «
Automobile », « Accident et R&D », « Ingénierie » et « Transport », qui affichent des
taux de croissance respectifs de 68,8 %, 36,9 %, 30 % et 10,7 %. Ces résultats sont
attribuables à la souscription de nouveaux contrats au cours de l’exercice 2022, ainsi qu’à
la dévaluation relative du Dinar sur le marché international et à sa parité avec les devises
fortes. Il convient de noter que la Compagnie Centrale de Réassurance (CCR) détient
actuellement le monopole à 100 % sur le marché de la réassurance en Algérie.

38
Chapitre 2 Le marché des assurances

Table 2.5 – État de production de la réassurance au 31/12/2022

Source : https: // cna. dz/ notes-de-conjoncture/

2.4 Canaux de commercialisation


La réalité de l’assurance algérienne dans un pays caractérisé par l’absence d’une culture
d’assurance a créé un problème majeur dans le secteur de l’assurance et conduit le secteur
à prendre du retard sur l’économie générale du pays. En 2022, le taux de pénétration de
l’assurance en Algérie n’était que de 0,7 % du PIB national. Un taux marginal et loin de
la moyenne mondiale qui tourne autour de 6 % et même africaine de 3 %, des chiffres qui
renseignent sur la vulnérabilité du secteur des assurances en Algérie. Le gouvernement
algérien est conscient de ces défis et prend des mesures pour y faire face. Ces dernières
années, le gouvernement a promulgué de nouvelles lois réglementaires pour élargir les
canaux de commercialisation, donnant aux compagnies d’assurance plus d’élan pour com-
mercialiser et vendre leurs produits, notamment l’Autorisation de l’activité des banques
d’assurance en 2006.[11]

Les canaux de commercialisation dans le domaine de l’assurance en algérie peuvent


être classés en trois grandes catégories : les canaux de distribution directs, les canaux de
distribution des Intermédiaires et les Bancassurances :

39
Chapitre 2 Le marché des assurances

Table 2.6 – Structure du réseau de distribution (En Million) au 31/12/2021

Source : UAR/ Activité des Assurances en Algérie 2021

2.4.1 Les canaux traditionnels

L’ Agence directe :avec 1204 agences et un montant 90 493 (millions) DZD en 2021
les agence directe représente 41% des canaux de distribution utilisés par les compagnies
d’assurance dans le pays . En l’absence de canaux de distribution numériques les agences
directes c’est le seul canal de distribution direct utilisé dans le pays, les services d’assurance
où les services d’assurance sont distribués directement par les agences de la compagnie
d’assurance sur l’ensemble du territoire du pays. Les employés de ces agences sont des
employés directs de la compagnie d’assurance et travaillent pour atteindre ses intérêts[11].

2.4.2 Les canaux des intermédiaires

Les canaux des Intermédiaires (AGA+COURTIERS) : au titre de l’exercice


2021 est composé de 48 (41 courtiers agréés en activité) et 1759 . Au titre de l’exercice
2021, le chiffre d’affaires réalisé par ce type d’intermédiaires a connu une évolution im-
portante de l’ordre de 11% par rapport à l’exercice précédent. Passant de 43.2 milliards
de DZD en 2020 à 48 milliards de DZD en 2021, sa part dans la production globale du
marché des assurances est de 9% [11].

40
Chapitre 2 Le marché des assurances

2.4.3 Les approches modernes

a La bancassurance :

En 2021, les bancassurances affiche une augmentation de 12%. La production ayant


transité par le réseau bancaire passe de 5,5 milliards DZD en 2020 à 6,2 milliards DZD
en 2021[11].

Table 2.7 – Activité de la bancassurance par société

Source : UAR/ Activité des Assurances en Algérie 2021

b La numérisation :

Il est à souligner qu’en dépit du développement significatif des moyens technologiques,


les prestations fournies par le secteur des assurances restent peu numérisées , en effet
seul 45,83% de ces compagnies proposent à leur client des devis ou des déclarations en
ligne de plus et les dispositifs de paiement électronique (TPE) sont très peu utilisés au
niveau des agences Cette incapacité des compagnies d’assurance à exploiter pleinement la
numérisation a entraîné de nombreuses conséquences négatives. Tout d’abord, elles n’ont
pas pu profiter des avantages de la numérisation tels que l’acquisition de nouveaux clients,
la réduction des coûts opérationnels et la recherche de solutions innovantes pour relever
les nouveaux défis du marché. En conséquence, le marché de l’assurance a connu un échec
et n’a pas réussi à suivre le rythme de développement de l’économie

41
Chapitre 2 Le marché des assurances

Conclusion
En conclusion de ce chapitre, nous avons présenté la réalité du marché des assurances
en Algérie, en mettant en évidence les évolutions les plus importantes qu’il a connues au fil
du temps, ainsi que les décisions et lois clés prises par l’état pour son développement. Nous
avons identifié les acteurs de ce marché et analysé les indicateurs financiers significatifs,
offrant ainsi une vision globale du secteur de l’assurance en Algérie. De plus, nous avons
examiné les canaux de distribution agréés par les compagnies d’assurance et leur rôle dans
ce marché.
Ce chapitre nous a permis de mieux comprendre le paysage de l’assurance en Algérie,
son évolution historique et les facteurs clés qui ont contribué à son développement. Il
a également jeté les bases nécessaires pour approfondir notre étude dans les chapitres
suivants.
Dans le prochain chapitre, nous allons nous concentrer sur les techniques des assurances
en abordant quelques lois qui influent sur ce marché.

42
Chapitre 3
Techniques d’assurance

Introduction
Dans ce chapitre, nous explorerons diverses techniques d’assurance qui jouent un rôle
essentiel dans la compréhension et la gestion des risques. Nous examinerons en détail
quatre sections clés de ce chapitre : la loi des grands nombres qui joue un rôle crucial dans le
domaine de l’assurance, car elle permet de prédire de manière statistique le comportement
des risques sur une large population d’assurés.La deuxième section se concentrera sur
l’asymétrie de l’information en assurance. Dans la troisième section, nous aborderons le
concept de sélection adverse. Enfin, nous analyserons l’aléa moral.

3.1 La loi des grands nombres


L’assurance repose sur les contrats aléatoires. Il n’est alors pas surprenant de voir surgir
des théorèmes de probabilité lorsque l’on tente de quantifier le résultat d’un assureur. Car
si ce dernier espère faire un bénéfice, il n’est pas impossible (ou improbable) qu’il fasse
une perte. Mais ce sont essentiellement les théorèmes dit « asymptotiques » ou « limites
» qui sont importants en assurance .
En effet, si l’assureur ne vendait qu’un contrat, l’opération se réduirait à un pari : si le
risque n’advient pas, l’assureur réalise un petit bénéfice (en encaissant la prime), mais,
dans le cas contraire, il pourrait faire une perte (très) importante. Ce pari pourrait alors
aisément causer la faillite de l’assureur. Afin de l’éviter, il va essayer de réunir un grand
nombre d’assurés, et réaliser une opération de mutualisation :

43
Chapitre 3 Techniques d’assurance

les primes reçues de tous vont permettre d’indemniser les plus malchanceux.

3.1.1 Le principe de la mutualisation et le transfert des risques

L’assurance est une invention merveilleuse dont la clé de voûte est la mutualisation
des risques. Nous courons tous des risques au quotidien mais nous ne savons pas s’ils vont
se matérialiser ni quand ils vont se matérialiser. C’est l’aléa, le contrat d’assurance est un
contrat que l’on dit "aléatoire" car on ne sait pas au départ si le sinistre va se produire
ou non. L’avenir est imprévisible et nous ne maîtrisons pas tous nos comportements et
actions. Par ailleurs, un accident peut être provoqué par des tiers. Même le conducteur le
plus prudent peut avoir un accident s’il croise un chauffard.
En revanche, il est possible de mesurer le risque en calculant le nombre de sinistres qui ont
lieu pour une population donnée par l’utilisation des statistiques. Les assureurs réalisent
ce travail de mesure : pour 1 000 automobilistes, combien ont un accident chaque année ?
Pour 1 000 locataires d’appartements, combien ont un dégât des eaux chaque année ? Ces
mesures permettent de calculer les probabilités de sinistre et donc le montant des primes
à provisionner pour pouvoir les couvrir.
Ce sont des provisions qu’on appelle mathématiques, car elles sont estimées grâce à des
formules de probabilités issues des constatations empiriques des assureurs.
Le principe de mutualisation des risques est au cœur de l’activité d’assurance. Il consiste
à répartir le coût de la réalisation d’un sinistre entre les membres d’un groupe soumis
potentiellement au même risque. Chaque année, les assureurs vont collecter les primes de
tous les assurés et les utiliser pour dédommager ceux qui n’auront pas eu de chance et
qui auront subi un sinistre.
Les primes d’assurance conducteur de tous les conducteurs seront utilisées pour dédom-
mager les accidentés, les primes de multirisque habitation de tous les locataires pour ceux
qui auront subi un dégât des eaux. "On ne sait pas où tombe le risque et qui aura un
sinistre, donc tout le monde cotise et seuls les sinistrés sont indemnisés." [12]

— Homogénéité des risques :


La réunion d’un grand nombre de risques aux même chances en ce qui est de réaliser,
ce qui donne une gamme de meilleurs conditions pour la compensation entre les
risques qui puisse se faire d’où l’importance des risques homogènes ;

— La dispersion des risques :

44
Chapitre 3 Techniques d’assurance

pour la survie de la mutualité, l’assureur doit veiller à ce qu’un seul sinistre puisse
toucher à la fois un très grand nombre d’assurés et qu’il ne se réalise pas en même
temps, sinon la compensation ne pourrait avoir lieu ;

— La division des risques :


Il convient d’éviter qu’un risque beaucoup plus important que la moyenne des risques
assurés ne mette en péril l’équilibre de la mutualité, mais aussi les cumuls de risques
individuellement proche de la moyenne des risques assurés sont susceptible d’être
sinistré à l’occasion d’un même événement.

Figure 3.1 – La mutualisation en assurance

Source : Environnement de l’assurance-openclassrooms

La mutualisation des risques nous aide à comprendre le fonctionnement primaire de


l’assurance. Cependant, il ne nous informe pas sur la manière de calculer un risque. Pour
cela il faut s’intéresser aux lois de la statistique. En effet, la particularité de l’assurance
est la souscription du contrat alors que son coût définitif n’est pas connu. Il est donc
impossible pour l’assureur de connaître, au moment de la vente du contrat, quel sera son
prix de revient. Celui-ci dépendra du nombre de sinistres à indemniser et du montant
de ces sinistres. La cotisation doit être ainsi fixée par anticipation, en constituant des
provisions techniques et en s’appuyant sur des données statistiques. On appelle cela «

45
Chapitre 3 Techniques d’assurance

l’inversion du cycle de production ».


Pour apprécier les risques, les assureurs se basent donc sur la « loi des grands nombres ».
C’est un mathématicien suisse du nom de Jacques Bernouilli qui énonça cette loi au
XVIIIème siècle. Selon cette loi, plus le nombre d’expériences augmente, plus les résultats
s’approchent de la probabilité théorique. L’exemple le plus connu pour illustrer cette loi
est le jeu de pile ou face. Théoriquement, il y a une chance sur deux de tomber sur pile.
C’est ce qu’on appelle la probabilité théorique. Pour autant, il n’est pas impossible qu’en
jouant 1 000 fois d’affilée, de tomber 1 000 fois sur pile. En faisant l’expérience, on constate
qu’on obtient environ 50 % de pile et 50 % de face, soit la probabilité théorique.
C’est donc sur cette loi que repose l’appréciation des risques en assurance. L’assureur
utilise des méthodes mathématiques pour sélectionner des risques acceptables et calculer
le montant des cotisations. La personne chargée de ces calculs s’appelle l’actuaire. Sa
fonction primordiale fait de lui un personnage clé de l’entreprise d’assurance.

3.1.2 Comprendre la loi des grands nombres dans l’assurance

Dans le secteur de l’assurance, la loi des grands nombres produit son axiome. Plus le
nombre d’unités d’exposition (assurés) augmente, plus la probabilité que la perte réelle
par unité d’exposition soit égale à la perte attendue par unité d’exposition est élevée. En
langage économique, on peut dire que la production d’assurance est rentable.
Concrètement, cela signifie qu’il est plus facile d’établir la prime correcte et donc de réduire
l’exposition au risque pour l’assureur, car un plus grand nombre de polices sont émises
dans une classe d’assurance donnée. Il est préférable pour une compagnie d’assurance
d’émettre 500 polices d’assurance incendie plutôt que 150, en supposant une distribution
de probabilité stable et indépendante pour l’exposition aux pertes.
Pour voir les choses autrement, supposons qu’une compagnie d’assurance maladie dé-
couvre que cinq personnes sur 150 subiront une blessure grave et coûteuse au cours d’une
année donnée. Si la compagnie n’assure que 10 ou 25 personnes, elle est confrontée à des
risques bien plus importants que si elle peut assurer les 150 personnes. La compagnie
peut être plus sûre que les 150 assurés paieront collectivement des primes suffisantes pour
couvrir les demandes d’indemnisation de cinq clients qui ont subi des blessures graves.[13]

Proposition 3.1. La loi des grands nombres


Soient X1 , X2 , ... une suite de v.a i.i.d avec E(Xi ) = µ et V ar(Xi ) = σ 2 pour i ∈ N+ . Soit

46
Chapitre 3 Techniques d’assurance

la v.a Wn = Xi , où E(Wn ) = µ et V ar(Wi ) = n1 σ 2 [14]


1
Pn
n i=1

Remarque 3.1. Interprétation en assurance


Soit un portefuille de n contrats dont les coûts sont i.i.d satisfaisant les conditions de la loi
des grands nombres. Selon le résultat de la 3.1, quand le nombre de contrats augmente, la
probabilité que le coût moyen Wn par contrat dévie d’une faible marge de son espérance
µ s’approche de 0.

Selon Arthur Charpentier [15] Elle s’énonce de la manière suivante :

Théorème 3.1. Considérons des variables indépendantes X1 , X2 , X3 , ..., Xn et de même


espérance E(Xi ) = µ finie, alors P (|Sn − nµ| > nϵ) → 0 où Sn = X1 + X2 + X3 + ... + Xn
lorsque n → ∞, quel que soit ϵ > 0.
Sn est alors la charge totale pour l’assureur et nµ est la prime acquise qu’il fait payer la
prime pure à ses assurés. De manière équivalente P (| Snn − µ| > ϵ) → 0

En termes plus assuranciels, la probabilité que la différence entre le coût moyen (par
contrat) et la prime pure soit plus petite que n’importe quelle constante arbitraire tend
vers 1 (événement certain) lors que la taille du portefeuille augmente à l’infini.
Formellement, ce théorème (sous cette forme) a été établi par Alexandre Khintchine en
1929 (des preuves beaucoup plus anciennes peuvent être trouvées, mais elles supposent en
plus que la variance est finie). Mais ce théorème n’a que peu d’intérêt réel en assurance.
La seule chose qu’il dise est que, lorsque l’on construit une table de mortalité, la fréquence
de décès à un âge donné doit être très proche de la probabilité de décéder à cet âge si
l’échantillon (ou population de référence) est suffisamment grand. Soit formellement :
P (| Dx
Nx
− qx | > ϵ) → 0 pour tout ϵ > 0 lorsque Nx → ∞
Ce théorème ne parle pas de risque (ou dans le langage de Markowitz de variance). L’idée
que la mutualisation réduit le risque ne vient pas de la loi des grands nombres, mais du
théorème central limite.

3.1.3 Le théorème central limite

Il est tout aussi ancien que la loi des grands nombres (on peut le faire remonter aux
travaux de De Moivre en 1733), même si le terme ne date que de 1920 (sous l’impulsion
de Georg Polya), car pour lui ce résultat limite jouait un rôle « central » dans la théorie
des probabilités. Adams (2009) et Fisher (2011) retracent l’histoire de ce théorème qui

47
Chapitre 3 Techniques d’assurance

n’apparaît chez de Moivre que sous une version très simplifiée. La version que l’on utilise
est plutôt celle proposée par Pierre-Simon de Laplace en 1812. On notera toutefois que
Paul Lévy, par exemple, a proposé des extensions intéressantes, en particulier pour les
très grands risques. Ce théorème s’énonce lui de la manière suivante :

Théorème 3.2. Considérons des variables indépendantes X1 , X2 , X3 , ..., Xn et de même


espérance E(Xi ) = µ et de même variance
Z β V ar(Xi ) = σ 2 finie,alors
√ 1 x2
P (Sn − nµ < σ n.β) → Φ(β) = 2π exp (− ) dx
−∞ 2
lorsque n → ∞, quel que soit β, où Φ est la fonction de répartition de la loi normale
centrée réduite.

C’est essentiellement à cause de ce théorème que la loi normale est autant présente
en statistique. Et l’interprétation en est à la fois simple et très importante : si les risques
sont indépendants, homogènes et de variance finie, alors la loi de la charge totale est
approximativement gaussienne. On peut alors en déduire toutes les mesures de risques
possibles (ce qui est fait dans la formule standard de Solvabilité II).

3.2 Asymétrie d’information

3.2.1 Définition

Les asymétries d’information désignent les situations où les acteurs d’un marché ne
disposent pas de la même information, qu’il s’agisse de la qualité du produit échangé,
des risques auxquels sont exposés les agents ou encore des comportements de chacune des
parties à une transaction.
L’asymétrie informationnelle est souvent présente dans les marchés économiques, entre
autres dans les assurances. Par exemple, dans le secteur de l’assurance automobile, en
l’absence d’une information publique abondante, il devient difficile pour un assureur de
calculer une prime adéquate pour l’assuré.
L’existence d’une relation de conflit d’intérêts entre l’assuré et l’assureur est la raison de la
présence de cette asymétrie informationnelle. D’un côté, l’objectif principal de l’assureur
est de maximiser son profit. Il va essayer de récolter le plus d’information possible sur son
client afin de lui charger une prime qui ne va pas générer des pertes futures. L’assuré, de
son côté, a pour objectif principal, en prenant une assurance automobile, de maximiser

48
Chapitre 3 Techniques d’assurance

l’utilité de sa richesse finale.


Cette relation dynamique incite les deux agents à cacher des informations qui peuvent
nuire aux objectifs de l’autre. Ainsi, cette asymétrie est présente des deux côtés. L’assureur
cherche à cacher des informations surtout concernant les clauses du contrat qui ne sont
pas toujours compréhensibles par le grand public. Quant à l’assuré, il cherche à cacher des
informations concernant son propre risque afin de bénéficier d’une prime sous-évaluée.
L’aléa moral et la sélection adverse sont deux conséquences de ces asymétries.

3.2.2 Les asymétries d’information et la théorie des jeux

La théorie des jeux permet de modéliser cette problématique du choix sous condition
des choix des autres entreprises. Mais, les asymétries d’information peuvent être repré-
sentées de plusieurs façons.
Soit il s’agit d’une asymétrie portant sur les résultats, c’est-à-dire sur les paiements du
jeu, ou sur les stratégies pouvant être envisagées. Le jeu sera alors joué en information
incomplète. C’est le jeu le plus délicat. Par exemple, c’est le cas d’une entreprise qui ne
sait pas où en est son concurrent en matière de recherche et développement et qui ne peut
donc pas anticiper ses décisions stratégiques.
Soit il s’agit d’une asymétrie portant sur la stratégie que jouera une entreprise parmi un
ensemble de stratégies bien identifié. Le jeu sera alors joué en information imparfaite.
C’est le cas d’une entreprise qui connaît parfaitement ses concurrents et qui peut antici-
per l’ensemble des stratégies possibles sans toutefois avoir l’information sur celle qui sera
précisément jouée.
Soit il s’agit d’une asymétrie portant sur les règles du jeu. Les deux joueurs n’ont pas
la même information sur le jeu. Ils n’en ont pas la même perception subjective. Ils joue-
ront alors deux jeux différents. Le jeu n’est ni en information complète, ni en information
imparfaite, il s’agit de deux jeux faiblement interconnectés. La rationalité des joueurs
est limitée. Leur information s’améliorera avec le mécanisme d’apprentissage. C’est le cas
des secteurs hautement technologiques où chaque entreprise travaille sur des technologies
complètement différentes censées pourtant rendre le même service.

49
Chapitre 3 Techniques d’assurance

3.2.3 Les effets de l’asymétrie d’information sur le système d’as-


surance.

Les sociétés d’assurance ne connaissent qu’imparfaitement les qualités intrinsèques


des individus qu’elles sont censées couvrir contre un certain nombre de risques. Si les
compagnies fixent une prime d’assurance, supposée couvrir un risque moyen s’appliquant
à l’ensemble de la population, elle s’expose à leur tour à un risque évident L’assurance
n’étant pas obligatoire, on peut raisonnablement penser que les « faibles risques », trou-
vant la prime moyenne trop élevée, ne vont pas s’assurer, privant la compagnie de recettes
attendues et nécessaires à son équilibre financier.
À l’inverse, les dépenses engagées par celles et ceux qui ont décidé de s’assurer (les « hauts
risques ») sont beaucoup plus importantes en volume et valeur, que celles retenues dans
l’hypothèse d’un risque moyen. Un tel choix conduit donc à la faillite du système. L’anti-
sélection s’est traduite par l’impossibilité d’assurer un grand nombre de clients potentiels
jugeant la prime d’assurance trop élevée par rapport au risque encouru.
L’asymétrie d’information privant la compagnie d’assurance de pouvoir proposer des
primes différentes selon les types de risques.
Une solution consiste alors à amener les assurés à révéler leurs risques en mettant en place
un système de franchise. L’entreprise d’assurance offre des contrats avec des primes d’as-
surance assez faibles, mais une franchise assez élevé et d’autres contrats avec, au contraire
des primes assez fortes et une faible franchise. Les agents à risque faible opteront ration-
nellement pour les premiers et les agents à risques élevés opteront pour les seconds. Le
problème de sélection adverse trouve dans cette situation une solution évidente : payer en
fonction du risque encouru. Cette discrimination, effectivement, permet de conserver les
bons clients. [16]

3.3 Anti sélection

3.3.1 Définition

La sélection adverse ou anti sélection est un phénomène statistique et économique qui


joue un rôle important notamment dans les domaines de l’assurance et de la gestion du
risque. La sélection adverse découle de l’incapacité de trouver des informations exhaustives

50
Chapitre 3 Techniques d’assurance

sur les caractéristiques de choix apparemment identiques. Dans le contexte de l’assurance,


c’est l’incapacité de l’assureur d’identifier parfaitement les caractéristiques de ses assurés.
Il y a sélection adverse lorsque des informations asymétriques sont exploitées.
La sélection adverse en assurance se réfère au phénomène où les personnes présentant
un risque plus élevé sont plus enclines à souscrire une assurance par rapport à celles
présentant un risque plus faible.
Supposons qu’il y ait une variable aléatoire R qui représente le niveau de risque réel
d’un individu, et une variable binaire A qui indique si l’individu choisit de souscrire une
assurance (A = 1) ou non (A = 0).
La probabilité d’adhérer à l’assurance, P(A), dépend du niveau de risque R. On peut
modéliser cette relation à l’aide d’une fonction de répartition conditionnelle, telle que :
P (A = 1|R) = F (R)
La fonction de répartition conditionnelle F(R) est une fonction croissante qui lie la
probabilité d’adhésion à l’assurance à un niveau de risque plus élevé.
Pour modéliser la sélection adverse, nous devons également tenir compte de la dis-
tribution de la variable aléatoire R. Supposons que la distribution marginale de R soit
donnée par la fonction de densité de probabilité f(R).
Maintenant, pour déterminer la prime d’assurance C, nous devons estimer l’espérance
conditionnelle du niveau de risque pour les assurés, E(R|A = 1) . Cela peut être formulé
comme suit :
R
E(R|A = 1) = R ∗ f (R|A = 1)dR
où f (R|A = 1) est la fonction de densité de probabilité conditionnelle de R sachant
que l’individu a souscrit une assurance.
La prime d’assurance peut être calculée en utilisant cette espérance conditionnelle :
C = E(R|A = 1)
Par exemple, supposons qu’il y ait deux groupes de personnes dans la population : ceux
qui fument et ne font pas d’exercice, et ceux qui ne fument pas et font de l’exercice. Il est
de notoriété publique que ceux qui fument et ne font pas d’exercice ont une espérance de
vie plus courte que ceux qui ne fument pas et choisissent de faire de l’exercice. Supposons
que deux personnes cherchent à souscrire une assurance vie, l’une qui fume et ne fait pas
d’exercice, et l’autre qui ne fume pas et fait de l’exercice quotidiennement. La compagnie
d’assurance, sans autre information, ne peut pas faire la différence entre la personne qui

51
Chapitre 3 Techniques d’assurance

fume et ne fait pas d’exercice et l’autre personne.


La compagnie d’assurance demande aux personnes de remplir des questionnaires pour
s’identifier. Cependant, la personne qui fume et qui ne fait pas d’exercice physique sait
qu’en répondant honnêtement, elle encourra des primes d’assurance plus élevées. Cet
individu décide de mentir et dit qu’il ne fume pas et fait de l’exercice quotidiennement.
Cela conduit à une sélection adverse.

3.3.2 Naissance de la notion d’anti-selection

La sélection adverse a été introduite par Akerlof (1970) dans son article où il a pris
comme exemple le marché des voitures d’occasion appelées aussi les « citrons ». Sur ce
marché, il n’y a que les vendeurs qui possèdent une information sur la qualité de leurs
voitures. Supposons qu’un vendeur de voitures de bonne qualité accepte le prix de 4000
$ pour la vendre et un vendeur de voitures de mauvaise qualité accepte le prix de 2000 $.
Les acheteurs, ayant pour seule information l’existence de voitures de mauvaise qualité
sur le marché offriront seulement 3125 $ pour l’achat d’une voiture.
Mais à ce prix, les vendeurs de voitures de bonne qualité refusent de vendre leurs voitures
et se retirent du marché.
Ainsi au final, le marché sera composé seulement des vendeurs de voitures de mauvaise
qualité qui seront vendues à un prix surévalué.
Par analogie à cet exemple, le problème de la sélection adverse dans le marché de l’as-
surance automobile se présenterait comme suit. Dans une situation de monopole, nous
avons un seul assureur et plusieurs assurés qui sont différents. Les assurés se décomposent
en deux types, les faibles risques et les hauts risques.
Toutefois, l’assureur ne peut pas distinguer le niveau de risque des deux types. Suppo-
sons aussi que l’assureur charge la même prime à tous les assurés. Par sécurité, l’assureur
charge la prime qui reflète le risque le plus élevé. Ainsi, cette prime reflétera un niveau
de risque situé entre les deux types d’assurés. En conséquence, les assurés à faible risque
décideront de ne pas s’assurer parce que la prime est surévaluée. Par contre, tous les as-
surés à haut risque achèteront l’assurance parce que la prime est sous-évaluée.
En fin de compte, l’assureur aura un portefeuille composé uniquement d’assurés à haut
risque et la prime qu’ils paieront ne reflétera pas leur vrai niveau de risque. Ainsi, l’assu-
reur n’est pas intéressé à charger cette prime.

52
Chapitre 3 Techniques d’assurance

D’après cette définition, la sélection adverse est une forme d’opportunisme pré-contractuel.
Les assurés connaissent déjà leurs risques avant l’écriture du contrat et vont choisir parmi
une multitude de contrats celui qui sera le plus avantageux pour eux.

3.3.3 Les mécanismes de réduction de la sélection adverse

Les solutions pour pallier ce type d’imperfection peuvent être envisagées à différents
niveaux : au sein des marchés eux-mêmes par la diffusion explicite de l’information pri-
vée,ou par la mise en place de contraintes d’auto sélection.[17]

1. La diffusion explicite de l’information privée


La partie qui détient les informations privées gagnerait parfois à ce qu’elles soient
connues. Par exemple, un ouvrier particulièrement productif aimerait en informer
ses employeurs potentiels. Le problème est qu’il n’est pas simple de divulguer de
telles informations et que les révélations ne sont pas toujours crédibles. Il faut donc
chercher à crédibiliser l’information. Se pose à nouveau la question de la réputation
de l’émetteur.
Les employeurs aimeraient aussi accéder à ce type d’information pour faire le meilleur
choix. Ils vont donc chercher à accéder aux informations privées. Dans certains cas,
il est possible d’accéder aux informations privées qui sont à l’origine de la sélection
adverse. Les tests d’aptitude et de compétence peuvent fournir des informations sur
les candidats à l’embauche ou l’analyse graphologique. . . Mais leur utilisation a des
coûts.

2. Les contraintes d’auto-sélection


En assurance, dans un contexte de sélection adverse, il est possible d’utiliser des
contrats dits révélateurs. L’asymétrie d’information est essentiellement défavorable
aux bons risques. Ceux-ci souhaiteraient pouvoir « signaler » leur qualité à l’assu-
reur pour pouvoir bénéficier d’une tarification plus basse. Mais ce signal doit être
crédible. Il faut que l’assureur soit certain que seul un vrai bon risque à intérêt à
se désigner comme tel. Laisser aux agents le choix entre divers contrats c’est leur
donner l’occasion d’envoyer un signal de ce type. Par exemple, certains contrats
spécifient que la couverture ne s’applique pas dans toutes les circonstances (par
exemple, le contrat d’assurance décès ne fonctionne pas pour les accidents consé-
cutifs à la pratique de sports dangereux). Ils incitent les assurés à se révéler en

53
Chapitre 3 Techniques d’assurance

proposant un contrat d’assurance standard (avec une franchise élevée) surtout des-
tiné aux bas risques et des contrats plus globaux ou sans franchise (et donc plus
chers) choisis par les individus concernés. Selon le choix de l’assuré, l’assureur peut
identifier son niveau de risque. L’assuré va s’auto-sélectionner. La crédibilité est ga-
rantie par la présence d’une franchise qu’un mauvais risque n’aurait aucun intérêt
à accepter même en échange d’une réduction tarifaire.
De même, les employeurs doivent distinguer les bons des mauvais travailleurs. Comme
ils ne peuvent pas, ils offrent le même salaire à tous (salaire reflétant la productivité
moyenne de tous les travailleurs de la population). Mais un tel salaire peut être trop
faible pour attirer les bons travailleurs : seuls les mauvais travailleurs accepteront.
Nous allons montrer qu’une politique salariale qui n’offre qu’une partie de salaire
en fixe, l’autre partie étant basée sur les pourboires reçus, permet-il à l’employeur
de distinguer les bons des mauvais serveurs. Seuls les bons serveurs resteront : les
salariés vont s’auto-sélectionner.

3.4 Aléa moral

3.4.1 Définition

L’aléa moral ou le moral hasard consiste dans le fait qu’une personne ou une entre-
prise assurée contre un risque peut se comporter de manière plus risquée que si elle était
totalement exposée au risque.
Soit R la variable aléatoire représentant le niveau de risque réel d’un assuré avant la sous-
cription de l’assurance (par exemple, le nombre d’accidents par an). Soit A la variable
aléatoire représentant le niveau de risque signalé par l’assuré lors de la souscription de
l’assurance.
Avant l’assurance, le comportement de l’assuré est gouverné par R. Cependant, une
fois assuré, l’assuré peut modifier son comportement en adoptant un comportement plus
risqué. Cela peut être représenté par une fonction F qui transforme la variable R en un
nouveau niveau de risque R′ .
R′ = F (R)
La fonction F peut être définie de différentes manières en fonction du comportement
spécifique des assurés. Par exemple, elle peut prendre la forme d’une fonction linéaire

54
Chapitre 3 Techniques d’assurance

ou non linéaire qui ajoute un facteur de risque supplémentaire en fonction du niveau de


couverture d’assurance.
La prime d’assurance C proposée par l’assureur doit donc tenir compte de ce risque
modifié. Une possible formulation mathématique pour représenter cette situation est la
suivante :
C = E(R′ ) + k
où E(R′ ) est l’espérance mathématique du niveau de risque modifié et k est un terme
supplémentaire pour couvrir les frais administratifs, les bénéfices de l’assureur.
Par exemple, supposons qu’un propriétaire n’ait pas d’assurance habitation ou d’assurance
inondation mais qu’il vive dans une zone inondable. Le propriétaire est très prudent et
souscrit à un système de sécurité domiciliaire qui aide à prévenir les cambriolages. En cas
de tempête, il se prépare aux inondations en dégageant les canalisations et en déplaçant
les meubles pour éviter les dégâts.
Cependant, le propriétaire en a assez de devoir toujours se soucier d’éventuels cambrio-
lages et de se préparer aux inondations, alors il souscrit une assurance habitation et
inondation. Une fois que sa maison est assurée, son comportement change. Il annule son
abonnement au système de sécurité de sa maison et il fait moins d’efforts pour se préparer
à d’éventuelles inondations. Il court désormais un plus grand risque de voir sa compagnie
d’assurance déposer une réclamation contre lui à la suite de dommages causés par une
inondation ou une perte de biens.
L’aléa moral est une forme d’asymétrie postcontractuelle, car elle survient après la signa-
ture du contrat.
Il y a risque moral lorsqu’il y a asymétrie d’information entre deux parties et qu’un chan-
gement de comportement de l’une d’entre elles se produit après la conclusion d’un accord
entre les deux parties.
Les assureurs ont cherché à savoir si les comportements de leurs clients pouvaient être
influencés par l’existence des contrats les protégeant contre divers types de risques. L’idée
sous-jacente est qu’une couverture d’assurance trop généreuse a pour effet d’accroître
l’exposition au risque, la prévention devenant moins utile aux yeux du contractant.

55
Chapitre 3 Techniques d’assurance

3.4.2 Naissance de la notion d’aléa moral

La notion d’aléa moral a été introduite au XVIIe siècle par l’économiste écossais Adam
Smith (1723-1790) qui est considéré comme le père de l’économie politique. Selon lui, l’aléa
moral apparaît lorsque la recherche de l’intérêt individuel est si forte qu’elle méconnaît
l’impact négatif d’une décision sur « l’utilité collective ».
En assurance, l’aléa moral revient à dire qu’un assuré peut augmenter sa prise de risque
dès qu’une police le met à l’abri des conséquences négatives d’un sinistre. En d’autres
termes, les efforts d’un assuré pour éviter un risque sont proportionnels au niveau d’in-
demnisation qu’il peut espérer.
C’est pour limiter ce risque que les assureurs fixent un niveau d’effort minimal, par
exemple des normes de construction. L’objectif est de responsabiliser l’assuré. Si celui-
ci, par exemple le promoteur, ne respecte pas ce taux d’effort minimal, il ne sera pas
indemnisé.

3.4.3 La façon de faire face aux aléas moraux

Il existe plusieurs façons de minimiser les aléas moraux. Le premier est d’encourager
la partie qui prend des risques à agir de manière plus responsable en lui offrant des
incitations. La seconde est d’instituer des politiques qui découragent un comportement
immoral en en faisant une infraction punissable. Enfin, un suivi régulier permet à la partie
à risque de savoir si l’autre partie en profite ou non.[18]
Ainsi, les assureurs se protègent de ce genre de situation grâce à la « coassurance », par
laquelle les assurés ne sont remboursés qu’en partie de leurs dommages. Dans l’assurance
automobile, par exemple, la coassurance prend souvent la forme d’une franchise qui définit
le montant des dommages restant à la charge de l’assuré.
Dans la plupart des pays, les systèmes d’assurance santé comprennent eux aussi un élément
de coassurance ; l’objectif n’est pas tant de dissuader les comportements à risque comme
la consommation de tabac ou d’alcool que de limiter les recours excessifs aux médecins
ou aux médicaments.

56
Chapitre 3 Techniques d’assurance

Conclusion
En conclusion, les compagnies d’assurance sont confrontées à une série de défis com-
plexes dans leur activité. Comprendre les principes de base tels que la loi des grands
nombres, l’asymétrie de l’information, la sélection adverse et l’aléa moral est essentiel
pour concevoir des stratégies de gestion des risques efficaces, pour tarifer correctement
les polices d’assurance et pour maintenir la stabilité financière. La prise en compte de
ces aspects dans la pratique de l’assurance est cruciale pour assurer la pérennité et la
confiance dans le secteur.

57
Chapitre 4
Techniques de classification

Introduction
Dans ce chapitre, nous allons explorer les fondements de l’apprentissage automatisé et
examiner différents types d’apprentissage, en mettant l’accent sur l’apprentissage non su-
pervisé. Nous allons également présenter plusieurs algorithmes couramment utilisés pour
la classification non supervisée. De plus, nous allons aborder des mesures de qualité de la
classification qui nous permettent d’évaluer les performances des algorithmes de classifi-
cation.

4.1 Apprentissage automatique (ML)

4.1.1 Définition

L’apprentissage automatique est une branche évolutive de l’intelligence artificielle (IA)


représentée par des algorithmes de calculs qui traitent de larges quantités de données dans
le but de prédire le résultat sur des données non observée en se basant sur les variables
d’entrée (input) de façon à imiter le raisonnement humain. [19]

58
Chapitre 4 Techniques de classification

Figure 4.1 – Apprentissage Automatique

Source : Amandine Allmang / AI Analyst

4.1.2 Les types d’apprentissage automatisé

L’apprentissage automatique comprend quatre principales approches, en fonction du


résultat souhaité. Les approches incluent :

Figure 4.2 – Les types de l’apprentissage automatique

Source : Amandine Allmang / AI Analyst

59
Chapitre 4 Techniques de classification

a Apprentissage supervisé

L’apprentissage supervisé est une méthode d’apprentissage automatique (machine lear-


ning) où un modèle est entraîné sur un ensemble de données étiquetées, c’est-à-dire des
données pour lesquelles les réponses souhaitées sont connues à l’avance. Le but de l’appren-
tissage supervisé est de faire apprendre au modèle à généraliser à partir de ces exemples
étiquetés afin de pouvoir prédire les réponses correctes pour de nouvelles données non
étiquetées. [20]
Le processus d’apprentissage supervisé se déroule en plusieurs étapes :

1. Collecte des données : Un ensemble de données est recueilli, composé de carac-


téristiques (variables) et des étiquettes correspondantes (les réponses connues).

2. Prétraitement des données : Les données peuvent nécessiter une étape de pré-
traitement pour les nettoyer, les normaliser ou les transformer afin de les rendre
appropriées pour l’apprentissage.

3. Séparation des données : L’ensemble de données est divisé en deux parties dis-
tinctes : un ensemble d’entraînement et un ensemble de test. L’ensemble d’entraî-
nement est utilisé pour entraîner le modèle, tandis que l’ensemble de test est utilisé
pour évaluer ses performances.

4. Sélection d’un algorithme d’apprentissage : Un algorithme d’apprentissage


supervisé est choisi en fonction du type de problème et des caractéristiques des
données. Il existe diverses techniques telles que les arbres de décision, les réseaux
neuronaux, les méthodes de régression, les machines à vecteurs de support (SVM),
etc.

5. Entraînement du modèle : Le modèle est alimenté avec les données d’entraîne-


ment, et il ajuste ses paramètres en fonction des étiquettes connues. L’objectif est
de minimiser l’erreur entre les prédictions du modèle et les étiquettes réelles.

6. Validation du modèle : Une fois le modèle entraîné, il est évalué en utilisant l’en-
semble de test. On examine la précision de ses prédictions et sa capacité à généraliser
aux nouvelles données.

7. Utilisation du modèle : Une fois que le modèle est validé et jugé performant, il
peut être utilisé pour prédire les réponses pour de nouvelles données non étiquetées.
[20]

60
Chapitre 4 Techniques de classification

l’apprentissage supervisé peut être séparé en deux types de problèmes lors de l’exploration
de données :

Figure 4.3 – Apprentissage Supervisé

Source : Analytics & Insights devient BrightCape 2021

— La régression : est une méthode qui utilise un algorithme pour comprendre la


relation entre les variables dépendantes et indépendantes. Les modèles de régres-
sion sont utiles pour prédire des valeurs numériques basées sur différents points de
données, tels que les projections de chiffre d’affaires pour une entreprise donnée. Cer-
tains algorithmes de régression populaires sont la régression linéaire, la régression
logistique et la régression polynomiale.

— La classification : est une méthode qui utilise utilisent un algorithme pour attri-
buer avec précision les données de test dans des catégories spécifiques, telles que la
séparation des pommes des oranges. Ou, dans le monde réel, des algorithmes d’ap-
prentissage supervisé peuvent être utilisés pour classer les spams dans un dossier
séparé d’une boîte de réception.Les classificateurs linéaires, les machines à vecteurs
de support, les arbres de décision et les forêts aléatoires sont tous des types courants
d’algorithmes de classification.

b Apprentissage non-supervisé

L’apprentissage non supervisé est une branche de l’apprentissage automatique où l’al-


gorithme est chargé d’explorer et de trouver des modèles, des structures ou des relations

61
Chapitre 4 Techniques de classification

intrinsèques dans les données sans disposer d’étiquettes ou de réponses préalables.

Dans l’apprentissage non supervisé, l’objectif principal est de découvrir des structures
cachées, des regroupements ou des schémas inhérents aux données. Cela peut aider à ob-
tenir des informations précieuses sur les données sans avoir à fournir d’étiquettes ou de
réponses explicites.
l’exemple le plus utilisé est un algorithme de regroupement (clustering) tel que le k-means
pour diviser les clients en différents groupes en fonction de leurs similitudes. L’algorithme
identifiera automatiquement les groupes qui ont des caractéristiques similaires, sans qu’il
soit nécessaire de fournir des étiquettes ou des catégories prédéfinies. [20]

Figure 4.4 – Apprentissage non-supervisé

Source : https: // fr. linedata. com/ 2020

Le processus d’apprentissage supervisé se déroule en plusieurs étapes :

1. Collecte des données : La première étape consiste à collecter les données brutes
pour effectuer l’apprentissage non supervisé. Les données peuvent provenir de di-
verses sources, telles que des bases de données, des fichiers CSV, des textes, des
images, etc.

2. Prétraitement des données : Avant d’appliquer des algorithmes d’apprentissage

62
Chapitre 4 Techniques de classification

non supervisé, il est souvent nécessaire de prétraiter les données. Cela peut inclure
des étapes telles que le nettoyage des données, la normalisation, la réduction de
dimensionnalité, la gestion des valeurs manquantes, etc. L’objectif est de préparer
les données pour une analyse plus approfondie.
3. Sélection de l’algorithme : En fonction des objectifs et du type de données dis-
ponibles, l’étape consiste à sélectionner l’algorithme d’apprentissage non supervisé
approprié. Il existe plusieurs types d’algorithmes, tels que le clustering (regroupe-
ment), la détection d’anomalies, la réduction de dimensionnalité, etc.
4. Application de l’algorithme : Une fois que l’algorithme approprié est choisi, il
faudra l’appliquer aux données prétraitées. L’algorithme explorera les structures, les
modèles ou les relations dans les données et générera des résultats.
5. Interprétation des résultats : Cette étape implique l’interprétation des résultats
obtenus à partir de l’algorithme d’apprentissage non supervisé. Reste à analyser les
groupes, les clusters ou les schémas identifiés et tirer des conclusions ou des insights
significatifs.
6. Évaluation : Selon le type d’algorithme utilisé, il peut y avoir des métriques spé-
cifiques pour évaluer la qualité des résultats. Par exemple, dans le clustering, des
mesures telles que l’inertie intra-cluster ou le coefficient de silhouette peuvent être
utilisées pour évaluer la cohérence des clusters formés.
7. Répétition et ajustement : Selon les résultats et les conclusions tirées, il sera
plus facile de répéter les étapes précédentes en ajustant certains paramètres ou en
essayant différents algorithmes pour améliorer les résultats.
Les modèles d’apprentissage non supervisé sont utilisés pour trois tâches principales,le
regroupement,l’association et la réduction de la dimensionnalité :
— La segmentation (clustering) : est une technique d’exploration de données per-
mettant de regrouper des données non étiquetées en fonction de leurs similitudes ou
de leurs différences. Par exemple, les algorithmes de segmentation K-means attri-
buent des points de données similaires en groupes, où la valeur K représente la taille
du groupement et la granularité. Cette technique est utile pour la segmentation du
marché, la compression d’images, etc.
— Association : est une méthode qui utilise différentes règles pour trouver des rela-
tions entre des variables dans un ensemble de données connu . Ces méthodes sont

63
Chapitre 4 Techniques de classification

fréquemment utilisées pour l’analyse du panier d’achat et les moteurs de recomman-


dation, à l’instar des recommandations "Les clients qui ont acheté cet article ont
également acheté ...".

— La réduction de la dimension est une technique utilisée lorsque le nombre d’en-


tités (ou de dimensions) dans un jeu de données donné est trop élevé. Il réduit
le nombre d’entrées de données à une taille gérable tout en préservant l’intégrité
des données. Souvent, cette technique est utilisée dans l’étape de prétraitement des
données, par exemple lorsque les encodeurs automatiques suppriment le bruit des
données visuelles pour améliorer la qualité de l’image.

c Apprentissage par renforcement

L’apprentissage par renforcement est une méthode d’apprentissage automatique où un


agent apprend à prendre des décisions dans un environnement afin de maximiser une ré-
compense cumulative. L’agent interagit avec l’environnement en effectuant des actions, et
en retour, il reçoit des récompenses ou des pénalités en fonction de ses actions. L’objectif
de l’agent est de découvrir quelle séquence d’actions lui permet d’obtenir la plus grande
récompense au fil du temps.
L’apprentissage par renforcement est souvent utilisé dans des domaines tels que la robo-
tique, les jeux, la planification de trajectoire, la gestion de portefeuille financier, etc., où
il est nécessaire d’apprendre à prendre des décisions dans un environnement dynamique
pour maximiser les récompenses.[21, 22]

Figure 4.5 – Apprentissage par renforcement

Source :Wikipédia

Les étapes principales de l’apprentissage par renforcement sont les suivantes :

64
Chapitre 4 Techniques de classification

1. Environnement : Un environnement est défini, dans lequel l’agent interagit et


prend des décisions. L’environnement peut être simulé, réel ou une combinaison des
deux.

2. État : À chaque étape de l’interaction, l’agent perçoit l’état de l’environnement.


L’état peut être une représentation de l’environnement qui contient des informations
pertinentes pour prendre des décisions.

3. Action : L’agent choisit une action à effectuer en fonction de l’état actuel de l’en-
vironnement. L’ensemble des actions possibles est défini à l’avance.

4. Récompense : Après avoir effectué une action, l’agent reçoit une récompense ou
une pénalité de la part de l’environnement. La récompense indique la qualité de
l’action prise par l’agent.

5. Politique : L’agent utilise une politique pour prendre des décisions. Une politique
est une stratégie ou une règle qui guide le choix des actions en fonction de l’état
actuel.

6. Apprentissage : L’agent met à jour sa politique en utilisant des méthodes d’ap-


prentissage afin d’améliorer ses performances au fil du temps. Les méthodes d’ap-
prentissage par renforcement incluent souvent des algorithmes tels que la méthode
de Monte-Carlo, la méthode de la différence temporelle (TD), ou les algorithmes
Q-Learning et SARSA.

7. Exploration et exploitation : L’agent doit trouver un équilibre entre l’explora-


tion de nouvelles actions pour découvrir des stratégies potentiellement meilleures
et l’exploitation des actions déjà connues pour maximiser les récompenses à court
terme.

8. Boucle d’apprentissage : L’agent continue d’interagir avec l’environnement, d’ob-


server les états, d’effectuer des actions, de recevoir des récompenses et de mettre à
jour sa politique jusqu’à ce qu’il atteigne un niveau de performance souhaité.

d Apprentissage semi-supervisé

L’apprentissage semi-supervisé est une méthode d’apprentissage automatique qui com-


bine à la fois des données étiquetées (données avec des annotations ou des étiquettes) et
des données non étiquetées (données sans annotations). Contrairement à l’apprentissage

65
Chapitre 4 Techniques de classification

supervisé traditionnel , l’apprentissage semi-supervisé permet d’exploiter efficacement de


plus grandes quantités de données non étiquetées pour améliorer les performances de l’ap-
prentissage.
L’apprentissage semi-supervisé est couramment utilisé dans des scénarios où il est diffi-
cile ou coûteux d’obtenir des données étiquetées en grande quantité, mais où les données
non étiquetées peuvent être facilement collectées. Cela peut inclure des domaines tels
que la classification d’images, la détection d’anomalies, la traduction automatique et bien
d’autres.

Figure 4.6 – Apprentissage semi-supervisé

Source : l’Alliance pour la Recherche et l’Innovation des Industries de Santé (ARIIS)

Les étapes principales de l’apprentissage semi-supervisé sont les suivantes :

1. Collecte des données : Les données étiquetées et non étiquetées sont collectées
à partir de différentes sources. Les données étiquetées sont généralement plus coû-
teuses à obtenir car elles nécessitent une annotation manuelle par des experts, tandis
que les données non étiquetées sont plus abondantes et peuvent provenir de diverses
sources.

2. Apprentissage supervisé initial : Un modèle est entraîné sur la petite quantité de


données étiquetées disponibles. Cela permet d’obtenir une première approximation
du problème d’apprentissage.

3. Utilisation des données non étiquetées : Le modèle initial est utilisé pour
prédire les étiquettes des données non étiquetées. Ces prédictions sont ensuite com-
binées avec les données étiquetées existantes pour former un nouvel ensemble de

66
Chapitre 4 Techniques de classification

données d’entraînement, appelé ensemble semi-supervisé.

4. Entraînement du modèle semi-supervisé : Le modèle est ré-entraîné sur l’en-


semble semi-supervisé qui comprend les données étiquetées et les prédictions des
données non étiquetées. Cette étape vise à améliorer les performances du modèle en
exploitant les informations contenues dans les données non étiquetées.

5. Évaluation et ajustement : Le modèle semi-supervisé est évalué sur un ensemble


de données de test distinct pour mesurer ses performances. Si nécessaire, les hy-
perparamètres du modèle peuvent être ajustés et l’ensemble d’entraînement peut
être étendu avec de nouvelles données étiquetées ou non étiquetées pour améliorer
davantage les performances. [23]

4.1.3 L’apprentissage automatisé dans le secteur de l’assurance

L’industrie de l’assurance a toujours eu besoin d’une analyse de grands ensembles


de données pour pouvoir coter le risque et fixer des prix sur les contrats et évaluer les
clients. Mais pour effectuer des analyses plus prospectives et automatisées, l’apprentissage
automatisé est plus adapté. son application est au cœur de la mutation du secteur et
transforment, à plusieurs niveaux, les métiers de l’assurance de demain :

— Détection de fraude :Les cas de fraude à l’assurance coûtent plusieurs milliards


d’euros chaque année aux assureurs (2.5Md€ en 2015 [24]). Grâce à sa capacité
à détecter des motifs et anomalies, le Machine Learning est capable de scorer les
déclarations pour orienter les traitements manuels de répression de fraude. La ma-
chine détecte alors automatiquement des situations non couvertes par le contrat,
des anomalies dans la description du sinistre et des pertes surestimées.

— Scoring : Qui est de plus en plus répandue dans le secteur de l’assurance est . Le
scoring est une méthode permettant d’évaluer le risque associé à un individu ou à
un contrat. Traditionnellement, les assureurs se basaient sur des critères statistiques
et des modèles mathématiques pour déterminer le score de risque.
Cependant, l’apprentissage automatisé offre de nouvelles possibilités en permettant
aux assureurs d’exploiter de grandes quantités de données et d’identifier des schémas
complexes. Grâce à des algorithmes de machine learning, il est possible de créer des
modèles prédictifs plus précis et plus personnalisés.

67
Chapitre 4 Techniques de classification

— Connaissance client et gestion du risque : Les nouvelles sources de données


(objets connectés, réseaux sociaux, météo, etc.) permettent de construire une image
plus complète des risques auxquels les utilisateurs sont exposés. A travers le traite-
ment et l’analyse automatisée de ces données, il est possible pour les assureurs de
proposer des offres et tarifs assurantiels toujours plus personnalisés. Un axe d’uti-
lisation possible est également de proposer à l’utilisateur des actions de prévention
pour prévenir plutôt que guérir.

4.2 Algorithmes de classification automatique (Ségmen-


tation)
Dans la classification automatique , il existe un lagre choix d’algorithme d’apprentis-
sage pour classifier/ségmenter les données par exemple :

— K-means

— Spectral Clustering

— Mean-Shift

— Gaussian Mixture Models (GMM)

— DBSCAN (Density-Based Spatial Clustering of Applications with Noise)

— Classification hiérarchique ascendante (CHA)

Dans la suite nous allons définir en detaille quelque algorithmes cité précédemment

4.2.1 L’algorithme K-means (K-moyenne)

L’algorithme k-means, mis au point par McQueen en 1967, est l’un des algorithmes
les plus simples d’apprentissage non supervisé. Il est également connu sous le nom d’al-
gorithme des centres mobiles. Cet algorithme attribue chaque point à un cluster dont le
centre (centroïde) est le plus proche. Le centre est la moyenne de tous les points présents
dans le cluster, et ses coordonnées sont la moyenne arithmétique pour chaque dimension
séparément à partir de tous les points du cluster. Ainsi, chaque cluster est représenté par
son centre de gravité [25].

68
Chapitre 4 Techniques de classification

a Définition

L’idée principale de l’algorithme k-means est de définir k centroïdes arbitraires µ01 , . . . , µ0k
où k est le nombre de clusters fixé à l’avance. Chaque centroïde représente le centre d’une
classe. Il est préférable de les placer le plus éloignés possible les uns des autres. Ensuite,
chaque point du jeu de données est associé au centroïde le plus proche. Ainsi, chaque
classe K est représentée par un ensemble d’individus les plus proches de son centroïde
µi . Les nuées dynamiques sont une généralisation de ce principe, où chaque cluster est
représenté par un noyau plus complexe qu’une simple moyenne.
Une fois qu’il n’y a plus de points en attente, la première étape est terminée et un
groupage préliminaire est réalisé. À ce stade, les k nouveaux centroïdes µi des groupes ob-
tenus à partir de l’étape précédente sont recalculés pour remplacer les anciens centroïdes
µti . Chaque nouveau centroïde µt+1
i est calculé comme le centre de gravité de la classe
correspondante Cit+1 , en utilisant les nouvelles classes obtenues. Ensuite, le processus est
répété jusqu’à ce qu’un état de stabilité soit atteint, où aucune amélioration supplémen-
taire n’est possible. On peut observer que les k centroïdes se déplacent étape par étape
jusqu’à ce qu’il n’y ait plus de changements. En d’autres termes, les centroïdes finissent
par rester fixes.

Figure 4.7 – Schématisation de l’algorithme K-means

Source : Algorithme des centres moblies par Faïcel Chamroukhi

69
Chapitre 4 Techniques de classification

b Les étapes de l’algorithme K-Means

1. Initialisation : L’étape d’initialisation consiste à définir les centres des classes


(0) (0)
µ1 , . . . , µK pour donner le point de départ de l’algorithme. Ces centres initiaux
peuvent être choisis de manière aléatoire ou en utilisant une autre approche basée
sur les données elles-mêmes. Une fois les centres initiaux définis, l’algorithme k-
means procède à l’itération t = 0 avec ces valeurs initiales pour les paramètres du
modèle.
Il est important de noter que les centres initiaux peuvent avoir un impact sur la
convergence et les résultats finaux de l’algorithme k-means. Par conséquent, diffé-
rentes stratégies d’initialisation peuvent être utilisées pour obtenir de meilleurs ré-
sultats. Certains exemples populaires d’initialisation incluent l’initialisation aléa-
toire, l’initialisation K-means++, etc.

2. Affectation(Classification) : Dans l’étape d’affectation de l’algorithme k-means,


chaque donnée est assignée à la classe du centre dont elle est la plus proche. Pour
chaque donnée xi où i = 1, . . . , n, on calcule la distance entre xi et tous les centres
de classe µk où k = 1, . . . , K. La donnée xi est ensuite assignée à la classe Kj où j
correspond à l’indice du centre de classe µj ayant la distance minimale par rapport
à xi . En d’autres termes, xi est assignée à la classe Kj si la distance entre xi et µj est
la plus petite parmi toutes les distances calculées. Les données sont ainsi assignées
à des clusters en se basant sur la similarité de leurs caractéristiques avec les centres
de classe. 
1, si k = arg minj∈{1,...,k} ∥xi − µj ∥2

t
zik (x) =
0, si non

3. Recalage des centres : Pour chaque classe k, le centre µk est recalculé comme
étant la moyenne arithmétique de toutes les données appartenant à cette classe,
suite à l’étape d’affectation précédente : ∀k = 1, . . . , K

Pn (t)
(t+1) i=1 zik xi
µk = Pn (t) (4.1)
i=1 zik

4. La stabilité des centres : on peut vérifie la stabilité des centres entre µt+1
k et µtk
utilisant Critère de convergence basé sur la minimisation de le critère d’erreur (la

70
Chapitre 4 Techniques de classification

distorsion) J
n X
X K
J(t) = zik (t) ||xi − µk (t)| |2 (4.2)
i=1 k=1

Si la valeur relative de la distorsion J entre les itérations t + 1 et t est inférieure à


un seuil préfixé ε, c’est-à-dire :

|J(t + 1) − J(t)|
≤ε (4.3)
|J(t)|

Les centres des classes sont considérés comme stables et l’algorithme k-means peut
être arrêté. Cela signifie que les centres ne changent pas de manière significative
d’une itération à l’autre et ont convergé vers une configuration stable.
Sinon, il faut répéter les étapes 2 et 3.

Remarque : ||xi − µk || correspond à la distance euclidienne totale entre chaque donnée


xi et le centre µk dont elle est la plus proche au sens de la distance euclidienne.
v
u d
uX
∥|xi − µk ∥| = d(xi , µk ) = t (xij − µkj )2 (4.4)
j=1

c La limitation du K-Means

— Sensibilité aux points d’initialisation

— Dépendance au nombre de clusters

— Impact des valeurs aberrantes

L’algorithme K-means présente certaines limitations, notamment :

4.2.2 L’algorithme de classification hiérarchique ascendante (AHC)

a Définition

La méthode de classification hiérarchique ascendante est une technique de regrou-


pement non supervisée utilisée pour regrouper les échantillons d’un jeu de données en
fonction de leurs similarités. Elle permet d’obtenir une représentation hiérarchique des
regroupements, ce qui facilite l’analyse de la structure des données.
La méthode de classification hiérarchique ascendante (CHA) consiste à regrouper les
échantillons de données de manière itérative en formant des clusters de plus en plus

71
Chapitre 4 Techniques de classification

larges. Elle se base sur la similarité entre les échantillons et utilise une approche ascen-
dante, c’est-à-dire qu’elle part des échantillons individuels pour former des groupes de
plus en plus grands. L’idée principale de la méthode est de mesurer la similarité entre les
échantillons, puis de regrouper ceux qui sont les plus similaires. Ce processus est répété
jusqu’à ce qu’un seul cluster global soit formé, ou jusqu’à ce qu’un certain critère d’arrêt
soit atteint. La méthode de classification hiérarchique ascendante produit généralement
un dendrogramme, qui est une représentation visuelle de la structure hiérarchique des
clusters. À partir de ce dendrogramme, on peut déterminer les clusters finaux en choisis-
sant un niveau de découpage approprié. Les échantillons regroupés ensemble à ce niveau
reçoivent une étiquette pour indiquer leur appartenance à un cluster spécifique. [26]

Figure 4.8 – Méthode de classification ascendante hiérarchique

Source : research gate

b Les étapes de la AHC

Les étapes les plus pertinentes permettant la construction d’une hiérarchie de regrou-
pements à partir des échantillons toute en facilitant l’analyse de la structure des données
sont :

— Calcul de la matrice de similarité/dissimilarité : Une mesure de similarité


ou de dissimilarité est calculée entre chaque paire d’échantillons du jeu de données.
Cela peut être fait en utilisant des mesures telles que :
- la distance de Manhattan qui est la distance que l’on parcourt entre deux
points quand on est obligé de se déplacer sur un réseau ou quadrillage de lignes
perpendiculaires ,qui est aussi indiquée mathématiquement par la formule :
n
X
|xi − yi | (4.5)
i=1

72
Chapitre 4 Techniques de classification

- La distance cosinus : qui est souvent employée pour cumuler les contributions
des différents types de variables décrivant les données. Pour chaque donnée (obser-
vation), les représentations des différentes variables sont directement concaténées
dans un vecteur de dimension élevée , sa formule mathématique est la suivante
Pn
xi · y i
1 − pPn i=1 2
pPn
2
(4.6)
i=1 xi · i=1 yi

— Calcul des similarités inter-cluster : à partir de la matrice de similarité/dissimilarité,


les similarités inter-cluster sont calculées. Elles représentent les similarités entre les
clusters en utilisant des méthodes telles que :
- La distance minimale (SL) : La similarité inter-cluster est définie comme la
plus petite distance (ou la plus grande similarité) entre les éléments de deux clusters
différents. Cela signifie que la similarité entre deux clusters est basée sur la paire
d’éléments les plus proches l’un de l’autre .
- Distance maximale (CL) : La similarité inter-cluster est définie comme la plus
grande distance (ou la plus petite similarité) entre les éléments de deux clusters
différents. Cela signifie que la similarité entre deux clusters est basée sur la paire
d’éléments les plus éloignés l’un de l’autre .
- Distance moyenne (AL) : La similarité inter-cluster est définie comme la
moyenne des distances (ou la moyenne des similarités) entre tous les éléments des
deux clusters. Cela permet de prendre en compte l’ensemble des relations entre les
éléments des clusters.

— Fusion des clusters : Les clusters les plus similaires sont fusionnés à chaque étape.
La paire de clusters avec la plus grande similarité est identifiée et fusionnée pour
former un nouveau cluster. La similarité entre les clusters fusionnés est recalculée
en utilisant une mesure de similarité mise à jour.

— Affectation d’une étiquette : Une fois que les clusters sont formés, les échantillons
qui appartiennent à chaque cluster reçoivent une étiquette ou un identifiant pour
indiquer leur appartenance à ce cluster. Cela permet de catégoriser les données en
fonction des groupes obtenus lors de la classification hiérarchique ascendante.

73
Chapitre 4 Techniques de classification

c La limitation de la AHC

La classification hiérarchique ascendante présente certaines limites qu’il est important


de prendre en compte lors de son utilisation :

— Sensibilité aux valeurs aberrantes

— Complexité computationnelle

— Difficulté de détermination du nombre de clusters

4.2.3 L’algorithme de DBSCAN

a Définition :

L’algorithme DBSCAN est une méthode de classification non supervisée proposé en


1996 par Martin Ester, Hans-Peter Kriegel, Jörg Sander et Xiaowei Xu utilisée pour
regrouper les données d’un échantillon denses en se basant sur la densité des points dans
l’espace. Au lieu de se baser sur des critères de distance fixes, DBSCAN identifie des
régions denses de points et les relie pour former des clusters. Les points qui se trouvent
dans des régions moins denses ou isolées sont considérés comme du bruit. [27]

Figure 4.9 – Méthode DBSCAN

Source : scikit-learn : machine learning

b Les étapes de la méthode DBSCAN

Les étapes de l’algorithme DBSCAN sont les suivantes :

— Sélection des paramètres : L’algorithme DBSCAN repose sur deux paramètres


principaux :

74
Chapitre 4 Techniques de classification

- distance maximale (EPS) : L’epsilon détermine la portée des points voisins lors
de la formation des clusters. Une valeur d’epsilon plus grande permettra d’inclure
davantage de points dans un même cluster, tandis qu’une valeur plus petite donnera
des clusters plus compacts. Il n’y a pas de valeur unique appropriée pour epsilon,
cela dépendra de la structure des données et de la densité attendue des clusters.
L’exploitation de différentes valeurs d’epsilon en utilisant des techniques telles que
le graphique "k-distance" ou le "k-nearest neighbors"est conseillée pour trouver une
valeur qui capture les relations de voisinage souhaitées.
- Nombre minimum de points (MinPts) : Le MinPts détermine le nombre minimum
de points requis pour former un cluster. Un MinPts plus élevé permettra de former
des clusters plus denses, tandis qu’un MinPts plus faible permettra de détecter des
clusters plus petits. La valeur de MinPts dépendra de la densité des données et de la
taille attendue des clusters. Il est recommandé de choisir une valeur qui est au moins
égale à la dimension des données plus 1. Cependant, il est courant d’expérimenter
différentes valeurs de MinPts pour trouver celle qui fonctionne le mieux pour un
ensemble de données spécifique.

— Calcul de la distance : Calculer la distance entre chaque paire de points dans


l’ensemble de données en utilisant une mesure de distance appropriée, telle que la
distance euclidienne ou la distance de Manhattan.

— Détection des points centraux : La détection des points centraux repose sur le
principe que les points situés dans les régions denses de l’espace auront un nombre
suffisant de voisins à proximité. Ces points centraux servent de base pour former les
clusters dans DBSCAN. Les points qui ne sont pas des points centraux mais qui se
trouvent à une distance epsilon d’un point central peuvent être considérés comme
des points frontières et être ajoutés au même cluster.

— Formation des clusters : Former les clusters en associant les points centraux et
leurs points voisins dans un même cluster. Un point est considéré comme voisin d’un
autre point s’il se trouve dans la distance epsilon.

— Attribution des points de bruit : Identifier les points qui ne sont pas des points
centraux ni des points frontières et les marquer comme des points de bruit ou de
contamination.

75
Chapitre 4 Techniques de classification

c La limitation du DBSCAN

Malgré la propagation de l’algorithme DCSBAN , sauf qu’il présente certaine limites


qu’il faut prendre en considération lors de son utilisation :

— Sensible aux paramètres

— Sensible à la densité de l’échantillonnage

— Sensible à la dimensionnalité

4.3 Mesure de la qualité de la classification


Dans le cas d’algorithmes non supervisés, le but de l’algorithme est moins évident à
définir que dans le cas d’algorithmes supervisés, où il y a une tâche claire à accomplir. Le
succès du modèle est donc plus subjectif. Le fait que la tâche soit plus difficile à définir
n’empêche pas qu’il existe un large éventail de mesures de la performance d’un algorithme
supervisé.
L’objectif principal de la mesure de qualité dans le clustering est de déterminer à quel
point les clusters sont cohérents à l’intérieur et séparés les uns des autres. Cela implique
de prendre en compte à la fois la similarité des données à l’intérieur d’un même cluster
(intra-class) et la différence entre les clusters (inter-class). Ces deux facteurs, intra-class
et inter-class, jouent un rôle crucial dans la mesure de la qualité d’un clustering.
La qualité d’une partition est d’autant plus élevée que W est petite et B est élevée,
où :
- W représente l’inertie intra-classe, qui mesure la compacité des clusters en évaluant
la similarité des données à l’intérieur de chaque cluster.
K X
X
W = ∥x − µi ∥2 (4.7)
i=1 x∈Ci

où K est le nombre de clusters, Ci représente le i-ème cluster, x est une donnée dans le
cluster Ci , et µi est le centre du cluster Ci .
- B représente l’inertie inter-classe, qui mesure la séparabilité des clusters en évaluant
la différence entre les clusters.
K
X
B= ni ∥µi − µ∥2 (4.8)
i=1

76
Chapitre 4 Techniques de classification

où K est le nombre de clusters, ni est le nombre de données dans le cluster Ci , µi est le


centre du cluster Ci , et µ est le centre moyen de tous les clusters.
Pour évaluer la qualité d’un clustering, il est courant de chercher à minimiser l’inertie
intra-classe (W) et à maximiser l’inertie inter-classe (B). Cette approche constitue la base
de nombreuses méthodes de mesure de qualité utilisées dans le domaine du clustering.
Parmi les mesures les plus pertinentes figurent les suivantes :

— Le coefficient de silhouette

— L’indice de Davies-Bouldin (DBI)

— L’indice de Dunn (DI)

— L’indice de Calinski-Harabasz (CH)

— Les mesures de validité du clustering

Ces mesures permettent d’évaluer différents aspects de la qualité du clustering, tels


que la cohésion des clusters, la séparation entre les clusters et la compacité des clusters.
Dans le cadre de notre projet, nous avons utilisé les trois indices suivants : le coefficient
de silhouette, l’indice de Davies-Bouldin et l’indice de Dunn. Ces indices nous ont permis
d’évaluer et de comparer la qualité des différents résultats de clustering obtenus.

4.3.1 L’indice de silhouette

L’indice de silhouette est une mesure de qualité d’une partition d’un ensemble de don-
nées.Pour chaque point, son coefficient de silhouette est la différence entre la distance
moyenne avec les points du même groupe que lui (cohésion) et la distance moyenne avec
les points des autres groupes voisins (séparation). Si cette différence est négative, le point
est en moyenne plus proche du groupe voisin que du sien : il est donc mal classé. À l’in-
verse, si cette différence est positive, le point est en moyenne plus proche de son groupe
que du groupe voisin , il est donc bien classé [28] .
On notera que l’indice de silhouette est borné : −1 ≤ s(ei ) ≤ 1.

L’indice de silhouette est calculé selon la formule suivante :

— Pour chaque point i :


1 X
a(i) = d(i, j) (4.9)
|ci | − 1 j∈c ,j̸=i
i

77
Chapitre 4 Techniques de classification

— Pour chaque point i et chaque cluster cj différent de ci :


 
1 X
b(i) = min  d(i, j) (4.10)
cj |cj | j∈c
j

— Calcule ’indice de silhouette pour chaque point i :

b(i) − a(i)
s(i) = (4.11)
max{a(i), b(i)}

— Calcule de L’indice de silhouette total :


N
1 X
S= s(i) (4.12)
N i=1

Figure 4.10 – Indice de Silhouette

Source :The Silhouette Loss Function : Metric Learning with a Cluster Validity Index

4.3.2 L’indice de Dunn

L’indice de Dunn est basé sur l’identification de clusters compacts et bien séparés.
Il est défini par le rapport entre la plus petite dissimilarité inter-classe (i.e. entre deux
individus de deux classes différentes) et la plus grande dissimilarité intra-classe (i.e. entre
deux individus de la même classe). la valeur de cet indice est plus élevée que les groupes
sont compacts et bien séparés. [29]
C = {c1 , c2 , . . . , ck } où k est le nombre des classes .L’indice de Dunn est calculé selon la

78
Chapitre 4 Techniques de classification

formule suivante :
mini̸=j (dinter (ci , cj ))
D= (4.13)
maxi (dintra (ci ))

dinter (ci , cj ) est la distance entre les clusters ci
et
cj , et dintra (ci ) est la distance intra-cluster pour le cluster ci .

Figure 4.11 – Indice de Dunn

Source : Machine Learning with R, the tidyverse, and mlr

4.3.3 L’indice de Calinski-Harabasz

L’indice de Calinski-Harabaz ou indice VRC est basé sur la variance intra classes,
c’est-à-dire la dispersion des points dans chaque classe et la variance interclasses L’indice
de Calinski-Harabasz est calculé comme suit :

B(k) N −k
CH = × (4.14)
W (k) k−1
où :
B(k) : est la somme des distances entre les centres des clusters et le centre global
W (k) : est la somme des distances intra-cluster
N : est le nombre total d’observations
k : est le nombre de clusters.

79
Chapitre 4 Techniques de classification

4.4 Détection de fraude


La fraude dans le domaine des assurances automobiles se réfère à l’action délibérée
de soumettre une fausse réclamation ou de chercher à tromper les assureurs automobiles
à des fins personnelles. Ce problème est en constante augmentation à l’échelle mondiale
et engendre des pertes estimées à environ 29 milliards de dollars chaque année. Ainsi,
la détection de la fraude à l’assurance automobile revêt une importance capitale dans la
stratégie des compagnies d’assurance, car elle permet de réduire les coûts des sinistres et
de maintenir un niveau de bénéfices satisfaisant.
Dans cette optique, les assureurs s’efforcent continuellement de développer des sys-
tèmes de détection plus performants, afin de surpasser les limites des méthodes tradi-
tionnelles. Cette volonté d’amélioration vise à mieux identifier et prévenir les activités
frauduleuses, contribuant ainsi à une gestion plus efficace des risques et à la préservation
de la stabilité financière des compagnies d’assurance.

4.4.1 Types de fraudes à l’assurance automobile

De ce fait, la fraude à l’assurance peut se présenter sous différentes formes :

a La fraude à la souscription

La fraude à la souscription est un type de fraude couramment rencontré dans le do-


maine de l’assurance automobile. Dans ce cas, l’assuré fournit sciemment des circonstances
inexactes ou trompeuses du risque à l’assureur lors de la souscription d’une police d’as-
surance. Cette fraude consiste à dissimuler ou falsifier la nature du risque dans le but de
payer des primes moins élevées ou de dissimuler certains aspects du risque.
Parmi les exemples courants de fraude à la souscription, on retrouve la déclaration
fausse ou incomplète de l’historique de conduite, la fausse déclaration de l’utilisation du
véhicule, la dissimulation de la localisation du véhicule et la non-divulgation de modifica-
tions apportées au véhicule.

b La fraude en cours de contrat

Dans le domaine de l’assurance automobile, la fraude en cours de contrat fait référence


au non-respect des termes du contrat ou à la création volontaire de dommages, où l’assuré

80
Chapitre 4 Techniques de classification

peut réclamer une indemnité suite à un sinistre qu’il a lui-même provoqué. Cette forme
de fraude implique des comportements frauduleux de la part de l’assuré dans le but de
bénéficier financièrement de manière déloyale.
Certains exemples courants de fraude en cours de contrat incluent la simulation d’un
accident, la déclaration de dommages prétendument causés par un tiers, mais qui ont
été intentionnellement provoqués par l’assuré lui-même, ainsi que la non-divulgation de
changements importants dans les circonstances ou l’utilisation du véhicule qui affectent
le risque assuré.

c La fraude à la déclaration de sinistre

La fraude à la déclaration de sinistre consiste à déclarer un faux sinistre ou à gonfler


délibérément le montant des dommages, dans le but d’obtenir une indemnisation financière
plus élevée que ce qui est réellement justifié.
Certains exemples courants de fraude à la déclaration de sinistre incluent la déclaration
de dommages fictifs, l’exagération intentionnelle des dommages réels, l’inclusion de biens
non endommagés dans la réclamation et la présentation de fausses preuves pour soutenir
la demande d’indemnisation.

d La fraude à un agent d’assurance

La fraude à l’agent d’assurance se produit lorsque l’agent d’assurance présente une


fausse image de la situation de l’assuré ou ignore des détails de base afin d’obtenir un
paiement plus élevé que celui qu’il aurait reçu autrement. Ce type de fraude est souvent
motivé par des incitations financières ou le désir d’un gain personnel de l’agent. Les agents
d’assurance frauduleux peuvent falsifier des documents, exagérer les risques ou manipuler
les informations sur les polices afin de maximiser leur rémunération ou d’obtenir des
avantages indus.

4.4.2 L’apprentissage automatique pour la détection de la fraude

Ces dernières années, le secteur de l’assurance automobile a connu un développement


rapide, ce qui a poussé les entreprises du secteur à se tourner vers la technologie d’ap-
prentissage automatique pour détecter et prévenir les activités frauduleuses. L’utilisation

81
Chapitre 4 Techniques de classification

d’algorithmes dans cette technologie permet de détecter des modèles dans de vastes en-
sembles de données, ce qui s’avère être un outil efficace pour identifier et atténuer la
fraude.
Les algorithmes d’apprentissage automatique sont capables de repérer des modèles
dans les données que les humains pourraient ne pas être en mesure de détecter. Cette
technologie permet aux assureurs de détecter rapidement et précisément les activités
suspectes. En analysant les données des clients en temps réel, ces algorithmes peuvent
rapidement identifier et prévenir les activités frauduleuses, contribuant ainsi à protéger
les clients contre les pertes et à sécuriser le système.

4.4.3 La technologie derrière la détection des fraudes

Dans le monde de l’apprentissage automatique, il existe un grand nombre d’autres


méthodologies et algorithmes qui exploitent avec précision de grandes quantités de don-
nées utilisateur. Chacun d’eux s’est avéré efficace dans certains scénarios et situations
particulières. Les experts en apprentissage automatique les divisent généralement en deux
scénarios principaux en fonction de l’ensemble de données disponible.

a L’ensemble de données contient un nombre suffisant d’exemples de fraude :

Dans ce cas, nous pouvons utiliser l’apprentissage automatique supervisée ou des tech-
niques basées sur les statistiques pour détecter les activités frauduleuses. Cela peut être
réalisé en formant un modèle supervisée d’apprentissage automatique ou en utilisant des
algorithmes adéquats pour trouver les relations cachées entre le client frauduleux et les
données, afin de prendre des décisions basées sur les informations disponibles concernant
le client en question. Ces techniques permet d’analyser les données de manière exhaustive
et de détecter des schémas et des relation qui pourraient indiquer des activités fraudu-
leuses. Des techniques telles que l’analyse de données, l’analyse de réseaux et les modèles
prédicatifs peuvent être utilisées pour identifier les comportements suspects et prendre les
mesures appropriées.

82
Chapitre 4 Techniques de classification

b L’ensemble de données n’a pas (ou seulement un très petit nombre) d’exemples
de fraude. :

Dans le cas où aucune information préalable ou seulement un très petit nombre de


transactions frauduleuses n’ont été enregistrées, il n’est pas possible de compter unique-
ment sur l’apprentissage automatique supervisé, car il serait biaisé envers les transactions
normales et ne serait pas capable de détecter efficacement les fraudes. Dans de telles
situations, il est recommandé de se tourner vers des approches telles que la détection
d’anomalies, l’utilisation de règles de décision et l’apprentissage non supervisé.
La détection d’anomalies permet de repérer les transactions ou les comportements
qui diffèrent significativement de la normale, ce qui peut indiquer une activité frauduleuse.
L’approche par règle décisionnelle implique l’établissement de règles basées sur
des critères spécifiques pour classer les transactions comme frauduleuses ou non. Cela
peut inclure des règles basées sur des seuils ou des modèles de comportement suspects.
L’apprentissage non supervisé, tel que le clustering ou la détection des motifs, peut
être utilisé pour explorer les données et identifier des groupes ou des schémas inhabituels
qui pourraient indiquer une fraude.
En combinant ces différentes approches, il est possible de détecter et de prévenir les
fraudes, même en l’absence d’un grand nombre de transactions frauduleuses dans l’en-
semble de données.

Conclusion
En conclusion de ce chapitre, nous avons exploré les fondements de l’apprentissage
automatisé et examiné différents types d’apprentissage, en mettant l’accent sur l’appren-
tissage non supervisé. Nous avons également présenté plusieurs algorithmes couramment
utilisés pour la classification non supervisée, tels que K-means, AHC et DBSCAN. De
plus, nous avons abordé les mesures de qualité de la classification, telles que l’indice de
Dunn, l’indice de silhouette et l’indice de Calinski-Harabasz, qui nous permettent d’éva-
luer les performances des algorithmes de classification.
Dans le prochain chapitre, nous nous concentrerons sur l’application concrète de ces al-
gorithmes de classification. Nous commencerons par présenter l’organisme d’accueil de
notre stage de fin d’étude et décrire la base de données d’apprentissage que nous uti-

83
Chapitre 4 Techniques de classification

liserons. Ensuite, nous appliquerons les algorithmes de classification sur ces données et
interpréterons les résultats obtenus. Cette étape nous permettra de mettre en pratique
les concepts théoriques que nous avons abordés jusqu’à présent et d’évaluer la pertinence
des algorithmes choisis pour notre étude.

84
Chapitre 5
Classification des clients en portefeuille en
fonction de la rentabilité

Introduction
Dans ce chapitre, nous commencerons par introduire l’organisme d’accueil qui a géné-
reusement mis à notre disposition les données nécessaires pour notre étude. Nous fourni-
rons ensuite une description détaillée de la base de données, en mettant en évidence les
variables pertinentes pour évaluer la rentabilité des clients en portefeuille. Nous présen-
terons également quelques statistiques clés sur la base de données.
Par la suite, nous aborderons le calcul des rentabilités pour chaque client, en mettant
en évidence trois indicateurs principaux : la rentabilité totale, la rentabilité moyenne et la
rentabilité en valeur assurée. Ces indicateurs nous permettront d’évaluer la performance
financière des clients et de quantifier leur contribution au résultat global de l’organisme
d’accueil.
Une fois les rentabilités calculées, nous passerons à l’application des algorithmes de
classification sur notre base de données expérimentale. Les trois méthodes de classification
choisies, à savoir le K-means, l’AHP et le DBSCAN, seront utilisées pour segmenter les
clients en groupes homogènes selon leur rentabilité.
Enfin, nous évaluerons la qualité des classifications obtenues en calculant plusieurs
indices de bonne classification, tels que les indices de Dunn, de silhouette et de Calinski-
Harabasz. Ces indices nous permettront d’évaluer la cohérence et la séparation des clusters
obtenus, en tenant compte des critères de compacité et de séparation des groupes.

85
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

5.1 La présentation de l’organisme d’accueil

5.1.1 Textes de loi

En application de l’article 231 de l’ordonnance n° 95-07 du 23 Chaâbane 1415 cor-


respondant au 25 janvier 1995, modifiée et complétée, susvisée, le présent décret a pour
objet de fixer la composition, l’organisation et le fonctionnement de l’organe spécialisé en
matière de tarification des assurances. L’organe cité est dénommé « Bureau spécialisé de
tarification en assurances », abréviation « B.S.T»

5.1.2 Organisation

Le bureau est présidé par le représentant du ministre chargé des finances. Il est composé
des membres suivants :

— Un représentant du ministère du commerce.

— Deux (2) représentants de l’association des sociétés d’assurance et de réassurance.

— Un expert en assurances désigné par le ministre chargé des finances.

Les membres du bureau sont désignés par arrêter du ministre chargé des finances sur
proposition de l’autorité dont ils relèvent pour une période de trois années, renouvelable.
En cas d’interruption du mandat de l’un des membres, pour quelque motif que ce soit, il
est pourvu à son remplacement dans les mêmes formes. Le membre nouvellement désigné
lui succède jusqu’à l’expiration du mandat en cours.
Le président du bureau peut faire appel à toute personne susceptible d’éclairer, par ses
compétences, les travaux du bureau. Pour exercer ses missions, le bureau est doté d’un
secrétariat dont l’organisation et le fonctionnement sont fixés par le règlement intérieur
du bureau.

5.1.3 Missions

Le bureau d’études et d’expertise, de par son rôle dans les travaux d’élaboration et
de révision de tarifs en matière d’assurance obligatoire et facultative et des paramètres
de tarification dont il a la charge, se voit ainsi attribuer un rôle d’émettre des avis tech-
niques sur les projets de tarifs que l’administration de contrôle lui transmet, telles sont ces

86
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

missions. BST est doté d’une équipe d’actuaires lui permettant de traiter toutes les spé-
cificités actuarielles, telles que la tarification, la gestion du risque, les provisionnements.
Conformément aux dispositions de l’article 231 de l’ordonnance n° 95-07 du 23 Chaâ-
bane 1415 correspondant au 25 janvier 1995, susvisée, le bureau a pour objet notamment
d’élaborer des projets de tarifs, d’étudier et d’actualiser les tarifs d’assurance en vigueur.

5.2 La présentation de la base de données


Les données utilisées pour cette étude proviennent du " BST" et contiennent des
renseignements sur une partie de la clientèle d’une compagnie d’assurance.Les principales
informations contenues dans cette base de données sont relatives aux transactions que les
clients ont effectuées avec cette compagnie dans la branche d’assurance automobile (Tous
Risque).
Avant d’aller plus loin , on suggère de faire une analyse descriptive des sur les deux
principaux critères utilisés (les primes et les indemnisations ) :

Table 5.1 – Statistiques descriptives des primes et indemnisations par exercice

87
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

Figure 5.1 – Analyse descriptive des primes et des indemnisations par an

D’après l’histogramme, on remarque des variations peu significatives dans les primes
peuvent indiquer une certaine stabilité dans les revenus générés par les contrats d’assu-
rance. Cela peut être favorable pour la planification financière et la prévisibilité des flux
de trésorerie pour l’entreprise.Concernant les indemnisations par année, nous remarquons
également des différences entre les années. Certaines années ont enregistré des indemnisa-
tions importantes, tandis que d’autres années ont connu des indemnisations plus faibles.
Cette observation suggère des variations dans les coûts liés aux sinistres d’une année à
l’autre.

5.2.1 La présentation des variables

D’après notre base expérimentale, on peut déduire que les variables peuvent être di-
visées en trois parties :

a Partie Assuré

Cette partie met en lumière les variables clés liées à la partie assurée dans les contrats
d’assurance, jouant un rôle crucial dans la fixation des primes. Ces variables sont extraites
des informations fournies par l’assuré et sont essentielles pour évaluer le risque couvert par
l’assureur. Le tableau 5.1 synthétise les principales variables associées à la partie assurée
présentes dans la base de données.

88
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

Table 5.2 – Variables de la partie assuré

b Partie contrat d’assurance (Prime)

Cette partie contient des variables qui englobent quelques informations procurées par
l’assureur sur le contrat le reliant à l’assuré après la prise en connaissance des informations
de la partie précédente . Le tableau (Table 5.2 ) résume les variables de cette partie de la
base de données :

Table 5.3 – Variables de la partie contrat d’assurance

c Partie indemnisation (Sinistre)

La dernière partie qu’on peut extraire de la base d’apprentissage est celle contenant
certaines variables basées sur les informations des sinistres des contratS d’assurance . Le
tableau (Table 5.3 ) résume les variables de cette partie de la base de données :

89
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

Table 5.4 – Variables de la partie indemnisation

5.2.2 Le prétraitement des données

En raison du manque de nombreux facteurs importants (Rentabilité) dans nos don-


nées pour générer des fonctionnalités de haute qualité utilisées par les classificateurs d’ap-
prentissage automatique, un prétraitement est nécessaire. Ce prétraitement implique un
travail conséquent en matière de nettoyage et de transformation des données.
Le prétraitement des données est une étape cruciale pour garantir que l’apprentissage
automatique produise des résultats précis et perspicaces. Cela est particulièrement im-
portant lorsque les données sont incomplètes ou nécessitent une transformation pour être
utilisées efficacement.
L’objectif de cette étape est d’identifier les caractéristiques les plus pertinentes et infor-
matives pour la classification. Ces caractéristiques seront ensuite utilisées comme entrées
pour les modèles de classification afin de produire des résultats précis et perspicaces.

a La transformation des données

En utilisant le logiciel "R" pour regrouper les contrats en fonction de leur code client,
nous avons observé que la base de données contient 29 201 clients distincts avec des codes
client différents.
Dans notre cas, étant donné la grande taille de l’échantillon et la nature des données, la
suppression les clients avec des valeurs manquantes est la meilleure approche pour assurer
la qualité et l’intégrité des données analysées. Les méthodes d’estimation ou d’imputation
peuvent introduire des biais ou des erreurs dans les données, il est donc préférable de les
éviter dans notre contexte.

b La sélection de caractéristique

Nous effectuons une analyse des données pour identifier les valeurs aberrantes avant
d’appliquer la classification.

90
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

Pour identifier les anomalies et les valeurs aberrantes à partir des données, nous utili-
sons l’exploration visuelle et la méthode de écart inter-quartile (IQR).
Une fois les valeurs aberrantes identifiées, vous disposez de plusieurs options pour les
traiter. Nous choisissons de les supprimer car elles sont considérées comme erronées et
présentent des problèmes de qualité des données.

Figure 5.2 – Ecart inter-quartile(IQR)

L’écart interquartile (IQR) est une mesure couramment utilisée dans le domaine
de l’apprentissage automatique pour traiter les valeurs aberrantes. Il permet de détecter
les valeurs extrêmes qui peuvent affecter négativement la performance du modèle.
L’IQR est calculé en soustrayant le premier quartile (Q1) du troisième quartile (Q3)
d’un ensemble de données. Il représente la dispersion des données à l’intérieur de la moitié
médiane de la distribution.

91
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

Figure 5.3 – La boite à moustache avant la suppression des valeurs aberrantes

Figure 5.4 – La boite à moustache après la suppression des valeurs aberrantes

92
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

c La standardisation des données

L’objectif est d’assurer une interopérabilité optimale des données et pour faciliter
l’apprentissage superviser des modèles qui sont basés sur les calculs de distance, l’étape
de standardisation des données est essentielle. Afin de pouvoir analyser nos données et de
réaliser des traitements de classification automatiser (clustering).
Standardisation (Normalisation Z-score) :consiste à soustraire la moyenne de
chaque observation, puis à diviser par l’écart type, afin de transformer chaque valeur
d’une variable quantitative en centrant la variable à zéro et en standardisant la variance
à 1.
xi − µ
x̄˜i = (5.1)
σ
où :

— x̄˜i est la valeur standardisé correspondant à la valeur xi de la variable,

— xi est la valeur de variable que l’on souhaite standardiser,

— µ est la moyenne de la variable,

— σ est l’écart type de la variable.

5.2.3 Quelques statistiques sur la base de donnée

Avant de se baser sur les statistiques des données , on doit d’abord introduire une
nouvelle variables :
-"Rent" :

1, si Rentabilité ≥ 0

Rent =
0, sinon

— Statistique de la variable Rent : Pour mieux comprendre la composition de notre


échantillon en termes de rentabilité, nous avons effectué une analyse de la distribu-
tion des contrats rentables et non rentables.

93
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

Figure 5.5 – Statistiques de la Variable Rent

Le graphique montre clairement une disparité entre les personnes rentables et non
rentables dans notre échantillon. On observe que la majorité des personnes sont
classées comme rentables, représentées par la barre verte la plus haute. En revanche,
le nombre de personnes non rentables, représentées par la barre grise, est nettement
inférieur.

— Statistique de la variable Rent par rapport au code catégorie : Afin de mieux voir la
dispersion des catégories en termes de rentabilité, nous avons effectué une analyse
de la distribution des contrats rentables et non rentables par catégorie des contrats
(flotte , particulier ).

Figure 5.6 – Statistiques de la Variable Rent par rapport aux Codes Catégories

Ce résultat met en évidence une prédominance des contrats rentables dans la ca-

94
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

tégorie particulier. Cela suggère qu’il y a une proportion plus élevée de contrats
rentables parmi les particuliers par rapport à la catégorie flotte. Cette observation
souligne l’importance de considérer la catégorie du contrat lors de l’évaluation de sa
rentabilité.

— Statistique de la variable Rent par rapport au genre des clients Afin d’explorer la
relation entre la variable Rent et le genre des clients, nous avons réalisé une analyse
de la distribution des contrats rentables et non rentables en fonction du genre.

Figure 5.7 – Statistiques de la Variable Rent par rapport aux Genre

Les résultats révèlent une différence significative entre les genres en termes de com-
position de l’échantillon. Nous constatons une proportion plus élevée de contrats
rentables parmi les clients de genre masculin par rapport aux clients de genre fémi-
nin, malgré un nombre de contrats masculins nettement supérieur.

— Statistiques de la Variable Rent par rapport à l’âge des conducteurs : Afin d’examiner
l’impact de l’âge des conducteurs sur la rentabilité des contrats, nous avons réalisé
une analyse de la distribution des contrats rentables et non rentables en fonction
des tranches d’âge.

95
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

Figure 5.8 – Statistiques de la Variable Rent par rapport à l’âge des conducteurs

Les résultats mettent en évidence des variations significatives dans la composition


de l’échantillon en termes de rentabilité selon l’âge. Nous observons une proportion
plus élevée de contrats rentables parmi les conducteurs plus âgés par rapport aux
conducteurs plus jeunes, malgré une représentation plus importante de ces derniers
dans l’échantillon.

— Statistiques de la Variable Rent par rapport à l’âge du permis de conduite des clients :
Afin d’explorer l’impact de l’âge du permis de conduire sur la rentabilité des contrats,
nous avons mené une analyse de la répartition des contrats rentables et non rentables
en fonction des tranches d’âge du permis.

Figure 5.9 – Statistiques de la Variable Rent par rapport à l’ancienneté du permis des
conducteurs

96
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

Les résultats révèlent des variations significatives dans la composition de notre


échantillon en termes de rentabilité selon l’âge du permis. Nous constatons une
proportion plus élevée de contrats rentables parmi les conducteurs ayant un permis
de conduire récent, tandis que les conducteurs avec un permis plus ancien .

— Statistique de la variable Rent par rapport à la date de la mécanique : Dans le but de


comprendre l’impact de la date de la mécanique sur la rentabilité des contrats, nous
avons réalisé une analyse de la distribution des contrats rentables et non rentables
en fonction des différentes dates de mécanique.

Figure 5.10 – Statistiques de la Variable Rent par rapport à l’âge mécanique des véhi-
cules

Les résultats mettent en évidence des variations significatives dans la composition de


notre échantillon en termes de rentabilité en fonction de la date de la mécanique. Nous
observons une concentration plus élevée de contrats pour certaines périodes spécifiques
de la mécanique, tandis que d’autres périodes montrent une proportion relativement plus
faible de contrats .

5.3 Calcul des rentabilités

5.3.1 Les hypothèses de travail

Avant de développer l’idée de notre projet , on doit d’abord introduire quelques hypo-
thèses de travail

97
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

• Agrégation des primes totales par année : Nous supposons que les primes sont regrou-
pées de manière cohérente par année d’exercice, ce qui nous permettra d’analyser
les tendances et les variations des primes au fil du temps.

• Agrégation des indemnisations totales par année : Nous considérons que les indem-
nisations sont également regroupées de manière appropriée par année d’exercice,
nous permettant ainsi d’analyser les montants des indemnisations sur une base an-
nuelle.

• Taux d’actualisation constant :Nous faisons l’hypothèse d’un taux d’actualisation


constant, ce qui signifie que les flux financiers liés aux primes et aux indemnisations
sont actualisés de manière uniforme pour tenir compte de la valeur temporelle de
l’argent.

• Primes et indemnisations constatées en fin d’exercice : Nous supposons que les


montants des primes et des indemnisations sont constatés à la fin de chaque exercice,
ce qui nous permettra d’effectuer des analyses annuelles basées sur des données
consolidées.

5.3.2 Les formules de calculs

La rentabilité désigne les bénéfices ou les pertes générés pour l’assureur à partir d’un
portefeuille ou d’un client. Elle prend en compte à la fois les revenus générés par les
primes collectées et les charges liées aux sinistres indemnisés. La rentabilité est mesurée en
comparant les revenus (prime) aux dépenses (charge sinistre) sur une période donnée.
Une rentabilité élevée signifie que les revenus excèdent les dépenses, ce qui indique une
performance favorable pour l’assureur.

Ri,j = Pi,j × (1 + δ)(T −ti +1) − Ci,j × (1 + δ)(T −ti +1) I(Ci,j > 0) (5.2)

98
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

Ri,j : Rentabilité du contrat i de client j

Pi,j : Prime du contrat i de client j

δ : taux d’intérêt

T : Année du dernier exercice

ti : Année de l’exercice i

Ci,j : Charge sinistre du contrat i de client j

I(Ci,j > 0) : Indicateur, vaut 1 si la charge sinistre est supérieure à 0, sinon 0

Avant de se baser sur l’étape d’application des algorithmes de classification des clients ,
on doit d’abord introduire les nouvelles variables de rentabilité (Total,Moyenne,Valeur
assurée) :

— La rentabilité totale (RT) : est la somme des rentabilités des contrats du client
au cours de leur relation avec l’assurance.

nj
X
RTj = Ri,j (5.3)
i=1

où Ri,j représente la rentabilité du contrat i, et nj est le nombre total de contrats


du client j.

— La rentabilité moyenne(RM) : est la moyenne des rentabilités des contrats du


client au cours de leur relation avec l’assurance.
nj
1 X
RMj = Ri,j (5.4)
N i=1

où Ri,j représente la rentabilité du contrat i, et N est le nombre d’années où le client


est dans le portefeuille.

— La rentabilité par rapport à la valeur assurée(RVA) : est un indicateur qui


mesure le rapport entre la rentabilité et la valeur assurée.

nj
X Ri,j
RV Aj = (5.5)
i=1
VAi,j

où Ri,j représente la rentabilité obtenue pour le contrat i et VAi représente la valeur


assurée du contrat i. nj est le nombre total de contrats du client j.

99
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

5.3.3 Les indicateurs de rentabilité pour un client

Dans cette partie, nous allons présenter une analyse interprétative d’un portefeuille
client (X) et expliquer comment calculer la rentabilité d’un client. Nous examinerons les
différents aspects tels que les primes payées, les charges sinistres, les années d’exercice et
le taux d’intérêt (δ). En effectuant ces calculs, nous serons en mesure de déterminer la
rentabilité du client et d’évaluer la performance financière de son portefeuille.

Table 5.5 – Valeur des primes et sinistres du client par année

Une fois que nous avons établi le diagramme des flux, nous devons calculer les trois
indicateurs de rentabilité choisis.
Rentabilité Total :
5
X
RTj = Ri,j
i=1

= 35895.42 + 30387.66 − 73963.97 + 18375 + 31907.04

RTj = 42601.15

Rentabilité Moyenne :
nj
1 X
RMj = Ri,j
N i=1
1
= (35895.42 + 30387.66 − 73963.97 + 18375 + 31907.04)
5
RMj = 8520.23

Rentabilité Valeur Assuré :


nj
X Ri,j
RV Aj =
i=1
VAi,j
35895.42 30387.66 73963.97 18375 31907.04
= + − + +
700000 700000 700000 700000 700000
RV Aj = 0.06085879

100
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

5.4 L’application des algorithmes de classification

5.4.1 L’algorithme K-means

a Application sur la rentabilité moyenne

En Appliquant l’algorithme K-means sur La variable "Rentabilité Moyenne"

Table 5.6 – Tableau des fréquences et moyennes par cluster / Rentabilité moyenne

Figure 5.11 – Dispersion des clients dans les classes (Rentabilité Moyenne) en utilisant
k-means

La figure et le tableau présentés ci-dessous montrent les résultats obtenus après l’appli-

101
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

cation de l’algorithme K-means sur la variable de rentabilité moyenne. On peut observer


que les clients sont répartis en 8 classes distinctes, représentées par les couleurs rouge
et verte. La partie rouge correspond aux classes négatives, tandis que la partie verte re-
présente les classes positives. Il n’y a pas de prédominance significative d’une classe par
rapport aux autres, à l’exception des classes 4 et 5 qui regroupent le plus grand nombre
de clients.

b Application sur la rentabilité totale

En Appliquant l’algorithme K-means sur La variable "Rentabilité Totale"

Table 5.7 – Tableau des fréquences et moyennes par cluster / Rentabilité totale

Figure 5.12 – Dispersion des clients dans les classes (Rentabilité Totale) en utilisant
k-means

La figure et le tableau ci-dessous illustrent les résultats obtenus suite à l’application


de l’algorithme K-means sur la variable de rentabilité totale. Les clients sont répartis

102
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

en 8 classes, identifiables par différentes couleurs.La partie rouge correspond aux classes
négatives, tandis que la partie verte représente les classes positives. La classe 4 se dis-
tingue légèrement des autres en regroupant un nombre légèrement plus élevé de clients.
Cependant, il n’y a pas de classe dominante de manière significative.

c Application sur la rentabilité Valeur-assuré

En Appliquant l’algorithme K-means sur La variable "Rentabilité Valeur assuré"

Table 5.8 – Tableau des fréquences et moyennes par cluster / Rentabilité valeur assuré

Figure 5.13 – Dispersion des clients dans les classes (Rentabilité Valeur assuré) en
utilisant K-means

La figure et le tableau ci-dessous présentent les résultats de l’algorithme K-means


appliqué à la rentabilité en termes de valeur assurée. Les clients sont répartis en plu-
sieurs classes, identifiées par différentes couleurs.La partie rouge correspond aux classes
négatives, tandis que la partie verte représente les classes positives. Les classes 1 et 2

103
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

contiennent un nombre relativement faible de clients, tandis que la classe 4 se distingue


par le plus grand nombre de clients, avec une différence significative par rapport aux
autres classes

5.4.2 L’algorithme AHP

a Application sur la rentabilité moyenne

En Appliquant l’algorithme AHP sur La variable "Rentabilité moyenne"

Table 5.9 – Tableau des fréquences et moyennes par cluster / Rentabilité moyenne

Figure 5.14 – Dispersion des clients dans les classes (Rentabilité moyenne) en utilisant
L’AHP

La figure et le tableau ci-dessous montrent les résultats de l’application de l’algorithme


AHP à la rentabilité moyenne. Les clients sont regroupés en différentes classes, représentées

104
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

par différentes couleurs.La partie rouge correspond aux classes négatives, tandis que la
partie verte représente les classes positives. Les classes 1, 2, 8 et 7 se caractérisent par un
nombre significativement réduit de clients, tandis que les autres classes démontrent une
domination plus marquée en termes de nombre de clients.

b Application sur la rentabilité totale

En Appliquant l’algorithme AHP sur La variable "Rentabilité Totale"

Table 5.10 – Tableau des fréquences et moyennes par cluster / Rentabilité totale

Figure 5.15 – Dispersion des clients dans les classes (Rentabilité totale) en utilisant
L’AHP

La figure et le tableau ci-dessous présentent les résultats de l’application de l’algo-


rithme AHP à la rentabilité totale. Les clients sont répartis en différentes classes, repré-
sentées par différentes couleurs. On observe une dominance significative de la classe 4,

105
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

qui regroupe un nombre considérable de clients. Les autres classes présentent un effectif
réduit de clients. Il est important de noter que les classes négatives sont représentées en
rouge, tandis que les classes positives sont représentées en vert.

c Application sur la rentabilité valeur assuré

En Appliquant l’algorithme AHP sur La variable "Rentabilité Valeur assuré"

Table 5.11 – Tableau des fréquences et moyennes par cluster / Rentabilité valeur assuré

Figure 5.16 – Dispersion des clients dans les classes (Rentabilité valeur assuré) en uti-
lisant L’AHP

La figure et le tableau ci-dessous illustrent les résultats de l’application de l’algorithme


AHP à la rentabilité en valeur assurée. On remarque une fois de plus une dominance
significative de la classe 4, qui compte un nombre considérable de clients. De plus, on
observe un pic dans la classe 3, ce qui indique une concentration particulière de clients

106
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

dans cette catégorie. Cependant, il est important de noter que les classes 1 et 2 contiennent
un nombre significativement faible de clients.

5.4.3 L’algorithme DBSCAN

a Application sur la rentabilité Moyenne

En Appliquant l’algorithme DBSCAN sur La variable "Rentabilité Moyenne "

Table 5.12 – Tableau des fréquences et moyennes par cluster / Rentabilité Moyenne

Figure 5.17 – Dispersion des clients dans les classes (Rentabilité moyenne) en utilisant
DBSCAN

La figure et le tableau ci-dessous présentent les résultats de l’application de l’algo-


rithme DBSCAN à la rentabilité moyenne. Nous observons une dominance claire de la
classe 4, qui regroupe un nombre considérable de clients. De plus, la classe 5 présente éga-

107
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

lement un nombre légèrement plus élevé que les autres classes. Cela suggère une concen-
tration de clients dans ces deux classes, ce qui peut indiquer des caractéristiques ou des
comportements similaires en termes de rentabilité moyenne. Les autres classes ont un
nombre relativement faible de clients

b Application sur la rentabilité totale

En Appliquant l’algorithme DBSCAN sur La variable "Rentabilité Totale "

Table 5.13 – Tableau des fréquences et moyennes par cluster / Rentabilité Totale

Figure 5.18 – Dispersion des clients dans les classes (Rentabilité totale) en utilisant
DBSCAN

La figure et le tableau ci-dessous décrivent les résultats de l’application de l’algorithme


DBSCAN à la rentabilité totale. Nous constatons une nette domination de la classe 4,
représentant un nombre significativement plus élevé de clients. Les classes 1, 2, 3, 6, 7 et
8, quant à elles, contiennent un nombre relativement faible de clients. Cette distinction

108
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

entre les classes suggère des différences marquées dans les niveaux de rentabilité totale
des clients. Les classes négatives sont représentées en rouge, tandis que les autres classes
sont représentées en vert.

c Application sur la rentabilité Valeur assuré

En Appliquant l’algorithme DBSCAN sur La variable "Rentabilité valeur assuré "

Table 5.14 – Tableau des fréquences et moyennes par cluster / Rentabilité valeur assuré

Figure 5.19 – Dispersion des clients dans les classes (Rentabilité valeur assuré) en uti-
lisant DBSCAN

La figure et le tableau ci-dessous présentent les résultats de l’application de l’algo-


rithme DBSCAN à la rentabilité en valeur assurée. Nous observons une nette dominance
de la classe 5, qui regroupe un nombre significativement plus élevé de clients. Les classes
4 et 6 présentent également un nombre relativement élevé de clients par rapport aux

109
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

autres classes. En outre, la classe 3 se distingue par un pic notable. Les autres classes
contiennent un nombre relativement faible de clients. Cette répartition inégale des clients
selon les classes suggère des différences importantes dans les niveaux de rentabilité en
valeur assurée.

5.5 Le calcule des indices de bonne classification

5.5.1 L’algorithme K-means

Table 5.15 – Indices de classification pour l’algorithme K-means

Les résultats montrent que : Dabord , l’indice de Dunn indique que la rentabilité
"Totale" permet d’obtenir une meilleure séparation des clusters (1.6053 . D’autre part,
l’indice de Silhouette suggère une compacité plus élevée des clusters pour la rentabilité
"Valeur assuré " (0.6928) . Finalement , l’indice de Calinski-Harabasz informe qu’une
séparation plus nette des groupes pour la rentabilité "Moyenne" (118545.7)

5.5.2 L’algorithme AHP

Table 5.16 – Indices de classification pour l’algorithme AHP

Les résultats montrent que : Dabord , l’indice de Dunn indique que la rentabilité
"Moyenne" permet d’obtenir une meilleure séparation des clusters (1.8746) . D’autre
part, les indices de silhouette et de Calinski-Harabasz sont plus élevés pour la rentabilité
"Valeur assurée", ce qui suggère une compacité plus élevée des clusters et une séparation
plus nette des groupes (0.5841 , 4602.725)

110
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

5.5.3 L’algorithme DBSCAN

Table 5.17 – Indices de classification pour l’algorithme DBSCAN

Les résultats montrent également que : Dabord , l’indice de Dunn indique que la
rentabilité "Moyenne" permet d’obtenir une meilleure séparation des clusters . D’autre
part, les indices de silhouette et de Calinski-Harabasz sont plus élevés pour la "Rentabilité
valeur" assurée, ce qui suggère une compacité plus élevée des clusters et une séparation
plus nette des groupes. (0.58771 , 5151.862)

Conclusion
En conclusion, nous avons débuté en fournissant une brève présentation de l’organisme
d’accueil qui a généreusement mis à notre disposition les données nécessaires à notre
étude. Ensuite, nous avons procédé à une description détaillée de la base de données, en
mettant en évidence les différentes variables présentes et en identifiant les variables les
plus pertinentes pour évaluer la rentabilité . De plus, quelques statistiques clés sur la
base de données ont été fournies pour une meilleure visibilité. Par la suite, nous avons
appliqué les trois méthodes de classification choisies, à savoir le K-means, l’AHP et le
DBSCAN, sur la base de données expérimentale. Enfin, nous avons calculé les indices
de bonne classification associés à chaque algorithme, notamment les indices de Dunn, de
silhouette et de Calinski-Harabasz. Les résultats obtenus du calcul ces expérimentations
ont montré des différences dans les performances des méthodes de classification en fonction
des critères de rentabilité utilisés :
la méthode K-means, la rentabilité totale a montré un meilleur indice de Dunn suggé-
rant une meilleure séparation des clusters , alors que rentabilité valeur assuré a retourné
un meilleur indice de silouette indiquant une cohésion interne plus élevée . Cependant,
l’indice de Calinski-Harabasz était plus faible , indiquant une dispersion plus élevée entre
les clusters basés sur la rentabilité totale et sur la rentabilité valeur assuré.

111
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité

En revanche, pour la méthode AHP , la rentabilité moyenne a présenté le meilleur


indice de Dunn , tandis que la rentabilité valeur assurée a affiché des indices de silhouette
et de Calinski-Harabasz plus élevés.
De même, pour la méthode DBSCAN , la rentabilité moyenne a présenté le meilleur
indice de Dunn , tandis que la rentabilité valeur assurée a affiché des indices de silhouette
et de Calinski-Harabasz plus élevés.

112
Conclusion générale

Notre étude a permis de comparer les performances des méthodes de classification


K-means, AHP et DBSCAN dans le contexte du scoring de rentabilité des contrats en
portefeuille des compagnies d’assurance. Les principales étapes de la méthodologie com-
prenaient la collecte des données sur les contrats en portefeuille, la sélection des critères
de rentabilité pertinents, l’application des méthodes de classification et l’évaluation des
résultats à l’aide d’indices de qualité de classification.
Les principaux résultats de cette étude mettent en évidence l’importance de choisir
les méthodes de classification appropriées en fonction des critères de rentabilité utilisés.
Les performances des méthodes K-means, AHP et DBSCAN varient en fonction de ces
critères. Par exemple, la rentabilité totale a montré de meilleurs résultats avec la méthode
K-means, tandis que la rentabilité valeur assurée a donné de meilleurs résultats avec les
méthodes AHP et DBSCAN. De manière générale ces résultats soulignent l’importance de
choisir les critères de rentabilité appropriés pour chaque méthode et mettre en évidence
les avantages et les limites de chaque approche. Ces résultats fournissent des indications
précieuses pour les compagnies d’assurance dans la gestion de leur portefeuille et la prise
de décisions stratégiques.
En ce qui concerne les hypothèses formulées, certaines ont été validées tandis que
d’autres ont été partiellement validées ou invalidées. L’hypothèse selon laquelle les mé-
thodes de classifications couramment utilisées dans le domaine du scoring de rentabilité
des clients en portefeuille sont les méthodes de classification automatisées, peut être consi-
dérée comme validée. En effet, les méthodes de classification automatisées telles que le
K-means, l’AHP et le DBSCAN ont été largement utilisées dans la littérature pour seg-
menter les clients en fonction de leur rentabilité.Cependant , l’hypothèse indiquant que le

113
Conclusion générale

critère et variable les plus pertinents est la rentabilité totale a été partiellement validée
car , d’après les résultats on trouve que le critère le plus pertinent dépend de la méthode
utilisée pour la classification . Finalement , l’hypothèse qui cite que les indices de Dunn,
de silhouette et de Calinski-Harabasz sont les plus appropriés pour évaluer la qualité de la
classification non-supervisée a été validée car, lorsqu’il s’agit d’effectuer une classification
non-supervisée des clients en portefeuille, il est essentiel de disposer d’indicateurs fiables
pour évaluer la qualité de cette classification. Les indices de Dunn, de silhouette et de
Calinski-Harabasz sont couramment utilisés dans les démarches similaire à la notre.
À la lumière des résultats, pour les compagnies d’assurance qui privilégient une seg-
mentation plus fine du portefeuille en termes de rentabilité, la méthode K-means basée
sur la rentabilité totale peut être plus appropriée. En revanche, pour ceux qui accordent
plus d’importance à la valeur assurée, la méthode AHP et la méthode DBSCAN offrent
des performances intéressantes en termes d’indices de Dunn, de silhouette et de Calinski-
Harabasz.
Cependant, il est important de souligner certaines limites de notre étude. Les résultats
que nous avons obtenus sont spécifiques à notre échantillon et aux critères de rentabilité
que nous avons utilisés. Il serait intéressant d’explorer d’autres variables et critères de
classification pour une analyse plus approfondie, notamment en prenant en compte des
aspects tels que des taux d’actualisation non constants et en étudiant les primes de ma-
nière plus détaillée, au-delà de leur agrégation par année. De plus, l’extension de notre
étude à un échantillon plus large et l’exploration d’autres méthodes de classification non
supervisées ou de techniques d’apprentissage automatique pourraient permettre d’appro-
fondir notre analyse et de fournir des résultats plus précis.
En conclusion, notre recherche contribue à l’avancement des connaissances dans le do-
maine du scoring de rentabilité des contrats en portefeuille des compagnies d’assurance.
Les résultats obtenus offrent des perspectives intéressantes pour les compagnies d’assu-
rance afin d’optimiser leur gestion de portefeuille et de prendre des décisions stratégiques
éclairées.

114
Bibliographie

[1] Lesfurets.com. Assurances, finances et énergie. 2021 , (consulté en Mai 2023).

[2] Le Tourneau Philippe and Jacob Nicolas. La responsabilité civile. Dalloz, 1982.

[3] Lequiller François. L’économie souterraine dans le pib : avancées et limites. OCDE.
http ://www. economie. gouv. fr/files/francois_lequiller_ocde. pdf, 2014.

[4] Sansévérino-Godfrin Valérie. L’État, les compagnies d’assurance et les risques ma-
jeurs. PhD thesis, Nice, 1996.

[5] BOUAZAMA Ridallah ERROCHDI amine Mohamed DAHBI Abdessamad, MALAI-


NINE Chekhlkbire. L’assurance islamique takaful. Maroc : Université Sultan Moulay
Slimane, 2016.

[6] Atlas magazin. Schéma d’une structure type de titrisation en assurance, 2012.

[7] Compagnie Centrale de Réassurance. L’assurance automobile en algérie situation et


perspectives.

[8] Bouaziz Cheikh. L’histoire de l’assurance en algérie. Journal Name.

[9] Union Algérienne des Sociétés d’Assurance et de Réassurance.

[10] Conseil National des Assurances. Notes de


conjoncture4 metrimestrea nne2022. https : //www.asjp.cerist.dz.

[11] URA. Activité des assurances en algérie 2021.

[12] Gaëtan Vergely Alain Bouijoux. Environnement de l’assurance.

[13] Maks Fraszka. La loi des grands nombres dans l’industrie des assurances : Vue d’ensemble.

[14] Marceau Étienne. Modélisation et évaluation quantitative des risques en actuariat. Col-
lection Statistique et probabilités appliquées dirigée par Yadolah Dodge. Springer-Verlag
France, 2013.

115
Bibliographie

[15] Charpentier Arthur. LA LOI DES GRANDS NOMBRES ET LE THÉORÈME CEN-


TRAL LIMITE COMME BASE DE L’ASSURABILITÉ ? 2011.

[16] BEN HAMOUDA MEHDI. Presence de l’asymetrie informationnelle sur le marchÉ de


l’assurance automobile. 2009.

[17] Nathalie De Marcellis-Warin and Thierry Warin. Économie Industrielle avec R. 2020.

[18] KENTON WILL. Moral hazard : Definition, meaning, examples, and how to manage.

[19] El Naqa Issam Murphy Martin J. "what is machine learning ?", 2015.

[20] Tibshirani R. Friedman J. Hastie, T. The elements of statistical learning : Data mining,
inference, and prediction. springer., 2009.

[21] Barto Andrew G. . Sutton Richard S. Reinforcement learning : An introduction., 2019.

[22] Schulman John Abbeel Pieter. Deep reinforcement learning, 2020.

[23] Zien Alexander . Chapelle Olivier, Schölkopf Bernhard. Semi-supervised learning, 2020.

[24] l’agence de lutte contre la fraude à l’assurance.

[25] J. B. MacQueen. : "some methods for classification and analysis of multivariate obser-
vations, proceedings of 5-th berkeley symposium on mathematical statistics and probabi-
lity",. Berkeley, University of California Press,no 1,, (1967).

[26] De Rham C. La classification hiérarchique ascendante selon la méthode des voisins réci-
proques. Cahiers de l’analyse des données, 5(2) :135–144, 1980.

[27] Khan Kamran, Rehman Ur Saif, Aziz Kamran, Fong Simon, and Sarasvady Sababady.
Dbscan : Past, present and future. IEEE, 2014.

[28] Wikipédia. Silhouette (clustering) — wikipédia, l’encyclopédie libre, 2023.

[29] Dunn Joseph C. Well-separated clusters and optimal fuzzy partitions. Journal of cyber-
netics, 1974.

[30] Fraszka Maks. Comprendre la différence entre le risque moral et la sélection adverse.

[31] Tang.B key.S. Toward optimal feature selection in naive bayes for text categorization.
2016.

116

Vous aimerez peut-être aussi