Pfe BK
Pfe BK
Pfe BK
faculté de mathématiques
mémoire
En vue de l’obtention du diplôme de MASTER
Thème
Avant tout, nous tenons à remercier le Dieu tout puissant pour la patience et la force
qui nous a permis de dépasser toutes les difficultés.
Nous tenons aussi à exprimer notre profonde reconnaissance à nos chères encadrants
M.HAFFAR Adlane et Mme.BELHADJ Fazia qui ont partagé avec nous leurs expériences
et qui ont toujours été présentes avec nous avec leurs conseils et leur aide précieuse tout
au long de la période de travail.
Nous exprimons nos sincères remerciements à l’ensemble des membres du jury pour
leurs présence et pour avoir examiné notre travaille.
On remercie également tous nos enseignants qui étaient présents durant nos années
d’études et qui nous ont soutenu dans la poursuite de nos études.
Nous tenons nos sincères remerciements a nos parents et nos familles et proches a qui
ont est profondément reconnaissant pour leurs aides morales.
Enfin, on remercie nos collègues et nos amis qui ont partagé avec nous nos dures périodes
pour aboutir a ce modeste travaille .
Dédicace
Je dédie ce travail à :
Mes chers parents à qui je dois ce que je suis aujourd’hui grâce à leur amour, leurs
sacrifices et leur patience. Que Dieu, le Tout-Puissant, les protège et les préserve, et leur
accorde santé et longue vie pour que je puisse les combler de bonheur et de gratitude.
Ma soeur Hidayet et mon frère Fares pour leur appui et leur encouragement et à qui
je souhaite un avenir brillant ainsi que tout le bonheur du monde.
Mon cher binôme Kandi Nadir avec qui j’ai travaillé pour ce projet et durant mon
cursus.
Mes chers amis Imad , Billel , Abdou qui m’ont soutenu et qui ont toujours été là
pour moi.
M. HAFFAR Adlane et Mme. BELHADJ Fazia qui ont été une source d’inspira-
tion.
À tous mes collègues et mes amis et à toute personne ayant aidé de près ou de loin à
l’aboutissement de ce projet .
Benhammadi Yassine
Je tiens de dédier ces quelques mots à :
Mes chers parents, votre soutien indéfectible, votre amour inconditionnel et vos en-
couragements constants ont été les piliers solides sur lesquels j’ai pu bâtir mon parcours
d’études.
M. HAFFAR Adlene, vos précieux enseignements m’ont ouvert les portes du savoir
et ont façonné ma pensée avec sagesse. Vous avez été bien plus qu’un professeur, vous
êtes devenu un véritable guide, toujours prêt à partager votre savoir et à nous inspirer à
donner le meilleur de nous-mêmes.
À mes chers frères, Amir, Mehamed, Abd Elwahab, et ma sœur Lyna, vous avez
été mes compagnons de route, mes soutiens infaillibles. Vos encouragements constants et
votre amour inconditionnel ont été des sources de motivation et de force tout au long de
mon parcours.
Et enfin, à mes chers amis, qui ont partagé avec moi tant de moments inoubliables,
de rires, de joies et de peines, vous avez été mes alliés.
KANDI Nadir
Table des matières
Introduction générale 1
i
Table des matières
3 Techniques d’assurance 43
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1 La loi des grands nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1.1 Le principe de la mutualisation et le transfert des risques . . . . . . 44
3.1.2 Comprendre la loi des grands nombres dans l’assurance . . . . . . . 46
3.1.3 Le théorème central limite . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 Asymétrie d’information . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
ii
Table des matières
4 Techniques de classification 58
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.1 Apprentissage automatique (ML) . . . . . . . . . . . . . . . . . . . . . . . 58
4.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.1.2 Les types d’apprentissage automatisé . . . . . . . . . . . . . . . . . 59
4.1.3 L’apprentissage automatisé dans le secteur de l’assurance . . . . . 67
4.2 Algorithmes de classification automatique (Ségmentation) . . . . . . . . . 68
4.2.1 L’algorithme K-means (K-moyenne) . . . . . . . . . . . . . . . . . . 68
4.2.2 L’algorithme de classification hiérarchique ascendante (AHC) . . . 71
4.2.3 L’algorithme de DBSCAN . . . . . . . . . . . . . . . . . . . . . . . 74
4.3 Mesure de la qualité de la classification . . . . . . . . . . . . . . . . . . . 76
4.3.1 L’indice de silhouette . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.3.2 L’indice de Dunn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.3.3 L’indice de Calinski-Harabasz . . . . . . . . . . . . . . . . . . . . . 79
4.4 Détection de fraude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.4.1 Types de fraudes à l’assurance automobile . . . . . . . . . . . . . . 80
4.4.2 L’apprentissage automatique pour la détection de la fraude . . . . . 81
4.4.3 La technologie derrière la détection des fraudes . . . . . . . . . . . 82
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
iii
Table des matières
Bibliographie 115
iv
Table des figures
v
Liste des figures
vi
Liste des tableaux
vii
Liste des tableaux
viii
ix
Liste des abréviations
• Quelles sont les méthodes de classification les plus couramment utilisées dans le
domaine du scoring de rentabilité des clients en portefeuille ?
Hypothèse : Les méthodes de classification couramment utilisées sont les méthodes
de classification automatisées .
• Quels sont les critères et les variables les plus pertinents pour évaluer la rentabilité
des clients en portefeuille ?
Hypothèse : Le critère et variable les plus pertinents sont la rentabilité totale car
elle procure une visibilité plus profonde sur le comportement d’un client dans le
1
Liste des abréviations
portefeuille .
2
Chapitre 1
Généralités sur les assurances
Introduction
Dans ce chapitre nous aborderons le mécanisme technique de gestion des risques liés
aux assurances et cela en définissant les assurances , réassurance et les coassurance et en
mettant l’accent sur le contrat d’assurance .Nous mentionnerons aussi les outils financiers
en introduisant la prime , la limite d’indemnisation et la franchise en assurance , au final
nous métrerons en avant les grandes formes et catégories d’assurance .
a Définition
D’une manière générale , l’assurance peut être définie comme : une réunion de per-
sonnes qui , craignant l’arrivée d’un événement dommageable pour elles , se cotisent à
ceux qui seront frappés par cet événement, de faire face à ses conséquences .
D’une manière plus précise , selon M.Joseph Hémard : l’assurance est une opération par
laquelle une partie , l’assuré, se fait promettre, moyennant une rémunération (la prime
), pour lui ou pour un tiers, en cas de réalisation d’un risque , une prestation par une
autre partie, l’assureur qui, prenant en charge un ensemble de risques , les compense
conformément aux lois de la statistique .
3
Chapitre 1 Généralités sur les assurances
a Définition
La réassurance est une opération financière dans laquelle une compagnie d’assurance,
appelée réassureur, indemnisera une autre compagnie d’assurance, appelée cédante, contre
tout ou partie de la perte qu’elle pourrait subir en vertu de sa police ou polices d’assurance.
En d’autres termes, la réassurance est une assurance pour les assureurs.
Le mécanisme de la réassurance permet à l’assureur cédant de transférer une partie de son
risque d’assurance à une tierce partie, le réassureur. Ainsi, l’assureur cédant peut limiter
son exposition à une perte financière importante, en répartissant le risque sur plusieurs
entités.
L’objectif fondamental de la réassurance est de répartir le risque afin qu’aucune entité
ne se retrouve aux prises avec une charge financière dépassant sa capacité de paiement.
La réassurance est donc un outil de transfert de risque qui permet de lisser les bilans et
résultats financiers des cédantes d’une année sur l’autre.
En plus de son rôle de transfert de risque, le réassureur joue également un rôle de conseil
auprès de ses clients. Il peut aider à l’analyse des risques, à la tarification des polices
d’assurance, à la gestion des sinistres et à la création de nouveaux produits d’assurance.
4
Chapitre 1 Généralités sur les assurances
5
Chapitre 1 Généralités sur les assurances
La coassurance est une opération d’assurance qui implique plusieurs assureurs, chacun
prenant une partie du risque assuré. Cette pratique est utilisée pour partager le risque
entre plusieurs compagnies d’assurance, plutôt que de l’assumer seul. La coassurance peut
être utilisée pour réduire les pertes financières pour chaque assureur individuel, ainsi que
pour augmenter la capacité globale d’assurance.
Dans la coassurance, chaque assureur impliqué dans l’opération est appelé « coassureur ».
Ils partagent la prime d’assurance et les pertes correspondantes selon les termes et condi-
tions spécifiés dans leur accord de coassurance. En général, les coassureurs travaillent
ensemble pour fixer les termes de l’opération d’assurance, déterminer les primes et les
limites de couverture.
— Définitions des termes : Les conditions générales incluent souvent une section
avec des définitions des termes utilisés tout au long du contrat. Cela garantit une
compréhension commune des mots et des expressions utilisés dans le document.
6
Chapitre 1 Généralités sur les assurances
[1]
Les conditions particulières d’un contrat d’assurance sont les termes spécifiques qui
s’appliquent à un contrat individuel, adaptés aux besoins et aux caractéristiques parti-
culières de l’assuré et de la situation assurée. Les éléments couramment inclus dans les
conditions particulières d’un contrat d’assurance sont :
— Biens assurés : Les conditions particulières spécifient les biens couverts par l’as-
surance, tels qu’un véhicule, une propriété ou des biens personnels. Elles peuvent
inclure des détails spécifiques tels que la marque, le modèle, le numéro d’immatri-
culation, l’adresse de la propriété, etc.
7
Chapitre 1 Généralités sur les assurances
— Franchises : Les conditions particulières indiquent les montants des franchises qui
s’appliquent en cas de sinistre. La franchise est le montant que l’assuré doit supporter
avant que l’assureur ne commence à indemniser les pertes.
[1]
a L’assuré
L’assuré est une personne physique ou morale qui souscrit une police d’assurance au-
près d’une compagnie d’assurance. Il peut également être désigné comme le titulaire de
l’assurance ou le bénéficiaire de la police d’assurance. En contrepartie du paiement d’une
prime d’assurance, l’assuré est couvert contre un risque ou une perte qui pourrait survenir
dans l’avenir, en fonction des termes et des conditions énoncés dans la police d’assurance.
8
Chapitre 1 Généralités sur les assurances
En d’autres termes, l’assuré est celui qui transfère le risque à l’assureur. Il peut être un
particulier, une entreprise ou une organisation qui cherche à se protéger contre une perte
ou un dommage financier. Par exemple, une personne peut souscrire une assurance auto-
mobile pour se protéger contre les pertes financières liées à un accident de voiture, tandis
qu’une entreprise peut souscrire une assurance responsabilité civile pour se protéger contre
les réclamations de tiers en cas de dommages causés à des tiers.
Relation assuré-assureur : Il est important de noter que l’assuré a des obligations envers
l’assureur, telles que la déclaration exacte et honnête des informations lors de la sous-
cription de la police d’assurance. L’assuré doit également payer les primes d’assurance à
temps pour éviter l’annulation de la police. En cas de sinistre, l’assuré est tenu de signaler
le dommage à l’assureur dans les délais impartis et de fournir les preuves nécessaires pour
pouvoir bénéficier de l’indemnisation prévue dans la police d’assurance.
b L’assureur
L’assureur est une entité commerciale spécialisée, telle qu’une compagnie d’assurance,
qui offre des contrats d’assurance pour protéger les individus, les entreprises et les biens
contre certains risques spécifiés.
Son rôle principal consiste à assumer les risques financiers associés à des événements
incertains. En échange du paiement de primes par les assurés, l’assureur s’engage à fournir
une compensation financière en cas de réalisation des risques couverts. Pour ce faire, il
évalue les risques présentés par les assurés, détermine les termes et les conditions de
la couverture, fixe les primes correspondantes et gère les réclamations lorsqu’un sinistre
survient.
L’assureur joue également un rôle crucial dans la gestion des risques, en utilisant des
méthodes d’évaluation des risques, des modèles actuariels et des outils statistiques pour
déterminer la tarification adéquate et la gestion globale des risques. Il doit se conformer
aux réglementations et aux normes régissant l’industrie de l’assurance pour assurer la
stabilité du marché et protéger les intérêts des assurés. [2]
c Le bénéficiaire
Le bénéficiaire en assurance est la personne ou l’entité désignée pour recevoir les pres-
tations d’un contrat d’assurance en cas de réalisation du risque couvert par le contrat.
9
Chapitre 1 Généralités sur les assurances
Le bénéficiaire peut être désigné par l’assuré au moment de la souscription du contrat d’as-
surance ou à tout moment ultérieur. Il peut s’agir d’une personne physique, telle qu’un
membre de la famille, un ami, un partenaire commercial, ou d’une personne morale, telle
qu’une entreprise ou une organisation.
Dans certains cas, le bénéficiaire désigné peut être le propre souscripteur du contrat d’as-
surance, notamment pour les contrats d’assurance-vie. Le bénéficiaire peut également être
une personne différente du souscripteur, selon les termes du contrat et les préférences de
l’assuré.
En cas de sinistre couvert par le contrat d’assurance, le bénéficiaire a droit aux presta-
tions prévues par le contrat. Ces prestations peuvent prendre différentes formes, telles
qu’un versement en espèces, la prise en charge de frais médicaux ou de réparation, ou le
remboursement de pertes financières.
Les Caractéristiques du bénéficiaire en assurance :
d Le souscripteur
10
Chapitre 1 Généralités sur les assurances
1.3.1 La prime
a Définition
La prime en assurance est le montant d’argent que l’assuré doit payer à la compa-
gnie d’assurance en échange de la couverture d’assurance. C’est le coût de l’assurance
pour l’assuré. La prime est généralement payée périodiquement, qu’il s’agisse d’une prime
mensuelle, trimestrielle, semestrielle ou annuelle, en fonction des modalités du contrat
d’assurance.
La prime d’assurance est calculée en tenant compte de plusieurs facteurs, tels que le risque
d’assurance, la probabilité de sinistre, l’étendue de la couverture, les caractéristiques per-
sonnelles de l’assuré et les caractéristiques de l’objet assuré. La compagnie d’assurance
utilise des méthodes actuarielles pour évaluer ces facteurs et déterminer la prime appro-
priée pour chaque assuré. [3]
11
Chapitre 1 Généralités sur les assurances
Les principaux éléments qui influent sur le montant de la prime d’assurance sont les
suivants :
1. Le niveau de risque : Plus le risque d’un événement couvert est élevé, plus la
prime d’assurance sera élevée. Par exemple, une prime d’assurance automobile sera
plus élevée pour un conducteur novice et inexpérimenté par rapport à un conducteur
expérimenté.
12
Chapitre 1 Généralités sur les assurances
est atteinte, l’assureur n’a plus l’obligation de verser d’indemnisation, à moins qu’une
nouvelle période d’assurance ne débute. [4]
Il existe plusieurs forme de limite d’indemnisation dont on va citer les plus pertinentes :
13
Chapitre 1 Généralités sur les assurances
1.3.3 La franchise
La franchise en assurance est un terme utilisé pour désigner la part des dommages ou
des pertes qui reste à la charge de l’assuré. Il s’agit d’un montant fixe ou d’un pourcentage
de la réclamation, déterminé au préalable dans le contrat d’assurance.
La franchise sert à plusieurs fins en assurance. Tout d’abord, elle permet de réduire les
coûts pour les assureurs en les exemptant de traiter les petits sinistres. Elle incite égale-
ment les assurés à faire preuve de prudence et à éviter les réclamations mineures.
14
Chapitre 1 Généralités sur les assurances
15
Chapitre 1 Généralités sur les assurances
a Définition
1. Assurance Vie :L’assurance vie est une branche de l’assurance conventionnelle qui
vise à fournir une protection financière en cas de décès, de survie ou d’événements
liés à la vie de l’assuré. Les caractéristiques de l’assurance vie comprennent :
— Assurance décès
— Assurance mixte
— Assurance épargne-retraite
16
Chapitre 1 Généralités sur les assurances
— Assurance automobile
— Assurance habitation
— Assurance santé
— Assurance voyage
a Définition
L’assurance Takaful est un concept d’assurance basé sur les principes de la finance
islamique. Il vise à fournir une protection financière aux individus et aux entreprises tout
en respectant les principes éthiques de l’islam.
En Algérie, l’assurance Takaful est également présente et proposée par certaines com-
pagnies d’assurance conformes aux exigences de la Charia. Elle permet aux clients de
bénéficier de solutions d’assurance conformes aux principes de l’islam, en évitant les pra-
tiques interdites, telles que les intérêts, la spéculation et l’incertitude (gharar).
Les opérations d’assurance Takaful en Algérie sont supervisées par l’Autorité de Contrôle
des Assurances et de la Prévoyance Sociale (ACAPS), qui veille à ce que les compagnies
d’assurance Takaful se conforment aux principes de la Charia et respectent les normes
réglementaires en vigueur.
[5]
17
Chapitre 1 Généralités sur les assurances
En Algérie, les branches vie et non-vie de l’assurance Takaful sont proposées par
certaines compagnies d’assurance conformes aux principes de la finance islamique, il existe
deux principales branches :
— Assurance Takaful Vie :L’assurance Takaful Vie offre une protection financière
pour les risques liés à la vie et à la santé de l’assuré. Les produits d’assurance Takaful
Vie en Algérie peuvent inclure :
— Assurance vie
— Assurance santé
— Assurance automobile
— Assurance habitation
18
Chapitre 1 Généralités sur les assurances
a Définition
La titrisation en assurance est une technique financière qui consiste à transférer des
risques d’assurance à des investisseurs opérant sur les marchés financiers internationaux.
Ce transfert est effectué en regroupant puis en transformant ces risques en titres financiers
négociables sur les marchés des capitaux.
Le principe général de la titrisation en assurance inclut donc deux éléments :
— le transfert des risques souscrits vers les marchés financiers par le biais d’échanges
de titres Le premier élément relève de l’engineering financière, construction banale
dans le monde bancaire.
Le second aspect consiste à dévier le placement des risques souscrits par l’assureur du
marché traditionnel de la réassurance étroit, où peu d’acteurs opèrent, vers les principales
places financières mondiales où des millions d’intervenants opèrent chaque jour.
Ceci est possible grâce à l’achat et à la vente de produits financiers dont les cash flows
(paiements des intérêts et du principal) sont liés à la couverture d’assurance à laquelle ils
sont rattachés. La réalisation ou non de l’élément assuré va influer sur les résultats des
titres sous-jacents.
[6]
19
Chapitre 1 Généralités sur les assurances
La titrisation renforce l’efficacité du capital car les besoins en fonds propres de-
viennent moins importants. Les obligations sont un des outils de titrisation qui
permettent la monétisation d’actifs incorporels tels que les frais d’acquisition repor-
tés et la valeur actualisée des bénéfices, ce qui constitue une source de financement.
De plus la titrisation permet aux compagnies d’assurance vie de transférer les risques
de nature catastrophique (mortalité extrême due à une pandémie par exemple) vers
les marchés financiers : c’est notamment le cas des obligations vie. Enfin, certaines
opérations de titrisation dégagent des avantages fiscaux pour l’assureur.
20
Chapitre 1 Généralités sur les assurances
Conclusion
Durant ce chapitre nous avons tout d’abord évoqué le mécanisme technique de gestion
des risque et cela en définissant les assurances , les réassurances et les coassurances tout en
mettant l’accent sur le contrat d’assurance . Nous avons aussi introduit les outils financiers
tel que les prime , la limite d’indemnisation et la franchise en assurance .Au final nous
avons mentionné les grandes formes et catégories d’assurance.
Le chapitre qui suit, présentera le marché des assurances, abordera l’historique , les acteurs
les indicateurs et les canaux de communication du marché d’assurance en Algérie .
21
Chapitre 2
Le marché des assurances
Introduction
Dans ce chapitre, nous allons présenter la réalité du marché des assurances en Algérie
et ces évolutions les plus importantes , ainsi que les décisions et lois les plus pertinentes
prises par l’État pour développer ce secteur tout au long de son histoire. nous allons aussi
identifier ces acteurs . Nous allons analyser les indicateurs financiers les plus essentiels
du marché de l’assurance ainsi que les secteurs qui le composent, afin de fournir une
vision générale du marché de l’assurance en Algérie. Nous allons aborder les canaux de
distribution agréés par les compagnies d’assurance et leur rôle dans ce marché.
22
Chapitre 2 Le marché des assurances
Cette période est divisée en trois phases, caractérisées par le monopole de l’état sur le
secteur des assurances et la nationalisation d’entreprises étrangères.
a L’étape no 1 1966-1975
Entre 1966 et 1974, l’Algérie a connu un vide juridique en matière de législation des
assurances , qui n’a pris fin qu’avec la promulgation de "l’ordonnance 74-15 du 30
janvier 1974 " relative à l’assurance automobile. Cette ordonnance a instauré le prin-
cipe d’indemnisation des accidents corporels pour toute victime [7], même si elle n’est pas
considérée comme un tiers vis-à-vis de la personne civilement responsable de l’accident.
Pendant cette période, l’état a institué un monopole sur l’exploitation de toutes les opé-
rations d’assurance, réservant leur exploitation aux entreprises nationales. Parmi les 17
sociétés qui existaient en 1966, seule la SAA a été nationalisée, tandis que toutes les autres
entreprises ont été liquidées, sauf celles qui ont la forme mutuelle. L’ancienne législation
française régissant l’assurance a été abrogée par "l’ordonnance 72-29 du 5 juillet
1973 dès le 5 juillet 1975" [8].
23
Chapitre 2 Le marché des assurances
b L’étape no 2 : 1975-1988 :
Pendant cette période, "la loi 88-31 de 1988" a été promulguée pour préciser les
modalités d’indemnisation et réviser le barème en vigueur en maintenant le principe d’in-
demnisation existant. Bien que la protection des victimes des accidents de la route reste
une préoccupation majeure des pouvoirs publics, une réflexion est engagée pour adapter
le dispositif aux nouvelles données économiques du pays.
Les pouvoirs publics ont également décidé d’organiser le marché de l’assurance en répar-
tissant la couverture des risques entre les quatre sociétés existantes.
— SAA : pour l’assurance automobile, les risques de masse et les assurances de per-
sonnes .
24
Chapitre 2 Le marché des assurances
a 1995-2006
En 1989, la parution des textes relatifs à l’autonomie des compagnies publiques en-
traîne la dé-spécialisation. A compter de cette date, les sociétés ont pu souscrire dans
toutes les branches Cependant, ce n’est qu’après l’adoption de "l’ordonnance n°95-
07 du 25 janvier 1995", supprime le monopole de l’État sur le marché d’assurance et
permet la création de sociétés privées algériennes, Cette ordonnance a aussi entraîné la
réduction de nombre de garanties dont la souscription est obligatoire. C’est ainsi que la
liste ne comprend plus principalement que les assurances de responsabilité civile visant à
garantir le paiement des réparations des victimes d’accidents.[8]
au début de septembre 2004. Une assurance obligatoire (Cat-Nat) contre les catastrophes
naturelles a été mise en application , conformément "l’ordonnance présidentielle n°
03-12 du 26 octobre 2003 " adoptée le 7 octobre 2003 par l’assemblée populaire na-
tionale (APN) et le 14 du même mois par le sénat, ainsi que par le conseil des ministres.[8]
D’après les données de CNA en 2021, les trois compagnies publiques d’assurance dom-
mages (SAA, CAAT, CAAR,CASH) règnent en maîtres sur le marché de l’assurance
25
Chapitre 2 Le marché des assurances
en Algérie, avec une part de marché de 48,67%. Les autres acteurs présents sur le marché,
qu’ils soient de petites compagnies privées et publiques, détiennent la part restante.
— Société publiques :
— Société privée :
2. ALLIANCE Assurances .
— Sociétés mutuelles :
— Société mixte :
Le marché de l’assurance-vie en Algérie connaît une croissance rapide, les primes de-
vant atteindre 2 milliards de dollars d’ici 2026 selon le ministère des finances. Le marché
est dominé par cinq sociétés représentant plus de 70% de part de marché.
— Société publiques :
1. CAARAMA Assurance.
26
Chapitre 2 Le marché des assurances
— Société privée :
1. Macir Vie-SPA.
2. CARDIF El-Djazair.
— Sociétés mutuelles :
1. Le Mutualiste.
— Société mixte :
1. Algerian Gulf Life Insurance Company-SPA.
c Compagnie de réassurance :
Selon UAR Il existe deux (02) compagnies d’assurances habilitées à pratiquer les as-
surances dites Spécialisées, qui assurent le « Crédit ».
a Courtier d’assurance :
27
Chapitre 2 Le marché des assurances
b Courtier de réassurance :
Selon UAR les seuls courtiers en réassurance en algérie sont des courtiers étrangers.
Liste des courtiers de réassurance étrangers, autorisés à exercer sur le marché algérien des
assurances, par arrêté du 3 novembre 2022 (JORA n°84 du 14 décembre 2022) :
1. Gallagher – London.
— Conseil National des assurance ( CNA ) :– est un organe institué par le Mi-
nistère des Finances et présidé par le Ministre chargé des finances.[9]
28
Chapitre 2 Le marché des assurances
— Bureau Unifié Automobile Algérien (BUA) :est une Société par actions (SPA),
pourvue d’un capital social de 13 millions de dinars. Il a pour principale mission la
délivrance de la carte orange, et ce, pour la prise en charge des sinistres automobiles
causés ou subis par des algériens au cours de leurs déplacements dans les pays arabes
signataires de la Convention collective des sociétés d’assurance de 1975.[9]
Le chiffre d’affaires (ou CA) d’une entreprise est la somme des ventes de biens ou de
services facturées sur un exercice.
29
Chapitre 2 Le marché des assurances
Table 2.1 – Marché mondial de l’assurance : évolution du chiffre d’affaires par continent
(2010-2020) en millions USD
D’après les notes conjoncture trimestrielles de (cna) Le marché algérien des assu-
rances a enregistré un chiffre d’affaires de 162,6 milliards de dinars algériens en 2022,
en hausse de 5,9% par rapport à l’année précédente. Cette croissance a été tirée par les
bonnes performances du segment de l’assurance dommages qui a vu son chiffre d’affaires
progresser de 4.7% à 139,6 milliards DZD. L’assurance de personnes s’est également bien
comportée, avec une progression de 19.7% de son chiffre d’affaires à 16,1 milliards DZD.
30
Chapitre 2 Le marché des assurances
31
Chapitre 2 Le marché des assurances
32
Chapitre 2 Le marché des assurances
a Assurance Dommages
33
Chapitre 2 Le marché des assurances
b ASSURANCES DE PERSONNES :
34
Chapitre 2 Le marché des assurances
de 19,7% par rapport à la même période de l’année précédente. Cette croissance a été ti-
rée par des développements positifs dans toutes les branches de l’assurance de personnes,
l’assurance-vie décès étant la branche la plus importante, avec 45.1% du chiffre d’affaires
total de marche.
35
Chapitre 2 Le marché des assurances
ment des affaires en portefeuille, ainsi qu’à l’acquisition de nouvelles affaires, pour
la majorité des sociétés d’assurance.
— ASSISTANCE :La plus importante évolution est marquée par la branche « As-
sistance », avec un taux de plus de 109% et un chiffre d’affaires de 1,7 milliard de
DA, à fin 2022, contre seulement 836,3 millions de DA pour la même période de
l’exercice 2021. Cette remarquable évolution est, notamment, due au retour à la
normale et à la reprise des voyages, en particulier, ce qui a causé l’augmentation
de la demande en garantie « Assistance Voyage », qu’elle soit souscrite en formule
individuelle (+119,3%) ou collective (+87%)[10].
36
Chapitre 2 Le marché des assurances
c Assurance takaful
Le marché de l’assurance Takaful en Algérie est encore au stade initial de son dévelop-
pement. La première société Takaful, Salama Assurances Algérie, a été fondée en 2008.
Cependant, ce n’est qu’en 2022 que la première société publique Takaful, GAM Takaful,
a été lancée. Cela s’est produit après la publication du décret exécutif no. 21-81 par le
gouvernement algérien en 2021, qui établit les conditions et les modalités pour l’exercice
de l’assurance Takaful.
En 2022, la valeur totale du marché Takaful en Algérie était estimée à 48,4 millions de
dollars, enregistrant une augmentation significative de 136,4 % par rapport à la production
totale de l’année 2020. Toutefois, le marché Takaful en Algérie demeure relativement petit,
représentant seulement 0,0002 % du marché global de l’assurance.
Le chiffre d’affaires de l’assurance Takaful est généré uniquement par le guichet d’une seule
compagnie opérant en tant que "Takaful Général". Les autres sociétés agréées et fenêtres
37
Chapitre 2 Le marché des assurances
38
Chapitre 2 Le marché des assurances
39
Chapitre 2 Le marché des assurances
L’ Agence directe :avec 1204 agences et un montant 90 493 (millions) DZD en 2021
les agence directe représente 41% des canaux de distribution utilisés par les compagnies
d’assurance dans le pays . En l’absence de canaux de distribution numériques les agences
directes c’est le seul canal de distribution direct utilisé dans le pays, les services d’assurance
où les services d’assurance sont distribués directement par les agences de la compagnie
d’assurance sur l’ensemble du territoire du pays. Les employés de ces agences sont des
employés directs de la compagnie d’assurance et travaillent pour atteindre ses intérêts[11].
40
Chapitre 2 Le marché des assurances
a La bancassurance :
b La numérisation :
41
Chapitre 2 Le marché des assurances
Conclusion
En conclusion de ce chapitre, nous avons présenté la réalité du marché des assurances
en Algérie, en mettant en évidence les évolutions les plus importantes qu’il a connues au fil
du temps, ainsi que les décisions et lois clés prises par l’état pour son développement. Nous
avons identifié les acteurs de ce marché et analysé les indicateurs financiers significatifs,
offrant ainsi une vision globale du secteur de l’assurance en Algérie. De plus, nous avons
examiné les canaux de distribution agréés par les compagnies d’assurance et leur rôle dans
ce marché.
Ce chapitre nous a permis de mieux comprendre le paysage de l’assurance en Algérie,
son évolution historique et les facteurs clés qui ont contribué à son développement. Il
a également jeté les bases nécessaires pour approfondir notre étude dans les chapitres
suivants.
Dans le prochain chapitre, nous allons nous concentrer sur les techniques des assurances
en abordant quelques lois qui influent sur ce marché.
42
Chapitre 3
Techniques d’assurance
Introduction
Dans ce chapitre, nous explorerons diverses techniques d’assurance qui jouent un rôle
essentiel dans la compréhension et la gestion des risques. Nous examinerons en détail
quatre sections clés de ce chapitre : la loi des grands nombres qui joue un rôle crucial dans le
domaine de l’assurance, car elle permet de prédire de manière statistique le comportement
des risques sur une large population d’assurés.La deuxième section se concentrera sur
l’asymétrie de l’information en assurance. Dans la troisième section, nous aborderons le
concept de sélection adverse. Enfin, nous analyserons l’aléa moral.
43
Chapitre 3 Techniques d’assurance
les primes reçues de tous vont permettre d’indemniser les plus malchanceux.
L’assurance est une invention merveilleuse dont la clé de voûte est la mutualisation
des risques. Nous courons tous des risques au quotidien mais nous ne savons pas s’ils vont
se matérialiser ni quand ils vont se matérialiser. C’est l’aléa, le contrat d’assurance est un
contrat que l’on dit "aléatoire" car on ne sait pas au départ si le sinistre va se produire
ou non. L’avenir est imprévisible et nous ne maîtrisons pas tous nos comportements et
actions. Par ailleurs, un accident peut être provoqué par des tiers. Même le conducteur le
plus prudent peut avoir un accident s’il croise un chauffard.
En revanche, il est possible de mesurer le risque en calculant le nombre de sinistres qui ont
lieu pour une population donnée par l’utilisation des statistiques. Les assureurs réalisent
ce travail de mesure : pour 1 000 automobilistes, combien ont un accident chaque année ?
Pour 1 000 locataires d’appartements, combien ont un dégât des eaux chaque année ? Ces
mesures permettent de calculer les probabilités de sinistre et donc le montant des primes
à provisionner pour pouvoir les couvrir.
Ce sont des provisions qu’on appelle mathématiques, car elles sont estimées grâce à des
formules de probabilités issues des constatations empiriques des assureurs.
Le principe de mutualisation des risques est au cœur de l’activité d’assurance. Il consiste
à répartir le coût de la réalisation d’un sinistre entre les membres d’un groupe soumis
potentiellement au même risque. Chaque année, les assureurs vont collecter les primes de
tous les assurés et les utiliser pour dédommager ceux qui n’auront pas eu de chance et
qui auront subi un sinistre.
Les primes d’assurance conducteur de tous les conducteurs seront utilisées pour dédom-
mager les accidentés, les primes de multirisque habitation de tous les locataires pour ceux
qui auront subi un dégât des eaux. "On ne sait pas où tombe le risque et qui aura un
sinistre, donc tout le monde cotise et seuls les sinistrés sont indemnisés." [12]
44
Chapitre 3 Techniques d’assurance
pour la survie de la mutualité, l’assureur doit veiller à ce qu’un seul sinistre puisse
toucher à la fois un très grand nombre d’assurés et qu’il ne se réalise pas en même
temps, sinon la compensation ne pourrait avoir lieu ;
45
Chapitre 3 Techniques d’assurance
Dans le secteur de l’assurance, la loi des grands nombres produit son axiome. Plus le
nombre d’unités d’exposition (assurés) augmente, plus la probabilité que la perte réelle
par unité d’exposition soit égale à la perte attendue par unité d’exposition est élevée. En
langage économique, on peut dire que la production d’assurance est rentable.
Concrètement, cela signifie qu’il est plus facile d’établir la prime correcte et donc de réduire
l’exposition au risque pour l’assureur, car un plus grand nombre de polices sont émises
dans une classe d’assurance donnée. Il est préférable pour une compagnie d’assurance
d’émettre 500 polices d’assurance incendie plutôt que 150, en supposant une distribution
de probabilité stable et indépendante pour l’exposition aux pertes.
Pour voir les choses autrement, supposons qu’une compagnie d’assurance maladie dé-
couvre que cinq personnes sur 150 subiront une blessure grave et coûteuse au cours d’une
année donnée. Si la compagnie n’assure que 10 ou 25 personnes, elle est confrontée à des
risques bien plus importants que si elle peut assurer les 150 personnes. La compagnie
peut être plus sûre que les 150 assurés paieront collectivement des primes suffisantes pour
couvrir les demandes d’indemnisation de cinq clients qui ont subi des blessures graves.[13]
46
Chapitre 3 Techniques d’assurance
En termes plus assuranciels, la probabilité que la différence entre le coût moyen (par
contrat) et la prime pure soit plus petite que n’importe quelle constante arbitraire tend
vers 1 (événement certain) lors que la taille du portefeuille augmente à l’infini.
Formellement, ce théorème (sous cette forme) a été établi par Alexandre Khintchine en
1929 (des preuves beaucoup plus anciennes peuvent être trouvées, mais elles supposent en
plus que la variance est finie). Mais ce théorème n’a que peu d’intérêt réel en assurance.
La seule chose qu’il dise est que, lorsque l’on construit une table de mortalité, la fréquence
de décès à un âge donné doit être très proche de la probabilité de décéder à cet âge si
l’échantillon (ou population de référence) est suffisamment grand. Soit formellement :
P (| Dx
Nx
− qx | > ϵ) → 0 pour tout ϵ > 0 lorsque Nx → ∞
Ce théorème ne parle pas de risque (ou dans le langage de Markowitz de variance). L’idée
que la mutualisation réduit le risque ne vient pas de la loi des grands nombres, mais du
théorème central limite.
Il est tout aussi ancien que la loi des grands nombres (on peut le faire remonter aux
travaux de De Moivre en 1733), même si le terme ne date que de 1920 (sous l’impulsion
de Georg Polya), car pour lui ce résultat limite jouait un rôle « central » dans la théorie
des probabilités. Adams (2009) et Fisher (2011) retracent l’histoire de ce théorème qui
47
Chapitre 3 Techniques d’assurance
n’apparaît chez de Moivre que sous une version très simplifiée. La version que l’on utilise
est plutôt celle proposée par Pierre-Simon de Laplace en 1812. On notera toutefois que
Paul Lévy, par exemple, a proposé des extensions intéressantes, en particulier pour les
très grands risques. Ce théorème s’énonce lui de la manière suivante :
C’est essentiellement à cause de ce théorème que la loi normale est autant présente
en statistique. Et l’interprétation en est à la fois simple et très importante : si les risques
sont indépendants, homogènes et de variance finie, alors la loi de la charge totale est
approximativement gaussienne. On peut alors en déduire toutes les mesures de risques
possibles (ce qui est fait dans la formule standard de Solvabilité II).
3.2.1 Définition
Les asymétries d’information désignent les situations où les acteurs d’un marché ne
disposent pas de la même information, qu’il s’agisse de la qualité du produit échangé,
des risques auxquels sont exposés les agents ou encore des comportements de chacune des
parties à une transaction.
L’asymétrie informationnelle est souvent présente dans les marchés économiques, entre
autres dans les assurances. Par exemple, dans le secteur de l’assurance automobile, en
l’absence d’une information publique abondante, il devient difficile pour un assureur de
calculer une prime adéquate pour l’assuré.
L’existence d’une relation de conflit d’intérêts entre l’assuré et l’assureur est la raison de la
présence de cette asymétrie informationnelle. D’un côté, l’objectif principal de l’assureur
est de maximiser son profit. Il va essayer de récolter le plus d’information possible sur son
client afin de lui charger une prime qui ne va pas générer des pertes futures. L’assuré, de
son côté, a pour objectif principal, en prenant une assurance automobile, de maximiser
48
Chapitre 3 Techniques d’assurance
La théorie des jeux permet de modéliser cette problématique du choix sous condition
des choix des autres entreprises. Mais, les asymétries d’information peuvent être repré-
sentées de plusieurs façons.
Soit il s’agit d’une asymétrie portant sur les résultats, c’est-à-dire sur les paiements du
jeu, ou sur les stratégies pouvant être envisagées. Le jeu sera alors joué en information
incomplète. C’est le jeu le plus délicat. Par exemple, c’est le cas d’une entreprise qui ne
sait pas où en est son concurrent en matière de recherche et développement et qui ne peut
donc pas anticiper ses décisions stratégiques.
Soit il s’agit d’une asymétrie portant sur la stratégie que jouera une entreprise parmi un
ensemble de stratégies bien identifié. Le jeu sera alors joué en information imparfaite.
C’est le cas d’une entreprise qui connaît parfaitement ses concurrents et qui peut antici-
per l’ensemble des stratégies possibles sans toutefois avoir l’information sur celle qui sera
précisément jouée.
Soit il s’agit d’une asymétrie portant sur les règles du jeu. Les deux joueurs n’ont pas
la même information sur le jeu. Ils n’en ont pas la même perception subjective. Ils joue-
ront alors deux jeux différents. Le jeu n’est ni en information complète, ni en information
imparfaite, il s’agit de deux jeux faiblement interconnectés. La rationalité des joueurs
est limitée. Leur information s’améliorera avec le mécanisme d’apprentissage. C’est le cas
des secteurs hautement technologiques où chaque entreprise travaille sur des technologies
complètement différentes censées pourtant rendre le même service.
49
Chapitre 3 Techniques d’assurance
3.3.1 Définition
50
Chapitre 3 Techniques d’assurance
51
Chapitre 3 Techniques d’assurance
La sélection adverse a été introduite par Akerlof (1970) dans son article où il a pris
comme exemple le marché des voitures d’occasion appelées aussi les « citrons ». Sur ce
marché, il n’y a que les vendeurs qui possèdent une information sur la qualité de leurs
voitures. Supposons qu’un vendeur de voitures de bonne qualité accepte le prix de 4000
$ pour la vendre et un vendeur de voitures de mauvaise qualité accepte le prix de 2000 $.
Les acheteurs, ayant pour seule information l’existence de voitures de mauvaise qualité
sur le marché offriront seulement 3125 $ pour l’achat d’une voiture.
Mais à ce prix, les vendeurs de voitures de bonne qualité refusent de vendre leurs voitures
et se retirent du marché.
Ainsi au final, le marché sera composé seulement des vendeurs de voitures de mauvaise
qualité qui seront vendues à un prix surévalué.
Par analogie à cet exemple, le problème de la sélection adverse dans le marché de l’as-
surance automobile se présenterait comme suit. Dans une situation de monopole, nous
avons un seul assureur et plusieurs assurés qui sont différents. Les assurés se décomposent
en deux types, les faibles risques et les hauts risques.
Toutefois, l’assureur ne peut pas distinguer le niveau de risque des deux types. Suppo-
sons aussi que l’assureur charge la même prime à tous les assurés. Par sécurité, l’assureur
charge la prime qui reflète le risque le plus élevé. Ainsi, cette prime reflétera un niveau
de risque situé entre les deux types d’assurés. En conséquence, les assurés à faible risque
décideront de ne pas s’assurer parce que la prime est surévaluée. Par contre, tous les as-
surés à haut risque achèteront l’assurance parce que la prime est sous-évaluée.
En fin de compte, l’assureur aura un portefeuille composé uniquement d’assurés à haut
risque et la prime qu’ils paieront ne reflétera pas leur vrai niveau de risque. Ainsi, l’assu-
reur n’est pas intéressé à charger cette prime.
52
Chapitre 3 Techniques d’assurance
D’après cette définition, la sélection adverse est une forme d’opportunisme pré-contractuel.
Les assurés connaissent déjà leurs risques avant l’écriture du contrat et vont choisir parmi
une multitude de contrats celui qui sera le plus avantageux pour eux.
Les solutions pour pallier ce type d’imperfection peuvent être envisagées à différents
niveaux : au sein des marchés eux-mêmes par la diffusion explicite de l’information pri-
vée,ou par la mise en place de contraintes d’auto sélection.[17]
53
Chapitre 3 Techniques d’assurance
proposant un contrat d’assurance standard (avec une franchise élevée) surtout des-
tiné aux bas risques et des contrats plus globaux ou sans franchise (et donc plus
chers) choisis par les individus concernés. Selon le choix de l’assuré, l’assureur peut
identifier son niveau de risque. L’assuré va s’auto-sélectionner. La crédibilité est ga-
rantie par la présence d’une franchise qu’un mauvais risque n’aurait aucun intérêt
à accepter même en échange d’une réduction tarifaire.
De même, les employeurs doivent distinguer les bons des mauvais travailleurs. Comme
ils ne peuvent pas, ils offrent le même salaire à tous (salaire reflétant la productivité
moyenne de tous les travailleurs de la population). Mais un tel salaire peut être trop
faible pour attirer les bons travailleurs : seuls les mauvais travailleurs accepteront.
Nous allons montrer qu’une politique salariale qui n’offre qu’une partie de salaire
en fixe, l’autre partie étant basée sur les pourboires reçus, permet-il à l’employeur
de distinguer les bons des mauvais serveurs. Seuls les bons serveurs resteront : les
salariés vont s’auto-sélectionner.
3.4.1 Définition
L’aléa moral ou le moral hasard consiste dans le fait qu’une personne ou une entre-
prise assurée contre un risque peut se comporter de manière plus risquée que si elle était
totalement exposée au risque.
Soit R la variable aléatoire représentant le niveau de risque réel d’un assuré avant la sous-
cription de l’assurance (par exemple, le nombre d’accidents par an). Soit A la variable
aléatoire représentant le niveau de risque signalé par l’assuré lors de la souscription de
l’assurance.
Avant l’assurance, le comportement de l’assuré est gouverné par R. Cependant, une
fois assuré, l’assuré peut modifier son comportement en adoptant un comportement plus
risqué. Cela peut être représenté par une fonction F qui transforme la variable R en un
nouveau niveau de risque R′ .
R′ = F (R)
La fonction F peut être définie de différentes manières en fonction du comportement
spécifique des assurés. Par exemple, elle peut prendre la forme d’une fonction linéaire
54
Chapitre 3 Techniques d’assurance
55
Chapitre 3 Techniques d’assurance
La notion d’aléa moral a été introduite au XVIIe siècle par l’économiste écossais Adam
Smith (1723-1790) qui est considéré comme le père de l’économie politique. Selon lui, l’aléa
moral apparaît lorsque la recherche de l’intérêt individuel est si forte qu’elle méconnaît
l’impact négatif d’une décision sur « l’utilité collective ».
En assurance, l’aléa moral revient à dire qu’un assuré peut augmenter sa prise de risque
dès qu’une police le met à l’abri des conséquences négatives d’un sinistre. En d’autres
termes, les efforts d’un assuré pour éviter un risque sont proportionnels au niveau d’in-
demnisation qu’il peut espérer.
C’est pour limiter ce risque que les assureurs fixent un niveau d’effort minimal, par
exemple des normes de construction. L’objectif est de responsabiliser l’assuré. Si celui-
ci, par exemple le promoteur, ne respecte pas ce taux d’effort minimal, il ne sera pas
indemnisé.
Il existe plusieurs façons de minimiser les aléas moraux. Le premier est d’encourager
la partie qui prend des risques à agir de manière plus responsable en lui offrant des
incitations. La seconde est d’instituer des politiques qui découragent un comportement
immoral en en faisant une infraction punissable. Enfin, un suivi régulier permet à la partie
à risque de savoir si l’autre partie en profite ou non.[18]
Ainsi, les assureurs se protègent de ce genre de situation grâce à la « coassurance », par
laquelle les assurés ne sont remboursés qu’en partie de leurs dommages. Dans l’assurance
automobile, par exemple, la coassurance prend souvent la forme d’une franchise qui définit
le montant des dommages restant à la charge de l’assuré.
Dans la plupart des pays, les systèmes d’assurance santé comprennent eux aussi un élément
de coassurance ; l’objectif n’est pas tant de dissuader les comportements à risque comme
la consommation de tabac ou d’alcool que de limiter les recours excessifs aux médecins
ou aux médicaments.
56
Chapitre 3 Techniques d’assurance
Conclusion
En conclusion, les compagnies d’assurance sont confrontées à une série de défis com-
plexes dans leur activité. Comprendre les principes de base tels que la loi des grands
nombres, l’asymétrie de l’information, la sélection adverse et l’aléa moral est essentiel
pour concevoir des stratégies de gestion des risques efficaces, pour tarifer correctement
les polices d’assurance et pour maintenir la stabilité financière. La prise en compte de
ces aspects dans la pratique de l’assurance est cruciale pour assurer la pérennité et la
confiance dans le secteur.
57
Chapitre 4
Techniques de classification
Introduction
Dans ce chapitre, nous allons explorer les fondements de l’apprentissage automatisé et
examiner différents types d’apprentissage, en mettant l’accent sur l’apprentissage non su-
pervisé. Nous allons également présenter plusieurs algorithmes couramment utilisés pour
la classification non supervisée. De plus, nous allons aborder des mesures de qualité de la
classification qui nous permettent d’évaluer les performances des algorithmes de classifi-
cation.
4.1.1 Définition
58
Chapitre 4 Techniques de classification
59
Chapitre 4 Techniques de classification
a Apprentissage supervisé
2. Prétraitement des données : Les données peuvent nécessiter une étape de pré-
traitement pour les nettoyer, les normaliser ou les transformer afin de les rendre
appropriées pour l’apprentissage.
3. Séparation des données : L’ensemble de données est divisé en deux parties dis-
tinctes : un ensemble d’entraînement et un ensemble de test. L’ensemble d’entraî-
nement est utilisé pour entraîner le modèle, tandis que l’ensemble de test est utilisé
pour évaluer ses performances.
6. Validation du modèle : Une fois le modèle entraîné, il est évalué en utilisant l’en-
semble de test. On examine la précision de ses prédictions et sa capacité à généraliser
aux nouvelles données.
7. Utilisation du modèle : Une fois que le modèle est validé et jugé performant, il
peut être utilisé pour prédire les réponses pour de nouvelles données non étiquetées.
[20]
60
Chapitre 4 Techniques de classification
l’apprentissage supervisé peut être séparé en deux types de problèmes lors de l’exploration
de données :
— La classification : est une méthode qui utilise utilisent un algorithme pour attri-
buer avec précision les données de test dans des catégories spécifiques, telles que la
séparation des pommes des oranges. Ou, dans le monde réel, des algorithmes d’ap-
prentissage supervisé peuvent être utilisés pour classer les spams dans un dossier
séparé d’une boîte de réception.Les classificateurs linéaires, les machines à vecteurs
de support, les arbres de décision et les forêts aléatoires sont tous des types courants
d’algorithmes de classification.
b Apprentissage non-supervisé
61
Chapitre 4 Techniques de classification
Dans l’apprentissage non supervisé, l’objectif principal est de découvrir des structures
cachées, des regroupements ou des schémas inhérents aux données. Cela peut aider à ob-
tenir des informations précieuses sur les données sans avoir à fournir d’étiquettes ou de
réponses explicites.
l’exemple le plus utilisé est un algorithme de regroupement (clustering) tel que le k-means
pour diviser les clients en différents groupes en fonction de leurs similitudes. L’algorithme
identifiera automatiquement les groupes qui ont des caractéristiques similaires, sans qu’il
soit nécessaire de fournir des étiquettes ou des catégories prédéfinies. [20]
1. Collecte des données : La première étape consiste à collecter les données brutes
pour effectuer l’apprentissage non supervisé. Les données peuvent provenir de di-
verses sources, telles que des bases de données, des fichiers CSV, des textes, des
images, etc.
62
Chapitre 4 Techniques de classification
non supervisé, il est souvent nécessaire de prétraiter les données. Cela peut inclure
des étapes telles que le nettoyage des données, la normalisation, la réduction de
dimensionnalité, la gestion des valeurs manquantes, etc. L’objectif est de préparer
les données pour une analyse plus approfondie.
3. Sélection de l’algorithme : En fonction des objectifs et du type de données dis-
ponibles, l’étape consiste à sélectionner l’algorithme d’apprentissage non supervisé
approprié. Il existe plusieurs types d’algorithmes, tels que le clustering (regroupe-
ment), la détection d’anomalies, la réduction de dimensionnalité, etc.
4. Application de l’algorithme : Une fois que l’algorithme approprié est choisi, il
faudra l’appliquer aux données prétraitées. L’algorithme explorera les structures, les
modèles ou les relations dans les données et générera des résultats.
5. Interprétation des résultats : Cette étape implique l’interprétation des résultats
obtenus à partir de l’algorithme d’apprentissage non supervisé. Reste à analyser les
groupes, les clusters ou les schémas identifiés et tirer des conclusions ou des insights
significatifs.
6. Évaluation : Selon le type d’algorithme utilisé, il peut y avoir des métriques spé-
cifiques pour évaluer la qualité des résultats. Par exemple, dans le clustering, des
mesures telles que l’inertie intra-cluster ou le coefficient de silhouette peuvent être
utilisées pour évaluer la cohérence des clusters formés.
7. Répétition et ajustement : Selon les résultats et les conclusions tirées, il sera
plus facile de répéter les étapes précédentes en ajustant certains paramètres ou en
essayant différents algorithmes pour améliorer les résultats.
Les modèles d’apprentissage non supervisé sont utilisés pour trois tâches principales,le
regroupement,l’association et la réduction de la dimensionnalité :
— La segmentation (clustering) : est une technique d’exploration de données per-
mettant de regrouper des données non étiquetées en fonction de leurs similitudes ou
de leurs différences. Par exemple, les algorithmes de segmentation K-means attri-
buent des points de données similaires en groupes, où la valeur K représente la taille
du groupement et la granularité. Cette technique est utile pour la segmentation du
marché, la compression d’images, etc.
— Association : est une méthode qui utilise différentes règles pour trouver des rela-
tions entre des variables dans un ensemble de données connu . Ces méthodes sont
63
Chapitre 4 Techniques de classification
Source :Wikipédia
64
Chapitre 4 Techniques de classification
3. Action : L’agent choisit une action à effectuer en fonction de l’état actuel de l’en-
vironnement. L’ensemble des actions possibles est défini à l’avance.
4. Récompense : Après avoir effectué une action, l’agent reçoit une récompense ou
une pénalité de la part de l’environnement. La récompense indique la qualité de
l’action prise par l’agent.
5. Politique : L’agent utilise une politique pour prendre des décisions. Une politique
est une stratégie ou une règle qui guide le choix des actions en fonction de l’état
actuel.
d Apprentissage semi-supervisé
65
Chapitre 4 Techniques de classification
1. Collecte des données : Les données étiquetées et non étiquetées sont collectées
à partir de différentes sources. Les données étiquetées sont généralement plus coû-
teuses à obtenir car elles nécessitent une annotation manuelle par des experts, tandis
que les données non étiquetées sont plus abondantes et peuvent provenir de diverses
sources.
3. Utilisation des données non étiquetées : Le modèle initial est utilisé pour
prédire les étiquettes des données non étiquetées. Ces prédictions sont ensuite com-
binées avec les données étiquetées existantes pour former un nouvel ensemble de
66
Chapitre 4 Techniques de classification
— Scoring : Qui est de plus en plus répandue dans le secteur de l’assurance est . Le
scoring est une méthode permettant d’évaluer le risque associé à un individu ou à
un contrat. Traditionnellement, les assureurs se basaient sur des critères statistiques
et des modèles mathématiques pour déterminer le score de risque.
Cependant, l’apprentissage automatisé offre de nouvelles possibilités en permettant
aux assureurs d’exploiter de grandes quantités de données et d’identifier des schémas
complexes. Grâce à des algorithmes de machine learning, il est possible de créer des
modèles prédictifs plus précis et plus personnalisés.
67
Chapitre 4 Techniques de classification
— K-means
— Spectral Clustering
— Mean-Shift
Dans la suite nous allons définir en detaille quelque algorithmes cité précédemment
L’algorithme k-means, mis au point par McQueen en 1967, est l’un des algorithmes
les plus simples d’apprentissage non supervisé. Il est également connu sous le nom d’al-
gorithme des centres mobiles. Cet algorithme attribue chaque point à un cluster dont le
centre (centroïde) est le plus proche. Le centre est la moyenne de tous les points présents
dans le cluster, et ses coordonnées sont la moyenne arithmétique pour chaque dimension
séparément à partir de tous les points du cluster. Ainsi, chaque cluster est représenté par
son centre de gravité [25].
68
Chapitre 4 Techniques de classification
a Définition
L’idée principale de l’algorithme k-means est de définir k centroïdes arbitraires µ01 , . . . , µ0k
où k est le nombre de clusters fixé à l’avance. Chaque centroïde représente le centre d’une
classe. Il est préférable de les placer le plus éloignés possible les uns des autres. Ensuite,
chaque point du jeu de données est associé au centroïde le plus proche. Ainsi, chaque
classe K est représentée par un ensemble d’individus les plus proches de son centroïde
µi . Les nuées dynamiques sont une généralisation de ce principe, où chaque cluster est
représenté par un noyau plus complexe qu’une simple moyenne.
Une fois qu’il n’y a plus de points en attente, la première étape est terminée et un
groupage préliminaire est réalisé. À ce stade, les k nouveaux centroïdes µi des groupes ob-
tenus à partir de l’étape précédente sont recalculés pour remplacer les anciens centroïdes
µti . Chaque nouveau centroïde µt+1
i est calculé comme le centre de gravité de la classe
correspondante Cit+1 , en utilisant les nouvelles classes obtenues. Ensuite, le processus est
répété jusqu’à ce qu’un état de stabilité soit atteint, où aucune amélioration supplémen-
taire n’est possible. On peut observer que les k centroïdes se déplacent étape par étape
jusqu’à ce qu’il n’y ait plus de changements. En d’autres termes, les centroïdes finissent
par rester fixes.
69
Chapitre 4 Techniques de classification
3. Recalage des centres : Pour chaque classe k, le centre µk est recalculé comme
étant la moyenne arithmétique de toutes les données appartenant à cette classe,
suite à l’étape d’affectation précédente : ∀k = 1, . . . , K
Pn (t)
(t+1) i=1 zik xi
µk = Pn (t) (4.1)
i=1 zik
4. La stabilité des centres : on peut vérifie la stabilité des centres entre µt+1
k et µtk
utilisant Critère de convergence basé sur la minimisation de le critère d’erreur (la
70
Chapitre 4 Techniques de classification
distorsion) J
n X
X K
J(t) = zik (t) ||xi − µk (t)| |2 (4.2)
i=1 k=1
|J(t + 1) − J(t)|
≤ε (4.3)
|J(t)|
Les centres des classes sont considérés comme stables et l’algorithme k-means peut
être arrêté. Cela signifie que les centres ne changent pas de manière significative
d’une itération à l’autre et ont convergé vers une configuration stable.
Sinon, il faut répéter les étapes 2 et 3.
c La limitation du K-Means
a Définition
71
Chapitre 4 Techniques de classification
larges. Elle se base sur la similarité entre les échantillons et utilise une approche ascen-
dante, c’est-à-dire qu’elle part des échantillons individuels pour former des groupes de
plus en plus grands. L’idée principale de la méthode est de mesurer la similarité entre les
échantillons, puis de regrouper ceux qui sont les plus similaires. Ce processus est répété
jusqu’à ce qu’un seul cluster global soit formé, ou jusqu’à ce qu’un certain critère d’arrêt
soit atteint. La méthode de classification hiérarchique ascendante produit généralement
un dendrogramme, qui est une représentation visuelle de la structure hiérarchique des
clusters. À partir de ce dendrogramme, on peut déterminer les clusters finaux en choisis-
sant un niveau de découpage approprié. Les échantillons regroupés ensemble à ce niveau
reçoivent une étiquette pour indiquer leur appartenance à un cluster spécifique. [26]
Les étapes les plus pertinentes permettant la construction d’une hiérarchie de regrou-
pements à partir des échantillons toute en facilitant l’analyse de la structure des données
sont :
72
Chapitre 4 Techniques de classification
- La distance cosinus : qui est souvent employée pour cumuler les contributions
des différents types de variables décrivant les données. Pour chaque donnée (obser-
vation), les représentations des différentes variables sont directement concaténées
dans un vecteur de dimension élevée , sa formule mathématique est la suivante
Pn
xi · y i
1 − pPn i=1 2
pPn
2
(4.6)
i=1 xi · i=1 yi
— Fusion des clusters : Les clusters les plus similaires sont fusionnés à chaque étape.
La paire de clusters avec la plus grande similarité est identifiée et fusionnée pour
former un nouveau cluster. La similarité entre les clusters fusionnés est recalculée
en utilisant une mesure de similarité mise à jour.
— Affectation d’une étiquette : Une fois que les clusters sont formés, les échantillons
qui appartiennent à chaque cluster reçoivent une étiquette ou un identifiant pour
indiquer leur appartenance à ce cluster. Cela permet de catégoriser les données en
fonction des groupes obtenus lors de la classification hiérarchique ascendante.
73
Chapitre 4 Techniques de classification
c La limitation de la AHC
— Complexité computationnelle
a Définition :
74
Chapitre 4 Techniques de classification
- distance maximale (EPS) : L’epsilon détermine la portée des points voisins lors
de la formation des clusters. Une valeur d’epsilon plus grande permettra d’inclure
davantage de points dans un même cluster, tandis qu’une valeur plus petite donnera
des clusters plus compacts. Il n’y a pas de valeur unique appropriée pour epsilon,
cela dépendra de la structure des données et de la densité attendue des clusters.
L’exploitation de différentes valeurs d’epsilon en utilisant des techniques telles que
le graphique "k-distance" ou le "k-nearest neighbors"est conseillée pour trouver une
valeur qui capture les relations de voisinage souhaitées.
- Nombre minimum de points (MinPts) : Le MinPts détermine le nombre minimum
de points requis pour former un cluster. Un MinPts plus élevé permettra de former
des clusters plus denses, tandis qu’un MinPts plus faible permettra de détecter des
clusters plus petits. La valeur de MinPts dépendra de la densité des données et de la
taille attendue des clusters. Il est recommandé de choisir une valeur qui est au moins
égale à la dimension des données plus 1. Cependant, il est courant d’expérimenter
différentes valeurs de MinPts pour trouver celle qui fonctionne le mieux pour un
ensemble de données spécifique.
— Détection des points centraux : La détection des points centraux repose sur le
principe que les points situés dans les régions denses de l’espace auront un nombre
suffisant de voisins à proximité. Ces points centraux servent de base pour former les
clusters dans DBSCAN. Les points qui ne sont pas des points centraux mais qui se
trouvent à une distance epsilon d’un point central peuvent être considérés comme
des points frontières et être ajoutés au même cluster.
— Formation des clusters : Former les clusters en associant les points centraux et
leurs points voisins dans un même cluster. Un point est considéré comme voisin d’un
autre point s’il se trouve dans la distance epsilon.
— Attribution des points de bruit : Identifier les points qui ne sont pas des points
centraux ni des points frontières et les marquer comme des points de bruit ou de
contamination.
75
Chapitre 4 Techniques de classification
c La limitation du DBSCAN
— Sensible à la dimensionnalité
où K est le nombre de clusters, Ci représente le i-ème cluster, x est une donnée dans le
cluster Ci , et µi est le centre du cluster Ci .
- B représente l’inertie inter-classe, qui mesure la séparabilité des clusters en évaluant
la différence entre les clusters.
K
X
B= ni ∥µi − µ∥2 (4.8)
i=1
76
Chapitre 4 Techniques de classification
— Le coefficient de silhouette
L’indice de silhouette est une mesure de qualité d’une partition d’un ensemble de don-
nées.Pour chaque point, son coefficient de silhouette est la différence entre la distance
moyenne avec les points du même groupe que lui (cohésion) et la distance moyenne avec
les points des autres groupes voisins (séparation). Si cette différence est négative, le point
est en moyenne plus proche du groupe voisin que du sien : il est donc mal classé. À l’in-
verse, si cette différence est positive, le point est en moyenne plus proche de son groupe
que du groupe voisin , il est donc bien classé [28] .
On notera que l’indice de silhouette est borné : −1 ≤ s(ei ) ≤ 1.
77
Chapitre 4 Techniques de classification
b(i) − a(i)
s(i) = (4.11)
max{a(i), b(i)}
Source :The Silhouette Loss Function : Metric Learning with a Cluster Validity Index
L’indice de Dunn est basé sur l’identification de clusters compacts et bien séparés.
Il est défini par le rapport entre la plus petite dissimilarité inter-classe (i.e. entre deux
individus de deux classes différentes) et la plus grande dissimilarité intra-classe (i.e. entre
deux individus de la même classe). la valeur de cet indice est plus élevée que les groupes
sont compacts et bien séparés. [29]
C = {c1 , c2 , . . . , ck } où k est le nombre des classes .L’indice de Dunn est calculé selon la
78
Chapitre 4 Techniques de classification
formule suivante :
mini̸=j (dinter (ci , cj ))
D= (4.13)
maxi (dintra (ci ))
où
dinter (ci , cj ) est la distance entre les clusters ci
et
cj , et dintra (ci ) est la distance intra-cluster pour le cluster ci .
L’indice de Calinski-Harabaz ou indice VRC est basé sur la variance intra classes,
c’est-à-dire la dispersion des points dans chaque classe et la variance interclasses L’indice
de Calinski-Harabasz est calculé comme suit :
B(k) N −k
CH = × (4.14)
W (k) k−1
où :
B(k) : est la somme des distances entre les centres des clusters et le centre global
W (k) : est la somme des distances intra-cluster
N : est le nombre total d’observations
k : est le nombre de clusters.
79
Chapitre 4 Techniques de classification
a La fraude à la souscription
80
Chapitre 4 Techniques de classification
peut réclamer une indemnité suite à un sinistre qu’il a lui-même provoqué. Cette forme
de fraude implique des comportements frauduleux de la part de l’assuré dans le but de
bénéficier financièrement de manière déloyale.
Certains exemples courants de fraude en cours de contrat incluent la simulation d’un
accident, la déclaration de dommages prétendument causés par un tiers, mais qui ont
été intentionnellement provoqués par l’assuré lui-même, ainsi que la non-divulgation de
changements importants dans les circonstances ou l’utilisation du véhicule qui affectent
le risque assuré.
81
Chapitre 4 Techniques de classification
d’algorithmes dans cette technologie permet de détecter des modèles dans de vastes en-
sembles de données, ce qui s’avère être un outil efficace pour identifier et atténuer la
fraude.
Les algorithmes d’apprentissage automatique sont capables de repérer des modèles
dans les données que les humains pourraient ne pas être en mesure de détecter. Cette
technologie permet aux assureurs de détecter rapidement et précisément les activités
suspectes. En analysant les données des clients en temps réel, ces algorithmes peuvent
rapidement identifier et prévenir les activités frauduleuses, contribuant ainsi à protéger
les clients contre les pertes et à sécuriser le système.
Dans ce cas, nous pouvons utiliser l’apprentissage automatique supervisée ou des tech-
niques basées sur les statistiques pour détecter les activités frauduleuses. Cela peut être
réalisé en formant un modèle supervisée d’apprentissage automatique ou en utilisant des
algorithmes adéquats pour trouver les relations cachées entre le client frauduleux et les
données, afin de prendre des décisions basées sur les informations disponibles concernant
le client en question. Ces techniques permet d’analyser les données de manière exhaustive
et de détecter des schémas et des relation qui pourraient indiquer des activités fraudu-
leuses. Des techniques telles que l’analyse de données, l’analyse de réseaux et les modèles
prédicatifs peuvent être utilisées pour identifier les comportements suspects et prendre les
mesures appropriées.
82
Chapitre 4 Techniques de classification
b L’ensemble de données n’a pas (ou seulement un très petit nombre) d’exemples
de fraude. :
Conclusion
En conclusion de ce chapitre, nous avons exploré les fondements de l’apprentissage
automatisé et examiné différents types d’apprentissage, en mettant l’accent sur l’appren-
tissage non supervisé. Nous avons également présenté plusieurs algorithmes couramment
utilisés pour la classification non supervisée, tels que K-means, AHC et DBSCAN. De
plus, nous avons abordé les mesures de qualité de la classification, telles que l’indice de
Dunn, l’indice de silhouette et l’indice de Calinski-Harabasz, qui nous permettent d’éva-
luer les performances des algorithmes de classification.
Dans le prochain chapitre, nous nous concentrerons sur l’application concrète de ces al-
gorithmes de classification. Nous commencerons par présenter l’organisme d’accueil de
notre stage de fin d’étude et décrire la base de données d’apprentissage que nous uti-
83
Chapitre 4 Techniques de classification
liserons. Ensuite, nous appliquerons les algorithmes de classification sur ces données et
interpréterons les résultats obtenus. Cette étape nous permettra de mettre en pratique
les concepts théoriques que nous avons abordés jusqu’à présent et d’évaluer la pertinence
des algorithmes choisis pour notre étude.
84
Chapitre 5
Classification des clients en portefeuille en
fonction de la rentabilité
Introduction
Dans ce chapitre, nous commencerons par introduire l’organisme d’accueil qui a géné-
reusement mis à notre disposition les données nécessaires pour notre étude. Nous fourni-
rons ensuite une description détaillée de la base de données, en mettant en évidence les
variables pertinentes pour évaluer la rentabilité des clients en portefeuille. Nous présen-
terons également quelques statistiques clés sur la base de données.
Par la suite, nous aborderons le calcul des rentabilités pour chaque client, en mettant
en évidence trois indicateurs principaux : la rentabilité totale, la rentabilité moyenne et la
rentabilité en valeur assurée. Ces indicateurs nous permettront d’évaluer la performance
financière des clients et de quantifier leur contribution au résultat global de l’organisme
d’accueil.
Une fois les rentabilités calculées, nous passerons à l’application des algorithmes de
classification sur notre base de données expérimentale. Les trois méthodes de classification
choisies, à savoir le K-means, l’AHP et le DBSCAN, seront utilisées pour segmenter les
clients en groupes homogènes selon leur rentabilité.
Enfin, nous évaluerons la qualité des classifications obtenues en calculant plusieurs
indices de bonne classification, tels que les indices de Dunn, de silhouette et de Calinski-
Harabasz. Ces indices nous permettront d’évaluer la cohérence et la séparation des clusters
obtenus, en tenant compte des critères de compacité et de séparation des groupes.
85
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
5.1.2 Organisation
Le bureau est présidé par le représentant du ministre chargé des finances. Il est composé
des membres suivants :
Les membres du bureau sont désignés par arrêter du ministre chargé des finances sur
proposition de l’autorité dont ils relèvent pour une période de trois années, renouvelable.
En cas d’interruption du mandat de l’un des membres, pour quelque motif que ce soit, il
est pourvu à son remplacement dans les mêmes formes. Le membre nouvellement désigné
lui succède jusqu’à l’expiration du mandat en cours.
Le président du bureau peut faire appel à toute personne susceptible d’éclairer, par ses
compétences, les travaux du bureau. Pour exercer ses missions, le bureau est doté d’un
secrétariat dont l’organisation et le fonctionnement sont fixés par le règlement intérieur
du bureau.
5.1.3 Missions
Le bureau d’études et d’expertise, de par son rôle dans les travaux d’élaboration et
de révision de tarifs en matière d’assurance obligatoire et facultative et des paramètres
de tarification dont il a la charge, se voit ainsi attribuer un rôle d’émettre des avis tech-
niques sur les projets de tarifs que l’administration de contrôle lui transmet, telles sont ces
86
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
missions. BST est doté d’une équipe d’actuaires lui permettant de traiter toutes les spé-
cificités actuarielles, telles que la tarification, la gestion du risque, les provisionnements.
Conformément aux dispositions de l’article 231 de l’ordonnance n° 95-07 du 23 Chaâ-
bane 1415 correspondant au 25 janvier 1995, susvisée, le bureau a pour objet notamment
d’élaborer des projets de tarifs, d’étudier et d’actualiser les tarifs d’assurance en vigueur.
87
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
D’après l’histogramme, on remarque des variations peu significatives dans les primes
peuvent indiquer une certaine stabilité dans les revenus générés par les contrats d’assu-
rance. Cela peut être favorable pour la planification financière et la prévisibilité des flux
de trésorerie pour l’entreprise.Concernant les indemnisations par année, nous remarquons
également des différences entre les années. Certaines années ont enregistré des indemnisa-
tions importantes, tandis que d’autres années ont connu des indemnisations plus faibles.
Cette observation suggère des variations dans les coûts liés aux sinistres d’une année à
l’autre.
D’après notre base expérimentale, on peut déduire que les variables peuvent être di-
visées en trois parties :
a Partie Assuré
Cette partie met en lumière les variables clés liées à la partie assurée dans les contrats
d’assurance, jouant un rôle crucial dans la fixation des primes. Ces variables sont extraites
des informations fournies par l’assuré et sont essentielles pour évaluer le risque couvert par
l’assureur. Le tableau 5.1 synthétise les principales variables associées à la partie assurée
présentes dans la base de données.
88
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Cette partie contient des variables qui englobent quelques informations procurées par
l’assureur sur le contrat le reliant à l’assuré après la prise en connaissance des informations
de la partie précédente . Le tableau (Table 5.2 ) résume les variables de cette partie de la
base de données :
La dernière partie qu’on peut extraire de la base d’apprentissage est celle contenant
certaines variables basées sur les informations des sinistres des contratS d’assurance . Le
tableau (Table 5.3 ) résume les variables de cette partie de la base de données :
89
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
En utilisant le logiciel "R" pour regrouper les contrats en fonction de leur code client,
nous avons observé que la base de données contient 29 201 clients distincts avec des codes
client différents.
Dans notre cas, étant donné la grande taille de l’échantillon et la nature des données, la
suppression les clients avec des valeurs manquantes est la meilleure approche pour assurer
la qualité et l’intégrité des données analysées. Les méthodes d’estimation ou d’imputation
peuvent introduire des biais ou des erreurs dans les données, il est donc préférable de les
éviter dans notre contexte.
b La sélection de caractéristique
Nous effectuons une analyse des données pour identifier les valeurs aberrantes avant
d’appliquer la classification.
90
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Pour identifier les anomalies et les valeurs aberrantes à partir des données, nous utili-
sons l’exploration visuelle et la méthode de écart inter-quartile (IQR).
Une fois les valeurs aberrantes identifiées, vous disposez de plusieurs options pour les
traiter. Nous choisissons de les supprimer car elles sont considérées comme erronées et
présentent des problèmes de qualité des données.
L’écart interquartile (IQR) est une mesure couramment utilisée dans le domaine
de l’apprentissage automatique pour traiter les valeurs aberrantes. Il permet de détecter
les valeurs extrêmes qui peuvent affecter négativement la performance du modèle.
L’IQR est calculé en soustrayant le premier quartile (Q1) du troisième quartile (Q3)
d’un ensemble de données. Il représente la dispersion des données à l’intérieur de la moitié
médiane de la distribution.
91
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
92
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
L’objectif est d’assurer une interopérabilité optimale des données et pour faciliter
l’apprentissage superviser des modèles qui sont basés sur les calculs de distance, l’étape
de standardisation des données est essentielle. Afin de pouvoir analyser nos données et de
réaliser des traitements de classification automatiser (clustering).
Standardisation (Normalisation Z-score) :consiste à soustraire la moyenne de
chaque observation, puis à diviser par l’écart type, afin de transformer chaque valeur
d’une variable quantitative en centrant la variable à zéro et en standardisant la variance
à 1.
xi − µ
x̄˜i = (5.1)
σ
où :
Avant de se baser sur les statistiques des données , on doit d’abord introduire une
nouvelle variables :
-"Rent" :
1, si Rentabilité ≥ 0
Rent =
0, sinon
93
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Le graphique montre clairement une disparité entre les personnes rentables et non
rentables dans notre échantillon. On observe que la majorité des personnes sont
classées comme rentables, représentées par la barre verte la plus haute. En revanche,
le nombre de personnes non rentables, représentées par la barre grise, est nettement
inférieur.
— Statistique de la variable Rent par rapport au code catégorie : Afin de mieux voir la
dispersion des catégories en termes de rentabilité, nous avons effectué une analyse
de la distribution des contrats rentables et non rentables par catégorie des contrats
(flotte , particulier ).
Figure 5.6 – Statistiques de la Variable Rent par rapport aux Codes Catégories
Ce résultat met en évidence une prédominance des contrats rentables dans la ca-
94
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
tégorie particulier. Cela suggère qu’il y a une proportion plus élevée de contrats
rentables parmi les particuliers par rapport à la catégorie flotte. Cette observation
souligne l’importance de considérer la catégorie du contrat lors de l’évaluation de sa
rentabilité.
— Statistique de la variable Rent par rapport au genre des clients Afin d’explorer la
relation entre la variable Rent et le genre des clients, nous avons réalisé une analyse
de la distribution des contrats rentables et non rentables en fonction du genre.
Les résultats révèlent une différence significative entre les genres en termes de com-
position de l’échantillon. Nous constatons une proportion plus élevée de contrats
rentables parmi les clients de genre masculin par rapport aux clients de genre fémi-
nin, malgré un nombre de contrats masculins nettement supérieur.
— Statistiques de la Variable Rent par rapport à l’âge des conducteurs : Afin d’examiner
l’impact de l’âge des conducteurs sur la rentabilité des contrats, nous avons réalisé
une analyse de la distribution des contrats rentables et non rentables en fonction
des tranches d’âge.
95
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Figure 5.8 – Statistiques de la Variable Rent par rapport à l’âge des conducteurs
— Statistiques de la Variable Rent par rapport à l’âge du permis de conduite des clients :
Afin d’explorer l’impact de l’âge du permis de conduire sur la rentabilité des contrats,
nous avons mené une analyse de la répartition des contrats rentables et non rentables
en fonction des tranches d’âge du permis.
Figure 5.9 – Statistiques de la Variable Rent par rapport à l’ancienneté du permis des
conducteurs
96
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Figure 5.10 – Statistiques de la Variable Rent par rapport à l’âge mécanique des véhi-
cules
Avant de développer l’idée de notre projet , on doit d’abord introduire quelques hypo-
thèses de travail
97
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
• Agrégation des primes totales par année : Nous supposons que les primes sont regrou-
pées de manière cohérente par année d’exercice, ce qui nous permettra d’analyser
les tendances et les variations des primes au fil du temps.
• Agrégation des indemnisations totales par année : Nous considérons que les indem-
nisations sont également regroupées de manière appropriée par année d’exercice,
nous permettant ainsi d’analyser les montants des indemnisations sur une base an-
nuelle.
La rentabilité désigne les bénéfices ou les pertes générés pour l’assureur à partir d’un
portefeuille ou d’un client. Elle prend en compte à la fois les revenus générés par les
primes collectées et les charges liées aux sinistres indemnisés. La rentabilité est mesurée en
comparant les revenus (prime) aux dépenses (charge sinistre) sur une période donnée.
Une rentabilité élevée signifie que les revenus excèdent les dépenses, ce qui indique une
performance favorable pour l’assureur.
Ri,j = Pi,j × (1 + δ)(T −ti +1) − Ci,j × (1 + δ)(T −ti +1) I(Ci,j > 0) (5.2)
98
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
δ : taux d’intérêt
ti : Année de l’exercice i
Avant de se baser sur l’étape d’application des algorithmes de classification des clients ,
on doit d’abord introduire les nouvelles variables de rentabilité (Total,Moyenne,Valeur
assurée) :
— La rentabilité totale (RT) : est la somme des rentabilités des contrats du client
au cours de leur relation avec l’assurance.
nj
X
RTj = Ri,j (5.3)
i=1
nj
X Ri,j
RV Aj = (5.5)
i=1
VAi,j
99
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Dans cette partie, nous allons présenter une analyse interprétative d’un portefeuille
client (X) et expliquer comment calculer la rentabilité d’un client. Nous examinerons les
différents aspects tels que les primes payées, les charges sinistres, les années d’exercice et
le taux d’intérêt (δ). En effectuant ces calculs, nous serons en mesure de déterminer la
rentabilité du client et d’évaluer la performance financière de son portefeuille.
Une fois que nous avons établi le diagramme des flux, nous devons calculer les trois
indicateurs de rentabilité choisis.
Rentabilité Total :
5
X
RTj = Ri,j
i=1
RTj = 42601.15
Rentabilité Moyenne :
nj
1 X
RMj = Ri,j
N i=1
1
= (35895.42 + 30387.66 − 73963.97 + 18375 + 31907.04)
5
RMj = 8520.23
100
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Table 5.6 – Tableau des fréquences et moyennes par cluster / Rentabilité moyenne
Figure 5.11 – Dispersion des clients dans les classes (Rentabilité Moyenne) en utilisant
k-means
La figure et le tableau présentés ci-dessous montrent les résultats obtenus après l’appli-
101
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Table 5.7 – Tableau des fréquences et moyennes par cluster / Rentabilité totale
Figure 5.12 – Dispersion des clients dans les classes (Rentabilité Totale) en utilisant
k-means
102
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
en 8 classes, identifiables par différentes couleurs.La partie rouge correspond aux classes
négatives, tandis que la partie verte représente les classes positives. La classe 4 se dis-
tingue légèrement des autres en regroupant un nombre légèrement plus élevé de clients.
Cependant, il n’y a pas de classe dominante de manière significative.
Table 5.8 – Tableau des fréquences et moyennes par cluster / Rentabilité valeur assuré
Figure 5.13 – Dispersion des clients dans les classes (Rentabilité Valeur assuré) en
utilisant K-means
103
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Table 5.9 – Tableau des fréquences et moyennes par cluster / Rentabilité moyenne
Figure 5.14 – Dispersion des clients dans les classes (Rentabilité moyenne) en utilisant
L’AHP
104
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
par différentes couleurs.La partie rouge correspond aux classes négatives, tandis que la
partie verte représente les classes positives. Les classes 1, 2, 8 et 7 se caractérisent par un
nombre significativement réduit de clients, tandis que les autres classes démontrent une
domination plus marquée en termes de nombre de clients.
Table 5.10 – Tableau des fréquences et moyennes par cluster / Rentabilité totale
Figure 5.15 – Dispersion des clients dans les classes (Rentabilité totale) en utilisant
L’AHP
105
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
qui regroupe un nombre considérable de clients. Les autres classes présentent un effectif
réduit de clients. Il est important de noter que les classes négatives sont représentées en
rouge, tandis que les classes positives sont représentées en vert.
Table 5.11 – Tableau des fréquences et moyennes par cluster / Rentabilité valeur assuré
Figure 5.16 – Dispersion des clients dans les classes (Rentabilité valeur assuré) en uti-
lisant L’AHP
106
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
dans cette catégorie. Cependant, il est important de noter que les classes 1 et 2 contiennent
un nombre significativement faible de clients.
Table 5.12 – Tableau des fréquences et moyennes par cluster / Rentabilité Moyenne
Figure 5.17 – Dispersion des clients dans les classes (Rentabilité moyenne) en utilisant
DBSCAN
107
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
lement un nombre légèrement plus élevé que les autres classes. Cela suggère une concen-
tration de clients dans ces deux classes, ce qui peut indiquer des caractéristiques ou des
comportements similaires en termes de rentabilité moyenne. Les autres classes ont un
nombre relativement faible de clients
Table 5.13 – Tableau des fréquences et moyennes par cluster / Rentabilité Totale
Figure 5.18 – Dispersion des clients dans les classes (Rentabilité totale) en utilisant
DBSCAN
108
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
entre les classes suggère des différences marquées dans les niveaux de rentabilité totale
des clients. Les classes négatives sont représentées en rouge, tandis que les autres classes
sont représentées en vert.
Table 5.14 – Tableau des fréquences et moyennes par cluster / Rentabilité valeur assuré
Figure 5.19 – Dispersion des clients dans les classes (Rentabilité valeur assuré) en uti-
lisant DBSCAN
109
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
autres classes. En outre, la classe 3 se distingue par un pic notable. Les autres classes
contiennent un nombre relativement faible de clients. Cette répartition inégale des clients
selon les classes suggère des différences importantes dans les niveaux de rentabilité en
valeur assurée.
Les résultats montrent que : Dabord , l’indice de Dunn indique que la rentabilité
"Totale" permet d’obtenir une meilleure séparation des clusters (1.6053 . D’autre part,
l’indice de Silhouette suggère une compacité plus élevée des clusters pour la rentabilité
"Valeur assuré " (0.6928) . Finalement , l’indice de Calinski-Harabasz informe qu’une
séparation plus nette des groupes pour la rentabilité "Moyenne" (118545.7)
Les résultats montrent que : Dabord , l’indice de Dunn indique que la rentabilité
"Moyenne" permet d’obtenir une meilleure séparation des clusters (1.8746) . D’autre
part, les indices de silhouette et de Calinski-Harabasz sont plus élevés pour la rentabilité
"Valeur assurée", ce qui suggère une compacité plus élevée des clusters et une séparation
plus nette des groupes (0.5841 , 4602.725)
110
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
Les résultats montrent également que : Dabord , l’indice de Dunn indique que la
rentabilité "Moyenne" permet d’obtenir une meilleure séparation des clusters . D’autre
part, les indices de silhouette et de Calinski-Harabasz sont plus élevés pour la "Rentabilité
valeur" assurée, ce qui suggère une compacité plus élevée des clusters et une séparation
plus nette des groupes. (0.58771 , 5151.862)
Conclusion
En conclusion, nous avons débuté en fournissant une brève présentation de l’organisme
d’accueil qui a généreusement mis à notre disposition les données nécessaires à notre
étude. Ensuite, nous avons procédé à une description détaillée de la base de données, en
mettant en évidence les différentes variables présentes et en identifiant les variables les
plus pertinentes pour évaluer la rentabilité . De plus, quelques statistiques clés sur la
base de données ont été fournies pour une meilleure visibilité. Par la suite, nous avons
appliqué les trois méthodes de classification choisies, à savoir le K-means, l’AHP et le
DBSCAN, sur la base de données expérimentale. Enfin, nous avons calculé les indices
de bonne classification associés à chaque algorithme, notamment les indices de Dunn, de
silhouette et de Calinski-Harabasz. Les résultats obtenus du calcul ces expérimentations
ont montré des différences dans les performances des méthodes de classification en fonction
des critères de rentabilité utilisés :
la méthode K-means, la rentabilité totale a montré un meilleur indice de Dunn suggé-
rant une meilleure séparation des clusters , alors que rentabilité valeur assuré a retourné
un meilleur indice de silouette indiquant une cohésion interne plus élevée . Cependant,
l’indice de Calinski-Harabasz était plus faible , indiquant une dispersion plus élevée entre
les clusters basés sur la rentabilité totale et sur la rentabilité valeur assuré.
111
Chapitre 5 Classification des clients en portefeuille en fonction de la rentabilité
112
Conclusion générale
113
Conclusion générale
critère et variable les plus pertinents est la rentabilité totale a été partiellement validée
car , d’après les résultats on trouve que le critère le plus pertinent dépend de la méthode
utilisée pour la classification . Finalement , l’hypothèse qui cite que les indices de Dunn,
de silhouette et de Calinski-Harabasz sont les plus appropriés pour évaluer la qualité de la
classification non-supervisée a été validée car, lorsqu’il s’agit d’effectuer une classification
non-supervisée des clients en portefeuille, il est essentiel de disposer d’indicateurs fiables
pour évaluer la qualité de cette classification. Les indices de Dunn, de silhouette et de
Calinski-Harabasz sont couramment utilisés dans les démarches similaire à la notre.
À la lumière des résultats, pour les compagnies d’assurance qui privilégient une seg-
mentation plus fine du portefeuille en termes de rentabilité, la méthode K-means basée
sur la rentabilité totale peut être plus appropriée. En revanche, pour ceux qui accordent
plus d’importance à la valeur assurée, la méthode AHP et la méthode DBSCAN offrent
des performances intéressantes en termes d’indices de Dunn, de silhouette et de Calinski-
Harabasz.
Cependant, il est important de souligner certaines limites de notre étude. Les résultats
que nous avons obtenus sont spécifiques à notre échantillon et aux critères de rentabilité
que nous avons utilisés. Il serait intéressant d’explorer d’autres variables et critères de
classification pour une analyse plus approfondie, notamment en prenant en compte des
aspects tels que des taux d’actualisation non constants et en étudiant les primes de ma-
nière plus détaillée, au-delà de leur agrégation par année. De plus, l’extension de notre
étude à un échantillon plus large et l’exploration d’autres méthodes de classification non
supervisées ou de techniques d’apprentissage automatique pourraient permettre d’appro-
fondir notre analyse et de fournir des résultats plus précis.
En conclusion, notre recherche contribue à l’avancement des connaissances dans le do-
maine du scoring de rentabilité des contrats en portefeuille des compagnies d’assurance.
Les résultats obtenus offrent des perspectives intéressantes pour les compagnies d’assu-
rance afin d’optimiser leur gestion de portefeuille et de prendre des décisions stratégiques
éclairées.
114
Bibliographie
[2] Le Tourneau Philippe and Jacob Nicolas. La responsabilité civile. Dalloz, 1982.
[3] Lequiller François. L’économie souterraine dans le pib : avancées et limites. OCDE.
http ://www. economie. gouv. fr/files/francois_lequiller_ocde. pdf, 2014.
[4] Sansévérino-Godfrin Valérie. L’État, les compagnies d’assurance et les risques ma-
jeurs. PhD thesis, Nice, 1996.
[6] Atlas magazin. Schéma d’une structure type de titrisation en assurance, 2012.
[13] Maks Fraszka. La loi des grands nombres dans l’industrie des assurances : Vue d’ensemble.
[14] Marceau Étienne. Modélisation et évaluation quantitative des risques en actuariat. Col-
lection Statistique et probabilités appliquées dirigée par Yadolah Dodge. Springer-Verlag
France, 2013.
115
Bibliographie
[17] Nathalie De Marcellis-Warin and Thierry Warin. Économie Industrielle avec R. 2020.
[18] KENTON WILL. Moral hazard : Definition, meaning, examples, and how to manage.
[19] El Naqa Issam Murphy Martin J. "what is machine learning ?", 2015.
[20] Tibshirani R. Friedman J. Hastie, T. The elements of statistical learning : Data mining,
inference, and prediction. springer., 2009.
[23] Zien Alexander . Chapelle Olivier, Schölkopf Bernhard. Semi-supervised learning, 2020.
[25] J. B. MacQueen. : "some methods for classification and analysis of multivariate obser-
vations, proceedings of 5-th berkeley symposium on mathematical statistics and probabi-
lity",. Berkeley, University of California Press,no 1,, (1967).
[26] De Rham C. La classification hiérarchique ascendante selon la méthode des voisins réci-
proques. Cahiers de l’analyse des données, 5(2) :135–144, 1980.
[27] Khan Kamran, Rehman Ur Saif, Aziz Kamran, Fong Simon, and Sarasvady Sababady.
Dbscan : Past, present and future. IEEE, 2014.
[29] Dunn Joseph C. Well-separated clusters and optimal fuzzy partitions. Journal of cyber-
netics, 1974.
[30] Fraszka Maks. Comprendre la différence entre le risque moral et la sélection adverse.
[31] Tang.B key.S. Toward optimal feature selection in naive bayes for text categorization.
2016.
116