Cours Décisio
Cours Décisio
Cours Décisio
Introduction
Le marché du décisionnel
Les entrepôts de
données
Les datamart
Architecture
Alimentation
Modélisation
Les bases
de données
multidimensi
onnelles
A combien
Quels
s’élèvent mes
Marocains
ventes
consomment
journalières?
beaucoup
de poisson?
Systèmes décisionnels page 2
Le marché du décisionnel
Intégré
Pentaho (Kettle, Mondrian, JFreeReport, Weka)
SpagoBI
10
Banque
Risques d’un prêt, prime plus précise
Santé
Épidémiologie
Risque alimentaire
Commerce
Ciblage de clientèle
Déterminer des promotions
Logistique
Adéquation
demande/production
Assurance
Risque lié à un contrat
d’assurance (voiture)
…
12
W. H. Inmon (1996):
« Le data Warehouse est une collection de données
orientées sujet, intégrées, non volatiles et
historisées, organisées pour le support d’un
processus d’aide à la décision »
18
21
ALIMENTATION
Entrepôt de
données
Système
d'information Magasins de Outils décisionnels
opérationnel données Analyse
reporting
data-mining
....
Datamarts du
service Marketing
Datamart du
DW de l’entreprise service Ressources
Humaines 23
24
Zone de
Zone de préparation Zone de stockage présentation
E
C
X
Transformations: H
Data Requêtes
T Nettoyage A
warehouse Rapports
Standardisation Visualisation
R R
… Data Mining
A …
G
C de
Sources Datamart
E
données
T
I M
O E 25
27
2- Données intégrées:
Normalisation des données
Définition d’un référentiel unique
h,f
1,0 h,f
homme, femme
GBP
EUR
CHF
USD
29
Suppression
Accès
Modification Chargement
30
4- Données datées
Les données persistent dans le temps
Mise en place d’un référentiel temps
Calendrier Répertoire
Entrepôt Code Année Mois Code Année Mois
de 1 2015 Mai
2005 1 Omari Casa
données
2 2016 Juillet 1 Jamali Agadir
2 Omari Rabat
H
I
Data Warehouse
S
OLAP: On-Line
Analitical T
Clientèle
Processing
O
32
R
Systèmes décisionnels pageI32
OLTP VS DW
OLTP DW
Orienté transaction Orienté analyse
Orienté application Orienté sujet
Données courantes Données historisées
Données détaillées Données agrégées
Données évolutives Données statiques
Utilisateurs nombreux, Utilisateurs peu nombreux, manager
administrateurs/opérationnels
Temps d’exécution: court Temps d’exécution: long
Modèle Magasin
id_Modèle id_Magas in
Descriptif Ventes Des criptif
Nombre Adresse
Total HT
Dimension
Fait (ensemble de
(ensemble positions)
Mois de mesures)
id_Mois
Nom_mois
Année
Modèle
Magasin
Mois
Modèle Magasin
id_Modèle id_Magas in
Descriptif Ventes Des criptif
Nombre Adresse
Total HT
Mois
id_Mois
Nom_mois
Trimestre
id_Trim
Nom_trim
Hiérarchie sur la Année
dimension « Temps » id_Année
Nom_année
Modèle Modèle
Magasin Magasin
Temps.Mois Temps.Année
Remarque
Il est possible de définir plusieurs hiérarchies pour une seule
dimension
Systèmes décisionnels page 40
Modélisation des DW
Fait:
Ce que l’on souhaite mesurer
Quantités vendues, montant des ventes…
Contient les clés étrangères des axes d’analyse (dimension)
Date, produit, magasin
Trois types de faits:
Additif
Semi additif
Non additif
44
Dimension produit
Avantages:
Avoir deux visions simultanées des données :
Voir les données récentes avec l’ancien attribut
Voir les données anciennes avec le nouvel attribut
Voir les données comme si le changement n’avait pas eu lieu
Inconvénient:
Inadapté pour suivre plusieurs valeurs d’attributs
intermédiaires
58
Dim client
Clé_client Faits
Dim client Faits
Nom Clé_client
Clé_client Clé_client
Prénom
… Clé_démo
Nom
Adresse g
Prénom
Date_naissance
Adresse
…
Date_nais
…
Revenus Dim_démographique
Niveau_étude Clé_démog
Nb_enfants Revenus
Statut_marital Niveau_étude
Profil_financier
Nb_enfants
Profil_achat
Statut_marital
Profil_financier
Profil_achat
Dimension Temps
ID temps
année
mois
jour Dimension produit
… ID produit
Dimension Magasin
ID magasin nom
code
Table de faits Achat prix
description
ID client poids
ville
ID temps groupe
surface
ID magasin famille
…
ID région …
ID produit
Dimension Region Quantité achetée Dimension Client
ID région Montant des achats ID client
pays nom
description prénom
district vente
…. adresse
…
Systèmes décisionnels page 59
Modèle en flocon
Dimension produit
Dimension Temps ID produit
ID temps ID
annee groupe
mois nom
jour code
Dimension Magasin … prix Dimension groupe
ID magasin poids ID groupe
description … ID
ville Table de faits Achat
famille
surface ID client
nom
… ID temps
…
ID magasin
Dimension Region ID région
ID région Dimension Famille
ID produit
ID division vente ID
Quantité achetée famille
pays Montant des achats
description nom
…. …
Dimension Client
Dimension
ID client
Division vente
nom
ID division vente
prénom
description
…15/
Systèmes décisionnels R-RAHA adresse
& L. Geneste page 67
60
Représentation tabulaire (exemple)
Don
Sub Bud
Type public privé asso ...
Région (Subvention, Taxe)
MP (250,25) (200,70) ...
Aquitaine ...
Languedoc ...
Géo
Temps.année=2006
Produits Pays
Produit oranges
Espagne
PK id_produit poires
Libellé pommes Allemagne
Famille
Achat France
PK id_achat
FK id_client
id_produit
05 06 07 06
Œuf Idf 220 265 284 Œuf Idf 265
Ain 225 245 240 Ain 245
Viande Idf 163 152 145 Viande Idf 152
Ain 187 174 184 Ain 174
74
Manipulation des données
multidimensionnelles
Opération agissant sur la structure
Extraction d’un bloc de données (dicing): ne travailler que sous
un sous-cube
05 06 07
Œuf Idf 220 265 284 05 06 07
Ain 225 245 240 Œuf Idf 220 265 284
Viande Idf 163 152 145 Ain 225 245 240
Ain 187 174 184
64
Systèmes décisionnels