Bi 1
Bi 1
Bi 1
La Business Intelligence (BI) désigne les moyens, outils et méthodes qui permettent
de collecter, consolider, modéliser et restituer les données, matérielles ou
immatérielles, d’une entreprise en vue d’offrir une aide à la décision et de permettre à
un décideur d’avoir une vue d’ensemble de l’activité traitée.
Les entreprises utilisent une myriade d’applications, et d’outils pour gérer leur activité
quotidienne.
Les besoins ?
Traiter ces données, Extraire l'information pertinente de ces données, par exemple
pour savoir :
1. Quels sont les résultats des ventes par gamme de produits et par région de
l'année dernière ? !
Documents BI | Sirine ZAABOUTI
2. Quelle est l'évolution des chiffres d'affaires par type de magasin et par période ?
Définition Décision
Une décision est le résultat d’un processus comportant le choix entre plusieurs
solutions en vue d’atteindre un objectif.
Définition information
l'information est une image des objets et des faits ; elle les représente, elle
possédait pas ou qu'il ne pouvait pas prévoir» (Davis, Olson, Ajenstat et Peaucelle p.
116).
1. Alimentation
Cette phase est généralement réalisée grâce à un outil d’ETL (Extract, Transform,
Load). Grâce à des connecteurs, l’ETL peut extraire un grand nombre de données de
différents types, puis grâce à des transformateurs manipuler ces données pour les
agréger et les rendre cohérentes entre elles. Nous verrons plus loin l’ensemble des
fonctionnalités et des avantages des ETL.
2. Modélisation
3. Restitution
Documents BI | Sirine ZAABOUTI
Lors de cette phase, de nouveaux calculs de données peuvent être effectués pour
répondre aux besoins spécifiques des utilisateurs. Les outils de la phase de
restitution sont multiples. Il peut s’agir d’outils de reporting, de portails d’accès à des
tableaux de bords, d’outils de navigation dans des cubes OPAL (ou hypercubes) ou
encore des outils de statistique
4. Analyse
Dans la phase d’analyse, les utilisateurs finaux vont analyser les informations qui leur
sont fournies. Habituellement, les données sont modélisées par des représentations
basées sur des requêtes pour construire des tableaux de bord ou des rapports via
des outils d’analyse décisionnelle (Power BI, Tableau, Qlikview, etc.).
L’objectif de cette phase est d’assister au mieux l’utilisateur pour qu’il puisse analyser
les informations mises à sa disposition et prendre des décisions. Cela passe
notamment par le contrôle d’accès aux rapports, la prise en charge des requêtes et
la visualisation des résultats.
Opérationnel VS décisionnel ?
Sont dédiés aux métiers de l'entreprise pour les assister dans leurs tâches de
gestion quotidiennes et donc directement opérationnels.
Documents BI | Sirine ZAABOUTI
Bien que les systèmes d'informations OLTP et OLAP aient le point commun de
regrouper les données de l'entreprise dans un S.G.B.D. (système de gestion de
bases de données) et d'en fournir l'accès aux utilisateurs, ils présentent de profondes
différences, présentées ci-dessous.
• Orienté sujet
Les données sont organisées par thème afin de pouvoir réaliser des analyses sur les
sujets et analyser le processus dans le temps
• Intégré
• Non volatile
• Historisé
L’historisation est nécessaire pour suivre dans le temps l’évolution des différentes
valeurs des indicateurs à analyser.
- Les SGBD sont des systèmes dont le mode de travail est transactionnel
(OLTP On-Line Transaction Processing).
- Permet d'insérer, modifier, interroger des informations rapidement,
efficacement, en sécurité.
Documents BI | Sirine ZAABOUTI
Il contient des données ciblées et regroupées pour répondre à des besoins d’un
secteur particulier de l’entreprise.
Il est plus facile à comprendre, à manipuler ainsi le temps de réponse est plus réduit
par rapport à un entrepôt de donnée.
• L'organisation des données est faite selon un modèle facilitant la gestion efficace
des données et leur historisation.
• Sont de petits entrepôts nécessitant une infrastructure plus légère et sont mis en
œuvre plus rapidement
• Les données extraites sont adaptées pour l'aide à la décision (pour classe de
décideurs, usage particulier, recherche de corrélation, logiciel de statistiques,...)
• L'organisation des données est faite selon un modèle facilitant les traitements
décisionnels
- Niveau extraction
- Niveau fusion
- Niveau exploitation
• Un fait :
• Les mesures :
Est un élément de donnée sur lequel portent les analyses, en fonction des différentes
dimensions
Table de fait
C’est la table centrale du modèle dimensionnel, elle contient les valeurs numériques
de ce qu’on désire mesurer.
Type de fait :
🡺 Solde d’un compte bancaire : pas de sens d’additionner suivant l’axe date.
🡺 Prix unitaire : l’addition sur n’importe quelle dimension n’a pas de sens.
Table de dimension
C’est la table qui représente les axes d’analyse, elle contient les détails sur Fait
Elle contient les informations sur les dimensions d’analyse (par exemple le lieu, le
temps, la description du produit).
Dimension Temps
Types de Modélisation :
Documents BI | Sirine ZAABOUTI
Le Modèle en étoile
- Une (ou plusieurs) table(s) de faits comprenant une (ou plusieurs) mesures.
- Plusieurs tables de dimension dénormalisées
- Les tables de dimension n'ont pas de lien entre elles
Documents BI | Sirine ZAABOUTI
Avantages :
• Facilité de navigation
• Alimentation facile.
• Performances : nombre de jointures limité ; gestion des données
creuses.
• Gestion des agrégats
Inconvénients :
Avantages :
• Réduction de la redondance
Documents BI | Sirine ZAABOUTI
Inconvénients :
• Navigation couteuses
• Nombreuses jointures
Partie3 : Notions BI
ETL : Extract-Transform-Load
C’est une base de données conçue pour centraliser les données issues de sources
hétérogènes. Le modèle d’une base des données (ODS ou SA) est un modèle
relationnel classique identique au modèle du système de production.
Leurs différences :
Staging Area :
Les données sont détruites directement après avoir été chargées dans le
DataWarehouse
ODS :
Les données auront quand même une durée de vie plus longue.
Documents BI | Sirine ZAABOUTI
Cette structure est prévue à des fins d'analyses interactives par une ou plusieurs
personnes (souvent ni informaticiens ni statisticiens) du métier que ces données sont
censées représenter.
•les avantages :
- Pas jointure
Opérations OLAP
• Rotate/pivot
• Switch
• roll-up
• drill-down
• slice, dice
• Selection
• Projection
Documents BI | Sirine ZAABOUTI
• jointure (drill-across)
SLICING: Sélection de tranches du cube par des prédicats selon une dimension
• Drill down : c'est la possibilité de « zoomer » sur une dimension (par exemple
d'éclater les années en 4 trimestres pour avoir une vision plus fine, ou de passer du
pays aux différentes régions)
• Roll up : c'est l'opération inverse qui permet d'« agréger » les composantes de l'un
des axes (par exemple de regrouper les mois en trimestre, ou de totaliser les
différentes régions pour avoir le total par pays)
Types de Cube