Conception D'une Base de Données
Conception D'une Base de Données
Conception D'une Base de Données
1. Introduction
2. Modèle conceptuel de données (MCD)
2-1. Schéma entités-associations
2-1-1. Entités et associations
2-1-2. Attributs et identifiants
2-1-3. Cardinalités
2-1-4. Associations plurielles
2-1-5. Association réflexive
2-1-6. Associations non binaires
2-2. Règles de normalisation
2-2-1. Les bonnes pratiques dans un schéma entités-associations
2-2-2. Les formes normales
2-3. Dépendances fonctionnelles
2-3-1. Définitions et propriétés
2-3-2. Graphe de couverture minimale
2-3-3. Traduction vers un schéma entités-associations
2-3-4. Gestion des dates et du caractère historique
2-3-5. Dépendances plurielles et réflexives
2-3-6. Associations sans attributs
2-4. Méthodologie de base
3. Modèle logique de données (MLD)
3-1. Systèmes logiques
3-2. Modèle logique relationnel
3-2-1. Tables, lignes et colonnes
3-2-2. Clés primaires et clés étrangères
3-2-3. Schéma relationnel
3-3. Traduction d'un MCD en un MLDR
4. Modèle physique de données (MPD)
4-1. Distinction entre MLD et MPD
4-2. Optimisations
5. Rétro-conception
5-1. Traduction inverse
5-2. Cas particuliers
6. Compléments
6-1. Agrégation
6-1-1. Association de type 1 : n
6-1-2. Association de type n : m
6-1-3. Tables de codification ou tables de référence
6-2. Identifiant relatif ou lien identifiant
6-2-1. Résolution d'un problème sur le schéma relationnel
6-2-2. Modèle conceptuel correspondant
6-2-3. Discussion autour de la numérotation des exemplaires
6-3. Héritage
6-3-1. Sous-entité
6-3-2. Utilisation de l'héritage pour séparer les informations complémentaires
6-3-3. Spécialisation des associations
7. Conclusion
8. Références
1. Introduction
Quand nous construisons directement les tables d'une base de données dans un logiciel de gestion des bases de données (Oracle, SQL Server, DB2, Access, MySQL, PostGre, ...), nous sommes
exposés à deux types de problème :
Nous ne savons pas toujours dans quelle table placer certaines colonnes (par exemple, l'adresse de livraison se met dans la table des clients ou dans la table des commandes ?) ;
Nous avons du mal à prévoir les tables de jonction intermédiaires, par exemple, la table des interprétations qui est indispensable entre les tables des films et la table des acteurs).
Les techniques présentées ici font partie de la méthodologie Merise (Méthode d'Étude et de Réalisation Informatique pour les Systèmes d'Entreprise) élaborée en France en 1978 [Tardieu et al.], qui
permet notamment de concevoir un système d'information d'une façon standardisée et méthodique.
Le but de ce support de cours est d'introduire le schéma entités-associations section « Modèle conceptuel de données (MCD) »), le schéma relationnel (sections « Modèle logique de données (MLD) »
et « Modèle physique de données (MPD) ») et d'expliquer la traduction entre les deux (sections « Traduction d'un MCD en un MLDR » et « Rétro-conception »). La construction du schéma entités-
associations peut se faire en étudiant les dépendances fonctionnelles (section « Dépendances fonctionnelles ») et en tenant compte d'un certain nombre d'extensions conceptuelles incontournables
(section « Compléments »).
Ne seront pas abordés ici : les contraintes, les traitements, le langage relationnel et la gestion de projet. La modélisation objet ne fait pas non plus partie des outils exposés dans ce document.
La modélisation conceptuelle que nous proposons dans ce document pour un univers dont on veut stocker les données, conduit à l'élaboration d'un type de schéma très répandu, le schéma entités-
associations.
Une entité est une population d'individus homogènes. Par exemple, les produits ou les articles vendus par une entreprise peuvent être regroupés dans une même entité articles (figure 1), car d'un
article à l'autre, les informations ne changent pas de nature (à chaque fois, il s'agit de la désignation, du prix unitaire, etc.).
Figure 1 - Entités
Par contre, les articles et les clients ne peuvent pas être regroupés : leurs informations ne sont pas homogènes (un article ne possède pas d'adresse et un client ne possède pas de prix unitaire). Il
faut donc leur réserver deux entités distinctes : l'entité articles et l'entité clients.
Une association est une liaison qui a une signification précise entre plusieurs entités. Dans notre exemple, l'association commander est une liaison évidente entre les entités articles et clients, tandis
que l'association livrer établit le lien sémantique entre les entités articles et fournisseurs.
Figure 2 - Associations
Remarquons que dans ce schéma, les entités clients et fournisseurs ne sont pas liées directement, mais indirectement, via l'entité articles, ce qui est assez naturel.
Toujours dans notre exemple (figure 3), le prix unitaire est un attribut de l'entité articles, le nom de famille est un attribut de l'entité clients, la quantité commandée est un attribut de l'association
commander et la date de livraison est un attribut de l'association livrer.
Figure 3 - Attributs
Une entité et ses attributs ne doivent traiter que d'un seul sujet afin d'assurer une certaine cohérence au modèle. Dans notre exemple, il est donc préférable de ne pas mettre les informations
relatives aux fournisseurs dans l'entité des articles mais plutôt dans une entité fournisseurs séparées (et liée à l'entité articles via l'association livrer).
Ensuite, chaque individu d'une entité doit être identifiable de manière unique. C'est pourquoi toutes les entités doivent posséder un attribut sans doublon (c'est-à-dire ne prenant pas deux fois la
même valeur). Il s'agit de l'identifiant que l'on souligne sur le schéma, par convention. Le numéro de client constitue un identifiant classique pour l'entité clients (figure 4).
Figure 4 - Identifiants
Remarques :
2-1-3. Cardinalités
La cardinalité d'un lien entre une entité et une association précise le minimum et le maximum de fois
Exemple : un client a au moins commandé un article et peut commander n articles (n étant indéterminé), tandis qu'un article peut avoir été commandé entre 0 et n fois (même si ce n'est pas le même
n que précédemment). On obtient alors le schéma entités-associations complet (figure 5).
Figure 5 - Cardinalités
Une cardinalité minimale de 1 doit se justifier par le fait que les individus de l'entité en question ont besoin de l'association pour exister (un client n'existe pas avant d'avoir commandé quoique ce soit,
donc la cardinalité minimale de l'entité clients dans l'association commander est 1). Dans tous les autres cas, la cardinalité minimale vaut 0 (c'est le cas pour une liste préétablie d'articles par
exemple).
Ceci dit, la discussion autour d'une cardinalité minimale 0 ou 1 n'est vraiment intéressante que lorsque la cardinalité maximale est 1. Nous verrons en effet lors de la traduction vers un schéma
relationnel (section « Traduction d'un MCD en un MLDR »), que lorsque la cardinalité maximale est n, nous ne pouvons pas faire la différence entre une cardinalité minimale de 0 et une cardinalité
minimale de 1.
Notons que sur notre exemple, un article peut être commandé par plusieurs clients. Cela provient du fait que tous les crayons rouges ne sont pas numérotés individuellement, mais portent un numéro
d'article collectif. En toute rigueur, notre entité articles aurait du s'appeler types d'article. Ainsi, un crayon rouge peut être commandé par plusieurs clients, ce n'est simplement pas le même crayon à
chaque fois. Il s'agit d'un choix de modélisation, le lecteur peut très légitimement faire le choix inverse qui consiste à numéroter individuellement chaque crayon rouge.
La seule difficulté pour établir correctement les cardinalités est de se poser les questions dans le bon sens. Autour de l'association commander, par exemple :
côté clients, la question est « un client peut commander combien d'articles ? » et la réponse est « entre 1 et plusieurs » ;
côté articles, la question est « un article peut être commandé par combien de client ? » et cette fois-ci, la réponse est « entre 0 et plusieurs ».
Deux mêmes entités peuvent être plusieurs fois en association (c'est le cas sur la figure 6).
Il est permis à une association d'être branchée plusieurs fois à la même entité, comme par exemple l'association binaire réflexive de la figure 7.
Lorsqu'autour d'une entité, toutes les associations ont pour cardinalités maximales 1 au centre et n à l'extérieur, cette entité est candidate pour être remplacée par une association branchée à toutes
les entités voisines avec des cardinalités identiques 0,n.
La deuxième condition qu'il faut impérativement satisfaire est la règle de normalisation des attributs des associations (section suivante). Cette règle conduit parfois à l'apparition d'associations qui
établissent un lien sémantique entre 3 entités ou plus.
Sur l'exemple de la figure 8 issu d'un cinéma, l'entité projections est uniquement entourée d'associations dont les cardinalités maximales sont 1 côté projections et n de l'autre côté. De plus, la
donnée d'un créneau, d'un film et d'une salle suffit à déterminer une projection unique. On peut donc la remplacer par une association projeter branchée aux trois entités salles, créneaux horaires et
films. On parle alors d'association ternaire.
Cette règle de conduite permet d'éviter d'introduire une association ternaire abusive, par exemple entre les avions, les pilotes et les vols (figure 9), car le concepteur peut s'apercevoir que l'une des
cardinalités maximales ne convient pas.
Figure 9 - Contre-exemple : l'entité départs n'est pas remplaçable par une association ternaire
Par ailleurs, une association peut être branchée à plus de trois entités, comme sur la figure 10. Là-encore, le conseil pour être sûr de la légitimité de cette association 4-aire, est de vérifier les
cardinalités sur un schéma intermédiaire faisant apparaître à la place, une entité occupations et quatre associations binaires.
Un bon schéma entités-associations doit répondre à 9 règles de normalisation, que le concepteur doit connaître par coeur.
Normalisation des entités (importante) : toutes les entités qui sont remplaçables par une association doivent être remplacées (comme sur la figure 8).
Normalisation des noms : le nom d'une entité, d'une association ou d'un attribut doit être unique.
Conseils :
pour les entités, utiliser un nom commun au pluriel (par exemple : clients) ;
pour les associations, utiliser un verbe à l'infinitif (par exemple : effectuer, concerner) éventuellement à la forme passive (être commandé) et accompagné d'un adverbe (avoir lieu dans, pendant, à) ;
pour les attributs, utiliser un nom commun singulier (par exemple : nom, numéro, libellé, description), éventuellement accompagné du nom de l'entité ou de l'association dans laquelle il se trouve
(par exemple : nom de client, numéro d'article).
Remarque : lorsqu'il reste plusieurs fois le même nom, c'est parfois symptomatique d'une modélisation qui n'est pas terminée (figure 11(a)) ou le signe d'une redondance (figure 11(b)).
(b) Si deux attributs contiennent les mêmes informations, alors la redondance induit non seulement un gaspillage d'espace mais également un grand risque d'incohérence : ici, les adresses risquent
de ne pas être les mêmes et dans ces conditions, où faut-il livrer ?
Conseils :
éviter les identifiants composés de plusieurs attributs (comme par exemple un identifiant formé par les attributs nom et prénom), car d'une part c'est mauvais pour les performances et d'autres part,
l'unicité supposée par une telle démarche finit tôt ou tard par être démentie ;
préférer un identifiant court pour rendre la recherche la plus rapide possible (éviter notamment les chaînes de caractères comme un numéro de plaque d'immatriculation, un numéro de sécurité
sociale ou un code postal ) ;
éviter également les identifiants susceptibles de changer au cours du temps (comme les plaques d'immatriculation ou les numéros de sécurité sociale provisoires).
Conclusion : l'identifiant sur un schéma entités-associations (et donc la future clé primaire dans le schéma relationnel) doit être un entier, de préférence incrémenté automatiquement.
Normalisation des attributs (importante) : remplacer les attributs en plusieurs exemplaires en une association supplémentaire de cardinalités maximales n et ne pas ajouter d'attribut calculable à
partir d'autres attributs.
En effet, d'une part, les attributs en plusieurs exemplaires posent des problèmes d'évolutivité du modèle (sur la figure 12(a) à gauche, comment faire si un employé a deux adresses secondaires ?) et
d'autre part, les attributs calculables induisent un risque d'incohérence entre les valeurs des attributs de base et celles des attributs calculés, comme sur la figure 12(b).
Normalisation des attributs des associations (importante) : les attributs d'une association doivent dépendre directement des identifiants de toutes les entités en association.
Par exemple, sur la figure 5 la quantité commandée dépend à la fois du numéro de client et du numéro d'article, par contre la date de commande non. Il faut donc faire une entité commandes à part,
idem pour les livraisons (figure 13).
Par exemple, entre les entités livres et auteurs de la figure 16, l'association écrire ne possède pas d'attribut. Imaginons que nous ajoutions un attribut pourcentage qui contient le pourcentage du livre
écrit par chaque auteur (du même livre). Comme cet attribut pourcentage dépend à la fois du numéro de livre et du numéro d'auteur, l'association écrire est bien normalisée.
Autre conséquence de la normalisation des attributs des associations : une entité avec une cardinalité de 1,1 ou 0,1 aspire les attributs de l'association (figure 14).
(a) les cardinalités sont toutes 1,1 donc c'est une association fantôme
(b) si un client ne peut pas régler la facture d'un autre client, alors l'association payer est inutile et doit être supprimée (dans le cas contraire, l'association payer doit être maintenue)
(c) une association suffit pour remplacer les 4 associations participer en tant que ...
Remarque : une autre solution pour le problème de la figure 15(b) consiste à retirer l'entité règlements et d'ajouter une association régler avec les mêmes attributs (sauf l'identifiant) entre les entités
clients et factures.
Normalisation des cardinalités : une cardinalité minimale est toujours 0 ou 1 (et pas 2, 3 ou n) et une cardinalité maximale est toujours 1 ou n (et pas 2, 3, ...).
Cela signifie que si une cardinalité maximale est connue et vaut 2, 3 ou plus (comme sur la figure 15(c) à droite, ou pour un nombre limité d'emprunts dans une bibliothèque), alors nous considérons
quand même qu'elle est indéterminée et vaut n. Cela se justifie par le fait que même si nous connaissons n au moment de la conception, il se peut que cette valeur évolue au cours du temps. Il vaut
donc mieux considérer n comme une inconnue dès le départ.
Cela signifie également qu'on ne modélise pas les cardinalités minimales qui valent plus de 1 car ce genre de valeur est aussi amené à évoluer. Par ailleurs, avec une cardinalité maximale de
'association n'aurait aucune signification.
Dans un SGBD relationnel, nous pourrions assurer les cardinalités valant 2, 3 ou plus, via l'utilisation de déclencheurs. Mais cette notion n'est pas abordée dans ce document qui se contente, au
contraire, de décrire ce qu'il est possible de faire sans utiliser de déclencheur.
À ces 6 règles de normalisation, il convient d'ajouter les 3 premières formes normales traditionnellement énoncées pour les schémas relationnels, mais qui trouvent tout aussi bien leur place en ce qui
concerne les schémas entités-associations.
Première forme normale : à un instant donné dans une entité, pour un individu, un attribut ne peut prendre qu'une valeur et non pas, un ensemble ou une liste de valeurs.
Si un attribut prend plusieurs valeurs, alors ces valeurs doivent faire l'objet d'une entité supplémentaire, en association avec la première (figure 16).
Figure 16 - Application de la première forme normale : il peut y avoir plusieurs auteurs pour un livre donné
Deuxième forme normale : l'identifiant peut être composé de plusieurs attributs mais les autres attributs de l'entité doivent dépendre de l'identifiant en entier (et non pas une partie de cet
identifiant).
Cette deuxième forme normales peut être oubliée si on suit le conseil de n'utiliser que des identifiants non composés et de type entier. En vérité, elle a été vidée de sa substance par la règle de
normalisation des attributs des associations (paragraphe « Normalisation des attributs des associations »).
Considérons malgré tout le contre-exemple suivant : dans une entité clients dont l'identifiant est composé des attributs nom et prénom, la date de fête d'un client ne dépend pas de son identifiant en
entier mais seulement de prénom. Elle ne doit pas figurer dans l'entité clients, il faut donc faire une entité calendrier à part, en association avec l'entité clients.
Troisième forme normale de Boyce-Codd (importante) : tous les attributs d'une entité doivent dépendre directement de son identifiant et d'aucun autre attribut. Si ce n'est pas le cas, il faut
placer l'attribut pathologique dans une entité séparée, mais en association avec la première.
Par exemple, l'entité avions (figure 18 à gauche) dont les valeurs sont données dans le tableau 17, n'est pas en troisième forme normale de Boyce-Codd, car la capacité et le constructeur d'un avion
ne dépendent pas du numéro d'avion mais de son modèle. La solution améliorée est donnée figure 18 à droite.
Pour établir efficacement un modèle entités-associations bien normalisé, on peut étudier au préalable les dépendances fonctionnelles entre les attributs puis, les organiser en graphe de couverture
minimale. Cette technique est traditionnellement employée pour normaliser des schémas relationnels, mais elle s'applique très bien en amont, au niveau des modèles conceptuels.
Un attribut Y dépend fonctionnellement d'un attribut X si et seulement si une valeur de X induit une unique valeur de Y. On note une dépendance fonctionnelle par une flèche simple : X ? Y.
Par exemple, si X est le numéro de client et Y le nom de client, alors on a bien X ? Y. Par contre, on a pas Y ? X, car plusieurs clients de numéros différents peuvent porter le même nom.
Transitivité : si X ? Y et Y ? Z alors X ? Z.
Par exemple, on a numéro de commande ? numéro de client ? nom de client, donc on a aussi numéro de commande ? nom de client.
Mais la dépendance fonctionnelle numéro de commande ? nom de client est dite transitive, car il faut passer par le numéro de client pour l'obtenir. Au contraire, la dépendance fonctionnelle numéro de
client ? nom de client est directe. Seules les dépendances fonctionnelles directes nous intéressent. D'autres exemples sont donnés dans le tableau 19.
Un attribut Y peut avoir une dépendance fonctionnelle qui repose sur la conjonction de plusieurs attributs, auquel cas la dépendance est dite non élémentaire. Les dépendances fonctionnelles non
élémentaires sont notées par une flèche unique mais comportant plusieurs points d'entrée (regroupés autour d'un cercle).
Par exemple, la quantité commandée (d'un article dans une commande) dépend de deux attributs : le numéro de commande et le numéro d'article (figure 20). Notons que cette dépendance numéro
de commande + numéro d'article ? quantité est à la fois non élémentaire et directe.
En représentant tous les attributs et toutes les dépendances fonctionnelles directes entre eux, nous obtenons un réseau appelé graphe de couverture minimale. Dans notre exemple sur les clients, les
commandes et les articles, ce graphe est donné sur la figure 21.
À partir du graphe de couverture minimale (figure 21), le schéma entités-associations normalisé correspondant apparaît naturellement (figure 22), en suivant quelques étapes simples.
Figure 22 - Identification des entités et des associations sur un graphe de couverture minimale
Étape 1 : il faut repérer et souligner les identifiants.
Étape 2 : puis tous les attributs non identifiant qui dépendent directement d'un identifiant et d'un seul, forment une entité (avec l'identifiant, bien sûr).
Étape 3 : ensuite, les dépendances élémentaires entre les identifiants forment des associations binaires dont les cardinalités maximales sont 1 au départ de la dépendance fonctionnelle et n à
l'arrivée.
Étape 4 : sauf si entre deux identifiants se trouvent deux dépendances élémentaires réflexives, auquel cas l'association binaire a deux cardinalités maximales valant 1.
Étape 5 : enfin, les attributs (non identifiants) qui dépendent de plusieurs identifiants sont les attributs d'une association supplémentaire dont les cardinalités maximales sont toutes n.
La traduction du graphe de couverture minimale de la figure 22 en un schéma entités-associations normalisé est donnée sur la figure 23.
Remarquons également qu'en réalité, il faut déjà connaître les entités en présence pour établir correctement le graphe de couverture minimale, ne serait-ce que pour y faire figurer leurs identifiants.
Donc finalement, cette technique n'est une aide pour établir les associations entre les entités et pour normaliser les entités et leurs associations (jusqu'en troisième forme normale de Boyce-Codd).
Dans une bibliothèque, on peut vouloir stocker les emprunts en cours (figure 24) et/ou les emprunts historiques (figure 25).
Par contre, un livre peut faire l'objet de plusieurs emprunts historiques et dans ces conditions, la date d'emprunt est déterminante pour connaître la date de retour prévue (figure 25 en haut à
gauche). Or une date n'est pas un identifiant et une dépendance fonctionnelle ne peut partir que d'un ou plusieurs identifiant(s). C'est le signe qu'il manque un identifiant : le numéro d'emprunt
(figure 25 en haut à droite).
Figure 25 - Même pour une entité historisée, il vaut mieux éviter que la date n'entre dans l'identifiant
Notons que l'entité emprunts historiques supplémentaire qui apparaît après traduction (figure 25 en bas) ne peut pas être transformée en une association comme on pourrait le croire au simple
examen des cardinalités qui l'entourent. En effet, les attributs de l'association qui en résulterait ne vérifieraient pas la normalisation des attributs des associations. Notamment, la date de retour
effectif ne dépend pas du numéro de livre et du numéro de membre, mais du numéro de livre et de la date d'emprunt.
La normalisation des entités ne s'applique donc pas aux entités qui ont un caractère historique. À moins que les dates ne soient regroupées dans une entité séparée, ce qui n'est pas conseillé tant
qu'aucune information liée aux dates (comme le caractère férié, par exemple) n'est nécessaire.
Une ou plusieurs dépendances fonctionnelles peuvent partir ou arriver plusieurs fois du même attribut. Pour clarifier la signification de chaque dépendance fonctionnelle, on peut ajouter un
commentaire sur la flèche (figure 26). Ce commentaire sert ensuite à donner un nom aux associations correspondantes.
Les fonctionnelles réflexives (X ? X), quoique toujours vraies, ne présentent aucun intérêt, à moins qu'elles aient une signification particulière. Un exemple de dépendance réflexive licite sur un graphe
de couverture minimale est la dépendance fonctionnelle personne ? personne, lorsqu'elle signifie « diriger », « être en couple avec » ou « être le père ou la mère de » (figure 26(b)).
Dans le même ordre d'idée, il est inutile de faire figurer sur le graphe de couverture minimal des dépendances fonctionnelles non élémentaires vraies, mais idiotes, comme par exemple numéro de
commande + numéro d'article ? numéro de commande.
La lacune majeure de cette méthode reste tout de même le fait que les associations dont toutes les cardinalités maximales sont n mais qui sont sans attribut ne figurent pas sur le graphe de
couverture minimale. Il faut alors, soit leur inventer temporairement un attribut (comme pour la normalisation des attributs des associations), soit introduire une notation spéciale (par exemple, une
dépendance non élémentaire qui ne débouche sur aucun attribut).
Pour illustrer ce défaut, prenons l'exemple des films et des acteurs (figure 27).
Figure 27 - Utilisation d'une dépendance non élémentaire et sans enfant sur un graphe de couverture minimal
Il n'y a pas d'attribut qui dépende à la fois du numéro de film et du numéro d'acteur (à moins d'imaginer le temps d'apparition à l'écran). Et pourtant, les deux entités films et acteurs sont en
association. Grâce à la dépendance non élémentaire et sans enfant, on peut rendre compte de cette situation sur le graphe de couverture minimale et faire ainsi apparaître l'association sur le schéma
entités-associations qui en est traduit.
Face à une situation bien définie (soit à travers un énoncé précis, soit à travers une collection de formulaires ou d'états que le nouveau système d'information est censé remplacer), nous pouvons
procéder sans établir le graphe de couverture minimale :
Mais, il est parfois plus intuitif d'en passer par l'étude des dépendances fonctionnelles directes :
identifier les entités en présence et leur donner un identifiant (numéro arbitraire et auto-incrémenté) ;
ajouter l'ensemble des attributs et leur dépendances fonctionnelles directes avec les identifiants (en commençant par les dépendances élémentaires) ;
traduire le graphe de couverture minimale obtenu en un schéma entités-associations ;
ajuster les cardinalités minimales ;
à ce stade, la majorité des règles de normalisation devraient être vérifiées, il reste tout de même la normalisation des noms, la présence d'attributs en plusieurs exemplaires et d'associations
redondantes ou en plusieurs exemplaires, à corriger.
Il faut garder également à l'esprit que le modèle doit être exhaustif (c'est-à-dire contenir toutes les informations nécessaires) et éviter toute redondance qui, on ne le dira jamais assez, constitue une
perte d'espace, une démultiplication du travail de maintenance et un risque d'incohérence.
Il faut par ailleurs veiller à éliminer les synonymes (plusieurs signifiants pour un signifié, exemple : nom, patronyme, appellation) et les polysèmes (plusieurs signifiés pour un signifiant, exemples :
qualité, statut).
Il va de soi que cette méthodologie ne doit pas être suivie pas-à-pas une bonne fois pour toute. Au contraire, il faut itérer plusieurs fois les étapes successives, pour espérer converger vers une
modélisation pertinente de la situation.
Avant l'apparition des systèmes de gestion de base de données (SGBD ou DBMS pour Data Base Management System), les données étaient stockées dans des fichiers binaires et gérées par des
programmes exécutables (développés en Basic, Cobol ou Dbase, par exemple). [Gabay] propose à ce sujet une traduction d'un MPD vers un MLD fichier. Mais la maintenance des programmes (en cas
de modification de la structure des données, notamment) était très problématique.
Sont alors apparus les SGBD hiérarchiques dans lesquels les données sont organisées en arbre (IMS-DL1 d'IBM, par exemple), puis les SGBD réseaux dans lesquels les données sont organisées selon
un graphe plus général (IDS2 de Bull, par exemple). [Matheron], [Nanci et al.]et [Gabay] décrivent la traduction d'un MPD vers un MLD Codasyl (base de données réseaux). Ces deux types de SGBD
sont dit navigationnels car on peut retrouver l'information à condition d'en connaître le chemin d'accès.
Aujourd'hui, ils sont largement remplacés par les SGBD relationnels (SGBDR) avec lesquels l'information peut être obtenue par une requête formulée dans un langage quasiment naturel (la langage
SQL pour Structured Query Langage). Parmi les SGBDR les plus répandus nous trouvons Oracle, SQL Server et DB2. Nous nous contentons ici d'exposer le modèle logique de données relationnel
(MLDR).
Plus récemment, sont apparus le modèle logique orienté objet et même des SGBD orientés objets. Pourtant, les SGBD relationnels restent extrêmement majoritaires, tandis que l'approche orienté
objet est parfaitement adaptée au développement d'applications clientes dynamiques et liées aux données du système d'information.
Lorsque des données ont la même structure (comme par exemple, les renseignements relatifs aux clients), on peut les organiser en table dans laquelle les colonnes décrivent les champs en commun
et les lignes contiennent les valeurs de ces champs pour chaque enregistrement (tableau 28).
Les lignes d'une table doivent être uniques, cela signifie qu'une colonne (au moins) doit servir à les identifier. Il s'agit de la clé primaire de la table.
L'absence de valeur dans une clé primaire ne doit pas être autorisée. Autrement dit, la valeur vide (NULL) est interdite dans une colonne qui sert de clé primaire, ce qui n'est pas forcément le cas des
autres colonnes, dont certaines peuvent ne pas être renseignées à toutes les lignes.
De plus, la valeur de la clé primaire d'une ligne ne devrait pas, en principe, changer au cours du temps.
Par ailleurs, il se peut qu'une colonne Colonne1 d'une table ne doive contenir que des valeurs prises par la colonne Colonne2 d'une autre table (par exemple, le numéro du client sur une commande
doit correspondre à un vrai numéro de client). 2 doit être sans doublons (bien souvent il s'agit d'une clé primaire). On dit alors que 1 est clé étrangère et qu'elle référence 2.
Par convention, on souligne les clés primaires et on fait précéder les clés étrangères d'un dièse # dans la description des colonnes d'une table :
Remarques :
une même table peut avoir plusieurs clés étrangères mais une seule clé primaire (éventuellement composées de plusieurs colonnes) ;
une colonne clé étrangère peut aussi être primaire (dans la même table) ;
une clé étrangère peut être composée (c'est le cas si la clé primaire référencée est composée) ;
implicitement, chaque colonne qui compose une clé primaire ne peut pas recevoir la valeur vide (NULL interdit) ;
par contre, si une colonne clé étrangère ne doit pas recevoir la valeur vide, alors il faut le préciser dans la description des colonnes.
Les SGBDR vérifient au coup par coup que chaque clé étrangère ne prend pas de valeurs en dehors de celles déjà prises par la ou les colonne(s) qu'elle référence. Ce mécanisme qui agit lors de
l'insertion, de la suppression ou de la mise à jour de lignes dans les tables, garantit ce que l'on appelle l'intégrité référentielle des données.
On peut représenter les tables d'une base de données relationnelle par un schéma relationnel dans lequel les tables sont appelées relations et les liens entre les clés étrangères et leur clé primaire est
symbolisé par un connecteur (figure 29).
Notations : on dit qu'une association binaire (entre deux entités ou réflexive) est de type :
En fait, un schéma relationnel ne peut faire la différence entre 0,n et 1,n. Par contre, il peut la faire entre 0,1 et 1,1 (règles 2 et 4).
Règle 1 : toute entité devient une table dans laquelle les attributs deviennent les colonnes. L'identifiant de l'entité constitue alors la clé primaire de la table.
Règle 2 : une association binaire de type 1 : n disparaît, au profit d'une clé étrangère dans la table côté 0,1 ou 1,1 qui référence la clé primaire de l'autre table. Cette clé étrangère ne peut pas
recevoir la valeur vide si la cardinalité est 1,1.
livraisons(n° livraison, date de livraison, nom livreur, #n° fournisseur (non vide))
Règle 3 : une association binaire de type n : m devient une table supplémentaire (parfois appelée table de jonction, table de jointure ou table d'association) dont la clé primaire est composée de deux
clés étrangères (qui référencent les deux clés primaires des deux tables en association). Les attributs de l'association deviennent des colonnes de cette nouvelle table.
Par exemple, l'association concerner (1) de la figure 13 est traduite par la table supplémentaire lignes de commande :
Si les associations fantômes ont été éliminées, il devrait y avoir au moins un côté de cardinalité 0,1. C'est alors dans la table du côté opposé que doit aller la clé étrangère. Si les deux côtés sont de
cardinalité 0,1 alors la clé étrangère peut être placée indifféremment dans l'une des deux tables.
Remarque : d'autres techniques sont parfois proposées pour cette règle 4 (fusionner les tables, utiliser une clé primaire identique, utiliser deux clés étrangères réflexives) mais elles ne sont pas
exploitables dans le cas général.
Règle 5 : une association non binaire est traduite par une table supplémentaire dont la clé primaire est composée d'autant de clés étrangères que d'entités en association. Les attributs de
l'association deviennent des colonnes de cette nouvelle table.
La traduction d'un MLD conduit à un MPD qui précise notamment le stockage de chaque donnée à travers son type et sa taille (en octets ou en bits). Cette traduction est également l'occasion d'un
certain nombre de libertés prises par rapport aux règles de normalisation afin d'optimiser les performances du système d'information.
La traduction d'un MLD relationnel en un modèle physique est la création (par des requêtes SQL de type CREATE TABLE et ADD CONSTRAINT) d'une base de données hébergée par un SGBD
relationnel particulier. Il peut s'agir d'une base Oracle, d'une base SQL Server, d'une base Access ou d'une base DB2, par exemple. Le fait que tous les SGBDR reposent sur le même modèle logique (le
schéma relationnel) permet à la fois la communication entre des bases hétérogènes et la conversion d'une base de données d'une SGBDR à l'autre.
4-2. Optimisations
L'optimisation des performances en temps de calcul se fait toujours au détriment de l'espace mémoire consommé. Dans le pire des cas, réduire les temps de réponse consiste à dé-normaliser
volontairement le système d'information, avec tous les risques d'incohérence et les problèmes de gestion que cela comporte.
Pour les bases de données relationnelles, l'optimisation qui vise à accélérer les requêtes peut passer par :
l'ajout d'index aux tables (au minimum sur les colonnes clés primaires et clés étrangères) ; ces index consomment de l'espace mémoire supplémentaire, mais la base de données reste normalisée ;
l'ajout de colonnes calculées ou de certaines redondances pour éviter des jointures coûteuses (auquel cas la base est dé-normalisée) ; il faut alors veiller à ce que la cohérence entre les colonnes soit
respectée, soit par l'utilisation de déclencheurs, soit dans les applications clientes du système d'information ;
la suppression des contraintes d'unicité, de non vacuité ou encore de clé étrangère (auquel cas, l'intégrité des données doit être assurée par le code client du système d'information).
Par exemple, la table commandes de la figure 31 peut être supprimée et la date de commande est alors ajoutée à la table lignes de commandes.
Le conseil le plus précieux, en matière d'optimisation, est de ne jamais optimiser a priori, mais toujours a posteriori, c'est-à-dire en réponse à une lenteur que le SGBDR n'est pas capable de résoudre
tout seul. Il faut alors mesurer le gain de toute optimisation manuelle en effectuant des tests (chronométrages avant/après) sur un volume de données significatif et de préférence en exploitation.
5. Rétro-conception
Dans la majorité des cas, le travail du concepteur de bases de données consiste non pas à créer une base de données ex nihilo, mais plutôt à corriger ou étendre une base existante. Dans ce cas, la
matière de travail initiale est un modèle physique et la méthode de rétro-conception ou reverse engineering consiste à traduire ce MPD en un modèle conceptuel, modifier le MCD obtenu puis modifier
le modèle physique en conséquence.
Dans le cadre des bases de données relationnelles, il faut convertir le modèle physique en un schéma relationnel normalisé (en détricotant les optimisations éventuelles et en renommant les colonnes
des tables pour assurer l'unicité et le caractère explicite (non codé) des noms), puis appliquer les règles de traduction de la section « Traduction d'un MCD en un MLDR » dans le sens inverse.
Étape 1 : chaque table dont la clé primaire ne contient pas de clé étrangère devient une entité dont l'identifiant est la clé primaire de la table et dont les attributs sont les colonnes de la table qui ne
sont pas clé étrangère.
Étape 3 : chaque table dont la clé primaire est composée exclusivement de clés étrangères qui référencent plusieurs clés primaires, devient une association autour de laquelle toutes les cardinalités
maximales valent n, c'est-a-dire soit une association binaire de type n : m soit une association ternaire ou plus (les autres colonnes non clés étrangères de la table deviennent des attributs de
l'association).
Étape 5 : les colonnes clés étrangères restantes deviennent des associations binaires de type 1 : n s'il n'y a pas de contrainte d'unicité ou de type 1 : 1 s'il y a une contrainte d'unicité (il faut trouver
un nom à cette association).
Étape 6 : la cardinalité minimale vaut 1 pour les clés étrangères qui font partie d'une clé primaire ou qui possèdent une contrainte (non vide), sinon elle vaut 0.
Malheureusement, ces quatre étapes ne suffisent pas pour traduire tous les schémas relationnels possibles. Notamment, les tables de la figure 36 nécessitent l'insertion d'étapes supplémentaires.
Étape 4 : chaque table dont la clé primaire est composée partiellement de clés étrangères provient soit d'une optimisation qu'il faire défaire (comme sur la figure 35) soit d'un identifiant relatif d'une
entité comme dans la section « Identifiant relatif ou lien identifiant » (auquel cas les autres colonnes non clés étrangères de la table deviennent des attributs de cette entité).
6. Compléments
Aucune situation complète, ou presque, ne peut être parfaitement modélisée si le concepteur se contente des fonctionnalités abordées à ce stade du document. Ne serait-ce que pour comprendre
l'élaboration des tables de la figure 36, il est nécessaire d'introduire de nouvelles notations sur le schéma entités-associations. Les trois extensions majeures présentées dans cette section font partie
de la version 2 de Merise [Panet et al.]. Elles permettent de traiter davantage de situations réelles et souvent de manière plus simple.
Dans cette section, nous reprenons la démarche qui consiste à étudier les dépendances fonctionnelles directes sur le graphe de couverture minimale, puis à traduire ce graphe en schéma entités-
associations, pour obtenir finalement un schéma relationnel. Les notions abordées ici ne permettent plus au schéma relationnel d'être écrit textuellement sans ambiguïté. Afin de lever toute ambiguïté
pour savoir quelle clé primaire est référencée par telle clé étrangère, il est impératif de représenter le schéma relationnel de manière graphique, ce que nous nous contentons de faire.
6-1. Agrégation
Une association n'est pas forcément établie exclusivement entre des entités.
Considérons l'exemple de la figure 37 issu du monde des courses hippiques. La dépendance fonctionnelle n° cheval + n° course ? n° jockey est la première dépendance fonctionnelle non élémentaire
vers un identifiant que nous rencontrons. Ce type de dépendance fonctionnelle nous incite à créer une association binaire de type 1 : n entre l'entité jockeys et l'association binaire de type n : m qu'il
y a entre les entités chevaux et courses. D'un point de vue sémantique, la logique est respectée puisque un jockey ne monte pas un cheval, mais un cheval-qui-participe-à-une-course.
Figure 37 - Association binaire de type 1 : n (monter), liée à une association binaire de type n : m (participer)
Pour tenir compte de ce nouveau cas de dépendance fonctionnelle, il convient d'ajouter une sixième étape à la technique de traduction d'un graphe de couverture minimal en un schéma entités-
associations, telle qu'elle est commencée section « Traduction vers un schéma entités-associations » :
Étape 6 : lorsqu'un identifiant dépend de plusieurs autres identifiants, son entité est en association de type 1 : n avec l'association qui lie les autres identifiants.
Certains auteurs considèrent que l'agrégation des entités chevaux, courses et de l'association participer constitue une nouvelle entité participations qui englobe ces trois éléments graphiques. Dans ce
cas, l'association monter fait le lien entre les deux entités (participations et jockeys). Le résultat final sur le schéma relationnel est le même. Malheureusement, cette notation n'est pas très pratique
car le schéma entités-associations devient vite illisible lorsqu'une entité participe à plusieurs agrégations.
Nous préférons donc autoriser, dans ce document, qu'une association puisse être liée à une association binaire de type n : m ou à une association ternaire (ou plus). Cependant pour ne pas confondre
les liens entres associations et entités avec les liens entres associations, nous encadrons soigneusement les associations qui interviennent dans une agrégation, comme sur la figure 37 en bas à
gauche.
En tout cas, une association ne peut pas être liée à une association binaire de type 1 : n ou 1 : 1. Dans ce cas, l'association doit être directement liée à l'entité qui se trouve du côté où la cardinalité
maximale est 1.
Sur le schéma relationnel final (figure 37 en bas à droite), la table de jonction participations reçoit une clé étrangère supplémentaire, mais qui contrairement aux autres, ne participe pas à la clé
primaire.
À présent, ajoutons les parieurs à notre exemple de la figure 37. Étant donné que nous avons la dépendance fonctionnelle n° cheval + n° course + n° parieur ? montant de la mise (figure 38 en haut),
nous pourrions avoir une association ternaire entre les entités chevaux, courses et parieurs. Mais dans ce cas, un parieur peut miser sur un cheval dans une course, alors que ce cheval ne participe
pas à cette course.
En réalité (figure 38 en bas), la vraie dépendance fonctionnelle directe est n° cheval + n° course) + n° parieur ? montant, ce qui garantit qu'un parieur ne peut miser que sur un cheval-qui-participe-
à-une-course.
Le fait qu'une association ternaire (ou plus) disparaissent au profit d'une ou plusieurs agrégations est très fréquent lorsque l'on modélise une situation complète. À tel point qu'on peut partir du
principe qu'un schéma entités-associations sans agrégation est généralement faux.
Dans notre exemple, la traduction de la nouvelle dépendance fonctionnelle en une association de type n : m (figure 39 en haut) se fait en appliquant, comme d'habitude, l'étape 4 de la
section « Traduction vers un schéma entités-associations ».
Figure 39 - Association binaire de type n : m (parier), liée à une autre association binaire de type n : m
Sur le schéma relationnel obtenu (figure 39 en bas), la traduction de l'association binaire de type n : m liée à une autre association binaire de type n : m fait apparaître dans la table paris une clé
étrangère composite qui référence la clé primaire composite de la table participations.
Rappelons qu'il est déconseillé d'utiliser des identifiants composites. Mais la clé primaire composite de la table participations est légitime puisqu'elle est issue d'une association binaire de type n : m.
En conséquence de quoi la clé étrangère composite de la table paris est également légitime puisqu'elle est aussi issue d'une association binaire de type n : m.
On peut ainsi imaginer avoir sur un schéma relationnel des clés primaires ou étrangères composées d'un nombre arbitraire de colonnes, sans pour autant qu'il n'y ait un seul identifiant composite sur
le schéma entités-associations correspondant.
Certains attributs ne peuvent prendre qu'un jeu volontairement limité de valeurs. C'est le cas sur la figure 40 à gauche, pour les attributs enseignant et matière. Cela évite sur cet exemple qu'une
même matière ne soit décrite de deux manières différentes et qu'un même nom d'enseignant ne soit orthographié deux fois.
Ainsi, l'agrégation évite notamment aux entités de codification de transformer une association binaire en une association ternaire (ou plus).
Même en utilisant des agrégations, il reste des situations où tout le potentiel de l'intégrité référentielle n'est pas exploité.
Prenons par exemple le schéma relationnel en haut de la figure 41, tiré d'une base de données pour un centre de golf. Dans la table trous, la clé primaire n° trou est en incrément automatique, tandis
que la colonne n° trou dans parcours est un nombre (généralement compris entre 1 et 18) qui correspond à la numérotation des trous dans le parcours.
Le problème de ce schéma relationnel est qu'en l'état, il peut y avoir un score dans la table scores pour un trou qui n'appartient pas au parcours sur lequel la partie se joue (le lecteur est invité à bien
observer la figure pour s'en apercevoir).
Cette solution consiste à faire entrer le numéro de parcours dans la numérotation des trous (remplaçant ainsi le n° trou) ainsi que dans la numérotation des parties (en conservant cette fois-ci le n°
partie en incrément automatique). Les tables trous et parties possèdent alors une clé primaire composite et partiellement étrangère (figure 41 en bas).
Les clés étrangères des tables participations et scores qui référencent ces nouvelles clés primaires sont alors complétées par une nouvelle colonne (le numéro de parcours). Dans la table des scores,
comme cette colonne n° parcours n'est introduite qu'une fois, il n'est plus possible pour un joueur d'avoir un score sur un trou qui n'appartient pas au parcours sur lequel se joue la partie.
En rétro-conception, pour tenir compte du fait que le numéro de parcours fera partie de la clé primaire de la table trous sur le schéma entités-associations, il suffit de mettre entre parenthèses la
cardinalité 1,1 de l'association entre les entités trous et parcours (figure 42). L'identifiant de l'entité côté 1,1 devient alors relatif à celui de l'autre entité en association.
Dans un magasin de location de vidéos, le gérant peut vouloir numéroter séparément les exemplaires de chaque vidéo (figure 44 colonne de gauche), alors que le concepteur de la base de données
aurait tendance à vouloir numéroter globalement l'ensemble des exemplaires (colonne de droite).
6-3. Héritage
Enfin, il est parfois utile de factoriser les attributs communs à plusieurs entités au sein d'une entité mère.
6-3-1. Sous-entité
Considérons l'exemple suivant : les factures d'une entreprise font l'objet d'un règlement par chèque ou par carte. Cette entreprise souhaite connaître pour chaque règlement la date, le montant et :
On a donc une entité générique règlements et deux entités spécialisées chèques et paiements par carte. Ces deux sous-entités de l'entité règlements ont des attributs propres mais pas d'identifiant
propre. Au niveau logique objet, on retrouve la notion d'héritage.
Conformément aux notations objets, sur le schéma entités-associations, on représente le lien qui unit une sous-entité à son entité générique par une flèche creuse (figure 45 au centre). Ce lien
remplace une association être de type 1 : 1 (un chèque « est un » règlement et un paiement par carte « est un » règlement).
La traduction des sous-entités au niveau logique relationnel fait intervenir une clé primaire identique à celle de l'entité mère, mais dans les sous-entités la clé primaire est aussi étrangère (figure 45 en
bas).
Sur le graphe de couverture minimale (figure 45 en haut), l'identifiant dont dépendent les attributs communs est volontairement dupliqué autant de fois que nécessaire pour les attributs spécialisés.
Nous pouvons alors remarquer que les attributs qui dépendent d'un même identifiant peuvent être regroupés avec des « et » logiques tandis que dès qu'il est nécessaire de faire appel à un « ou »
logique, c'est le signe d'une spécialisation.
Sur la figure 45, il est tentant de traduire directement le graphe de couverture minimale en le schéma relationnel, car il en est beaucoup plus proche que le schéma entités-associations. C'est une
technique licite, à condition de traduire correctement les associations de type 1 : 1 (étape 4).
L'héritage peut être utilisé même lorsqu'il n'y a qu'une entité spécialisée. C'est utile pour stocker dans une table séparée des informations complémentaires.
Considérons la table clients dans laquelle nous stockons déjà le numéro, le nom et le code postal. Nous souhaitons désormais stocker également le numéro de téléphone, l'adresse courrier et l'adresse
électronique. La première idée consiste à ajouter trois colonnes supplémentaires dans la table clients. Mais pour les clients qui ont déjà été saisis dans la table, ces trois colonnes seront vides.
Pour gagner de la place, ces trois colonnes peuvent constituer une nouvelle table annuaire clients dont la clé primaire référence celle de la table clients (figure 46). Formellement, annuaire clients est
issu d'une sous-entité de l'entité clients.
La notion d'héritage est valable également pour les associations. Nous pouvons donc faire appel à des sous-associations avec des attributs spécifiques et des associations génériques qui contiennent
les attributs communs. Mais sans aller jusqu'à l'introduction de sous-associations, dès qu'un schéma entités-associations fait appel à des sous-entités, il est fréquent que les associations concernées
par ces sous-entités soient elles-mêmes spécialisées.
Considérons une entreprise artisanale qui vend non seulement des articles produits en série à prix unitaire fixe, mais aussi des articles fait sur mesure et dont le prix unitaire est calculé à partir de la
durée de confection et d'un taux horaire. Dans ce cas, non seulement l'entité articles est spécialisée en articles en série et articles sur mesure, mais en plus, l'association concerner entre les entités
commandes et article est spécialisée selon qu'il s'agit d'un article en série ou sur mesure (figure 47 au centre).
Sur le schéma relationnel (figure 47 en bas), les associations spécialisées sont traduites de manière classique. À charge ensuite pour le développeur du formulaire de facturation, d'effectuer la réunion
des articles commandés.
7. Conclusion
Avec la pratique, vient un moment où le concepteur peut se passer du modèle entités-associations et produire directement des schémas relationnels corrects. Pourtant, continuer de travailler à un
niveau conceptuel plutôt qu'à un niveau logique reste une tactique payante pour lui, dans la mesure où les données pourtant stockées sous une forme relationnelle, doivent de nos jours être accédées
par des applications orientées objet. Le modèle conceptuel permet de faire le lien entre d'une part la représentation objet des données et d'autre le stockage relationnel des mêmes données.
Par exemple, on peut très bien imaginer qu'un schéma entités-associations soit d'un côté traduit en un schéma relationnel puis implémenté dans une base de données Oracle ; tandis qu'en parallèle, il
est traduit en un diagramme de classe (modèle logique objet), lui-même implémenté dans un ensemble de classes Java. Ces classes Java permettent ensuite aux développeurs de construire des
applications clientes orientées objet et qui attaquent de manière transparente les données de la base Oracle. Il s'agit d'une solution de passage entre la modélisation orientée objet (pertinente pour
développer des interfaces graphiques) et la modélisation relationnelle (pertinente pour gérer les données).
Par ailleurs, la méthodologie Merise est certes typiquement française, mais en Grande-Bretagne, la méthodologie standard s'appelle SSADM (Structured Systems Analysis ans Design Method) et
repose sur les mêmes principes. Les nord-américains quant à eux utilisent ce qu'on appelle des diagrammes de flux, dont les principes sont repris par la version 2 de Merise.
Aujourd'hui, ce sont les modélisations objets et leur unification UML (Unified Modeling Language, autrement dit langage unifié de modélisation) qui se placent à la pointe de l'état de l'art.
Malheureusement, UML n'est qu'un ensemble de notations (d'ailleurs moins intuitives que celles des schémas entités-associations). La connaissance de ce langage ne permet donc pas au concepteur
de faire l'économie d'une méthodologie de conception. Voilà pourquoi il n'est pas anachronique de ré-éditer en 2005 un document sur des méthodes qui auront bientôt 30 ans ;-)
8. Références
[Akoka et Comyn-Wattiau]Akoka, J. et Comyn-Wattiau I. Conception de bases de données relationnelles. Vuibert Informatique. Ce livre très didactique contient de bons exercices sur la phase de
conception d'un système d'information.
[Gabay] Gabay, J. Apprendre et pratiquer Merise. Masson, 1989. Ce livre très synthétique permet de s'exercer sur la méthode.
[Matheron]Matheron, J.-P. Comprendre Merise. Eyrolles, 1994. Cet ouvrage très accessible permet vraiment de comprendre la méthode.
[Nanci et al.] Nanci, D., Espinasse, B., Cohen, B. et Heckenroth, H. Ingénierie des systèmes d'information avec Merise. Sybex, 1992. Cet ouvrage complet détaille la méthode dans son ensemble.
[Panet et al.] Panet, G., Letouche, R. et Tardieu, H. Merise/2 : Modèles et techniques Merise avancés. Édition d'organisation, 1994. Ce livre décrit la version 2 de la méthode.
[Tardieu et al.] Tardieu, H., Rochfeld, A. et Coletti, R. La méthode Merise. Principes et outils. Édition d'organisation, 1986. Il s'agit-là du livre de référence par les auteurs de la méthode.