Cours BD
Cours BD
Cours BD
6
F IGURE 1.1 – Un extrait d’un fichier de données de commandes de clients.
mettent de stocker des données nombreuses dans un seul ensemble bien structuré, d’éviter
le plus souvent les doublons, d’assurer la cohérence des informations qu’elles contiennent
et fournissent des moyens d’interrogation performants répondant ainsi à toutes nos réserves
vis-à-vis de l’usage de fichiers pour des données “liées”.
La gestion d’une base de données pose des problèmes complexes et elle est assurée
par des logiciels spécialisés : les systèmes de gestion de bases de données (SGBD), en
anglais DBMS pour database management system (voir le §1.9).
Tout au long de ce cours nous utiliserons deux exemples de bases de données :
1. La base de données appelée client commande, décrite dans le §1.1, est utilisée
pour enregistrer les clients, les produits et les commandes d’une entreprise de
matériaux de construction ; le système d’information construit sur cette base de
données permettra, entre autres, d’éditer des factures, de gérer les stocks et la
comptabilité.
2. La base de données appelée gie agricole, décrite dans le §1.2, est utilisée
par un GIE 2 agricole pour enregistrer les interventions de ses employés sur les
parcelles des agriculteurs ; le système d’information construit sur cette base de
données permettra, entre autres, d’éditer les fiches de paye des employés et les
interventions effectuées pour un agriculteur.
7
1.1 La base de données client commande
La base de données client commande est utilisée par une entreprise de matériaux
de construction pour lui permettre d’éditer des factures pour ses clients et de gérer ses
stocks.
Le schéma de la base de données client commande est présenté dans la figure 1.2 :
1. la table client est utilisée pour enregistrer les propriétés concernant les clients
de l’entreprise : leur nom, leur adresse, etc.
2. la table produit est utilisée pour enregistrer les propriétés concernant les ma-
tériaux de construction disponibles à la vente : leur libellé, le prix à l’unité, la
quantité en stock.
3. la table commande est utilisée pour enregistrer les propriétés concernant une
commande : son numéro, la date de la commande et l’identifiant du client (NCLI)
qui permet de récupérer dans la table client toutes les informations relatives à
ce client.
4. la table detail est utilisée pour enregistrer les “lignes” des commandes : l’iden-
tifiant de la commande (NCOM), l’identifiant du produit (NPRO) et la quantité com-
mandée.
8
table client table commande
9
un agriculteur.
Le schéma de la base de données gie agricole est présenté dans la figure 1.4 :
1. la table agriculteur est utilisée pour enregistrer les propriétés concernant un
agriculteur : son nom, son prénom et son adresse.
2. la table parcelle est utilisée pour enregistrer les propriétés concernant les par-
celles des agriculteurs : leur nom, leur lieu, leur superficie et l’identifiant de leur
propriétaire.
3. la table employe est utilisée pour enregistrer les propriétés concernant les em-
ployés.
4. la table intervention est utilisée pour enregistrer les interventions des em-
ployés du GIE sur les parcelles des agriculteurs.
10
table agriculteur table tarif
table parcelle
table employe
table intervention
F IGURE 1.5 – Les lignes de la base de données gie agricole à un instant donné.
11
1.3 BD, tables, lignes et colonnes
Une base de données est composée d’un ensemble de tables.
Une table contient une collection/suite de lignes, aussi appelées enregistrements.
Une ligne d’une table est une suite de valeurs, chacune d’un type déterminé. Une ligne
regroupe les données relatives à une entité ou un fait du domaine d’application (la partie
du monde à laquelle on s’intéresse). Toutes les lignes d’une table ont le même format ou
structure.
Une colonne est définie par son nom et le type de ses valeurs.
Exemple 1. La figure 1.6 représente les informations enregistrées à un instant donné dans
la table produit de la BD client commande : la table a 7 lignes (enregistrements)
décrivant chacune un produit. On trouve dans chaque ligne quatre valeurs représentant
respectivement le code, le libellé, le prix à l’unité d’un produit, ainsi que la quantité restant
en stock. La colonne LIBELLE contient des valeurs qui sont des chaı̂nes de caractères,
les valeurs de la colonne PRIX sont des nombres décimaux (dont deux chiffres après la
virgule) et les valeurs de la colonne QSTOCK sont des nombres entiers (cf à la figure 1.2).
12
= égal à
> plus grand que
< plus petit que
<> différent de
>= plus grand ou égal
<= plus petit ou égal
L’interprétation de ces relations est évidente pour les valeurs numériques. Pour les va-
leurs temporelles, l’expression date1 < date2 s’interprète comme date1 est antérieure à
date2 dans le calendrier. Pour les chaı̂nes de caractères, l’expression ch1 < ch2 pour toute
chaı̂nes ch1 et ch2 , s’interprète comme ch1 est plus petite que ch2 selon l’ordre lexicogra-
phique (celui du dictionnaire). Attention : le caractère “a” n’est pas égal à “A”.
Les opérateurs logiques utilisés pour les valeurs de type booléen sont :
and : conjonction
or : disjonction
not : négation
Lorsqu’une expression complexe comporte plusieurs opérateurs, les priorités des opé-
rateurs (ou précédence des opérateurs) déterminent l’ordre d’exécution des opérations.
Cet ordre peut affecter considérablement la valeur du résultat. Un opérateur de priorité
élevée est évalué avant un opérateur de priorité basse. Lorsque deux opérateurs dans une
expression ont le même niveau de priorité, ils sont évalués de gauche à droite en fonction
de leur position dans l’expression. En règle générale
— les opérateurs arithmétiques de multiplication et de division sont prioritaires sur
les opérateurs arithmétiques d’addition et de soustraction ;
— les opérateurs arithmétiques sont prioritaires sur les opérateurs de comparaison ;
— les opérateurs de comparaison sont prioritaires sur les opérateurs logiques ;
— l’opérateur logique and est prioritaire sur l’opérateur or.
Pour modifier la priorité habituelle des opérateurs dans une expression il faut utiliser
des parenthèses. Tout ce qui se trouve entre parenthèses est évalué en premier pour pro-
duire une seule valeur, qui est ensuite utilisée par un opérateur en dehors des parenthèses.
La valeur NULL
L’absence de valeur d’une colonne dans une ligne d’une table se signalera par l’affec-
tation de la valeur conventionnelle NULL à cette colonne.
13
On peut imposer l’interdiction d’assigner la valeur NULL à une colonne : cette colonne
sera alors une colonne obligatoire. Si la valeur NULL est autorisée, cette colonne sera dite
facultative.
Contrainte : Toute tentative d’insérer une ligne qui ne posséderait pas de valeur pour
une colonne obligatoire serait automatiquement signalée comme une erreur.
Remarque : La valeur NULL a un statut particulier par rapport aux autres valeurs, son
usage entraı̂ne de multiples difficultés et certains auteurs recommandent de l’éviter.
1.5 Clé
Une ligne dans une table regroupe des informations sur une entité. Il est primordial de
pouvoir identifier de manière unique une ligne dans une table à l’aide d’un identifiant ou
une clé (key en anglais).
14
1.5.2 Clés étrangères
Dans une table, appelée table enfant, une de ses colonnes, appelée clé étrangère (fo-
reign key en anglais), peut faire référence à la colonne qui est clé primaire dans une autre
table, appelée table parent. Le couple constitué par une clé étrangère de la table enfant et
la clé primaire de la table parent permet de relier des lignes dans des tables distinctes.
On notera que le nom d’une colonne formant une clé étrangère peut être le même ou
non de celui de la clé primaire à laquelle elle fait référence.
Pour qu’une clé étrangère joue correctement le rôle de référence, il est nécessaire que
l’ensemble de ses valeurs dans la table enfant soit un sous-ensemble des valeurs de la
clé primaire de la table parent. Cette propriété est appelée contrainte référentielle (voire
aussi le §1.6.3, page 16). Elle est garantie par le SGBD pour autant qu’on ait explici-
tement déclaré les clés étrangères (c.à.d. créer les relations avec les clés primaires aux-
quelles elles font référence) : toute opération qui conduirait à violer cette contrainte serait
automatiquement rejetée.
15
1.6 Modification et contraintes d’intégrité
Les colonnes obligatoires, les clés primaires et les clés étrangères, imposent aux
données des contraintes qui doivent toujours être satisfaites. Ces contraintes, désignées
généralement sous le terme de contraintes d’intégrité, seront donc prises en compte lors
de toute tentative de modification sur les données. Ajouter une ligne, supprimer une ligne
ou modifier une valeur de colonne d’une ligne sont des opérations qui ne sont autorisées
que si ces contraintes sont toujours respectées par les données après ces opérations. Si ces
contraintes sont violées, on dit que les données ont perdu leur intégrité.
16
Exemple 9. La clé étrangère de l’exemple 5 page 15 pour la BD gie agricole impose
que dans la colonne Par Prop de la table parcelle les seules valeurs acceptées soient
celles déjà présentes dans la colonne Agr Id de la table agriculteur.
Exemple 10. Les deux clés étrangères présentées dans l’exemple 6 page 15 pour la BD
client commande impose deux contraintes référentielles :
1. la première, cf. FK1, indique que toute valeur de la colonne NCOM dans detail
doit faire référence à une valeur de la colonne NCOM de la table commande ;
2. la seconde, cf. FK2, indique que toute valeur de la colonne NPRO dans detail
doit faire référence à une valeur de la colonne NPRO de la table produit.
Exemple 11. La table commande (table enfant) de la BD client commande doit
respecter la contrainte référentielle donnée par la colonne NCLI identifiée comme étant
une clé étrangère, appelée FK3, qui fait référence à la colonne NCLI de la table client
(table parent) : dans la colonne NCLI de la table commande les seules valeurs acceptées
sont celles déjà présentes dans la colonne NCLI de la table client.
La suppression dans la table parent d’une ligne référencée par d’autres lignes dans
une table enfant sera exécutée selon une des stratégies possibles suivantes, appelées delete
mode :
— blocage : la suppression de la ligne dans la table parent est refusée ;
— cascade : la suppression de la ligne dans la table parent est accompagnée de la
suppression des lignes correspondantes dans la table enfant ;
— indépendance : la suppression de la ligne dans la table parent est accompagnée
par la mise à NULL des colonnes correspondant aux clés étrangères des lignes
concernées dans la table enfant.
Exemple 12. Dans la base de données client commande la table detail a pour clé
primaire le couple de colonnes (NCOM, NPRO) (voir aussi l’exemple 4) et doit respecter
les deux contraintes référentielles données dans l’exemple 10. Les conséquences sur la
modification de cette table sont les suivantes :
1. La création d’une ligne dans la table detail est autorisée seulement si :
(a) la valeur de la colonne NCOM de cette nouvelle ligne existe dans la colonne
NCOM de la table commande (cf. FK1) ;
(b) la valeur de la colonne NPRO de cette nouvelle ligne existe dans la colonne
NPRO de la table produit (cf. FK2) ;
(c) le couple de valeurs (NCOM, NPRO) n’existe pas déjà dans une ligne de la table
detail (voir aussi l’exemple 7).
2. La suppression d’une ligne dans la table detail est autorisée.
3. La modification de la clé primaire d’une ligne dans la table detail, c’est-à-
dire le couple de valeurs (NCOM, NPRO), est autorisée seulement si ces valeurs
respectent les contraintes 1(a), 1(b) et 1(c) vues ci-dessus.
Exemple 13. Dans la base de données client commande, la table commande
i) a pour clé primaire la colonne NCOM,
17
ii) est la table parent dans la clé étrangère FK1 (voir aussi l’exemple 6), et
iii) est la table enfant dans la clé étrangère FK3 (voir aussi l’exemple 11).
Les conséquences sur la modification de cette table sont les suivantes :
1. La création d’une ligne dans la table commande est autorisée seulement si :
(a) la valeur de la colonne NCOM de cette nouvelle ligne n’existe pas déjà dans une
ligne de la table commande (NCOM est clé primaire) ;
(b) la valeur de la colonne NCLI de cette nouvelle ligne existe dans la colonne
NCLI de la table client (cf. FK3).
2. Si la stratégie de suppression est en mode blocage, alors la suppression d’une ligne
lcomm dans la table commande est autorisée seulement s’il n’existe pas de lignes
dans la table detail qui font référence à cette ligne lcomm (cf. FK1).
3. La modification de la clé primaire d’une ligne dans la table commande, c’est à
dire la valeur de la colonne NCOM, est autorisée seulement si cette valeur respecte
la contrainte 1(a).
Exemple 14. Dans la base de données client commande, la table client a pour
clé primaire la colonne NCLI et elle est la table parent dans la clé étrangère FK3. Les
conséquences sur la modification de cette table sont les suivantes :
1. La création d’une ligne dans la table client est autorisée seulement si la valeur
de la colonne NCLI de cette nouvelle ligne n’existe pas déjà dans une ligne de la
table.
2. Si la stratégie de suppression est en mode blocage, alors la suppression d’une ligne
lcli dans la table client est autorisée seulement s’il n’existe pas de lignes dans
la table commande qui font référence à cette ligne lcli (cf. FK3).
3. La modification de la clé primaire d’une ligne dans la table client, c’est à dire
la valeur de la colonne NCLI, est autorisée seulement si cette valeur n’existe pas
déjà dans une ligne de la table client.
18
Le contenu d’une base de données à un instant t est l’ensemble des lignes de toutes
ses tables.
Le contenu d’une base de données réelle est généralement volumineux (plusieurs
millions de lignes) et est susceptible d’évoluer constamment. En revanche, le schéma
comporte un nombre limité d’éléments (quelques tables à quelques milliers de tables en
général) présentant une relative stabilité dans le temps : on ne modifie la structure d’une
base de données que lorsque la structure du domaine d’application à représenter évolue.
Il existe plusieurs conventions graphiques de représentation d’un schéma de BD,
parmi lesquelles les plus utilisées sont les suivantes :
1. Une table est représentée soit par un rectangle contenant le nom de la table et celui
de chaque colonne, en liste horizontale (à la mode “EXCEL”), soit par une boı̂te
dont le premier compartiment indique le nom de la table et ensuite les noms de ses
colonnes en liste verticale.
2. La clé primaire est soit soulignée d’un trait continu, soit elle est indiquée en gras,
soit elle est spécifiée par la clause “id :”.
3. Une clé étrangère est soit soulignée d’un trait pointillé, soit spécifiée par la clause
“ref :”.
4. Une contrainte référentielle est représentée par une flèche qui part du nom de la
colonne qui est une clé étrangère et qui pointe vers la clé primaire référencée dans
la table cible.
19
Exemple 16. La figure 1.7 donne trois représentations graphiques du schéma de la base
de données client commande, décrite dans le §1.1.
20
1.8 Le langage SQL (Structured Query Language)
Les SGBD proposent un langage de requête dénommé SQL (Structured Query Lan-
guage). Présenté pour la première fois en 1973, ce langage a rapidement été adopté comme
standard potentiel et pris en charge par les organismes de normalisation ANSI et ISO qui
ont publié 3 normes : SQL-89, SQL-92 (dénommée aussi SQL2) et SQL : 1999 (SQL3).
Malheureusement, les éditeurs de SGBD ne respectent pas intégralement ces normes :
ils ne reprennent qu’un sous-ensemble de spécifications, modifient la syntaxe, voire l’in-
terprétation des concepts retenus, et ajoutent leur propres fonctions. Dans ce cours, nous
utiliserons la syntaxe SQL2 dans sa version SQLite.
Le langage de bases de données SQL est composé de deux sous-langages :
1. SQL DDL (Data Definition Language) pour la définition et la modification des
structures (table, colonne, contrainte). Les instructions sont : CREATE, ALTER, et
DROP ;
2. SQL DML (Data Manipulation Language) pour l’extraction et la modification des
données. Les instructions sont : SELECT, INSERT, DELETE, et UPDATE.
Une instruction SQL constitue une requête (en anglais query), c’est-à-dire la descrip-
tion d’une opération que le SGBD doit exécuter.
Une requête SQL peut être écrite en utilisant le clavier, générée à partir d’une interface
graphique, ou importée à partir d’un fichier. Le résultat de l’exécution d’une requête peut
apparaı̂tre à l’écran avec des éventuels messages d’erreurs. Dans la première partie de ce
cours, nous utiliserons cette formulation interactive des requêtes SQL.
Une requête peut également être envoyée par un programme (écrit en C, PHP ou Py-
thon, par exemple) au SGBD. Dans ce cas, le résultat de la requête est stocké par le SGBD,
ligne par ligne, dans les variables du programme. Dans la dernier partie du cours, nous
utiliserons du code Python pour envoyer des requêtes au SGBD et exploiter ensuite leurs
résultats dans des programmes.
21
1.9 Les systèmes de gestion de bases de données (SGBD)
La gestion d’une base de données est assurée par des logiciels spécialisés : les SGBD.
Les fonctions d’un SGBD sont les suivantes :
1. Organisation des données : le SGBD organise les données en tables stockées sur
disque et il crée les mécanismes garantissant un accès rapide aux données.
2. Gestion des données : le SGBD garantit l’évolution cohérente des données et il
vérifie que les contraintes (unicité, référence entre tables, etc.) sont respectées.
3. Accès aux données : le SGBD permet l’accès aux données à la fois par un utilisa-
teur occasionnel et par des programmes de traitement de données.
4. Gestion des accès concurrents : le SGBD permet l’accès simultané aux données
par des centaines voire des milliers d’utilisateurs. Il contrôle rigoureusement les
opérations simultanées sur les mêmes données.
5. Contrôle des accès : le SGBD garantit que seuls les utilisateurs autorisés peuvent
accéder aux données et les modifier.
Les différents SGBD sur le marché se différencient par le périmètre d’utilisation des
bases de données. Le périmètre influence le nombre d’utilisateurs simultanés, la taille
des bases de données et la puissance de calcul nécessaire. Certains SGBD, utilisés dans
les entreprises, supportent de très grandes bases de données et nécessitent des ordinateurs
puissants et très couteux. D’autres SGBD fonctionnent sur des ordinateurs personnels bon
marché, avec des limites quant à la taille des bases de données et la puissance de calcul.
Le marché des SGBD 10 se répartit entre :
1. des SGBD commerciaux (payants) :
— Oracle Database 11 ,
— DB2 Database Software 12 d’IBM,
— SQL Server 13 de Microsoft,
— Access 14 , édité par Microsoft, qui fait partie de la suite bureautique MS Office
Pro, etc.
2. des SGBD Open Source (ou libre) :
— SQLite 15 ,
— MySQL 16 ,
— PostgreSQL 17 , etc.
Dans ce cours, nous utiliserons le SGBD SQLite, un logiciel SGBD libre.
SQLite est une bibliothèque écrite en C qui propose un moteur de base de données
relationnelle accessible par le langage SQL. Contrairement aux serveurs de bases de
10. Pour en savoir plus sur les parts de marché consultez, par exemple, http://www.mysql.com/
why-mysql/marketshare/
11. http://www.oracle.com/fr/products/database/index.html
12. http://www-01.ibm.com/software/data/db2/
13. http://www.microsoft.com/france/serveur-cloud/sql/
14. http://office.microsoft.com/fr-fr/access/
15. https://www.sqlite.org/
16. http://www.mysql.fr/
17. http://www.postgresql.org/
22
données traditionnels, comme MySQL ou PostgreSQL, sa particularité est de ne pas
reproduire le schéma habituel client-serveur mais d’être directement intégrée aux pro-
grammes que l’on souhaite développer. L’intégralité de la base de données (déclarations,
tables, index et données) est stockée dans un fichier indépendant de la plateforme.
23
Chapitre 2
Dans la suite nous présentons une syntaxe simplifiée des instructions du langage SQL,
adaptée aux objectifs du cours. Le langage SQL est le standard utilisé pour la définition
du schéma d’une base de donnée et pour la manipulation des données.
Exemple 17. Pour créer en SQLite la base de données client commande il faut créer
un nouveau fichier client commande.sqlite. Cette opération produit une nouvelle
BD, sans tables.
24
2.2.2 Création d’une table (CREATE TABLE)
Pour créer une table, le langage SQL propose l’instruction CREATE TABLE :
CREATE TABLE nom_table
( nom_colonne type,
nom_colonne type,
...
nom_colonne type )
Il faut spécifier le nom de la nouvelle table, nom table, ainsi que la description de ses
colonnes : pour chaque colonne il faut spécifier son nom, nom colonne, et le type de
ses valeurs. Sur les colonnes on peut ajouter des contraintes :
— pour définir une colonne obligatoire, il faut ajouter NOT NULL après sa définition ;
— pour définir une clé primaire, il faut ajouter PRIMARY KEY ;
— pour définir une clé étrangère, il faut ajouter
FOREIGN KEY REFERENCES table cible (colonne).
Cette opération produit une table vide (c’est-à-dire sans lignes).
25
3 NOM char(18) NOT NULL,
4 ADRESSE char(24) NOT NULL,
5 LOCALITE char(20) NOT NULL,
6 CAT char(2) DEFAULT NULL,
7 COMPTE decimal(9,2) NOT NULL
8 )
De plus, la mot clé AUTOINCREMENT noté après la définition d’une colonne de type
entier s’avère particulièrement utile pour les clés primaires et permet d’attribuer à chaque
nouvelle ligne (enregistrement) un numéro unique qui s’incrémente automatiquement. Il
est particulièrement utile lorsque la valeur de la clé n’a pas de sens particulier pour l’entité
décrite.
Le mot clé DEFAULT quant a lui sera utilisé pour préciser une valeur pour défault
pour une colonne.
Exemple 19. Pour créer la table commande, la commande SQLite est la suivante :
1 CREATE TABLE commande (
2 NCOM INTEGER PRIMARY KEY AUTOINCREMENT,
3 NCLI char(10) NOT NULL,
4 Date TEXT NOT NULL DEFAULT NO_Date,
5 FOREIGN KEY (NCLI) REFERENCES client (NCLI)
6 )
DROP nom_table
Attention : Toutes les données ainsi que la structure de la table seront perdues à la suite
de cette opération !
26
doivent respecter les contraintes d’intégrité définies dans la table. Nous donnons quelques
exemples de règles :
• Ajout d’une colonne. Si la colonne est facultative, l’opération s’effectue sans con-
trainte. Si elle est obligatoire, alors la table doit être vide ou la colonne doit être
accompagnée d’une valeur par défaut.
• Suppression d’une colonne. Cette colonne ne peut pas intervenir dans la compo-
sition d’une clé primaire ou d’une clé étrangère. Si nécessaire, ces clés doivent
d’abord être modifiées ou supprimés.
• Ajout d’une clé primaire. Si la table n’est pas vide, les lignes doivent respecter la
contrainte d’unicité.
• Suppression d’une clé primaire. Cette suppression n’est pas soumise à des condi-
tions sur les données. Cependant, cette clé primaire ne doit pas être référencée par
une clé étrangère.
• Ajout d’une clé étrangère. Si la table n’est pas vide, les lignes doivent respecter la
contrainte référentielle.
Attention ! A cause de toutes ces règles, la modification du schéma d’une base de
données n’est pas une opération fréquente et doit être effectuée avec précautions.
1. la clause select précise le nom des colonnes dont on veut récupérer les valeurs
dans le résultat de la requête,
2. la clause from indique la ou les tables sur lesquelles portent la requête. Toutes
les colonnes de la clause select doivent appartenir à une des tables de la clause
from.
3. la clause where spécifie les conditions de sélection des valeurs du résultat de la
requête. Cette partie de la requête est facultative.
1. Une donnée extraite reste dans la base de données, on en extrait une copie ! La commande delete
est utilisée pour extraire (effacer) une donnée.
27
2.3.2 Extraction simple (SELECT-FROM)
La requête select la plus simple, appelée projection, n’a pas de clause where et
permet l’affichage de toutes les lignes d’une table, mais en ne montrant que certaines
colonnes. Sa forme générale est :
SELECT liste_colonnes
FROM nom_table
affiche pour toutes les lignes de la table client seulement les valeurs des trois colonnes
NCLI, NOM, et LOCALITE.
Pour obtenir les valeurs de toutes les colonnes, la requête est :
1 SELECT *
2 FROM client
SELECT liste_colonnes
FROM nom_table
WHERE condition
n’affiche que les lignes de la table client dont la valeur de la colonne LOCALITE est
égale à la chaı̂ne de caractères ’Toulouse’. De plus, seules les valeurs des colonnes NCLI
et NOM seront affichées.
Conditions de sélection
Dans la clause where, pour construire la condition de sélection on dispose :
— des noms des colonnes de la table nom table ;
— des opérateurs du §1.4 ;
— des constantes :
• numériques et décimales, comme par exemple : 123, -0.003, 7.12 ;
• chaı̂nes de caractères : valeurs entre ’ et ’ (exemple : ’Jean Mercier’) ;
la présence du caractère ’ dans la chaı̂ne se représente par son redoublement
(exemple : ’rue de l’’Eté’) ;
28
• dates : ’2009-02-14’ (standard SQL 2) ; autres variantes selon les SGBD :
’14-02-2009’, ’14/02/2009’.
Pour les expressions composées, l’usage des parenthèses permet de former des condi-
tions plus élaborées, comme par exemple :
1 SELECT NCLI, NOM
2 FROM client
3 WHERE COMPTE >0 AND (CAT = ’ C1 ’ OR LOCALITE = ’ P a r i s ’)
Dans les deux dernières conditions, le signe ’ ’ désigne un caractère quelconque et ’%’
désigne toute suite de caractères, éventuellement vide.
SELECT liste_colonnes
FROM nom_table
WHERE condition
ORDER BY liste_colonnes DESC
Par défault, le classement se fait par ordre ascendant des valeurs. On peut également
spécifier explicitement un ordre ascendant (ASC) ou descendant (DESC).
29
Exemple 22. Pour la base de données client commande les lignes résultant de la
requête
1 SELECT *
2 FROM client
3 WHERE CAT is not null
4 ORDER BY LOCALITE
vont apparaı̂tre classées par ordre alphabétique croissant sur les noms des localités.
On peut indiquer plusieurs critères de tri :
1 SELECT *
2 FROM client
3 ORDER BY LOCALITE, CAT
Les clients vont apparaı̂tre classés par localité, puis dans chaque localité, classés par
catégorie.
affiche les clients classés par catégorie, puis dans chaque catégorie, classés par localité.
le résultat de la requête sera un tableau des montants TVA des articles en stock dont
la quantité restante est supérieure à 500 unités. Dans le résultat (voir Figure 2.1), les co-
lonnes reçoivent un nom qui est celui du composant de la clause SELECT (dans l’exemple
precedent TVA de).
On peut aussi, définir explicitement le nom qui apparait en début de colonne grâce à
la clause AS :
30
Exemple 24.
1 SELECT NPRO AS produit, 0.196*PRIX*QSTOCK AS ” m o n t a n t TVA”
2 FROM produit
3 WHERE QSTOCK > 500
le résultat de la requête sera toujours le même, mais les noms affichés seront ceux spécifiés
après la clause AS.
SQLite offre plusieurs fonctions permettant de dériver des valeurs à partir des valeurs
des colonnes des lignes extraites 2 .
Attention : La requête
2. voir https://www.sqlite.org/lang_corefunc.html pour une liste de celle-ci.
3. voir https://www.sqlite.org/lang_aggfunc.html.
31
1 SELECT MAX(DATECOM)
2 FROM commande
affiche bien la date de la dernière commande enregistrée dans la table commande, mais
la requête
1 SELECT MAX(DATECOM), NCOM
2 FROM commande
est fausse car elle ne permet pas de récupérer le numéro de cette dernière commande
(cf.Example 34.) !
donne les identifiants des clients qui habitent à Namur. Elle est utilisée comme sous-
requête dans la requête
1 SELECT NCOM, DATECOM
2 FROM commande
3 WHERE NCLI in (SELECT NCLI
4 FROM client
5 WHERE LOCALITE = ’ Namur ’)
32
donne les références des produits des commandes des clients qui habitent à Namur.
Si la sous-requête renvoie une seule ligne, il est permis d’utiliser les opérateurs de
comparaison classiques, par exemple :
1 SELECT *
2 FROM client
3 WHERE COMPTE > (SELECT COMPTE
4 FROM client
5 WHERE NCLI = ’ C400 ’)
affiche pour chaque commande de la table commande, le nom et la ville du client qui a
passé cette commande (voir la figure 2.2).
Les valeurs des colonnes NCOM et DATECOM sont extraites de la table commande
(table enfant) tandis que les valeurs des colonnes NOM et LOCALITE sont extraites de la
table client (table parent). La colonne commande.NCLI est une clé étrangère 4 de la
table commande et fait référence à la clé primaire client.NCLI de la table client.
Remarque 1 : Si les deux tables ont des colonnes qui ont le même nom, il faut le-
ver l’ambiguı̈té et préciser à quelle table appartient la colonne, en utilisant la syntaxe
suivante :
4. notée FK3 dans l’exemple 10, page 17
33
F IGURE 2.2 – Le résultat de la requête de l’exemple 29.
nom_table.nom_colonne
Remarque 2 : L’ordre des noms des tables dans la clause FROM ainsi que l’ordre des
conditions dans la clause WHERE n’a pas d’importance. La requête
1 SELECT NCOM, DATECOM, NOM, LOCALITE
2 FROM client, commande
3 WHERE client.NCLI = commande.NCLI
Le résultat d’une jointure entre deux tables est obtenu comme suit :
1. On construit une table (fictive) en couplant chaque ligne de la première table avec
chaque ligne de la seconde, sans prendre en compte la clause where. Si on lance
la requête de l’exemple 29 sur la base de données client commande contenant
les lignes données dans la figure 1.3, page 9, alors cette table fictive contient 9
colonnes (3 colonnes de la table commande, plus 6 colonnes de la table client),
et 112 lignes (112 = 7 x 16 : 7 lignes de la table commande, multiplié par 16 lignes
de la table client).
2. On sélectionne, parmi les lignes ainsi obtenues, celles qui vérifient la condition de
jointure. Pour l’exemple 29 on garde 7 lignes sur les 112.
3. On ne retient alors que les colonnes demandées. Quatre colonnes seront affichées
pour l’exemple 29.
34
La deuxième condition de jointure, col FK E2 = col PK P2, spécifie la règle pour
relier la table nom table 3 à la table nom table E ou à la table nom table P.
affiche pour chaque client et pour chaque commande qu’il a passé le numéro de produit
et la quantité commandée.
Pour avoir aussi le libellé du produit il faut faire une requête avec la jointure de quatre
tables en imposant trois conditions de jointure
1 SELECT client.NOM, commande.NCOM, commande.DATECOM, detail.NPRO,
2 detail.QCOM, produit.LIBELLE
3 FROM client, commande, detail, produit
4 WHERE client.NCLI = commande.NCLI
5 AND detail.NCOM = commande.NCOM
6 AND detail.NPRO = produit.NPRO
Attention ! Une requête sans condition de jointure porte le nom de produit cartésien :
chaque ligne de la première table est couplée avec chaque ligne de la deuxième table.
Si dans la requête de l’exemple 29 on oublie d’imposer la condition de jointure, alors la
requête
1 SELECT NCOM, DATECOM, NOM, LOCALITE
2 FROM commande, client
35
1 SELECT NCOM, DATECOM
2 FROM commande, client
3 WHERE commande.NCLI = client.NCLI
4 AND LOCALITE = ’ Namur ’
Attention : Les structures de select emboı̂tés qui utilisent des conditions de non-
association (not in) ne peuvent pas s’exprimer par une jointure !
Exemple 33. La requête
1 SELECT NCOM, DATECOM, NCLI
2 FROM commande
3 WHERE NCOM not in (SELECT NCOM
4 FROM detail
5 WHERE NPRO = ’ PA60 ’)
désigne les commandes qui ne portent pas sur le produit PA60. Cette requête n’est pas
équivalente à la requête
1 SELECT distinct commande.NCOM, DATECOM, NCLI
2 FROM commande, detail
3 WHERE commande.NCOM = detail.NCOM
4 AND NPRO <> ’ PA60 ’
qui désigne les commandes qui portent au moins sur un produit différent de PA60 (mais
qui par ailleurs peuvent également porter sur le produit PA60).
Exemple 34. La requete
1 SELECT NCOM, DATECOM
2 FROM commande
3 WHERE DATECOM in (SELECT MAX(DATECOM)
4 FROM commande)
qui est une correction de la dernière requête du Section 2.3.5, ne peut pas être écrite sous
la forme d’une jointure.
36
2.3.9 Groupements (clause GROUP BY)
Pour extraire des données regroupées selon une certain valeur de colonne, on utilise
la clause GROUP BY :
SELECT liste_colonnes
FROM nom_table
WHERE condition
GROUP BY liste_colonnes
affiche pour chaque groupe de clients regroupés par localité, le nom de cette dernière, le
nombre de clients dans le groupe et la valeur moyenne des comptes des clients du groupe.
Le résultat compte autant de lignes qu’il y a de groupes ainsi constitués, et donc autant de
lignes qu’il y a de localités distinctes dans la table client.
Exemple 36. Dans la requête suivante, on ne retient que les groupes d’au moins trois
clients :
1 SELECT localite, count(*), avg(compte)
2 FROM client
3 GROUP BY localite
4 having count (*) >= 3
Dans cette requête, la condition HAVING peut porter sur les élément cités dans la
clause SELECT, mais aussi sur toute autre fonction d’agrégation calculable sur chaque
groupe.
Exemple 37. La requête suivante traite les lignes de COMMANDE en les regroupant par
client :
1 SELECT NCLI, count(*)
2 FROM commande
3 GROUP BY NCLI
37
Dans le résultat on ne considère ensuite, avant groupement, que les commandes portant
sur le produit PA45. On s’intéresse aux clients qui ont commandé au moins deux fois le
produit PA45 (soit ici l’unique client C400).
1 SELECT NCLI, count(*)
2 FROM commande
3 WHERE NCOM in (SELECT NCOM
4 FROM detail
5 WHERE NPRO = ’ PA45 ’)
6 GROUP BY NCLI
7 HAVING count(*) >= 2
calcule la quantité qui resterait en stock pour chaque produit si on déduisait les quantités
commandées.
Dans l’exemple précédent, on observe la présence de QSTOCK dans le critère de grou-
pement. Ceci est nécessaire par son apparition dans la clause SELECT en dehors d’une
fonction d’agrégation.
Exemple 40. La requête ci-après calcule, pour chaque groupe de mêmes valeurs de
localite et NPRO, le montant total commandé :
1 SELECT localite, produit.NPRO, sum(QCOM*PRIX)
2 FROM client, commande, detail, produit
3 WHERE commande.NCLI = client.NCLI
4 and commande.NCOM = detail.NCOM
5 and detail.NPRO = produit.NPRO
6 GROUP BY localite, produit.NPRO
38
Exemple 41. La requête suivante constitue des groupes de clients selon leurs valeurs de
compte par intervalles de 1000 :
1 SELECT ” de ”, (compte/1000)*1000
2 ” a ” , (compte/1000)*1000,
3 count(*)
4 FROM client
5 GROUP BY (compte/1000)
L’ordre des valeurs est le même que celui des colonnes. Toute colonne non spécifiée
dans la liste des colonnes prend la valeur NULL ou la valeur par défaut si celle-ci a été
déclarée comme propriété de la colonne. Toute colonne obligatoire (not null) doit
recevoir une valeur, sauf si on lui assigne une valeur par défaut lors de sa déclaration.
Chaque valeur peut être exprimée sous la forme d’une constante, ou plus généralement
de toute expression dont l’évaluation donne une valeur de même type que celui de la
colonne.
Dans tous les cas, les données insérées doivent respecter les contraintes d’intégrité
(unicité, intégrité référentielle, colonnes obligatoires) définies pour à la table dans laquelle
les nouvelles lignes sont insérées, cf. §1.6.
39
2.3.11 Suppression de lignes (DELETE)
L’instruction pour supprimer des lignes dans une table est DELETE :
où le format de la condition de la clause where est le même que celui de l’instruction
select du §2.3.3.
Après l’opération, la base de données doit être dans un état qui respecte toutes les
contraintes d’intégrité (unicité, intégrité référentielle, colonnes obligatoires) auxquelles
elle est soumise et, en particulier, les contraintes référentielles.
efface les 2 lignes de la table detail pour lesquelles le numéro de commande est 30184.
UPDATE nom_table
SET nom_colonne = nouvelle_valeur,
...
nom_colonne = nouvelle_valeur,
WHERE condition
La modification sera effectuée sur toutes les lignes qui vérifient la condition de sélection.
Les nouvelles valeurs peuvent être obtenues par une expression arithmétique.
40