
Dans ce chapitre ...
enjeux de la matière
objectifs de la partie I
histoire: trier, compter
histoire: les imprimantes, les bandes
histoire: approche par les fichiers
concept de base de données: par une définition
definion 2 : par les objectifs d'un Système d'Information
Le champ d'application
Les traitements
Les interrogations
Les données
Les règles d'intégrité
Les méthodologies de conception de BD
retour aux modèles: les fichiers
modèle hiérarchique
modèle réseau
modèle relationnel
Niveaux conceptuels
Distribution des BD
enjeux de la matière
plan de:
Introduction
aux BD
objectifs
de la partie I
Information: ressource de l'entreprise
enjeux de la matière
histoire:
trier, compterLa BD <-> Entreprise
objectifs de la partie I
histoire:
les imprimantes, les bandesRecencement américain 1890 (63 mio)
1 personnes = plusieurs cartes perforées
1 critères = plusieurs colonnes (1mia de trous)
=> machine électro-mécanique
trier + compter
répondre à des questions
- enfants nés, vivants, famille parlant anglais
=> utiliser jusqu'en 1960 (mécanographie)
Lien
histoire: trier, compter
histoire:
approche par les fichierspremières machines EDVAC, ENIAC, ...(1944, )
première machine commercialisée UNIVAC 1 (1951, ..)
(200 dérouleurs bandes- BIZMAC de RCA année 50)
Langage de programation
Flow-matic (1955) -> Cobol (1960)
description des données séparée des instructions
histoire: les imprimantes, les bandes
histoire: approche par les fichiers
concept
de base de données: par une définition
création de fichiers spécifiques à des programmes:
structure des données dépend de l'analyse des traitements
partage difficile entre applications
duplification de l'information (plusieurs vues des mêmes données)
assembleur.........................................fichiers
--------------------indépend. physique--------------
langage prog............................................B.D
histoire des standarts
caractères = EBCDIC & ASCII
langage de prog = COBOL
Base de données = SQL
histoire: approche par les fichiers
concept de base de données: par une définition
definion
2 : par les objectifs d'un Système d'Information
une définition
"Une base de données est un ensemble structuré de données enregistrées sur des supports accessibles par l'ordinateur pour satisfaire simultanément plusieurs utilisateurs de façon sélective et en un temps opportun"
Dans: Bases de données et systèmes relationnels, C. Delobel et M. Adiba, Dunod 1982.
Les données
Les données de la BD représentent des faits, des activités ou des événements de l'entreprise. La BD doit être considérée comme la mémoire de l'entreprise. De ce fait, le contenu de la BD doit être:
Les objets mémorisés dans la BD possèdent des propriétés communes, permettant ainsi de les regrouper par type d'objet. La structure de la BD est le "plan" qui permettra d'interpréter les données stockées. La gestion de la base de données se fait par rapport à cette structure.
Les supports
La base de données peut comporter quelques milliers de caractères pour une petite base sur micro-ordinateur, donc elle peut être stockée sur disquette ou elle est constituée de plusieurs milliards de caractères et elle doit être stockée sur des unités de disques d'un "gros" ordinateur. Malgré les différences de tailles, les techniques et les concepts utilisés sont similaires.
Les utilisateurs
Les données mémorisées sont appelées à être utilisées par différents services de l'entreprise, avec des utilisateurs appartenant principalement à trois catégories:
La BD est surtout utilisée en interrogation, le langage d'interrogation est donc un élément essentiel du système, il doit être:
On entend par là que si l'information existe dans la BD, alors on peut
l'obtenir dans un délai raisonnable (court si l'on travaille de
manière interactive (guichet de banque) ou à temps (pour prendre
une décision))
concept de base de données: par une définition
definion 2 : par les objectifs d'un Système d'Information
Le
champ d'application
Les objectifs de l'organisation
La conception d'une application BD est une opération demandant des ressources financières (achat des ordinateurs, logiciel de gestion de BD, ...) ainsi que des ressources humaines (concepteur, programmeur, opératrices de saisie, ...), il est donc important que l'organisation examine les avantages qu'elle doit en retirer. Les arguments suivants peuvent motiver l'organisation:
definion 2 : par les objectifs d'un Système d'Information
Les
traitementsLes objectifs de l'organisation délimitent un champ d'application dans la réalité dont la BD est le reflet (méthode: Schéma directeur). Ses éléments sont:

HOTEL

Le champ d'application
Les traitements
Les
interrogations
Les traitements de l'application sont définis par toutes les modifications envisagées sur les données de la BD. Trois types d'actions sont possibles:

En résumé, les traitements permettent de modifier la BD pour
tenir compte des changements intervenant dans la réalité du champ
d'application.
Les traitements
Les interrogations
Les
données
Il s'agit d'identifier les besoins de chaque utilisateur devant utiliser la BD, en se posant les questions suivantes:
Les
règles d'intégritéLes données à mémoriser dans la BD sont celles définies par le champ d'application. Les traitements les créent, les mettent à jour et les détruisent. Les requêtes d'interrogation les utilisent en lecture pour répondre aux utilisateurs.
La sélection des données
Nous avons vu que c'est dans le cadre de la définition du champ d'application qu'elle s'effectue. Le choix des propriétés à enregistrer dans la BD doit être nécessaire et suffisant pour exécuter les traitements et répondre aux requêtes d'interrogation:
nécessaire: à court terme, pour être aussi efficace que le système remplacé et à moyen terme, pour répondre à de nouvelles questions (que l'on évite de se poser car dans un système manuel, elles sont trop onéreuses).
suffisant: pour éviter de mémoriser des informations qui seront peu ou pas utilisées.
Pour une personne, nous pouvons la définir par exemple:
nom, prénom, taille, profession, adresse, numéro de téléphone, revenu, poids, appartenance politique, sports pratiqués, état civil, nombre d'enfants, ....
Chacune de ces propriétés a un sens dans un contexte bien défini, par contre elles sont inutiles dans un autre.
Chaque information (comptée en caractères) a un prix calculé avec les coûts suivants:
coût de saisie (opératrice, poste de saisie)
coût de stockage (disques, bandes d'archivage)
coût de manipulation (taille ordinateur ...)
Les données
Les règles d'intégrité
Les
méthodologies de conception de BD
Les règles d'intégrité reflètent les règlements de l'organisation, le "bon sens" de la réalité. On peut les exprimer:
Les règles d'intégrité
retour
aux modèles: les fichiersNous pouvons constater que les principaux éléments cités sont interdépendants. De plus, dans un approche classique, chaque élément doit traverser plusieurs étapes dans le processus de conception.
Les méthodologies de conception de BD
modèle
hiérarchiqueLe fichier (1950-..); c'est l'organisation la plus simple (et encore la plus utilisée). Les données d'un même objet sont définies par un enregistrement physique, l'ensemble des enregistrements physiques constitue le fichier.
La description de l'enregistrement est implicite et elle est codée dans les programmes qui utilisent le fichier. Si l'on modifie la structure du fichier, on est donc obligé de modifier les programmes.
Les systèmes de base de données contournent cet inconvénient majeur en rendant explicite la structure des données, rendant ainsi indépendants les programmes de la représentation physique.
Les SGBD possèdent donc tous une description explicite de la structure
de donnée, mais il existe plusieurs façon de décrire les
liens existant entre les objets du champ d'application; on parle alors de
modèle de données.
retour aux modèles: les fichiers
modèle hiérarchique
modèle
réseau
modèle hiérarchique (1965-..);
dans ce modèle les liens existant entre les objets sont strictement arborescent.

Dans l'exemple, on remarquera que si une feuille de l'arbre doit être utilisée dans une autre arborescence il faudra la duplifier.
IMS est un SGBD hiérarchique.
modèle hiérarchique
modèle réseau
modèle
relationnel
modèle réseau (1965-..); ce modèle est une extension
du modèle précédent, les liens entre objets peuvent
exister sans restriction.

Pour retrouver une donnée dans une telle modélisation, il faut connaître le chemin d'accès (les liens), ceci rend encore les programmes dépendants de la structure de données.
IDMS, TOTAL, MDBS-III sont des SGBD de ce type.
modèle réseau
modèle relationnel
Niveaux
conceptuels
le modèle relationnel (1970-..); Ce modèle est basé sur la notion de relation. Une relation est un ensemble de n-uplet (n est fixe) qui correspondent chacun à une propriété de l'objet à décrire.

DEPARTEMENT, PROJET, EMPLOYE, EMP-PROJET sont des relations. Les lignes dessinées en pointillé sont les liens entre les relations, mais ici il n'est plus nécessaire de décrire explicitement les liens, les chemins d'accès sont indépendants de la modélisation.
INGRES, ORACLE, RDB, DB2, SYBASE sont des SGBD relationnels.
C'est dans ce modèle que nous allons travailler.
modèle relationnel
Niveaux conceptuels
Distribution
des BD

Niveaux conceptuels
Distribution des BD
BASE
DU MODELE RELATIONNEL
