Banques et bases de données
 
SYNTHÈSE DES DISCUSSIONS DE L'ATELIER

Frédéric Robert
Institut National de Recherche Pédagogique
 

LES TYPES DE DONNÉES

   Les interventions des participants à l'atelier ont fait apparaître la grande variété des données utilisées ou utilisables dans les différentes disciplines :

  • en technologie (mécanique CFAO) : bases graphiques (dessins, montages), alphanumériques (nomenclatures, reliées ou non aux précédentes), de composants, particulières à des entreprises, etc. ;

  • banques de textes et de données linguistiques : éditions électroniques de dictionnaires du commerce (Robert, Larousse, sur CD-ROM), dictionnaires électroniques et bases lexicales-grammaticales pour les traitements automatiques du langage - indexation, traduction, génération et compréhension - (tels les instruments construits par le LADL dirigé par M. Gross), banques de textes (littérature française) de l'INALF, banques de textes anciens, latins et grecs (voir le produit Perseus combinant sur CD-ROM textes, informations de tous types, images, cartes, etc.), bibliographies électroniques (Electre, Opale de la BN tous les dépôts depuis 1975), banques documentaires de la presse (indexation automatique des articles : Le Monde, Ouest France)... ;

  • en économie et gestion : banques de données à grande diffusion (juridiques, économiques), ou à diffusion plus restreinte au niveau local ;

  • en biologie et géologie : banques de données internationales en accès libre, géologiques (sismiques, gravimétriques, etc.), moléculaires, épidémiologiques (médicales, sociologiques) ;

  • en géographie : nombreuses banques cartographiques depuis peu ;

  • ont été également mentionnées, sans entrer dans les détails, les barques en physique-chimie et les données satellitaires utilisées en télédétection, les banques d'images accessibles par vidéodisques ou numérisées.

   Cet inventaire ne prétendait pas à l'exhaustivité, mais a permis de mettre en évidence un certain nombre de problèmes liés à la disponibilité des données, à leur organisation et leur exploitation à l'aide des instruments fournis.

DISPONIBILITÉ

   Les exposés ont fait ressortir une assez grande disparité dans la disponibilité et l'accessibilité des données selon les domaines. En général, la situation française est plutôt marquée par une insuffisance de la disponibilité des données, au niveau éducatif, tant sur réseaux (l'Éducation nationale n'est pratiquement pas connectée aux serveurs de données) que sur CD-ROM, malgré un effort important du ministère sur ce support (3 000 lecteurs distribués dans les établissements, équipement des CDI, etc.).

   Le problème de l'accessibilité aux réseaux est celui du coût. De plus en plus la distribution des données et leur mise à jour régulière sur CD-ROM apparaît comme une des solutions possibles, le prix de revient du support étant faible, on n'est même pas obligé de le remplir à tout prix.

   Un des problèmes soulevés est celui du passage des banques de données en tant que produits professionnels ou de recherche à leur usage pédagogique : d'une part il y a souvent des adaptations ou transpositions nécessaires, surtout pour les instruments d'exploitation, d'autre part l'exhaustivité des données existantes n'est pas toujours requise. Cependant les éditeurs ne semblent pas prêts à se lancer dans ce genre de diffusion, faute d'un marché suffisant (pas d'amorce ou domaine trop restreint). Quand ils le font, ils restent trop souvent attachés à des pratiques traditionnelles, par exemple diffusent des banques de textes sous forme de morceaux choisis, comme dans les manuels (les mêmes !), alors que les traitements applicables sur machines se justifient sur des textes complets.

   À cela viennent s'ajouter des problèmes de droit d'auteur et de diffusion, même sur des textes très classiques depuis longtemps dans le domaine public : sur ce point, la différence entre les « lettres » et les « sciences » est très nettement marquée.

LES INSTRUMENTS

   Leur évolution est constante et la plupart des problèmes techniques semblent en voie de règlement. En ce qui concerne les données « images », le passage de l'analogique au numérique est généralisé et des cartes spécialisées permettent de numériser directement les images vidéo.

   Par contre, on a noté l'absence de standardisation sur les codages des données, leur organisation et leur traitement, ce qui se traduit par des impossibilités de communication et des incompatibilités entre les différents instruments logiciels. Sans compter les restrictions ou verrouillages introduits volontairement par certains diffuseurs qui rendent impossibles certains modes d'accès, types de traitement ou transfert de données.

   Il serait intéressant, dans le cas de bases constituées à des fins d'enseignement, d'associer des enseignants du domaine à la définition des caractéristiques, des besoins, des instruments et procédures nécessaires à l'exploitation, etc. On a également relevé l'absence actuelle d'un standard de traitement de texte scientifique.

   Enfin, on n'a pas manqué de déplorer l'insuffisance des équipements scolaires en matériel informatique, les problèmes de disponibilité et d'accessibilité selon les secteurs, etc. Le travail sur données nécessite des machines rapides, possédant des capacités en mémoire conséquentes et pouvant communiquer entre elles ou avec des périphériques spécialisés. L'utilisation obligatoire d'une salle spécialisée (et protégée) entraînant des déplacements, bloque certains usages (appui à un cours, avec projection par exemple).

L'UTILISATION PÉDAGOGIQUE

   L'introduction de l'utilisation de banques et bases de données entraîne une transformation des méthodes, mais également des connaissances et contenus : celle-ci est variable selon les disciplines, très importante dans certaines (voir les contributions de l'atelier).

   Certains insistent sur le changement de position de l'enseignant : il n'est plus présentateur des connaissances (factuelles), mais se retrouve dans le rôle, plus intéressant selon eux, de formateur à l'acquisition, la manipulation, l'exploitation de ces données, à la maîtrise de la logique de constitution et du fonctionnement des instruments.

   Partant de là, une des questions soulevées est la suivante : faut-il ou non « enseigner » ou f   aire « prendre conscience » de certains concepts propres à la manipulation de données (logique, modes de représentation, de classement et d'organisation, opérateurs de consultation, etc.) ? Dans le même ordre d'idées, y a-t-il des connaissances spécifiques nécessaires à transmettre sur la façon dont la base étudiée est structurée (certains le soutiennent : économie), ou plus généralement sur les traitements de l'information ? Il est vraisemblable que la réponse à ces questions ne peut être univoque selon les domaines, les types de données et de traitement.

   De là dépend également la conception que l'on se fait de la « transparence » des interfaces d'exploitation. Si tout le monde est d'accord pour demander des outils soigneusement étudiés pour faciliter le travail, certains redoutent que trop de « transparence » en vienne précisément à masquer la structure et l'organisation des données étudiées et empêche de prendre conscience des problèmes de représentation proprement dits. Ces questions rejoignent celles qui font l'objet de l'atelier sur les « compétences transversales ».

   En fait, il existe peu d'exemples de collaboration entre disciplines sur ta base des méthodes, concepts et instruments. Cela s'est fait sur des banques de textes en histoire et lettres ; dans d'autres cas, l'utilisation des statistiques par exemple, on a abouti à des échecs assez décevants... Avant tout, il paraît nécessaire que chaque discipline mette au point ses propres instruments de traitement.

   Les exposés ont fait ressortir essentiellement trois types d'utilisation :

  • en démonstration collective à l'appui d'une séquence de cours, le professeur utilise l'outil pour présenter les connaissances qui font l'objet de l'étude, ce qui nécessite généralement un équipement supplémentaire de visionnement collectif ;

  • en séance de travaux pratiques ou dirigés par petits groupes sur machines ;

  • en libre accès, dans un CDI par exemple (le problème du rôle des CDI dans un tel environnement suscite les interrogations habituelles...).

   Toute manipulation des élèves implique donc une formation minimale de leur part. Tout le monde s'accorde sur la nécessité de préparer, de définir et d'encadrer le travail des élèves avant de les lâcher en utilisation autonome, le point délicat étant de trouver l'équilibre nécessaire entre un laisser-faire générateur de mésusages et de navigations aléatoires et un dirigisme trop restrictif qui bride les initiatives et l'esprit de recherche. L'objectif final devrait être l'acquisition parallèle des connaissances du domaine et des méthodes permettant d'y accéder et donc, pour partie au moins, de les structurer.

   Le dernier point abordé concernait naturellement la formation des enseignants. Celle-ci doit-elle être spécifique ou incluse dans une formation plus générale aux usages de l'informatique ? Le danger d'une formation purement informatique dans ce domaine est de masquer les enjeux spécifiquement disciplinaires liés aux évolutions et transformations des connaissances et des méthodes induites par l'introduction de ces techniques de stockage, de représentation et de traitement de données. Cette formation ne saurait donc être entièrement déconnectée de la formation disciplinaire, mais au contraire être incluse dans celle dispensée par l'enseignement supérieur aux futurs enseignants.

   Enfin, on a insisté pour l'organisation d'une information large et permanente en direction des enseignants sur l'existence et l'évolution de ces instruments.

Paru dans L'intégration de l'informatique dans l'enseignement et la formation des enseignants ; actes du colloque des 28-29-30 janvier 1992 au CREPS de Châtenay-Malabry, édités par Georges-Louis Baron et Jacques Baudé ; coédition INRP-EPI, 1992, p. 176-179.

___________________
Association EPI

Accueil Retour aux actes

Banques de données

Articles