Parlez moi de... synthèse vocale
compte rendu d'expériences

Daniel Feneuille
 

Introduction

     L'outil « SYNTHESE VOCALE » commence à se généraliser sur la plupart des ordinateurs récents.

     Cet « auxiliaire » est-il superficiel, intéressant, important ? La réponse apportée dans cet article demande à être relativisée au moins à deux égards :

     D'une part, l'objectif (aide dans des logiciels d'apprentissage de la lecture des enfants de 6 à 8 ans) se démarque des « EAO » tutoriels et traditionnels et, d'autre part, nous avons utilisé un modèle de synthèse puissant (nécessitant un compatible PC de 512 Koctets). Une souris complétant cet environnement.

     Ce préalable posé, il n'en demeure pas moins que cet outil multimédia doit être considéré, dès aujourd'hui, à notre sens, comme bien autre chose qu'un banal complément.

     Cet article nous permettra également d'expliquer le cadre dans lequel s'est concrétisé ce travail.

     En effet, les logiciels conçus ont été écrits par des étudiants du département informatique (IUT d'AIX en PROVENCE). Le programme officiel de ces départements prévoit en deuxième année un projet pluridisciplinaire et ce travail entrait parfaitement dans la définition d'un tel projet.

LA LECTURE AUJOURD'HUI

     Il n'est pas de notre propos de faire, ici, en si peu de place, la description de ce qu'est « l'acte de lire ».

     C'est une activité complexe, individuelle et variable suivant les objectifs du lecteur.

     Depuis de nombreuses années des pédagogues, des associations tentent de faire sortir l'enseignement de la lecture du schéma trop traditionnel : (correspondance graphème <-> phonème ).

     L'EPI, d'ailleurs, a largement sa part dans cette bataille... notamment par la diffusion du logiciel LIRA.

     Aussi pourrait-on être choqué, en première approximation, de voir utiliser la synthèse vocale dans l'apprentissage de la lecture alors que justement lire n'est pas produire du son mais est, avant tout, produire du sens.

     Comme on le verra dans le descriptif d'un des cinq logiciels, plus loin, la synthèse vocale viendra, dans les processus d'apprentissage, apporter des aides, verbales certes, mais pas en contradiction avec les principes de la lecture fonctionnelle à laquelle nous souscrivons entièrement.

Rôle de l'ordinateur (avec ou sans synthèse vocale)

     Nous nous contenterons de dégager rapidement quelques fonctions de l'ordinateur dans l'apprentissage de la lecture. Les logiciels existants permettent des entraînements fréquents, individuels, sur des textes divers (fichiers), avec des bilans très fins.

     Leurs apports sont importants, voire irremplaçables mais bien sûr non suffisants.

     À côté de LIRA on peut citer ELMO et ELMO ZERO diffusés par l'A.F.L.(Association Française pour la Lecture) ainsi que LIS, LISONS, LISEZ et LUCIL la plupart disponibles, à notre connaissance, sur nanoréseau.

     Les exercices les plus fréquents peuvent se regrouper autour des thèmes suivants :

  1. L'ordinateur instrument de systématisation de l'image visuelle des mots.

  2. L'ordinateur outil de discrimination visuelle fine.

  3. L'ordinateur outil de développement de l'aptitude à : l'exploration d'un texte.

  4. L'ordinateur instrument d'aide à l'élargissement du champ visuel.

  5. L'ordinateur outil de développement de la mémoire immédiate.

  6. L'ordinateur instrument de renforcement des comportements d'anticipation.

  7. L'ordinateur aide à l'élaboration du sens de l'écrit.

  8. L'ordinateur comme test d'efficacité de lecture.

     L'introduction de l'ordinateur dans l'apprentissage de la lecture fonctionnelle soulève à notre sens une espérance, ce n'est bien sûr pas la panacée. Elle constitue cependant une double source d'innovation : si elle renforce les méthodes traditionnelles, elle leur apporte des moyens nouveaux et (c'est notre espoir) elle offre l'occasion de changer de méthode en utilisant à plein la puissance de machines « sérieuses ».

     Enfin cet Enseignement Assisté par Ordinateur se démarque assez nettement de ceux plus tutoriels et traditionnels. Il oblige véritablement le concepteur du logiciel à s'intéresser, avant tout, aux dimensions cognitives et relationnelles des processus d'appropriation du contenu par l'apprenant. Ce qui, hélas, n'était pas toujours « l'obligation » dans certains schémas d'E.A.O.

Le système utilisé

     La restitution du son stocké sous forme numérique (et non analogique comme dans un 45 tours) nécessitait il n'y a pas si longtemps une compression préalable (par exemple L.P.C. Codage par Prédiction Linéaire ).

     La création de ces bibliothèques relève du spécialiste et cette technique manque de souplesse (une phrase enregistrée ne pouvant être modifiée en temps réel).

     Des progrès récents en phonétique et en linguistique ont permis de réaliser dés logiciels de transcription orthographique / phonétique créant l'enchaînement en temps réel des diphones à partir d'un texte écrit sous forme de caractères alphanumériques (avec rythme, intonation...). Ces diphones sont ensuite interprétés sous forme de trames par un processeur spécialisé (circuit synthétiseur) les amplifiant en sons.

     C'est sur ce principe que fonctionne le système utilisé conçu à partir d'études effectuées au C.N.E.T. (système TELEVOX distribution ELAN INFORMATIQUE :)

     Le système comprend :

  • une carte (ADD-ON) au format PC (à base de microprocesseur 68705) ; elle s'implante dans un connecteur cartes longues.

  • un ensemble de logiciels (DRIVER). La plupart sont lancés à l'initialisation du système, ce qui rend ensuite la fonction de SYNTHESE de la PAROLE totalement transparente à l'utilisateur.

     Programmation : (extrêmement simple)

     La phrase à annoncer est écrite dans un fichier (moins de 256 caractères ASCII) ; le premier caractère a une fonction de commande. Certains caractères améliorent la prosodie . Exemple : write (SYNTHESE,PHRASE) c'est tout!

     Le système travaille en simultanéité (au moins apparente) et de façon presque instantanée.

     Les logiciels sont assez gourmands en place mémoire (270 Ko) c'est le seul reproche ; il est recommandé de muscler, le micro-ordinateur à 500 Ko, ce qui tend à devenir aujourd'hui la « norme » raisonnable !

Un exemple

     on trouvera décrit succinctement l'une des 5 activités que nous avons réalisées, ceci pour mieux fixer les idées.

Écran 1

     Un dessin stylisé (page graphique) montre un enfant qui rêve, une bulle vide est au-dessus de lui.

Écran 2

     Consigne orale : « Choisis, parmi ces trois histoires celle que tu voudrais que le dessin raconte ». À l'écran s'affichent trois hypothèses :

  1. Ce soir c'est la Noël, Fabrice rêve des jouets qu'il va recevoir.

  2. Demain, c'est le premier jour des vacances, Fabrice rêve des jeux sur la plage.

  3. Fabrice fait un cauchemar.

     Le texte des trois hypothèses peut être prononcé par la machine L'enfant fait son choix.

Écran 3

     Consigne orale : « lis les mots suivants ; quand tu as fini, appuie sur la souris ».

     Apparaissent, dispersés sur l'écran, dix mots de l'histoire. L'enfant ayant appuyé, nouvelle consigne orale : « Je dis un mot, pointe le avec la souris ». Les erreurs sont validées avec assistance orale et visuelle. On recommence jusqu'à épuisement des mots.

Écran 4

     Les mots apparaissent successivement au centre de l'écran un court instant. Ils sont prononcés par la machine. L'enfant peut recommencer cet Écran 4 (systématisation)

Écran 5

     Systématisation silencieuse. Les mots sont affichés très brièvement, un à un, en silence. On peut recommencer.

Écran 6

     Consigne orale : « Lis maintenant le texte que tu as choisi ». Affichage du texte par empan. Les empans restent affichés une demi-seconde à la place qu'ils auront réellement dans le texte. On peut recommencer cet Écran

Écran 7

     Consigne orale : « Lis rapidement ce texte ». Le texte entier apparaît. Le temps d'affichage est égal au temps cumulé d'affichage des empans.

     On peut recommencer cet Écran 7.

Écran 8

     Apparaissent successivement des questions de contrôle, les questions sont prononcées en même temps. Les réponses sont validées oralement et sur l'écran.

Apport de la synthèse vocale

     Notre travail nous permet de dégager 3 classes d'apport assez remarquables de la synthèse vocale dans les exercices d'entraînement à la lecture pilotés par ordinateur.

1) les commandes opératoires parlées permettent l'utilisation très tôt de ces logiciels évitant les blocages des premières utilisations.

2) les aides apportées à l'enfant par l'ordinateur peuvent être verbales. L'enfant ignorant un mot peut en le pointant faire une hypothèse de sens (ou découvrir le mot) en demandant la prononciation ; ceci lui évitant une tentative de déchiffrement.

3) enfin les questions de contrôle parlées permettent d'utiliser des textes qui sortent de l'indigence classique de ceux des premiers pas de la lecture.

     Revenons sur ces trois propositions :

1) Ce qui caractérise une activité technique de lecture c'est tout d'abord qu'elle doit forcer le jeune apprenant à une dynamique et à une concentration que l'on ne trouve pas toujours face à l'écrit.

     L'exercice technique de lecture est une situation contraignante pour l'enfant puisqu'elle l'oblige à obéir à une série très stricte de consignes.

     Pour les élèves du cours préparatoire, la consigne est en général donnée par l'enseignant en début de séance, mais cela n'est pas suffisant.

     Notre expérience nous a montré que pour un travail rentable, l'enseignant doit pratiquer avec ses élèves de nombreux exercices ..... d'entraînement !

     Il est fréquent que, lors de séances de travail, le maître soit sollicité pour dénouer une situation bloquée.

     On pourrait croire que le blocage vient de ce que l'enfant emploie une stratégie inadaptée à la situation. Il n'en est rien ! Dans la majorité des cas, c'est l'oubli de consignes simples qui ne permet plus de continuer, par exemple « appuie sur ENTRÉE » ou « sélectionne le mot avec la souris » ou « nom du fichier ? ». Or ceci est une rupture dans le déroulement de l'exercice qui nuit à la fois à la dynamique de celui-ci et à la concentration de l'apprenant.

     La synthèse de la parole va permettre d'éviter cette rupture, Les consignes opérationnelles sont données à l'enfant quelques secondes avant qu'il n'ait à les mettre en application. Il y a peu de chance qu'il les oublie. De plus il peut demander à tout moment à ce qu'elles lui soient rappelées. Enfin le logiciel peut les énoncer à nouveau dans certains cas d'erreur.

2) Quand un enfant se trouve devant un écrit, et qu'il est au début de son apprentissage, donc avec un corpus faible, il lui est très difficile de faire une hypothèse sur la situation évoquée par l'écrit.

     Il faut donc, avant de lui proposer un texte à lire, donner des informations sur la situation. C'est en général le domaine des illustrations.

     La synthèse de la parole apporte une aide précieuse. Elle va dire a l'enfant un choix d'hypothèses. Nous travaillons au niveau de l'imaginaire de l'enfant.

     À la difficulté d'élaborer des hypothèses s'ajoute pour l'enfant la maîtrise du vocabulaire ; un certain nombre de mots d'un texte peuvent être « devinés » sans que l'enfant sache les reconnaître graphiquement, il en est d'autres pour lesquels il faudra l'assister.

     La systématisation par la synthèse vocale sera une aide, là encore, pour sa lecture. Le fait de forcer son attention sur ces mots lui permettra d'être plus à l'aise avec les formes graphiques et donc moins tenté d'utiliser une technique de déchiffrement.

3) Enfin, le contrôle de la compréhension se fera plus sûrement car les questions seront prononcées.

     Combien de fois en lecture (et ailleurs aussi !) n'avons nous pas constaté que les enfants ne savaient pas répondre à une question car ils ne savaient pas la lire!

     L'ensemble des aides apportées par la synthèse vocale devrait permettre de présenter aux enfants en début d'apprentissage des écrits d'une plus grande richesse quant à la situation et au vocabulaire. Il faudrait faire un jour l'effort de ''sortir'' des textes du type :

     « maman lave la salade ; papa coupe le lapin » qui ne peuvent qu'émouvoir des adultes en mal... de passé.

Réalisation et cadre de ce travail

     Ont participé activement :

  • 3 classes de C.P. et de C.E.1 de la ville d'AIX en PROVENCE et leurs enseignants.

  • 10 étudiants et étudiantes de deuxième année du département informatique de l'IUT d'AIX

     Nous avons utilisé un ordinateur LOGABAX P1600 du plan IPT équipé de la carte et des logiciels SYNTHESE VOCALE de la société ELAN INFORMATIQUE ainsi pue la souris pour éviter les blocages clavier des débutants.

     Les logiciels ont été écrits en PASCAL (6 à 7 000 lignes).

     Quatre des cinq logiciels ont été conçus par notre collègue J.-C. Fontaine, instituteur et formateur en informatique.

     Un cahier des charges établi au cours de nombreux entretiens a concrétisé la phase de conception. D'autres contacts, validation des prototypes, premiers tests avec les enfants des classes indiquées ont été nécessaires. Cette collaboration constante est une des conditions essentielles à la bonne réalisation d'un projet de cette envergure.

     L'ampleur des programmes produits s'explique (outre la grande sophistication des logiciels), d'une part par la création d'un éditeur dédié, pour chaque activité, à la fabrication des fichiers de données et, d'autre part par la confection en temps réel d'un fichier ''VECU'' accessible par l'enseignant après la séance (trace et diagnostic des activités pour chaque élève).

     Comme nous l'avons signalé en introduction, l'état d'esprit de cette démarche : conception, analyse, programmation, prototype, tests, s'inscrit parfaitement dans le cadre des projets pluridisciplinaires que doivent réaliser les étudiants des départements informatique des IUT (ne pas confondre avec leur stage industriel de 10 semaines de fin de deuxième année).

     Leurs compétences sont loin d'être négligeables :

  • 800 heures au moins de formation à l'informatique (sur les deux années de la scolarité).

  • L'écriture de milliers de lignes de PASCAL, de C, d'assembleur, de COBOL (ou de PL/1), éventuellement de FORTRAN ou de... BASIC !

  • La connaissance et la pratique d'un système de gestion de base de données.

  • Enfin la pratique plus ou moins autodidacte de progiciels, de traitement de textes et de DBASE par exemple.

     Cette information est peut-être de nature à intéresser des collègues du primaire ou du secondaire qui pourraient trouver là des réalisateurs et des concepteurs de tâches informatiques dont l'ampleur les effraie quelque peu.

     Plusieurs conditions nous semblent nécessaires :`

  • Être proche d'un département informatique (à cause des contacts fréquents).

  • Être disponible (sans être, a priori, compétent en informatique). Le projet étant placé sous la responsabilité d'un enseignant de l'IUT.

  • Que le projet s'inscrive dans la démarche informatique rappelée plus haut.

  • Entrer en contact avant la fin de l'année scolaire, car ces projets débutent dès la rentrée de Septembre.

     Les thèmes peuvent porter sur des champs divers par exemple :. gestion, EAO, télématique, intelligence artificielle, applications industrielles...

Daniel Feneuille
AIX le 30 Avril 1987

Bibliographie succincte

Articles et revue

Les articles de B. Ott dans les numéros EPI 22, 23, 24 et le numéro spécial 1986 avec le groupe lecture du collège A. FRANK page 157.

D'autres articles divers dans le dossier Informatique à l'école, EPI, pages 150 et -174.

Les actes de lecture, revue trimestrielle de l'A.F.L.

Quelques livres importants

Ceux des maîtres es-lecture. F. Richaudeau et J. Foucambert La lisibilité et La manière d'être lecteur.
Ainsi que Comment les enfants apprennent à lire de F. Smith 1980 chez RETZ.

Et sur le sujet propre à cet article

« Synthèse vocale et Lecture », D. Feneuille et J.-C. Fontaine Colloque ADI EAO 87 Cap d'Agde, mars 1987.

Sur le système utilisé

Carte TELEVOX . Société ELAN INFORMATIQUE 20 rue des Frères LUMIERE ZA NORD 31520 RAMONVILLE ST AGNE.

Sur les logiciels français

Étude de 30 logiciels (une page minitel chaque) Département éducation du CESTA accès minitel CESTEL code LECTURE.

Paru dans la  Revue de l'EPI  n° 46 de juin 1987.
Vous pouvez télécharger cet article au format .pdf (114 Ko).

___________________
Association EPI

Accueil

Sommaires des Revues