Architecture distribuée d'un entrepôt pédagogique Nawel Iles, Azeddine Chikh, Josiane Mothe Résumé : Face à l'évolution rapide des moyens d'information et de communication dans le domaine de l'apprentissage automatique, une masse importante de ressources pédagogiques est produite à travers de nombreuses universités. La réutilisation des objets pédagogiques ainsi produits en local est faible et même inexistante entre les universités. Ceci peut s'expliquer en particulier par le manque de connaissance de la part des enseignants sur les ressources existantes. Nous proposons dans cet article un modèle d'entrepôt qui vise à palier ce déficit. Il s'agit d'un modèle d'entrepôt distribué qui repose sur la description par les métadonnées de LOM et l'indexation sémantique des objets pédagogiques. Nous supposons dans notre approche que chaque université dispose de son propre entrepôt, contenant des objets pédagogiques, leur description en métadonnées et leur description sémantique. Les métadonnées et les descripteurs de chaque entrepôt sont alors utilisés pour capitaliser les connaissances sur les objets distribuées et alimenter un méta entrepôt, comparable à un catalogue accessible par tous. Mots-clés : apprentissage automatique, objet pédagogique, entrepôt, métadonnée LOM, indexation sémantique, partage, réutilisation. 1. Introduction et problématique Les Technologies de l'Information et de la Communication (TIC) améliorent profondément nos façons de nous informer, de communiquer et de nous former. Cette émergence technologique a fait apparaître un nouveau mode d'apprentissage connu sous le nom d'apprentissage automatique ou e-learning. L'apprentissage automatique est défini comme l'utilisation des nouvelles technologies multimédias et de l'internet, pour améliorer la qualité de l'apprentissage en facilitant l'accès à des ressources et des services, ainsi que des échanges et la collaboration à distance. Dans le domaine universitaire, les objets pédagogiques « OP » constituent l'ensemble des informations, parties de cours, de programmes, de thèses, etc. qui permettent de véhiculer et de transmettre des concepts et contenus d'enseignements. Un OP numérique peut être de différents formats : .pdf, .doc, .jpg, etc. Compte tenu du coût de production de telle ressource et de l'expertise nécessaire pour les produire, il est primordial de les rendre facilement accessibles, exploitables et réutilisables. Les travaux présentés dans cet article visent à proposer un modèle d'entrepôt qui permet de mémoriser de manière pérenne les ressources pédagogiques et de les indexer afin de faciliter leur accès et leur réutilisation. Les OP sont créés par différentes universités et sont essentiellement utilisées au sein de l'établissement qui les a créés. Ainsi, une université n'a pas accès aux OP des autres universités (sauf relations informelles entre enseignants). Il en résulte un manque de capitalisation des savoir-faire et des objets ; chaque université devant alors créer des objets qui ont les mêmes objectifs pédagogiques, sans prise en compte de l'existant. Compte tenu du coût de production de tels OP et de l'expertise nécessaire pour les produire, il est primordial de les rendre facilement accessibles, exploitables et réutilisables. La faible réutilisation des OP produits peut s'expliquer en particulier par le manque de connaissance chez les enseignants concepteurs de cours et des étudiants sur les objets déjà existants. Notre proposition vise à mettre à disposition les OP existants à un ensemble d'universités organisées en réseau. La mise à disposition des OP n'est pas suffisante pour garantir leur réutilisation. Elle doit s'accompagner de moyens de recherche et d'accès à l'information utile. La description LOM qui peut être associée à chaque OP constitue une première description indispensable à cet accès. Cependant elle n'encadre pas suffisamment les choix faits lors de la description des contenus des OP. À l'heure du Web sémantique, il est alors nécessaire d'associer des annotations sémantiques au contenu des OP pour permettre de les retrouver. Nous proposons dans ce travail de recherche un modèle d'entrepôt distribué qui repose sur la description des OP par les métadonnées de LOM et les concepts des ontologies de domaine. Ces deux descriptions complémentaires permettent l'interrogation sémantique des OP. Ainsi chaque université dispose de son propre entrepôt, contenant les OP, leurs métadonnées LOM et leurs annotations sémantiques. Les métadonnées et les annotations de chaque entrepôt local sont dupliquées dans un méta entrepôt central et partagé, accessible à partir d'un serveur commun. L'accès aux OP disponibles dans les autres entrepôts locaux est réalisé via le méta-entrepôt. Ce dernier est interrogé essentiellement par les étudiants dans le cadre de leur recherche bibliographique ou par les enseignants concepteurs de cours lors de l'élaboration d'un nouveau cours ou de l'enrichissement d'un cours existant. La suite de l'article est organisée comme suit. Dans la section 2, nous présentons l'état de l'art ; nous y abordons en particulier l'utilisation des entrepôts et celle des ontologies dans le domaine de l'apprentissage automatique. Dans la section 3, nous proposons l'architecture de l'entrepôt distribué des ressources pédagogiques universitaires et le modèle sous-jacent. La modélisation de l'entrepôt se base sur les normes de l'apprentissage automatique ainsi que leur représentation sémantique grâce aux ontologies. Nous terminons l'article par une conclusion et les perspectives aux travaux présentés. 2. État de l'art 2.2. Les entrepôts pédagogiques en apprentissage automatique Objet pédagogique En apprentissage automatique, la forme fondamentale d'une ressource pédagogique est l'« objet pédagogique » (OP) ; Le groupe de travail des IEEE-LTSC (Learning Technology Standards Committee) a proposé une définition d'un OP qui est la suivante : « Un objet pédagogique est défini comme toute entité numérique ou non qui peut être utilisée, réutilisée ou référencée pendant des activités d'apprentissage assistées par ordinateur (enseignement intelligent assisté par ordinateur, environnements d'enseignement interactifs, systèmes d'enseignement à distance, environnements d'apprentissage collaboratif). » Entrepôt de données De nombreuses définitions d'un entrepôt ont été proposées, nous retenons celle de William H. Inmon (2002) « un entrepôt de données est une collection de données orientées sujet, intégrées, filtrées, non volatiles et historisées, organisées pour le support d'un processus d'aide à la décision ». Les données de l'entrepôt doivent avoir les caractéristiques suivantes :
Les collections des OP sont régies par les mêmes caractéristiques. Chaque OP doit être sauvegardé de manière permanente, présenté sous différentes versions et peut être issu de différentes sources. Ainsi, nous proposons un entrepôt pédagogique qui permet de capitaliser non seulement les OP, mais aussi, toute sorte d'information liée à l'OP et qui peut être utile à l'utilisateur. 2.2. Modèle de description des Objets pédagogiques Afin de faciliter l'accessibilité, la recherche, le partage et la réutilisation, chaque OP doit être décrit à l'aide de métadonnées et d'annotations sémantiques. En effet, un OP non indexé ou annoté ne pourra pas être retrouvé et à fortiori réutilisé. Cette étape d'indexation est donc indispensable, elle a été abordée dans différents travaux présentés dans les paragraphes qui suivent. Métadonnées Les métadonnées peuvent être définies comme étant des données relatives à d'autres données. Dans le domaine de l'apprentissage automatique, les métadonnées servent à décrire les documents pédagogiques afin de les rendre plus facilement identifiables (accessibles) et plus manipulables (interopérables, réutilisables, durables, adaptables). Ces métadonnées sont structurées suivant des catégories ou champs sémantiques « descripteurs ». Chaque champ représente une caractéristique particulière sur la ressource comme par exemple son titre (Bourda, 2001). Dans notre travail, nous nous appuyons sur LOM qui permet une description à la fois fine et précise. Learning Object Metadata « LOM » Le standard LOM spécifie la syntaxe et la sémantique des métadonnées pédagogiques et définit les attributs nécessaires pour une description adéquate et complète des ressources pédagogiques. Il existe 78 attributs regroupés en neuf catégories :
Les caractéristiques de LOM ne sont pas toutes nécessaires pour une application donnée. Un profil d'application permet d'en limiter le nombre. Un profil d'application est un assemblage de métadonnées adaptées au contexte d'utilisation spécifique. Ce profil peut soit restreindre les descripteurs de LOM, soit les enrichir. Il existe de nombreux profils d'application : CanCore, Celebrate, Normetic, ManUel, etc. Représentation sémantique des ressources pédagogiques LOM n'est pas assez puissant pour assurer le partage des OP et leur réutilisation entre les acteurs des différentes universités. En effet, la sémantique des contenus est mal représentée puisqu'elle se limite souvent à des mots clés. Afin de compléter la sémantique de l'indexation des OP, nous suggèrerons l'utilisation d'ontologies de domaine. En effet, une ontologie regroupe les concepts qui représentent l'ensemble des connaissances d'un domaine en une spécification explicite et formelle. Elle montre les relations ainsi que les règles d'associations qui existent entre ces concepts. Ainsi, une ontologie peut fournir le vocabulaire et sa sémantique, pour exploiter le contenu des métadonnées associées aux objets pédagogiques annotés (Hernandez et al., 2008). La description d'une ontologie repose sur différentes normes : RDF (Resource Description Framework), OWL (Web Ontology Language), etc. Différents travaux de la littérature s'intéressent à l'indexation ou l'annotation sémantique, citons les projets suivants :
Les différents travaux cités se sont intéressés à la construction des entrepôts pédagogiques en se basant sur différentes façons d'annoter les OP et sur différentes approches : les projets Ariadne, Arpem sur les métadonnées, Memorae, Trial Solution et Karina sur les ontologies. Ce type de modèle permet à chaque université de construire son propre entrepôt pédagogique mais leurs contenus restent réservés toujours qu'à un public très limité. Pour faire face à cette contrainte et élargir la diffusion des OP, notre approche consiste à envisager un système qui permette, d'un coté de capitaliser les OP, les indexer afin de les rendre réutilisables et d'un autre côté qui permette à chaque OP annoté d'être accessible et exploité par les acteurs de différentes universités. Ainsi, nous proposons de construire un entrepôt pédagogique dit « serveur », qui il capitalise l'ensemble des OP annotés en un seul endroit. 3. Représentation et modélisation de l'entrepôt pédagogique distribué 3.1. Architecture d'un entrepôt local Le contenu de l'entrepôt pédagogique associé à une université, doit être constitué d'un ensemble de ressources pédagogiques de différents formats (pdf, doc, jpg, etc.) et sur différents supports (papier, électronique, multimédia, etc.). Une ressource pédagogique doit être sélectionnée et filtrée avant d'être stockée dans l'entrepôt. Une ressource pédagogique est composée d'un ensemble d'objets pédagogiques reliés entre eux. Chaque objet pédagogique est décrit par les métadonnées LOM afin de le retrouver et de le réutiliser. L'entrepôt pédagogique associé à une université sera composé de deux parties :
De cette façon, on sépare le stockage des OP de ses descripteurs tout en gardant un lien entre eux, et on facilite la recherche des OP en se basant sur les métadonnées LOM, et les annotations sémantiques. Notre entrepôt local est représenté par l'architecture suivante :
L'intégration d'un OP dans l'entrepôt distribué se fait en deux phases : 1- Phase de filtrage : il s'agit de sélectionner les OP pertinents pour les capitaliser, tout en gardant les relations entre les objets appartenant à la même ressource. 2- Phase de qualification : à chaque OP sont associés un ou des descripteurs LOM et une ou des annotations sémantiques par rapport aux ontologies de domaine (Snae, 2007). La mise en relation entre les ontologies et les contenus des OP s'appuie sur les techniques d'indexation automatique telles qu'abordées par Hernandez (2005).
3.2. Architecture générale du méta entrepôt pédagogique Dans le cadre universitaire, il existe différentes sources des OP : supports de cours, exercices, thèses, rapports, etc., disponibles par les utilisateurs au niveau de chaque université. Cependant, il leur est impossible d'accéder de façon efficace, et de trouver les OP pertinentes adaptés à leurs besoins. D'un autre coté, ces OP restent localement réservés, et non accessibles par les utilisateurs d'autres d'universités. Dans notre approche, nous proposons une architecture distribuée qui consiste à mettre en place un système qui va permettre de :
L'architecture générale du modèle est la suivante :
Les entrepôts pédagogiques se basent sur deux types de structures, des structures spécifiques et une structure générique :
3.3. Accès à la ressource pédagogique par l'apprenant Un apprenant d'une université peut rechercher des documents, soit dans son université ou dans les autres universités associées en prenant en compte les droits d'accès. L'interface pédagogique de notre système sera située alors au niveau du méta entrepôt.
Cette architecture requiert trois catégories d'acteurs, apprenant, auteur et l'expert :
L'apprenant doit effectuer les étapes suivantes afin de satisfaire sa recherche :
4. Conclusion Pour conclure, nous avons proposé un modèle d'entrepôt distribué qui permet l'indexation des objets pédagogiques, leur recherche et leur réutilisation de façon à répondre aux besoins des apprenants ou des enseignants. L'originalité de notre approche peut être résumée par le fait qu'elle :
En vue de pouvoir retrouver les objets pédagogiques directement lors de l'implémentation d'un nouveau cours en ligne sur un LMS, nous comptons l'interfacer avec l'entrepôt distribué. Nawel Iles*, * Faculté des sciences de l'ingénieur.
Université de Tlemcen. ** Institut de Recherche en Informatique de Toulouse.
IRIT / équipe SIG. Le présent texte correspond à l'intervention de Mme Iles à la session 3 « Fédération des contenus, constitution des bases de données personnelles » du colloque international ePrep 2008. Bibliographie Abel, M.-H., Lenne, D., Moulin, C., Benayache, A. (2003). Gestion des ressources pédagogiques d'une e-formation [Pedagogical resources for e-learning]. Document Numérique, 7 (1-2), Bourda, Y. (2001). Objets pédagogiques, vous ave dit objets pédagogiques ?, Supélec, Plateau de Moulon, F91192, GifsurYvette, CEDEX. Bouzeghoub, A., Defude, B., Duitama, J.-F., Lecocq, C. (2005). Un modèle de description sémantique de ressources pédagogiques, basé sur une ontologie de domaine. Sticef, Volume 12. Buffa, M., Dehors, S., Faron-Zucker, C., Sander, P. (2005), Vers une approche sémantique dans la conception d'un système d'apprentissage. Revue du projet TRIAL-SOLUTION, Plate forme AFIA nice. Chikh, A. (2003). Une approche méthodologique de réutilisation en ingénierie de document. Thèse de Doctorat, Alger : INI. Hernandez, N. (2005). Ontologies de domaine pour la modélisation du contexte en Recherche d'Information. Thèse de doctorat, Toulouse : Université Paul Sabatier. Hernandez, N., Mothe, J., Ralalason, B., Ramamonjisoa, B., Stolf, P. (2008). A Model to Represent the Facets of Learning Objects. Interdisciplinary Journal of Knowledge and Learning Objects, Informing Science Institute, Volume 4, Santa Rosa-USA. (à paraître) Inmon, W. H. (2002), Building the data warehouse. New-York. Snae, C., Brueckner, M. (2007). Ontology-Driven E-Learning System Based on Roles and Activities for The Learning Environment. Interdisciplinary Journal of Knowledge and Learning Objects, Volume 3, Varlamis, I., Apostolakis, I. (2006). The Present and Future of Standards for E-Learning Technologies. Interdisciplinary Journal of Knowledge and Learning Objects, Volume 2, Références sur le WEB Boutemedjet, S. (2004). Web Sémantique et e-Learning, [Semantic web and e-learning], Cours IFT6261. Gašević, D., Hatala, M. (2005). Searching context relevant learning resource using ontology mappings, International Workshop on Applications of Semantic Web Technologies for E-learning (SW-EL), Winston-Salem State University. Knight, C., Gašević, D., Richards, G. (2005). Ontologies to integrate learning design and learning content. Journal of Interactive Media in Education, (07), ISSN :1365-893X. ___________________ |
Articles |