Éducation à la santé : Dominique Lenne, Jean-François Rodes, Naoum Salamé En quelques décennies, les progrès de la médecine et de la biologie ont permis d'améliorer considérablement le pronostic d'un grand nombre de maladies. Cependant, certaines affections ne demeurent que partiellement guéries, d'autres ne disposent pas à ce jour de traitement efficace. La prévention reste alors un des seuls moyens de lutte contre la maladie et son éventuelle propagation. Comment mettre en oeuvre un programme de prévention ? Quelle en est l'efficacité réelle ? L'épidémie de SIDA rend ces deux questions particulièrement actuelles, aussi nous parait-il essentiel d'aborder ce problème et d'examiner les réponses possibles dans le cadre du cours de biologie ou d'un programme d'éducation à la santé. Une politique de prévention se base sur l'identification de facteurs de risque permettant de déterminer des populations dites « à risque ». Schématiquement, deux types de démarches, éventuellement complémentaires, peuvent être utilisées pour définir et caractériser ces facteurs :
Afin d'illustrer ces notions, nous présentons dans la suite l'enquête « Prématurité » qui nous semble particulièrement intéressante parce qu'elle correspond à la réalisation d'un double objectif :
De par le volume des données disponibles et les traitements statistiques qu'elle nécessite, l'étude de cette enquête s'appuie largement sur l'informatique. Elle peut être envisagée en deux temps dans un cadre pédagogique :
Ce plan d'étude nous paraît suffisamment général pour être la trame de l'exploitation pédagogique d'une banque de données résultant d'une enquête épidémiologique. L'ENQUÊTE « PRÉMATURITÉ » La banque de données « Prématurité » est le résultat d'une vaste enquête épidémiologique, réalisée à la maternité de Haguenau de 1971 à 1985. Cette maternité a été choisie, parmi d'autres, en raison de la bonne représentativité de la population féminine qui la fréquentait. La banque de données comporte plus de 21 000 enregistrements correspondant au nombre de naissances ayant eu lieu dans cette maternité entre 1971 et 1985. Parmi les nombreuses variables que comportait cette banque à l'origine, seules 30 ont été retenues en vue d'une exploitation en classe. En dehors de l'année de l'accouchement on distingue, parmi les différentes variables sélectionnées (tableau 1), celles qui fournissent des renseignements sur :
ÉTUDE DESCRIPTIVE Une réflexion sur les principales variables de la banque et sur les motifs de leur sélection permet de préciser le cadre de l'enquête. Elle doit être complétée par une étude descriptive de ces variables. Pour cela, on peut établir leur distribution, les représenter graphiquement, déterminer des valeurs extrêmes, des valeurs centrales, évaluer la dispersion, etc. Ces résultats peuvent assez facilement être obtenus avec un tableur (EXCEL, QUATTRO PRO, LOTUS 123...) ou un gestionnaire de bases de données (DBASE3, PARADOX...). Il s'agit en effet d'effectuer des comptages, des calculs statistiques simples (moyenne, écart-type, min, max...) ou de réaliser des graphiques [1]. Les nombreuses fonctionnalités, en particulier graphiques, offertes par les versions récentes de ces logiciels plaident largement en faveur de leur utilisation. La réalisation de ces opérations exige toutefois la maîtrise de ces outils ; elle peut aussi être l'occasion d'acquérir un savoir faire nouveau.
Tableau 1 : Les variables sélectionnées dans la banque de donnée « PRÉMATURITÉ » Décrivons, à titre d'exemple, trois variables de la banque « Prématurité » :
Figure 1 : répartition des nouveaux nés suivant le poids. Cette banque de données permet aussi de préciser certaines caractéristiques démographiques ou sociologiques de la population étudiée. Au cours de l'enquête on constate ainsi :
EXPLOITATION Les facteurs de risque Mettre en évidence un facteur de risque dans l'exemple étudié revient à établir une liaison statistique entre une des caractéristiques de la mère et un taux de prématurité élevé. Pour cela, on utilise souvent le test du c2, dont la mise en oeuvre est très simple avec un logiciel de Statistique. Ce type de logiciel permet en outre d'envisager éventuellement des traitements plus élaborés tels que le calcul de corrélations, et même dans certains cas des analyses factorielles ou des classifications hiérarchiques. Malheureusement, fort peu de ces logiciels possèdent l'ensemble des caractéristiques souhaitables pour une utilisation en classe :
Les deux logiciels de Statistique accessibles en licences mixtes, Le Sphinx et Secos2 (essentiellement utilisés en économie), se sont révélés inadaptés, en particulier pour le traitement d'enquêtes de grande taille. Par ailleurs, des logiciels de Statistique puissants et assez simples à mettre en oeuvre sont maintenant disponibles sur PC : Statgraphics, SYSTAT, SPSS, PCSM, CSS STATISTIKA, etc. Ils offrent un éventail de traitements dont la complexité dépasse largement les besoins de l'enseignement général, et leur prix assez élevé (à partir de 5 000 F) les met souvent hors de portée des établissements. Pour le traitement de la banque Prématurité, nous nous sommes appuyés sur le logiciel EPI-Info, conçu pour le traitement de données épidémiologiques et diffusé par l'Organisation Mondiale de la Santé. Il permet la saisie contrôlée, importe des données à divers formats (notamment DBase et Lotus) et exporte des résultats en vue d'une exploitation par un tableur-grapheur. Sa partie graphique n'est pas très développée, mais offre néanmoins les représentations classiques. Il présente également l'avantage de traiter assez rapidement des données nombreuses. Il permet la réalisation des traitements statistiques élémentaires : moyenne, tri à plat, tri croisé, régression... Son interface utilisateur est d'une conception assez ancienne. Elle utilise en effet un langage de commandes. Celles-ci peuvent toutefois être choisies dans une liste, ainsi d'ailleurs que les variables auxquelles elles s'appliquent. Figure 2 : menu principal du logiciel Epi-Info [3], À l'aide de ce logiciel, on peut établir qu'une petite taille est un facteur de risque de prématurité de la façon suivante :
Epi-Info produit le tableau suivant (qui peut être complété par les pourcentages lignes et colonnes et par les pourcentages de l'effectif total) : Tableau 2 : tri croisé taille maternelle-prématurité obtenu avec Epi-Info Il permet de construire le tableau 3, qui est plus lisible. Tableau 3 : taux de prématurité et taille maternelle. (c2 = 34,96 ; P < 0,1%) On constate que le taux de prématurité est significativement plus élevé chez les femmes de petite taille. De la même façon, on peut déterminer différents facteurs de risque liés :
Tableau 4 : taux de prématurité et niveau d'étude maternel. Cette relation a été rapportée à l'existence simultanée de plusieurs facteurs comme le surmenage physique, le manque d'information ou la mauvaise qualité des consultations prénatales des femmes appartenant aux catégories sociales les plus défavorisées. Enfin certains signes cliniques relevés au cours de la grossesse constituent également des facteurs de risque : la fréquence des prématurés est significativement plus importante chez les femmes ayant eu des métrorragies pendant leur grossesse ou souffrant d'hypertension artérielle. Évaluation de l'efficacité de la politique de prévention Ces facteurs de risque ne pouvant être traités eux-mêmes, la politique de prévention a consisté d'une part à inciter les femmes enceintes à consulter afin de mieux cerner leurs risques d'accoucher prématurément et d'autre part à prescrire plus facilement des arrêts de travail aux femmes présentant ces risques. Quels en sont les résultats (tableau 5) ? On constate une diminution (33%) de la fréquence des prématurés entre le début et le milieu de l'enquête (1982) ; leur proportion semble stagner ensuite. L'observation plus détaillée des résultats montre en revanche une baisse très sensible (56%) de la fréquence des prématurés jeunes (< 32 semaines) ; la fréquence des prématurés plus âgés qui posent en général moins de problèmes médicaux, ne décroît que faiblement ou même de façon non significative pendant la durée de l'enquête. Ces résultats permettent de montrer l'utilité d'une politique de prévention : sur le plan national une légère baisse de la fréquence de la prématurité « grave » peut se traduire par des milliers d'accouchements prématurés évités avec les handicaps périnataux qui peuvent en résulter. Tableau 5 : évolution du taux de prématurité au cours de l'enquête. Pour terminer, afin d'illustrer les risques d'une interprétation hâtive de résultats statistiques, signalons un fait qui a étonné dans un premier temps les chercheurs qui ont traité cette enquête : sur la période étudiée, on peut constater une baisse sensible de la proportion des femmes ayant eu des métrorragies lors du premier trimestre de la grossesse. Or, la politique de prévention mise en place ne pouvait en aucun cas influer sur un phénomène biologique. En revanche, elle a eu pour effet d'augmenter le nombre de consultations systématiques. La proportion des femmes consultant sans problème apparent a donc augmenté, réduisant ainsi la proportion de femmes consultant à la suite de métrorragies. CONCLUSION Si les résultats obtenus présentent un intérêt biologique certain, l'étude de cette banque de données ne peut être dissociée du contexte social dans lequel l'enquête à été réalisée. Il semble donc intéressant d'associer à ce travail des enseignants appartenant à d'autres disciplines, d'autant plus que l'interprétation de ces résultats permet l'acquisition d'un savoir méthodologique largement réutilisable (en biologie mais aussi dans ces disciplines). Le temps nécessaire à l'apprentissage des différents outils informatiques et à la réalisation des traitements que permet cette banque nous semble destiner ce type de travail à des classes à vocation littéraire ou économique pour lesquelles la gestion du programme de biologie apparaît relativement souple. Les traitements statistiques requis sont assez simples à mettre en oeuvre et ne présentent pas de difficultés mathématiques insurmontables. Par ailleurs, ces données peuvent aussi servir d'exemples réels et attrayants pour illustrer certaines notions statistiques enseignées en mathématiques dans les sections scientifiques. Quels que soient les traitements effectués et les résultats obtenus, il faut rappeler que les corrélations mises en évidence ne peuvent être interprétées qu'avec prudence. Il est donc souhaitable d'énoncer les liens de causalité sous le « couvert » des publications scientifiques traitant de la banque étudiée. D. Lenne et N. Salamé J.-F. Rodes Paru dans le Bulletin de l'EPI n° 70 de juin 1993. RÉFÉRENCES Association pour la Statistique et ses utilisations, L'enseignement de la Statistique en France, 1991. Baron G.-L., Lenne D., SalamÉ N. : « Databases and software tools for statistical analysis in education », In Actes de la 9ème Conférence Internationale sur la technologie et l'Education, Paris, 1992, pp. 1250-1252. Bertrandias F. et J.-P., Mathématiques pour les sciences de la nature et de la vie, Presses Universitaires de Grenoble, 1990. Bouyer J. et al., La prématurité. Enquête périnatale de Haguenau (1971-1982), Ed. INSERM, 1987. Lenne D., Druez D., Rodes J.F., « L'exploitation de données épidémiologiques dans l'enseignement », Actes du colloque L'informatique scientifique dans l'enseignement de la biologie et de la géologie au lycée, INRP, 1991. Morton et Hebel, Epidémiologie et biostatistique. Une introduction programmée, Ed. Doin, 1990. Rumeau-Rouquette C., du Mazaubrun C., Rabarison Y., Naître en France, 10 ans d'évolution, Ed. INSERM, 1984 Salame N., Lenne D., « Vers une nouvelle place des données et des traitements statistiques en biologie-géologie », Statistiquement Vôtre, n°1, septembre 1992. Schwartz D., Méthodes statistiques à l'usage des médecins et des biologistes, Flammarion, 1963. NOTES [1]. les principales difficultés pourront venir du volume des données à traiter. Il est cependant possible de réduire ce volume en travaillant sur les données d'une ou de plusieurs années. De plus, beaucoup d'enquêtes portent sur des effectifs sensiblement inférieurs. [2]. mesurée par le nombre d'enregistrements correspondant à chaque année. [3]. Nous avons utilisé la version anglaise de ce logiciel. Il en existe également une version française, diffusée par EPICENTRE - 8 rue Saint-Sabin - 75011 Paris. [4]. HIgh représente la plus grande valeur acceptable par le logiciel. L'intervalle 172-HI regroupe donc toutes les valeurs supérieures à 171. ___________________ |