Des outils d'IA génératives pour les sciences,
vraiment ?
Jean-Marie Gilliot
Je propose ici un petit retour d'expérience sur ma participation à une semaine de formation pour découvrir les usages de l'IA Générative pour les sciences [1]. Au travers de ce retour, nous cherchons à partager des réponses aux questions suivantes en trois billets : Quel cadre pédagogique pour tirer parti de cette technologie d'IA Générative [2] ? Comment construire un programme de découverte d'une nouvelle technologie de l'information [3] ? Dans ce troisième billet, nous explorons si cette technologie peut effectivement être utilisée dans un cadre de recherche scientifique ?
Le développement des IA générative a connu un succès grand public sans précédent. Ce développement impacte potentiellement tous les métiers. Dans le cadre d'un cours d'inter-semestre, nous avons exploré la question des pratique de ces IA génératives dans le cadre des sciences. Nos étudiants ont proposé un guide de bonnes pratiques [4] à l'issue de notre semaine commune.
Lors d'une exploration préalable, j'ai pu découvrir l'existence de tout un ensemble d'outils spécifiques pour le chercheur, beaucoup plus diversifiée que ce que laisse penser l'omniprésence des outils conversationnels comme ChatGPT et tous ses concurrents.
Comme l'offre des IAG évolue très vite, il est également intéressant de regarder ces services et outils plus spécialisés, et ce pour 2 raisons. D'abord, parce que dans le cadre de la recherche, ils sont spécifiquement basés sur les articles de recherche comme données d'entrée, ce qui est une garantie dans le processus, sauf quant il s'agit de demander une reformulation plus simple. Ensuite, parce qu'actuellement, c'est la bonne manière de découvrir ce qu'il est possible de faire avec les IAG. La liste proposée ci-dessous émerge d'une exploration de ces outils. Des outils spécialisés, issus d'autres domaines peuvent également mériter qu'on s'y arrête. Deepl, qui d'abord est un outil de traduction (i.e. une IAG spécialisée) propose un outil de type traitement de textes outillé (Deepl Write [5]).
Un point important à préciser d'emblée est que ces outils peuvent fournir les sources de leurs textes, et surligner les extraits de texte concernés. Dans une démarche scientifique, il est en effet indispensable de pouvoir sourcer les informations, de disposer de leur contexte, et de vérifier que ces informations puissent effectivement être réutilisées dans le contexte de recherche.
Je propose donc ici d'abord quelques points d'entrée. Autre point important, l'extraordinaire évolutivité du domaine, entre évolutions incessantes, et annonces fracassantes, fait que (1) cette liste est amenée à évoluer, (2) ce qui n'est pas encore convaincant aujourd'hui peut le devenir rapidement, et (3) la forme d'interaction la plus efficace est encore à trouver, ou au moins à confirmer. Voici donc quelques tâches, qui sont sans doute à compléter, dans lesquelles une IA Générative (IAG) pourra vous aider :
L'exploration d'un sujet. Quand on aborde un nouveau sujet, il est souvent difficile de cerner les concepts, les mots clés pour trouver des sources. Un article sur Wikipédia, un article de vulgarisation écrite par un expert constituent de bons points d'entrée. Commencer par des articles scientifiques peut s'avérer ardu. Dans tous les cas, demander à une IAG de reformuler en variant les styles permet de mieux comprendre et de revenir vers des formulations plus scientifiques. Vous pouvez décliner cette approche par concept, question de recherche, hypothèse ... Vous pourrez alors explorer les articles de références sur ces sujets, en étant prêts à vous les approprier.
Explorer et détailler un article de recherche. Demander un résumé d'un article est particulièrement facile, mais en quoi celui-ci est il plus pertinent que celui proposé par les auteurs et surtout en quoi répond-il à votre question spécifique ? Clairement, ces outils ne proposent pas de remplacer votre expertise, mais de vous accompagner dans votre lecture et vous faire gagner un peu de temps. En fait, on peut aller en profondeur sur un certain nombre de points. Une IAG vous permet de poser de nombreuses questions d'exploration suivant votre point d'intérêt : quels sont les apports de l'article, quelle est la méthode utilisée, la dimension de l'échantillon, ... ? Bref, il devient facile d'extraire de l'information spécifique.
Et comme indiqué précédemment, il est toujours possible de demander une reformulation pour explorer un concept qui vous paraît nouveau.
Explorer un corpus. On peut élargir la tâche précédente à un corpus de documents, mais ce n'est pas directement accessible sur les versions d'essai. Cela peut a priori permettre de construire une réponse basée sur les informations dans ces textes, mais il reste à évaluer comment sont gérées les contradictions.
Conduire sa revue de littérature. Les nouveaux outils permettent de dépasser une simple recherche par mots clés. Il devient possible de poser une question de recherche et d'obtenir une série d'articles qui s'y rapportent et d'obtenir une synthèse (consensus [6], elicit [7], scispace [8]), d'explorer la littérature par graphe de proximité de chercheurs ou de sujets (ResearchRabbit [9]). Certains outils vous promettent des recommandations d'articles en fonction de vos recherches précédents (GoogleScholar [10]) ou en fonction de votre base d'articles (SemanticScholar [11]). Bref, ces outils vous offrent des nouvelles manières de faire des revues de littérature. Il s'agit de combiner ces points de vue, pour vous construire une base d'articles qu'il vous restera à comprendre.
Explorer des données. Les outils d'IAG vous permettent d'extraire des données de toutes sortes de sources, y compris d'un tableau dans un pdf. Ils vous permettent également de mettre en forme ces données selon les spécifications de l'outil que vous visez. Je n'ai pas encore investigué ce point là, mais il est clair que c'est une étape toujours chronophage, qui mérite des outils dédiés.
Produire du code. Clairement, les IA génératives peuvent rendre de grands services pour aider à créer du code. Pour nombre de codes simples, les propositions des IA génératives peuvent faire gagner beaucoup de temps. Il peut rester une phase de mise au point, mais c'est un usage plébiscité.
Organiser son papier. Les plans d'articles scientifiques sont finalement assez classiques. Il n'est donc pas étonnant qu'une IA générative puisse vous faire une première proposition qui permette d'éviter la page blanche, et que vous pourrez affiner, en conversant avec l'IAG, et en ajoutant ce que vous considérez comme important.
Écrire son papier. Il ne s'agit pas ici de générer un document automatiquement, mais bien de se faire aider dans son écriture. L'IAG vous permet de reformuler, pour améliorer le style, pour vous permettre de reprendre une idée que vous avez déjà formulé dans un article précédent (pour éviter l'auto plagiat), pour citer correctement une idée issue d'une référence. La traduction est également une option logique en visant un style scientifique.
Améliorer son texte. Les IAG peuvent servir de relecteur. Tout comme il est intéressant de faire relire votre papier par un collègue, ou un pair, vous pouvez demander à une IAG d'analyser votre texte, de vérifier votre argumentaire, de regarder si il est possible de mieux présenter une idée. Reprenez les éléments d'exploration d'un article de recherche et appliquez le à votre brouillon.
Présenter vos résultats. L'IA générative ne s'arrête pas à la génération de texte, il y a évidemment les illustrations, mais aussi des outils d'aide pour les diaporamas, et bientôt les vidéos.
Pour effectuer toutes ces tâches, il est possible d'utiliser une IAG généraliste comme ChatGPT (avec des résultats bien supérieurs pour la version payante), qui intègre de plus régulièrement les idées développées par d'autres sous forme de plugins variés. Parmi tous ces outils, certains sont issus de démarche de science ouverte (comme SemanticScholar [12]), alors que d'autres sont au contraire issus d'éditeurs qui ont été décriés, mais qui annoncent assurer une qualité supérieure (voir l'annonce par Springer [13] de l'outil Curie [14]). Notons également que les outils existants ont tendance à proposer leur propre IAG, le dernier que j'ai vu apparaître est l'extension proposée par Writefull [15] pour le bien connu éditeur latex collaboratif Overleaf.
Citons quelques outils parmi ceux que nous avons pu tester :
SemanticScholar [16] qui permet de faire des recherches, propose des résumés en une phrase, et met en avant les éléments importants d'un article. Un outil de recherche dans la littérature scientifique ;
Consensus [17] qui vous propose sur une question de recherche les articles les plus pertinents, les conclusions de chacun, et une synthèse. Une bonne base pour entamer une exploration, ou au contraire constater qu'un consensus existe déjà ;
AskYourPDF [18] qui permet de converser avec un article. Un outil spécialisé, sur une tâche ;
SciSpace [19], est ce qui ressemble le plus à un outil intégré pour la recherche scientifique, en vous permettant de gérer votre bibliothèque de références, de faire une revue de littérature, d'explorer un texte ou un corpus, de citer, paraphraser, de détecter du contenu généré par l'IA générative. Il propose également un cahier de notes, et un plugin pour simplifier du texte ou aller chercher des références, dans un pdf ou sur une page web.
AI reviewer [20], pour avoir un retour sur un article en cours de rédaction.
Dans tous les cas, rappelons quelques éléments de bonnes pratiques :
Avant tout, posez vous la question de savoir si votre travail peut être diffusé sur une plate-forme externe, qui peut réutiliser ce travail. Ces outils ne vous garantissent pas un niveau de confidentialité absolu ;
L'IAG est un assistant pour vous accompagner dans votre travail, un partenaire avec qui échanger, mais pas un outil auquel vous déléguez votre travail ;
Interagissez en anglais. Ce conseil ne plaira pas à tout le monde, mais les bases de ressources scientifiques sont majoritairement en anglais. De plus, l'anglais reste la langue pivot de beaucoup d'outils, qui y reviennent naturellement ;
Décomposez vos étapes, préciser ce que vous voulez, cela vous permettra de construire des prompts précis, pour obtenir des résultats corrects ;
Réitérez, précisez, interagissez pour raffiner,
N'hésitez par à prendre le contre-pied, en lui demandant ce qu'il a écarté par exemple, ce qu'il manque dans votre proposition...
Prenez le temps d'analyser les réponses. Vérifiez les sources. Les réponses des IAG, mais aussi les articles publiés, peuvent comporter des biais. Le texte peut être hors sujet, car issu d'un passage qui parle d'autre chose, ou qui le donne en contre exemple...
Dans tous les cas, gardez le contrôle, c'est vous qui êtes responsables de la construction des idées, par les IAG.
En synthèse, l'IAG n'est pas là pour vous remplacer, mais peut effectivement jouer le rôle d'un assistant qui répond à vos questions, qui vous fait des mémos, qui mâche des étapes de votre travail. À vous d'apprendre à travailler avec un assistant, c'est à dire interagir avec lui pour l'amener à faire au mieux de ses possibilités, l'amener à vous remettre en question, bien considérer ce qu'il vous propose et garder le contrôle sur chaque étape, sur chaque conclusion. Si vous le prenez comme tel, vous pourrez aller assez loin.
Jean-Marie Gilliot
Maître de conférences à IMT Atlantique,
une école de l'Institut Mines-Telecom,
chercheur au Lab-STICC.
Paru le 11 mars, 2024 sur le site Techniques innovantes pour l'enseignement supérieur.
https://tipes.wordpress.com/2024/03/11/des-outils-dia-generatives-pour-les-sciences-vraiment/
Cet article est sous licence Creative Commons Attribution 4.0 International.
https://creativecommons.org/licenses/by/4.0/deed.fr
NOTES
[1] https://isblue.fr/actualites/pim-ia-g-explorer-les-intelligences-artificielles-generatives/
[2] https://tipes.wordpress.com/2024/02/29/lagentivite-comme-cadre-de-reflexion-pour-lia-dans-la-classe/
[3] https://tipes.wordpress.com/2024/03/04/decouverte-de-lia-generative-pour-le-jeune-chercheur/
[4] https://isblue.fr/actualites/pim-ia-g-explorer-les-intelligences-artificielles-generatives/
[5] https://www.deepl.com/write
[6] https://consensus.app/search/
[7] https://elicit.com/
[8] https://typeset.io/
[9] https://www.researchrabbit.ai/
[10] https://scholar.google.com/
[11] https://www.semanticscholar.org/
[12] https://www.semanticscholar.org/
[13] https://group.springernature.com/fr/group/media/communiques-de-presse/curie-assistant-de-redaction-intelligence-artificielle-springer/26176108
[14] https://www.aje.com/curie/
[15] https://www.writefull.com/
[16] https://www.semanticscholar.org/
[17] https://consensus.app/search/
[18] https://askyourpdf.com/
[19] https://typeset.io/
[20] https://typeset.io/
|