La tentation est grande d'entrer un mot-clé dans chaque fenêtre d'interrogation qui s'affiche à l'écran. D'ailleurs, ces fenêtres sont placées là pour ça. Mais, lorsque l'utilisateur a succombé à la tentation, le résultat n'est pratiquement jamais à la hauteur de ses espérances. La pertinence n'est pas au rendez-vous parce que le mot-clé est mal choisi, l'outil de recherche défectueux ou la syntaxe d'interrogation inadaptée.
Le mot-clé et la fenêtre d'interrogation sont des pièges que le médecin doit savoir déjouer. Pour cela, il lui faut apprendre à choisir ses mots-clés et à ne les entrer que dans les fenêtres dont il maîtrise le fonctionnement.
Lorsque la recherche est activée, «tout est joué, rien ne va plus» : on gagne ou on perd. Mais le hasard n'y est pour rien. Mode d'emploi pour «rafler la mise» le plus souvent possible.
Qu'est-ce qui se cache derrière les fenêtres ?
Une fenêtre d'interrogation est toujours couplée à un outil de recherche. Mais, il n'est pas toujours évident de savoir quelle est la syntaxe de l'outil et son champ d'investigation. Ce qui amène à distinguer plusieurs types de fenêtres : les petites fenêtres, les grandes, les fenêtres multiples, les simples, celles qui sont couplées à un menu déroulant et celles qui sont associées à une autre fenêtre.
Les petites fenêtres sont les plus suspectes. Elles sont trop étroites pour accueillir une véritable équation de recherche. Elles précisent rarement l'espace qu'elles interrogent (c'est souvent le site lui-même, ce qui ne présente qu'un intérêt restreint si l'arborescence est cohérente).
Les grandes fenêtres sont l'apanage des outils de recherche du type Google, Fast, AltaVista ou HotBot. Elles s'opposent aux précédentes. Leur champ d'investigation est bien déterminé : c'est 30 à 50% des pages «visibles» de la Toile. Leur syntaxe est détaillée dans les modes d'emploi (help). Elles autorisent l'entrée de plusieurs mots-clés reliés par des opérateurs booléens figurés (comme dans AltaVista) ou virtuels (comme dans Google).
Les fenêtres multiples se rencontrent dans les modules avancés de certains moteurs de recherche (Fast ou HotBot) et dans les outils de recherche bibliographique (fonctions «Limits» et «Preview/
Index» de PubMed). Lorsqu'elles sont reliées entre elles avec l'opérateur AND, elles limitent le champ de la requête et réduisent le «bruit».
La fenêtre d'interrogation des navi-gateurs (encore appelée «barre d'adresse») héberge un menu déroulant qui est invisible lorsqu'il n'est pas activé. Ce menu «déroule» l'historique des sessions les plus récentes. Pour l'activer, il convient de cliquer sur le triangle inversé figurant à l'extrémité droite de la fenêtre.
Certaines fenêtres d'interrogation sont couplées à des «fenêtres menu déroulant». Les deux exemples les plus caractéristiques sont le menu déroulant couplé à la fenêtre d'interrogation de Fast et celui de la fonction «Preview/
Index» de PubMed. Dans le premier cas, le menu déroulant propose «all of the words», «any of the words» et «the exact phrase», c'est-à-dire (sur le plan syntaxique) l'opérateur booléen AND, l'opérateur OU et les guillemets du mot composé. Dans le deuxième cas, le menu «déroule» les 21 champs spécifiques de l'interface PubMed.
Comment la demande de l'utilisateur peut-elle se traduire en termes simples ?
L'exploration d'un répertoire consiste à faire coïncider le mot-clé choisi par l'utilisateur avec le mot-clé déterminé par le documentaliste. Le plus souvent, cela se fait en explorant une liste hiérarchique de mots-clés jusqu'à rencontrer celui que l'on a choisi. Le risque de non-pertinence est nul (le document proposé est toujours en adéquation avec la demande). En revanche le risque de rentrer bredouille est élevé.
L'interrogation d'un moteur de recherche est très différente. Elle consiste à entrer un mot-clé dans une fenêtre d'interrogation et à afficher les résultats. Première différence : l'outil de recherche est rarement pris en défaut car l'indexation des pages est confiée à un automate qui retient tous les mots non vides de sens. Ainsi se constitue un index géant capable de «répondre à tout». Deuxième différence : le risque de non-pertinence est élevé car l'automate accorde la même valeur à tous les mots, qu'ils soient significatifs ou non du sujet traité. Ce risque de non-pertinence est d'autant plus élevé que la requête de l'utilisateur est imprécise ou trop générale.
En pratique : il faut faire simple et «aider» le moteur de recherche à interpréter la requête. Pour faire simple, il faut déterminer les points essentiels de la requête, les décliner et les critiquer. Pour aider l'outil de recherche, il ne faut retenir que les mots-clés qui s'avèrent indispensables. Un outil (malheureusement anglophone) donne une très bonne idée du travail à accomplir pour aboutir à une requête en termes simples. Ce site (Guidebeam) est couplé au moteur de recherche Google. Dans Guidebeam, entrer «Heart Arrest» dans la fenêtre d'interrogation et se laisser guider par son instinct jusqu'à rencontrer des expressions écrites en vert Un voyage très instructif.
Quelle est la syntaxe à employer ?
Le mieux est de prendre en exemple la requête suivante : «en quoi consiste la rééducation fonctionnelle dans le traitement des tendinites chroniques d'Achille ?» et de l'appliquer à trois outils de recherche (Google, Fast et AltaVista).
La première idée qui vient à l'esprit est d'entrer la requête en langage naturel, soit : la rééducation fonctionnelle dans le traitement des tendinites d'Achille. L'entrée de la requête dans Google affiche dix documents dont un seul est pertinent («le tendon d'Achille et sa pathologie» sur le site de l'hôpital européen de Paris La Roseraie). Fast affiche cinq documents dont un seul est pertinent (c'est le même que Google). AltaVista affiche plus de 25 000 références dans lesquelles sont noyés les éventuels documents pertinents. L'explication de ces résultats est la suivante :
dans Google, l'opérateur booléen par défaut est AND ; la requête est interprétée comme rééducation AND fonctionnelle AND traitement AND tendinites AND Achille ;
dans Fast, on est dans le même contexte que dans Google (opérateur par défaut AND) sous réserve d'avoir sélectionné «all the words» dans le menu déroulant qui jouxte la fenêtre d'interrogation ;
dans AltaVista, l'opérateur booléen par défaut est OR, ce qui explique l'afflux de références (bruit).
L'étape suivante consiste à passer du langage naturel à l'équation de recherche.
Dans Google, cela donne : «rééducation fonctionnelle» «tendinite d'Achille» ; les guillemets sélectionnent l'expression ou le mot composé ; l'équation est interprétée comme : rééducation fonctionnelle AND tendinite d'Achille.
Dans Fast, il faut avoir recours au module de recherche élaborée ; entrée de rééducation fonctionnelle (the exact phrase) dans la fenêtre supérieure et de tendinite d'Achille (avec must include) dans une des fenêtres des «Word Filters».
Dans AltaVista, c'est aussi la recherche élaborée qui est sollicitée ; dans la fenêtre de la «requête booléenne», entrée de «rééducation fonctionnelle» AND «tendinite d'Achille».
Aucune de ces requêtes ne fournit de réponse pertinente.
Cet échec conduit à reconsidérer l'équation de recherche. Il s'agit, en particulier, de débarrasser l'équation des scories qui ont pu empêcher les outils de recherche de fonctionner normalement. L'expression rééducation fonctionnelle est simplifiée en rééducation, ce qui dégage l'horizon : trois à quatre documents pertinents sont proposés par chaque moteur de recherche.
Cet exemple montre bien les difficultés d'une recherche documentaire à l'aide des moteurs de recherche. Il semble plus simple d'entrer un mot-clé dans une fenêtre d'interrogation que de parcourir une arborescence de descripteur. C'est une erreur. Le maniement des mots-clés et des fenêtres d'interrogation réclame plus de réflexion, plus de rigueur et plus de temps que l'exploration d'un répertoire. Mais le temps et la patience permettent d'obtenir un résultat plus satisfaisant.
Les adresses
I Google
http://www.google.com
I Fast
http://www.alltheweb.com
I AltaVista
http://www.altavista.com
I HotBot
http://www.hotbot.lycos.fr
I PubMed
http://www.ncbi.nlm.nih.gov/entrez/
query.fcgi
I Guidebeam
http://www.guidebeam.com
Ph. Eveillard
pheveillard@jbbsante.fr