La production de revues systématiques en médecine est croissante, sur la base d'essais cliniques randomisés (efficacité thérapeutique, préventive) mais aussi d'études d'observation (pronostic, diagnostic, étiologie). Les limites méthodologiques et la plus grande hétérogénéité des études d'observation ainsi que l'insuffisance des méthodes actuelles à contrôler tous les problèmes de leur agrégation méta-analytique se traduisent par une qualité souvent insuffisante. Alors qu'une revue systématique constitue indubitablement un progrès dans la tentative de répondre à une question médicale clinique, la combinaison méta-analytique des études primaires ne fournit pas toujours une réponse crédible, surtout si les études primaires contiennent peu de patients, lors qu'elles sont hétérogènes, que de larges essais cliniques méthodologiquement corrects et adéquatement conduits donnent des résultats différents et lorsqu'elles sont réalisées sur la base d'études d'observation.
Dans la pratique quotidienne de la médecine, diverses questions se posent fréquemment : posologie d'un médicament en présence d'une insuffisance rénale, risque d'interaction médicamenteuse, adéquation du choix d'un examen diagnostique ou d'un traitement. Selon le type et le lieu de pratique, de 7 à 577 questions pour 100 patients ont été décrites.1 Usuellement, le médecin tentera d'y trouver réponse auprès d'un collègue, dans un ouvrage médical ou un compendium des médicaments, plus rarement, mais peut-être à l'aide d'internet, dans un article, une revue systématique ou des recommandations pour la pratique clinique.
Le volume d'informations existant en médecine à propos de l'efficacité des interventions médicales est énorme, sans compter les développements issus de la recherche biomédicale qui pourront peut-être permettre le développement des investigations et des traitements du futur. Individuellement, le médecin n'est ainsi pas en mesure d'effectuer facilement la sélection de l'ensemble des informations qui lui permettent, en combinaison avec son savoir-faire clinique et relationnel, de garantir des soins de qualité.
A. L. Cochrane avait souligné le besoin de disposer de résumés, régulièrement mis à jour, rapportant l'efficacité, ou non, des interventions médicales.2 En réponse à ce constat, la Collaboration Cochrane a vu le jour il y a près de dix ans, ayant notamment pour but de réaliser des revues systématiques, de les maintenir à jour et de les diffuser.3 Actuellement, plus de 1000 revues systématiques sont disponibles sur CD ou sur interneta et plus de 5000 personnes participent à cette collaboration. Le travail est cependant loin d'être achevé, de nombreuses revues restent à effectuer et tous les domaines médicaux ne sont pas représentés équitablement au sein de la collaboration. Les revues systématiques effectuées ont surtout porté sur des interventions thérapeutiques, moins sur les aspects diagnostiques ou pronostiques. Les revues systématiques en médecine ne se limitent cependant pas aux seuls essais cliniques, mais comprennent aussi des études d'observation. L'objet de ce court texte est de présenter comparativement ces deux types de revues systématiques.
Faire le point sur un thème clinique consiste souvent à demander à un prestigieux professeur d'une faculté, tout aussi prestigieuse, de rédiger une revue relative à un thème. De tels documents ne sont pas nécessairement préparés avec une objectivité, ni une méthodologie scientifiquement adéquates. Au-delà des possibles préjugés ou préférences de l'auteur, la recherche de la littérature est fréquemment partielle, la sélection des études ne répond pas à des critères prédéfinis, l'extraction de l'information des études sélectionnées et l'analyse sont basées sur des études et approches hétérogènes.
Réaliser une revue systématique consiste à effectuer une recherche secondaire à partir des études primaires existantes. Il s'agit de chercher systématiquement toutes les études effectuées pour répondre à une question au sujet de l'efficacité d'une intervention sanitaire (traitement pharmacologique ou préventif, amélioration de la qualité des soins, etc.), ce qui permet une synthèse. La rédaction d'un protocole est indispensable qui précise une question claire et focalisée, définit la stratégie de recherche des études primaires, l'application de critères pour évaluer leur qualité méthodologique et une proposition d'analyse des résultats qui tienne compte du plan d'étude et de l'hétérogénéité entre les études. La Collaboration Cochrane a développé un guide détaillé pour la réalisation d'une revue systématique.4 Le terme méta-analyse est fréquemment utilisé comme synonyme de revue systématique. Cependant, il est préférable de réserver méta-analyse pour décrire l'analyse statistique effectuée à partir des études primaires, qui consiste à agréger les données provenant des études considérées comme suffisamment homogènes pour être analysées ensemble. La méta-analyse permet d'obtenir une meilleure précision de l'effet, d'accroître la généralisation des résultats et d'explorer les effets au sein de sous-groupes de population. La plupart des méta-analyses sont réalisées à partir des résultats publiés dans la littérature médicale, établis pour des groupes de patients, alors que l'obtention, difficile, des données individuelles des participants de toutes les études considérées conduit à une meilleure validité des résultats. Cependant, les revues systématiques et surtout les méta-analyses comptent encore nombre de défauts et insuffisances, révélés notamment par diverses analyses comparatives de méta-analyses et de larges essais randomisés.5,6
Un bref rappel des mérites et des limitations des études primaires constitue un préalable indispensable car, avant les aspects techniques des revues systématiques et méta-analyses, leur nature influence fortement les résultats et conclusions des analyses synthétiques. En outre, le paragraphe ci-dessous rappelle la notion de niveau de preuve en fonction du type et de la qualité des études.
En introduction, il convient de souligner la difficulté à traduire adéquatement le terme anglais evidence en français. Parler de «preuve» donne l'impression trompeuse d'un aspect irréfutable et formel qui découle moins fortement du terme anglais evidence.
Le groupe de travail canadien de l'examen médical périodique a initialement développé la notion de niveau de preuve des recommandations pour la pratique clinique examinées.7 Des échelles simples, voire simplistes, de la hiérarchisation des types d'études selon le niveau d'évidence existent (tableau 1). Ce type d'échelle, essentiellement applicable à des interventions médicales thérapeutiques ou préventives dont l'évaluation de l'efficacité peut être quantifiée par un essai clinique, est souvent lié à un niveau de recommandation.8 Les échelles simples s'appliquent mal à l'évaluation d'un facteur pronostique ou d'un test diagnostique et ne permettent pas de tenir compte de défauts méthodologiques, ni d'autres aspects de la qualité des études. Des échelles plus complexes permettent de mieux prendre en compte ces divers éléments.9
L'essai clinique randomisé (en anglais, Randomised Clinical Trial, RCT) est le paradigme de l'expérimentation destinée à prouver l'efficacité d'une intervention médicale, en minimisant le risque de survenue d'erreurs systématiques de sélection. Le choix aléatoire de l'intervention pour un participant donné garantit en principe que la probabilité a priori de survenue du résultat clé considéré soit similaire dans les groupes comparés (nouveau traitement vs traitement habituel ou placebo). La conduite de l'étude en double insu (investigateur et participant) est facilitée lorsque la nature de l'intervention le permet. Les principes et les outils d'une analyse statistique rigoureuse s'accommodent bien du plan des RCT. Le contrôle des autres erreurs systématiques possibles (qualité de l'exécution de l'intervention, détection du résultat, par exemple) est plus simple. En outre, la randomisation ne fonctionne réellement que si ni l'investigateur ni le participant ne peuvent être informés du choix du traitement avant l'inclusion du participant et le début de l'intervention.
Les études d'interventions effectuées en l'absence de randomisation, c'est-à-dire lorsque le choix du traitement est soumis à l'appréciation de l'investigateur ou du patient sont sujettes aux erreurs systématiques de sélection. Il est difficile d'utiliser des séries de cas soumis à une intervention ou les comparaisons avec des témoins historiques pour évaluer l'efficacité d'une intervention, sauf lorsque l'effet est patent : succès curatif obtenu pour une large proportion de patients alors que l'issue est usuellement rapidement fatale, par exemple.
Les RCT connaissent cependant toute une série de limites. Premièrement, un RCT ne peut être conduit et éthiquement acceptable que s'il y a réellement incertitude quant à l'existence d'une efficacité supérieure du nouveau traitement par rapport au groupe témoin. Très souvent, l'incertitude est réfutée sur la base d'études préliminaires non valides, empêchant ainsi l'obtention d'une réponse claire. Dans un RCT, c'est avant tout la validité interne de l'étude qui est recherchée. Cela se fait au prix d'une sélection parfois très importante des patients, selon l'âge, le sexe, les comorbidités ou la vérification de la bonne observance du traitement. L'extrapolation des résultats à d'autres groupes de patients devient alors problématique. En outre, les équipes qui pratiquent l'intervention ou les interventions comparées ont fréquemment une expertise et une maîtrise de ces interventions supérieures à celles des centres ou des praticiens qui les appliquent ultérieurement.
Lorsque la question fondatrice d'une revue systématique examine les effets d'une intervention sanitaire, le plan d'étude prioritairement recherché pour les études primaires est un RCT. Outre les revues Cochrane, de qualité supérieure en moyenne,10 la Database of Abstracts of Reviews of Effectiveness (DARE) renvoie à près de 3000 revues systématiques.3 La publication de revues systématiques est devenue routinière dans de nombreuses revues biomédicales et une approche a été proposée pour faciliter leur interprétation ; sur cette base, le tableau 2 indique quels éléments d'évaluation considérer.11 Divers développements méthodologiques et statistiques visent à améliorer la qualité des revues systématiques et méta-analyses. Par exemple, le test de l'entonnoir (funnel plot), qui permet d'investiguer la présence d'éventuels biais de publication ou de sélection des participants en fonction de la taille de l'étude,12 la méta-régression ou d'autres approches.13,14 Cependant, des progrès doivent être réalisés, notamment dans l'interprétation des résultats15 et pour permettre de mieux tenir compte des différences méthodologiques entre RCT.
Les études d'observation telles le suivi d'une cohorte d'individus ou de patients, des études cas-témoins ou transversales, pour ne citer que les plans d'études «classiques», sont moins fréquemment utilisées que l'essai clinique pour évaluer l'efficacité d'un traitement. D'autres types d'études seront rangés dans la catégorie des études d'observation : études de pronostic, de diagnostic, de diagnostic différentiel, de prévalence de symptômes, règles de décisions cliniques et analyses décisionnelles, analyses médico-économiques. Si la plupart de ces types d'études correspondent à des plans d'analyse que l'on peut considérer comme de nature observationnelle, une faible proportion sont réalisées sous la forme d'un essai clinique et seront donc analysées comme telles : évaluation d'un test diagnostique, évaluation économique couplée à un essai clinique, par exemple.
Diverses méthodes d'analyse permettent d'ajuster les résultats en fonction des différences connues entre les groupes comparés. Des analyses empiriques ont indiqué que les résultats d'études d'observation tendaient à surestimer l'effet en comparaison avec des RCT ayant examiné un même traitement.16,17 D'autres travaux ont cependant montré que l'analyse adéquate d'études d'observation permettait de trouver des résultats similaires à ceux obtenus dans des RCT.18,19 Néanmoins, ces ajustements ne sont pas toujours effectués ni toujours possibles. En particulier, s'il existe des facteurs déterminants du résultat qui ne sont pas mesurés ou inconnus, il sera impossible d'ajuster pour d'éventuelles différences de prévalence de ces facteurs entre les deux groupes. Cela ne peut conduire à la survenue d'une erreur systématique que si le déterminant est simultanément associé à l'un des groupes comparés et au résultat mesuré. Un tel effet a été invoqué pour tenter d'expliquer que les résultats de nombreuses études d'observations cohortes, notamment la cohorte des infirmières américaines20 qui avaient conduit les auteurs à conclure à un effet protecteur de l'hormonothérapie substitutive envers les maladies coronariennes, ont été sérieusement remis en question par les résultats de RCT qui n'ont pas montré cette protection.21 Une analyse détaillée des limites et mérites des études d'observation a été publiée récemment, qui considère aussi les avantages et problèmes des RCT.22,23
En médecine, les revues systématiques d'études d'observation sont moins fréquentes que celles de RCT. Elles sont difficiles à conduire à toutes les étapes ou presque de leur réalisation. Les problèmes sont liés à la qualité souvent insuffisante des études réalisées dans un cadre moins codifié que celui des RCT, à l'hétérogénéité des plans, réalisations et rapports d'études, ainsi qu'au caractère parfois rétrospectif et à la multiplicité des variables ou résultats considérés (surtout pour les études pronostiques ou étiologiques). Les difficultés liées aux revues systématiques d'études pronostiques ont été décrites par Altman et sont en partie applicables aux études étiologiques.24 L'obtention de données individuelles est parfois réalisable qui permet de mieux gérer certaines différences entre études,25 la principale difficulté étant l'obtention de la plus grande proportion possible de données individuelles. Le manque de recommandations quant à la conduite et à la communication des résultats de revues systématiques et de méta-analyses d'études d'observation en médecine constitue un handicap complémentaire. La proposition consensuelle récente d'un groupe essentiellement étasunien vise à combler ce manque.26
Le tableau 3 présente les problèmes associés aux revues systématiques de RCT et d'études d'observation. Il s'agit d'une présentation synthétique, développée empiriquement, des principaux problèmes qui peuvent se présenter lors de la réalisation d'une revue systématique. Ce tableau indique que les revues systématiques d'études d'observation sont plus sujettes à des difficultés et limites. L'hétérogénéité entre les études est un élément qui doit toujours être scrupuleusement examiné, cet aspect crucial a été mis en évidence dans une méta-analyse d'études cas-témoins.27 Habituellement, on considère trois types d'hétérogénéité : clinique, méthodologique et statistique. La première concerne les variations, entre les études, des caractéristiques des patients inclus. La deuxième se rapporte aux différences dans le plan d'étude et la troisième aux différences d'effets observés entre les études primaires. Ce dernier élément peut être évalué par des tests statistiques dits d'hétérogénéité. En présence d'une hétérogénéité, il doit être examiné si une méta-analyse peut être effectuée. Si oui, un modèle statistique qui prend en compte les variations d'effets présents non seulement au sein des études (effets fixes) mais aussi en plus entre les études (effets aléatoires) doit être considéré. Cependant, ce n'est que récemment qu'une approche statistique tenant compte des effets aléatoires dans une méta-analyse d'études d'observation (tests diagnostiques)28 et une méthode exacte pour les méta-analyses d'études cas-témoins29 et de suivi ont été proposées.
Afin de permettre aux patients de disposer des soins les plus appropriés à leur état de santé et face au rythme accéléré de la mise sur le marché de nombreuses nouvelles technologies médicales, une information appropriée doit atteindre les médecins prescripteurs dans les meilleurs délais. Des revues systématiques de qualité, mises à jour selon l'apparition de nouvelles études primaires, permettent d'informer de manière synthétique les médecins de l'évolution des connaissances quant à l'efficacité des interventions médicales existantes et nouvelles. Les décisions de politique sanitaire s'appuyant aussi fréquemment sur des revues systématiques, il est particulièrement important que la qualité de ces études soit la meilleure possible. Les revues systématiques réalisées à partir d'essais cliniques randomisés sont en général moins difficiles à réaliser et de qualité intrinsèquement supérieure aux revues d'études d'observation. Cependant, il convient toujours d'examiner la qualité méthodologique d'une revue systématique avant d'en appliquer les conclusions, a fortiori si les études primaires contiennent peu de patients, lorsque les études sont hétérogènes et que de larges études méthodologiquement correctes et adéquatement conduites donnent des résultats différents de ceux d'une revue systématique.