Afin de déterminer si l’application unique de chloramphénicol topique après chirurgie dermatologique mineure permet de prévenir les infections de plaie, un essai clinique randomisé, multicentrique, en double insu, a comparé cette préparation à une pommade à base de paraffine dans une cohorte à risque augmenté d’infection.1
Les résultats montrent une incidence d’infection de 6,6% (IC 95% : 4,9-8,8 ; n = 488) dans le groupe traité, significativement plus basse (p = 0,010) que dans le groupe placebo (11% ; IC 95% : 7,9-15,1 ; n = 484). La diminution du risque absolu était de 4,4%, et la réduction du risque relatif de 40%. Le risque relatif d’infection de plaie était 1,7 fois plus élevé (IC 95% : 1,1-2,5 ; n = 972) dans le groupe placebo. Il a fallu traiter 22,8 patients pour prévenir un épisode infectieux.
Ce traitement est-il cliniquement relevant ?
Pendant longtemps, la pratique médicale était une démarche essentiellement empirique, et ce n’est que depuis la seconde moitié du 20e siècle que l’approche épidémiologique et ses méthodes rigoureuses prévalent dans la recherche médicale.2
Il est important que le médecin qui lit des articles scientifiques maîtrise un minimum de notions statistiques afin de pouvoir interpréter, critiquer et enfin appliquer les résultats de ses lectures à ses patients. Or cette maîtrise fait souvent défaut et ce, même parmi le corps médical de deux hôpitaux universitaires romands où, en 2004, moins de la moitié était capable de réaliser des tests statistiques simples et de les interpréter.3 Depuis lors, l’introduction de cours de statistiques lors du cursus médical et de certificat de formation postgraduée en recherche clinique orientée patient devrait améliorer cette culture.
La méthode statistique intervient premièrement lors de l’écriture du protocole de l’essai clinique où elle consiste à définir le dessin d’étude le plus approprié, à planifier les analyses statistiques et enfin à calculer la taille du collectif nécessaire, de manière à optimiser les ressources. Elle intervient aussi dans un second temps, à la fin du projet, pour effectuer les calculs initialement prévus, qui fournissent «une mesure rationnelle reflétant le degré d’incertitude associé avec des assertions fondées sur des données».4
Les outils statistiques rationalisent l’interprétation des résultats et facilitent la prise de décision en synthétisant des données brutes non interprétables autrement. Les tests statistiques permettent d’obtenir des valeurs «p», mais ces dernières ne constituent pas en elles-mêmes une mesure de la force de la relation entre les variables étudiées.5 La valeur «p» est la probabilité de commettre une erreur en affirmant l’existence d’une différence quand en réalité aucune différence n’est présente. Plus elle est petite, moins le hasard est responsable du résultat observé, mais elle n’est jamais nulle car elle correspond à une surface sous une courbe asymptotique. Un résultat est usuellement considéré comme statistiquement significatif si la valeur «p» est strictement inférieure à 5% (p < 0,05).
La signification clinique, appelée aussi importance pratique, doit elle aussi être définie a priori avant le début d’un essai clinique en termes de taille de l’effet attendu.6 Un résultat sera cliniquement important si l’efficacité du nouveau traitement induit un changement dans la prise en charge des patients mais, outre la magnitude de l’effet, d’autres considérations interviennent comme la balance risque-bénéfice, le coût, la disponibilité ou l’acceptabilité du nouveau traitement. Dans l’exemple présenté en préambule, la taille de l’effet cliniquement relevant avait été prédéfinie comme une différence d’incidence de 5%, aussi la conclusion des auteurs était que la diminution du risque absolu d’infection était statistiquement mais pas cliniquement significative.1
Significations statistique et clinique sont souvent confondues et parfois considérées à tort comme synonymes, alors qu’il s’agit de deux notions distinctes (tableau 1). La première n’impliquant pas nécessairement la seconde et vice versa. La taille de l’effet considéré comme important demeure un choix basé sur l’expérience clinique et pourra varier selon le clinicien. Enfin, un nouveau concept a été récemment proposé par Philip Sedgwick : celui de «significatif pour le patient».6
‣ La valeur «p» :
doit être présentée avec 3 décimales
n’indique pas la force d’une relation
n’est jamais égale à zéro
‣ La signification statistique dépend :
de la taille des groupes
de la dispersion des résultats
de l’importance de la différence entre les groupes
du seuil de «p» choisi (probabilité d’accepter un résultat faussement positif)
de la puissance statistique du test (probabilité de détecter une vraie différence)
‣ L’importance clinique d’un résultat est quantifiée par :
les intervalles de confiance
la magnitude de l’effet objectivée par :
la différence entre les groupes
l’inverse de la différence, soit le nombre nécessaire à traiter
différents indices comme le «d» de Cohen, le risque relatif, etc…