La valeur ajoutée de l’intervalle de confiance


Lors de l’interprétation de résultats thérapeutiques comparés entre deux traitements, il y a deux questions importantes à se poser : 

  1. Est-ce que ces différences sont dues au hasard ? 
  2. Sont-elles cliniquement importantes ? 

La réponse à la première question fait appel au caractère statistiquement significatif de l’étude, la seconde à son caractère cliniquement significatif. 

Traditionnellement, la première est régie par la proximité du petit p avec la valeur 0.05. Elle est influencée par la taille de l’échantillon, sa dispersion, et la différence observée entre les traitements comparés. 

A contrario, l’importance clinique est influencée par les convictions des praticiens, le risque de survenue d’effets secondaires, le coût et la faisabilité des pratiques et de la mesure de leurs effets. 

L’intervalle de confiance cumule les informations statistiques et cliniques pour aider à la décision thérapeutique. 

Exemple : 

On compare les résultats de 4 études contrôlées randomisées hypothétiques. Pour chaque étude, la question posée était : « chez des patients souffrant de lombalgies depuis 8 à 12 semaines, y a-t-il une différence entre les pourcentages de réussite des interventions A et B au bout de 2 semaines de traitement, une réussite étant considérée comme une réduction d’au moins 2 points sur l’EVA après traitement ? » 

Basiquement : 

Les deux hypothèses habituellement formulées sont : 

1°- l’hypothèse nulle : il n’y a pas de différences entre les traitements A et B dans les pourcentages de succès obtenus (H0 : PA = PB) 

2°- l’hypothèse alternative, sous condition de rejet de l’hypothèse nulle : il y a une différence entre les traitements A et B dans les pourcentages de succès obtenus (H0 : PA ≠PB). C’est une hypothèse bilatérale puisqu’on ne peut pas préjuger du sens de la différence (si A est meilleur que B ou B meilleur que A). 

La valeur du pourcentage de réussite du traitement A, pondérée de son intervalle de confiance est comparée à la valeur du pourcentage de réussite du traitement B, pondérée de son intervalle de confiance. 

Il y aura toujours une différence entre ces deux pourcentages, même infime, même après plusieurs décimales ; le calcul du petit p permettra de déterminer si le hasard a moins de 5 chances sur 100 (0,05) dans cette différence, auquel cas, nous pourrions attribuer cette différence à un facteur intrinsèque, non lié au hasard. 

Aller plus loin : 

Même en présence d’une différence non liée au hasard, l’étude n’est pas terminée : pratiquement, si un traitement A est meilleur qu’un traitement B, il faut que l’apprentissage ou la pratique du traitement A soit suffisamment facile pour que les praticiens soient invités à changer leurs habitudes et que la différence de réussite entre les traitements soit suffisamment importante. 

Considérons une amélioration de plus de 15% comme seuil cliniquement significatif. 

m_ptj0333-fig001
Illustration issue de l’article

Deux études comparant les mérites du traitement A versus traitement B produisent un résultat négatif. 

Deux autres études comparant les mérites du traitement A versus traitement B produisent un résultat positif. 

Les études 1 et 2 ne montrent pas de différences significatives entre les traitements et encore moins une différence cliniquement significative de 0,15 entre les deux pourcentages de réussite. En regard des chiffres obtenus, deux questions doivent être posées : 

  1. Est-ce que la taille de l’échantillon est suffisante pour détecter une différence si celle-ci existe réellement ? 
  2. Est-ce qu’une étude dotée d’un échantillon de taille suffisant permettra de mettre en évidence une différence inter-groupes au-delà de 0,15 ? 

La réponse à ces questions peut être apportée par l’analyse des intervalles de confiance 

L’étude 1 montre une différence de 0.05IC95%[-0.073, 0.173]. Cet intervalle inclus à la fois la valeur nulle et la valeur seuil de 0,15. Cela sous-entend que la taille de l’échantillon est trop faible et que nous ne pouvons pas exclure la possibilité que la vraie différence entre les groupes de traitement soit de 0,15. 

En appliquant le même raisonnement à l’étude 2, qui montre une différence de 0.05IC95%[-0.037,0.137], nous pouvons constater que l’intervalle de confiance n’inclut pas le seuil clinique de 0,15, ce qui veut dire que bien que nous ne pouvons pas exclure qu’une vraie différence existe entre les deux interventions, l’intervalle de confiance n’inclut pas la valeur seuil de 0,15 et il n’est donc pas nécessaire de faire une étude complémentaire pour savoir si ceci est cliniquement utile. 

Dans l’étude 3, la différence est de 0.3IC95%[0.06, 0.54]. L’intervalle de confiance est très large et ne peut pas permettre d’affirmer avec confiance que la différence seuil de 0,15 sera systématiquement retrouvée. Il faudra un échantillon plus large pour se prononcer avec plus d’acuité. 

Dans l’étude 4, la différence est aussi de 0.3, mais l’intervalle de confiance est au-delà de la valeur seuil de 0,15 IC95%[0.17, 0.43]. Elle peut être considérée comme apportant de fortes preuves que le traitement A est d’une importance clinique conséquence par rapport au traitement B. 

Et si je considère la valeur seuil comme plus élevée ? 

Il me suffira, à la lecture de l’intervalle de confiance, de placer mon curseur à cette valeur et de voir si elle est « dans les clous » que je me suis fixé. 


Référence bibliographique

Paul W. Stratford. The Added Value of Confidence Intervals. Phys Ther March 2010 90:333-335 

Article disponible en ligne 

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s