Oublier le statistiquement significatif et les études impuissantes à démontrer quoique ce soit


abstract blackboard bulb chalk
Photo de Pixabay sur Pexels.com

Premier point

Une différence statistiquement significative observée entre deux interventions n’implique pas nécessairement que cette différence soit cliniquement importante pour les patients et les cliniciens.

S’il est statistiquement significatif que de faire du bio-psycho-social en multidisciplinaire dans une lombalgie chronique est plus efficace qu’un bon gros vieux massage du dos, il faut peut être savoir s’il est raisonnable d’engager 700 € de dépenses par jour versus 16,13 € par semaine pour un point gagné sur l’EVA.

Deuxième point

Une étude n’ayant pas la puissance nécessaire expose le lecteur à des résultats contradictoires avec d’autres études passées traitant du sujet.

Schématiquement, la puissance est fonction de la différence espérée entre deux traitements et du nombre de sujets recrutés dans l’échantillon.

Pour démontrer l’effet létal du curare comparativement aux fraises Haribo, il n’est pas nécessaire de disposer de beaucoup de sujets (ce qui tombe bien, vu qu’il faut trouver des volontaires pour potentiellement ne pas faire partie du groupe contrôle Haribo). Pour démontrer un maigre avantage thérapeutique (du style espérer montrer que le traitement d’un hypothétique point-gâchette du trapèze supérieur c’est mieux avec une aiguille qu’avec un bon gros appui du pouce), il ne faut pas hésiter à recruter large…

Ces points sont connus et classiques.

Ce sont ceux abordés par cette étude dans le cadre de la lombalgie. Leurs auteurs se sont donné pour objectif de déterminer si les effets thérapeutiques d’études contrôlés randomisées sur la lombalgie étaient statistiquement significatifs et pertinents sur le plan clinique, soit conçus pour obtenir des différences cliniquement pertinentes.

Méthodes

Ils ont recherché toutes les études contrôlées randomisées incluses dans les revues systématiques Cochrane destinées à mettre l’accent sur l’efficacité des interventions de rééducation pour la lombalgie et publiées jusqu’en avril 2017.

Des études contrôlées randomisées calculant la taille de l’échantillon et prévoyant une différence minimale importante ont été prises en compte.

Ils ont calculé la proportion d’études contrôlées randomisées classées comme :

  • « Statistiquement significatives et cliniquement pertinentes »,
  • « Statistiquement significatives mais non cliniquement pertinentes »,
  • « Non statistiquement significatives mais cliniquement pertinentes »,
  • « Non statistiquement significatives et non cliniquement significatives ».

« Non statistiquement significatives mais cliniquement pertinentes« , ça paraît bizarre, mais cela correspond à un intervalle de confiance débordant sur le non-statistiquement significatif tout en ayant une moyenne au-dessus du cliniquement significatif (voir les graphiques dans l’article illustrant les différentes configurations).

Ils ont ensuite recherché combien de fois une inadéquation entre la signification statistique et la pertinence clinique était due à une puissance insuffisante.

Résultats

Parmi les 20 méta-analyses Cochrane admissibles sur les 62 concernant la lombalgie, 105 études contrôlées randomisées étaient admissibles mais seulement 42 présentaient tous les critères. Elles concernaient 81 comparaisons d’intervention.

Globalement, 60% (25 ECR) étaient statistiquement significatives alors que seulement 36% (15 ECR) étaient statistiquement et cliniquement significatives.

La plupart des études (38%) n’ont pas abordé la pertinence clinique des effets du traitement lorsque les résultats n’ont pas atteint la signification statistique.

Parmi les études avec des résultats non statistiquement significatifs, 60% n’ont pas atteint la taille prévue de l’échantillon, risquant donc de ne pas détecter un effet réellement présent (erreur de deuxième espèce).

Conclusion des auteurs

Seule une minorité des résultats positifs des ECR était à la fois statistiquement significative et cliniquement pertinente. Une diligence limitée ou des omissions franches d’éléments importants des études contrôlées randomisées, tels que la pertinence clinique et la puissance, diminuent la fiabilité des résultats.

Commentaires

Ils se sont basés sur des études ayant appuyé des revues Cochrane…pas étonnant que le conditionnel soit le temps le plus fréquemment employé dans les conclusions de ces revues.

Les principales revues étaient Spine, Clinical Journal of Pain, British Medical Journal, Journal of Manipulative and Physiological Therapeutics. Aucune étude française n’est recensée mais je ne suis pas sûr que nous devions nous en réjouir 🙂


Références bibliographiques

Gianola S, Castellini G, Corbetta D, Moja L. Rehabilitation interventions in randomized controlled trials for low back pain: proof of statistical significance often is not relevant. Health Qual Life Outcomes. 2019 Jul 22;17(1):127. doi: 10.1186/s12955-019-1196-8.

Articles en rapport avec le sujet

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s