vendredi 20 juin 2014

Comment écrire un mauvais article : tests multiples, corrélation = causalité, et communiqué de presse mensonger

[caption id="attachment_2066" align="aligncenter" width="92"]Cliquez sur l'image Cliquez sur l'image[/caption]

Lior Pachter, le lonely cow boy de la bioinformatique, a dégainé à nouveau il y quelques temps (j'ai pris du retard dans la rédaction de billets), mais pour changer il n'a pas attaqué un gros joueur de la bioinformatique (voir ce bilet et celui-ci), mais un article qui a fait pas mal de bruit en début d'année aux Etats-Unis :

J.M. Gilman et al.Cannabis Use Is Quantitatively Associated with Nucleus Accumbens and Amygdala Abnormalities in Young Adult Recreational Users, Neurology of Disease, 34 (2014), 5529–5538.

D'après le communiqué de presse et les interviews de l'auteur, l'article montrerait que même une consommation faible de marijuana cause des lésions au cerveau. C'est possible que ce soit le cas, mais le papier ne montre pas cela. Je vous fais un résumé des erreurs, pour le détail lisez le billet (en anglais) de Lior.

  • Echantillonage faible et biaisé : seulement 20 personnes, et les personnes présentées comme fumeurs occasionnels fumaient en moyenne plus de 10 joints par semaine. On n'a pas la même définition d'occasionnel que l'auteur apparemment.

  • Tests multiples mal corrigés : plus de 120 tests, sans correction appropriée (rappel : quand on fait plein de tests, certains apparaissent significatifs par hasard, sauf si on corrige de manière appropriée). Pire, des tests qui ne passent même pas les critères insuffisants des auteurs sont quand même discutés comme s'ils étaient significatifs, et mis en gras dans les tableaux.

  • Bien sur, les données ne sont pas disponibles, donc on ne peut rien vérifier.

  • Des résultats pas significatifs dans l'article sont discutés comme significatifs par l'auteur dans la presse.

  • Au final, même si tout était bien fait (et rien ne semble l'être), l'étude ne pourrait montrer qu'une association corrélative, avec une causalité inconnue. Mais l'auteur a conclut sur une causalité.


Pourquoi est-ce que je discute ceci malgré mon retard à réagir ? Parce que les mêmes mécanismes sont à l'oeuvre dans de nombreux cas où une étude isolée est utilisée pour appuyer une position qui a un certain appui social.

2 commentaires:

  1. […] Lior Pachter, le lonely cow boy de la bioinformatique, a dégainé à nouveau il y quelques temps (j’ai pris du retard dans la rédaction de billets), mais pour changer il n’a pas attaqué un gros joueur de la bioinformatique (voir…Read more → Continue...  […]

    RépondreSupprimer
  2. Très bon billet qui résume bien les erreurs ou tromperies de bases.
    C'est bien aussi de rappeler qu'une corrélation entre deux faits ne donne pas la nature de la relation entre les faits, ce n'est peut être pas une relation de cause à effet.

    RépondreSupprimer