vendredi 27 janvier 2012

#Wikipedia est une excellente source d'informations scientifiques et médicales

cliquez sur l'image (et n'oubliez pas de cliquer sur le point rouge)
Je commence ce billet par une constatation double : beaucoup de mes collègues et moi-même faisons un usage abondant et pertinent de Wikipedia dans notre vie professionnelle (vous croyez que je connais tous les gènes, tous les organes, toutes les bestioles ?) ; et d'autre part beaucoup de personnes à l'université continuent à décourager les étudiants d'utiliser Wikipedia, et à le traiter comme une sous-resource, pour paresseux. Je trouve ça choquant, et je le prouve.

Une étude récente (malheureusement d'accès payant paradoxalement) dans le journal Psychological Medecine a comparé l'information concernant des pathologies liées à la schizophrénie (5 pathologies) ou à la dépression (5 pathologies) entre différentes sources d'information : les sites internet arrivant en tête de recherches pour "depression" ou "schizophrenia" (14 sites au total), y compris Wikipedia mais aussi des sites plus officiels, comme celui du National Institute of Mental Health, ainsi que l'Encyclopedia Britanica en ligne, et un livre de psychiatrie utilisé en études de médecine.

En comparant ces différentes ressources, ils trouvent, et je cite :

The quality of information about depression and schizophrenia on Wikipedia was generally rated higher than other centrally controlled resources, including 14 mental health-related websites, Encyclopaedia Britannica and Kaplan & Sadock’s Comprehensive Textbook of Psychiatry.

En d'autres termes, et comme ils précisent plus loin, les articles de Wikipedia sur des sujets de santé contiennent peu d'erreurs factuelles, malgré un certain manque de couverture. Ils sont également bien référencés, mais paradoxalement peuvent être difficiles à comprendre. Ils sont généralement meilleurs en moyenne que les autres sources, y compris le livre spécialisé.

De manière intéressante aussi, bien qu'un avantage majeur de Wikipedia sur le livre est sa mise à jour fréquente et rapide, le livre fait mieux que la plupart des sites web officiels. Ces sites sont moins bons que le livre, mais pas plus à jour. Au moins, ils sont gratuits.

Ceci nous amène à un second point, qui est qu'il est difficile de maintenir de l'information scientifique ou médicale à jour de manière centralisée, avec des ressources forcément limitées.

Il y a un autre article récent sur ce sujet dans le numéro spécial annuel sur les bases de données en biologie (NAR Database, entièrement gratuit) : les auteurs discutent de l'intégration entre Wikipedia, ou d'autres approches participatives, avec des bases de données spécialisées de biologie. Ils partent de leur expérience positive avec les bases de données Pfam (domaines protéiques) et Rfam (ARNs fonctionnels) : les données structurées sont dans une base de données SQL dédiée, mais les annotations en texte qui décrivent la fonction des molécules passent par Wikipedia. Plus précisément, à un moment ils ont exporté toute leur information vers Wikipedia, et depuis ils récupèrent toutes les modifications qui sont faites dans les pages Wikipedia correspondantes, et les remettent dans Pfam et Rfam.

Par exemple, l'article sur mon domaine préféré, de liaison aux hormones des récepteurs nucléaires d'hormones : dans la page Pfam il y a de l'information textuelle, avec un bouton "Edit in Wikipedia". On clique dessus, et on arrive sur la page Wikipedia correspondante, en mode édition directement qui plus est. Et là-dedans vous avez de jolies boîtes avec de l'information structurée venant de Pfam. C'est beau c'est grand c'est magnifique.

Ils ont des curateurs qui vérifient les infos venant de Wikipedia, et ils en acceptent 99%. Ils ont des milliers d'éditions par an, donc beaucoup d'informations pertinentes, à jour, et ... gratuites. Et disponibles à tous !

Ils regardent aussi d'autres modèles d'intégration avec Wikipedia, et les limitations. Par exemple, Wikipedia a un critère d'intérêt général, qui fait qu'on peut avoir une entrée par gène humain, ou par domaine protéique (partagé par plein de protéines), mais pas une entrée par gène de poisson épinoche, ou par variant de gène humain. Une autre limitation est la règle "pas de travaux inédits", qui interdit d'ajouter des infos que vous avez obtenu de vous-même, même par une méthode toute bête et simple. Or une base de données scientifique ne peut pas toujours accepter ces limitations. Et les wiki spécialisés ne marchent généralement pas aussi bien que Wikipedia, c'est peu de le dire.

Leur conclusion, et c'est là où je trouve que ces deux articles à priori bien distincts se rejoignent, est que nous ne pourrons maintenir à jour une information pertinente en biologie (et médecine donc) qu'en s'alliant à Wikipedia (et autres ressources des foules) de manière intelligente. Je suis bien d'accord, d'ailleurs j'utilise déjà Wikipedia. Il ne me reste plus qu'à devenir intelligent.

3 commentaires:

  1. "beaucoup de personnes à l'université continuent à décourager les étudiants d'utiliser Wikipedia, et à le traiter comme une sous-resource, pour paresseux".

    Vraiment ? Ce n'est en tout cas pas l'impression que j'ai des gens avec qui je discute dans les universités suisses, en tout cas. Je ne serais pas fâché d'être détrompé -- ce serait une bonne motivation pour aller discuter avec ces personnes pour voir s'ils ont mis le doigt sur des problèmes de Wikipédia, ou s'ils basent leur opinion sur des préconceptions.

    La situation n'est pas forcément la même en France, cependant -- et je ne peux pas vraiment en juger.

    RépondreSupprimer
  2. J'ai eu cette remarque récemment en formation de pédagogie à l'université de Lausanne. J'ai dit que j'étais choqué.

    Je l'ai aussi vu dans des conseils en ligne aux étudiants, mais je n'ai pas les références.

    RépondreSupprimer
  3. J'ai également parfois eu cette remarque au cours de ma scolarité, mais surtout au collège et lycée (en France).

    A l'université beaucoup moins, tous les chercheurs que je connais utilisent massivement Wikipedia.

    La reproche que j'ai entendu faire à Wikipedia c'est que n'importe qui peut y raconter ce qu'il veut : c'est oublier que n'importe qui peut y corriger ce qu'il veut ! Les pages sont lues, corrigées et éditées par un grand nombre de personnes en permanence, que les détracteurs essaient d'aller y raconter n'importe quoi ils verront combien de temps leurs commentaires restent !

    RépondreSupprimer