lundi 24 septembre 2012

Faudrait pas que le bon peuple puisse juger de la science concernant les #OGM directement (#openaccess, not)

[caption id="attachment_486" align="aligncenter" width="130"] cliquez sur l'image[/caption]

Je me méfie des révolutionnaires qui commencent par changer le nom de la police politique tout en augmentant ses prérogatives. Je me méfie des scientifiques qui veulent combattre les idées reçues en cachant leurs expériences et les détails de leurs résultats.

Il y a beaucoup à dire sur l'étude récente de rats nouris au maïs OGM, et d'ailleurs beaucoup est dit. Pour mes lecteurs qui ne verraient cette question que par une lunette idéologique (genre commentaires sur Passeur de sciences ou sur Biopsi), il y a une raison pour laquelle plein de scientifiques sont fachés avec cet article : c'est de la mauvaise science qui reçoit plein de pub (excellent commentaire sur bacterioblog). C'est un peu pareil que pour ENCODE, sauf que là vous n'aviez pas fait attention, et que ENCODE c'est 1000 fois mieux fait. Bon, vu les réactions chez Biopsi, si vous ne voulez pas me croire, vous ne me croirez pas. Mais si, ça existe la mauvaise science.

Un point abordé chez Biopsi, et sur lequel je voudrais revenir, c'est la publication fermée de cet article. Car enfin, il paraît que tout ceci a été fait pour éclairer le peuple et les décideurs, et mettre fin au règne maléphique de la pseudo-science manipulée par les multinationales, et que font les auteurs ?

  1. L'étude a été faite en secret. Apparemment sinon les gros bras de Monsanto seraient venu faire exploser le labo ou quelque chose comme ça.

  2. L'article a été fourni à quelques journaux très peu à l'avance, à la condition de ne pas le montrer à qui que ce soit. Y compris donc ne pas le montrer à d'autres scientifiques pour avoir leur opinion sur les travaux et les résultats. Ce qui est très choquant, et veut dire que les journalistes avaient le choix entre écrire un article à temps pour l'évènement, mais sans aucune information ou expertise externe, ou attendre et publier plus tard. Ce qui veut dire que tout le buzz le jour J était forcément mal informé. Excellente politique de communication scientifique, bien mise en pièces par l'excellent journaliste scientifique Carl Zimmer sur son blog.

  3. L'article est publié dans une revue disponible uniquement sur abonnement, donc pas accessible aux citoyens, aux militants, aux profs de lycée, aux journalistes, bref j'en ai déjà parlé ailleurs (et aussi ici), mais quand une étude est potentiellement si importante pour tout le monde, ça me paraît crucial de faire en sorte qu'elle soit le plus largement disponible possible. Ils auraient publié dans PLOS One, ça serait en copyright Creative Commons et librement disponible pour la planète (et en prime le facteur d'impact est plus élevé). Et là non seulement ça n'est pas chez PLOS, mais c'est chez Elsevier, le grand méchant loup de l'édition scientifique, la multinationale la plus grosse et la plus rapace du secteur. D'ailleurs chez PLOS, non seulement c'est libre d'accès, mais on peut ajouter des commentaires, et les liens Twitter sont montrés en temps réel à côté de l'article. C'aurait pas été bien ça, pour faire débat public ?

  4. Une pratique courante en science, où on ne peut souvent pas mettre toutes les données ou tous les résultats dans l'article lui-même, pour des raisons de place, est de fournir des "matériels supplémentaires", qui contiennent les détails des analyses ou des preuves, les tableaux de résultats bruts, l'intégralité des figures là où on n'a montré qu'un exemple dans l'article, etc. Vu le faible nombre de rats (donc de données), et l'importance que chacun puisse juger de ces résultats, c'eut été facile de le faire. Mais non. Pas de matériels supplémentaires ici. Comparons à ENCODE : 15 To de données publiquement disponibles.

  5. On doit généralement déclarer les "conflits d'intérêts" à la fin des articles. Ici, les auteurs n'en déclarent aucun, donc on en déduit que les résultats et leur publication n'ont aucune incidence financière personnelle pour eux. Sauf que Séralini, responsable de l'étude (et curieusement 1er auteur, en biologie d'habitude le responsable est dernier, mais bref), sort en même temps un livre et un film sur le sujet "OGM fait-moi peur". C'est pas un conflit d'intérêt, ça ? Ils l'auraient déclaré, ç'aurait augmenté leur stature morale à peu de coût. Mais non.


Toute ceci n'est qu'un aspect de cette affaire, et peut-être pas le plus important. Mais d'une part il me tient à coeur (et c'est mon blog ici), et d'autre part cet aspect est indicatif à mon sens de l'attitude générale de ces auteurs et de leurs soutiens, qui ne semblent pas tant chercher la vérité (une recherche généralement collective et ouverte), mais chercher à affirmer une position politique. Tiens, encore un parallèle, inquiétant celui-ci, entre biologie et économie.

Petite note supplémentaire : ça me frappe que tous les comptes Twitter et tous les blogs que je suis, sélectionnés parce qu'ils parlent de science de manière intéressante, sont critiques de cette étude. Je n'ai pas choisi de lire ces gens parce qu'ils sont pro-OGM, la grande majorité travaille dans des laboratoires fondamentaux sur fonds publics, pourtant je n'ai pas encore vu une défense raisonnée de l'étude. Sur ENCODE ou la bactérie à l'arsenic par exemple, y avait débat dans la communauté scientifique. Ici, non.

Deuxième note : pour ceux qui pensent qu'on est tous à la solde de Monsanto. D'abord, j'attends toujours le virement bancaire, à titre personnel. Contactez-moi directement merci. Ensuite, sérieusement, les industries poluantes dépensent beaucoup beaucoup pour faire de la propagande pseudo-scientifique anti changement climatique, et pourtant la très grande majorité des chercheurs dans le domaine montre que le changement se produit et est dû à l'activité humaine. Avec de l'argent, on peut facilement acheter une illusion de débat, on ne peut pas facilement acheter un consensus scientifique.

Mise à jour : trouvé un excellent commentaire francophone sur la manière dont les journalistes ont eu accès à l'article.

Mise à jour 2 : je ne suis pas toujours d'accord avec le traitement de l'info scientifique par Sylvestre Huet, mais là il fait plein dans le mile.

Mise à jour 3 : Jérémy @ChemPhilia me signale sur Twitter cet excellent article traitant du "syndrome de la recherche unique", tout à fait pertinent.

vendredi 21 septembre 2012

Expertise par les pairs #peerreview : une question de point de vue ?

[caption id="attachment_407" align="aligncenter" width="171"] cliquez sur l'image[/caption]

Suite aux remarques de H sur mon post il y a quelques temps, et à une série de posts intéressants de Mike Taylor (posts 1, 2, 3), je me suis demandé à quel point les différences de point de vue sur l'expertise par les pairs sont dues à des différences d'expérience selon les rôles joués.

On peut jouer l'un de trois rôles par rapport à cette expertise :

  1. Auteur de l'article, qui reçoit les expertises.

  2. Expert, qui juge l'article, parmis plusieurs experts.

  3. Editeur, qui choisit les experts, reçoit leurs évaluations, et prend une décision finale.


Dans chacun des rôles, plusieurs cas de figure sont possibles. Chacun va colorer l'expérience personnelle de l'expertise (peer review).

En tant qu'auteur, vous pouvez avoir fait un travail qui laisse à désirer, et les experts peuvent améliorer votre article ; vous pouvez avoir mal écrit votre article, et les experts peuvent vous aider à clarifier votre pensée ; ou vous pouvez avoir un excellent travail bien écrit, et les "bon" experts n'ont rien à dire, mais le troisième expert vous embête. Si vos articles sont généralement très bons, votre expérience de l'expertise n'est pas forcément très positive. Et il faut prendre en compte la possibilité que votre travail ait besoin d'être amélioré, mais que vous ne vous en rendiez pas compte (on est humains), enquel cas votre expérience subjective sera encore négative, bien que l'expertise ait marché en fait.

En tant qu'expert, vous pouvez fournir des remarques pertinentes et correspondant aux attentes du journal. Ou vous pouvez être trop gentil, et votre revue n'apporte rien. Ou vous pouvez être trop méchant (voir troisième expert ci-dessus), et l'éditeur a raison de ne pas prendre en compte vos remarques. Si vous êtes systématiquement trop gentil ou trop méchant, votre expérience de l'expertise n'est à nouveau pas très positive.

En tant qu'éditeur, et c'est là où je veux en venir, vous voyez tout cela. Vous voyez de bons et de moins bons papiers. Vous recevez des expertises informatives et d'autres vides de contenu ; des trop gentilles et des trop méchantes. Or la plupart des chercheurs vont d'abord être dans le rôle de l'auteur, ensuite relativement rapidement dans le rôle de l'expert, mais nettement plus tard ou jamais dans le rôle de l'éditeur. Dans mon expérience (relativement limitée) d'éditeur, il n'est pas rare que l'expertise améliore les articles, et il est fréquent qu'il permette d'éviter la publication de travaux franchement erronés.

Donc mon impression pour le moment (je peux me tromper), c'est que les critiques de l'expertise par les pairs manquent souvent de l'expérience d'éditeur.

J'ajouterais à ceci que le rôle de l'éditeur va dépendre de la politique du journal, mais si votre papier est refusé parce qu'il n'est "pas suffisamment significatif pour notre journal", la faute en est à cette politique éditoriale, et non à l'expert, quoiqu'il ou elle ait pu dire.

-------

Rien à voir, mais allez lire l'excellent commentaire de Philippe Julien sur l'étude récente sur les rats mangeurs d'OGM.

------

Encore rien à voir, mais j'ai plein de spams dans les commentaires, allors si le votre est perdu, je m'en excuse.

vendredi 14 septembre 2012

Economiste et biologie évolutive

[caption id="attachment_411" align="aligncenter" width="90"] Cliquez sur l'image (ce bonhomme c'est Krugman)[/caption]

Via le blog de Jeremy Fox (anciennement contributeur principal du blog du journal Oikos), j'ai découvert un texte un peu ancien mais intéressant, dans lequel l'économiste Paul Krugman discute des similarités entre l'économie (en tant que science) et la biologie évolutive.

Krugman dit plusieurs choses intéressantes. L'économie et la biologie évolutive sont tous deux intéressés par ce que font les individus ; l'analyse de niveaux supérieurs doit être basée sur la compréhension des individus : Methodological individualism. Les individus suivent leur propre intérêt ; les modèles qui marchent expliquent généralement l'altruisme apparent par un intérêt égoiste indirect. Nous nous intéressons aux interactions entre individus. Par contre en économie, on suppose généralement que les individus sont intelligents, alors qu'en biologie évolutive le gène individuel est aveugle aux conséquences de sa fonction et son évolution.

Dans les deux domaines, les chercheurs sont intéressés par des problèmes de stratégies d'optimisation, de préférence des optimisations stables. Mais Krugman note aussi que dans les deux cas, l'optimisation doit être vue comme une stratégie de modélisation, et non comme un principe très fort.

Une autre similarité amusante est que les deux domaines s'appuyent fortement sur les maths, mais attirent des personnes qui sont souvent peu motivées par cet aspect mathématique.

Finalement, Krugman discute un point sur lequel je voudrais me démarquer de lui. Il note avec raison qu'en dehors d'un domaine, ce domaine sera souvent popularisé par un petit nombre d'auteurs, qui risquent de ne pas être représentatifs. Par exemple en économie moi je lis surtout Krugman ;-). Mais à mon avis il commet une erreur en considérant qu'en ayant lu Dawkins, Hamilton et Maynard-Smith, il a une vue à peu près équilibrée de la biologie évolutive, par opposition à ses collègues ayant lu Gould. Dawkins et Gould ont en commun d'avoir écrit des livres très lus. Les deux ont également contribué des avancées importantes à des aspects différents de la biologie, même si on peut arguer que Gould a davantage fait de recherche, et que Dawkins a davantage clarifié des concepts. N'empêche que Hamilton et Maynard-Smith et Dawkins, très intéressants, représentent une certaine approche de la biologie évolutive, individu et gène centrée, avec un intérêt fort pour l'optimisation et peu d'intérêt pour l'histoire évolutive ou l'évolution non adaptative. C'est vrai qu'avoir une vue d'ensemble de la biologie évolutive, c'est pas évident. Et au moins Krugman essaye.

(Voici une autre comparaison par Kurgman entre la réaction des imbéciles face aux complexités des deux domaines)

vendredi 7 septembre 2012

#ENCODE : La revanche du retour du fils du génome humain

[caption id="attachment_436" align="aligncenter" width="227"] cliquez sur l'image[/caption]

En 2001, des équipes de chercheurs ont publié deux versions de la séquence du génome humain. A l'époque on a comparé cela à poser un homme sur la Lune. Rétrospectivement, c'était plutôt Spoutnik : la preuve que c'était possible d'aller là-bas, mais on n'y était pas encore.

Cette semaine, un nouveau consortium a publié une série de papiers assez incroyables du project ENCODE, qui vise à comprendre en détail exquis tout le fonctionnement de ce génome. Je vais dire que c'est notre moment Gagarin. Oui on peut le faire et on l'a fait. C'est le deuxième étage de la fusée "comprendre notre génome" (OK, j'arrête les analogies foireuses).

Il y a une kilochiée de données là-dedans, et comme tout le monde ça va me prendre un peu de temps pour digérer tout ça. Je vais donc me concentrer ici sur quelques points qui sont apparus via les réactions à chaud (bref, je vais blogguer ce que j'ai lu sur twitter).

D'abord quelques chiffres :

  • ENCODE c'est 440 chercheurs dans 32 labos dans le monde

  • 30 articles publiés le même jour

  • 1'600 types d'expériences sur 147 types de tissus (tissu au sens "tissu musculaire"), portant pour la plupart sur les 3 milliards de bases du génome humain

  • Au final 15 Tb de données.


Ensuite, le point énervant, c'est que la quasi-totalité de la couverture que j'ai vue dans la presse ou les communiqués de presse se concentre sur un message simple :
On croyait que presque tout le génome était de l'ADN poubelle ("junk"), mais que nenni, on vient de découvrir que c'est presque tout fonctionnel.

Réponse courte : test de l'oignon.

Réponse longue: je vais essayer d'expliquer rapidement ce qu'ils ont trouvé (d'après les résumés, billets de blogs, et présentations orales que j'en ai vues - je n'ai pas encore lu vraiment les papiers), puis je vais donner une interprétation légèrement différente de celle des communiqués de presse, puis je vais expliquer qu'on n'est pas si surpris que ça.

Ce qu'ils ont trouvé : 80% du génome est "fonctionnel". La définition de "fonctionnel" est très débattue en biologie (on n'est pas très forts pour les définitions claires - on ne sait toujours pas ce qu'est un gène, une espèce, ou le vivant), mais revenons à l'analogie que je donnais sur l'annotation de génomes. La définition la plus courante suppose que l'on sache à quoi sert une partie de génome dans l'organisme. D'autres définitions peuvent être qu'on ne connait pas la fonction mais que c'est probablement important, par exemple parce que c'est conservé entre humains et poissons. Ici, la définition donnée est qu'une région du génome est considérée comme fonctionnelle si elle resort comme positive dans au moins un des tests effectués. Ne nous attardons pas ici sur les problèmes de répétition des tests, parce que je n'ai pas encore lu les méthodes en détail, mais les personnes impliquées sont généralement de très bon bioinformaticiens et statisticiens, et je ne pense pas qu'ils aient laissé passé des erreurs grossières du type "un test sur 20 est significatif au hasard". Par contre, les tests mesurent uniquement une activité biochimique dans les conditions expérimentales. Parmi les tests, il y a la liaison de facteurs de régulation de l'ADN plus ou moins spécifiques, et il y a la transcription, à savoir copier un fragment d'ADN en fragment d'ARN. Donc 80% du génome est détecté comme actif dans au moins un test biochimique.

Comme dit sur Twitter :
John Davey@johnomics

I wish #ENCODE had gone for the more complex '20% functional, 80% active'. Yes, more to explain, but it IS complex. And still exciting

En fait, les auteurs ne montrent pas que 80% du génome soit fonctionnel. A savoir qu'ils ne connaissent pas de fonction, ne savent pas si c'est indispensable ou même utile à la cellule ou à l'organisme, ne savent pas si ça joue un rôle évolutif ou médical.

Ewan Birney, leader de l'analyse bioinformatique dans le consortium ENCODE, a écrit un excellent billet de blog que toute personne intéressée non seulement à la génomique, mais à la science haut débit ou à la biologie moderne, doit lire. Dedans, il justifie d'abord le chiffre de 80%, en confirmant que c'est tout ce qui a une "activité biochimique spécifique" (spécifique ça veut dire que ça n'affecterais pas n'importe quel bout d'ADN au hasard). Ensuite et très intéressant, il donne une estimation du fonctionnel stricto sensu : Environ 8% du génome a une interaction spécifique avec une protéine (par exemple un facteur de transcription) ; auquel il faut ajouter environ 1% d'exons (morceaux qui codent vraiment pour des protéines - bien qu'il ne précise pas "exons codants") ; comme ils n'ont pas étudié toutes les protéines pouvant interagir avec l'ADN, il double son estimation, donc (8+1)x2 = 18% (il ne dit pas pourquoi les exons sont inclus dans le chiffre à doubler) ; arrondissons, ça fait 20% estimation minimale du génome fonctionnel.

Basé sur les mêmes chiffres, j'aurais tendance à dire estimation basse 9% (avant de doubler au hasard et arrondir), estimation haute 20% (voir ci-dessus), et non estimation basse 20%, estimation haute 80%.

Pour revenir au sempiternel "on est très surpris de trouver tout cet ADN supposé poubelle fonctionnel", il faut clarifier que personne n'a jamais dit que tout l'ADN non codant était "poubelle" ou non fonctionnel ! C'est super énervant au fil des années de voir ce canard resortir chaque fois qu'une étude trouve de la fonction nouvelle dans un morceau d'ADN non codant. Enfin quoi, la régulation des gènes a valu le prix Nobel à Jacob, Monod et Lwoff en 1965 ! Plus près de nous, mais clairement avant la publication ENCODE que nous célébrons cette semaine, Larry Moran sur son excellent blog listait en février 2008 tout ce que nous savions sur la composition fonctionnelle du génome humain, et arrivait aux totaux suivants :
Total Essential/Functional (so far) = 8.7%
Total Junk (so far) = 65%
Unknown (probably mostly junk) = 26.3%

Wahou il doit être très surpris de lire une estimation de fonctionnel stricto sensu entre 9% et 20%. Tiens, non.

Je n'ai pas le temps de lister toutes les réactions que j'ai lues à ce "80% de fonctionnel" couplé à "surprise ! pas tout le non codant est pourri", mais disons que ça a bardé sur Twitter et les blogs scientifiques dès quelques heures après la publication et ça ne s'est pas calmé.

Je voudrais maintenant traiter un autre point assez rapidement, c'est la politique de publication d'ENCODE. D'abord, c'est tout libre d'accès, ouf. Pour l'anectode ensuite, Casey Bergman s'est amusé à calculer que le temps cumulatif perdu pour que tous les papiers sortent en même temps (un papier a été retardé un mois, un autre deux mois, ça fait trois mois de cumulé...) est d'un an de dix ans (corrigé, désolé).

Plus important, les papiers publiés dans trois journaux différents, qui ont des éditeurs différents (Nature publishing group, BMC et Cold Spring Harbor press), ont réussi à mettre ensemble une vue transversalle des articles par "fils", ou "threads" :

A gauche, une série de thèmes qui se retrouvent dans différents articles. A droite, lorsque l'on choisit un thème, sont mis en avant les articles pertinents. Si on clique sur le thème, on obtient tous les extraits d'articles et les figures correspondantes, à la suite. C'est génial.


Râlage quand même : les "Supplementary Information", tous les résultats complémentaires et détails des méthodes qui sont en annexe, sont exclus de ce système. Du coup, c'est loin d'être complet, et ça reste malheureusement prisonnier du modèle de publication classique en partie.


Il y a aussi une App iPad, mais autant que je puisse juger c'est pareil que la page web, mais en App iPad.


Autre innovation : ils ont rendu disponible une machine virtuelle, qui permet d'installer localement tous les programmes utilisés, les jeux de données au bons formats, les détails d'installation informatique, etc, permettant de reproduire leurs analyses. Les données ne sont pas complètes dans cette machine virtuelle (15 Tb, vous vous rappellez ?), mais c'est clairement un énorme progrès dans la diffusion des méthodes bioinformatiques et leur standardisation.

Et puis voilà, y a encore beaucoup à dire, mais je n'ai pas le temps. A la prochaine.

Mise à jour : excellent compte-rendu qui couvre certain des mêmes points, et d'autres, par Malicia sur bioinfo-fr.net.