mercredi 27 août 2014

Tous les articles scientifiques sur l'impact des #OGM, organisés sur le web

[caption id="attachment_2453" align="aligncenter" width="133"]cliquez pour voir ce qui se passe quand un dessinateur de BD croit la propagande anti-OGM cliquez pour voir ce qui se passe quand un dessinateur de BD croit la propagande anti-OGM[/caption]

J'ai découvert un nouveau service web, Genera, par le site Biofortified, un groupe plutôt pro-biotechnologie qui combat les méconceptions sur les OGM, et qui passe mon test climat+OGM. Dans mon expérience, ils sont pro-biotechnologie mais communiquent de la science correcte (c'est comme les écologistes sur le changement climatique, quand la science est de votre coté pas besoin de mentir).

Ce service m'a l'air très intéressant : ils ont classé tous les articles scientifiques rapportant des études sur l'impact des OGM en fonction de l'espèce, l'impact détecté ou pas, la source de financement, etc. On peut tout chercher ici :

http://genera.biofortified.org/advanced_search.php

Ils fournissent quelques infographies intéressantes sur le bilan global, dont celui-ci sur les impacts positifs ou négatifs détectés selon les sources de financements :

[caption id="attachment_2452" align="aligncenter" width="150"]cliquez pour votre le graphique pleine taille sur le site d'origine cliquez pour votre le graphique pleine taille sur le site d'origine[/caption]

J'ai essayé de chercher quelques trucs évidents, comme "cancer" ou "endocrine", et je suis tombé sur les études de Séralini et al., donc ça contient bien des études anti-OGM. Ceci dit, je n'ai pas pu tout vérifier, il peut y avoir de légers biais. Mais ça semble en tous cas être une resources très intéressante pour qui cherche des informations scientifiques sur l'impact des OGM. Une requête un peu plus large, "environnement", récupère de nombreuses et diverses études. A suivre donc.

mardi 26 août 2014

Encore une nouvelle technologie révolutionaire de séquençage de l'ADN, cette fois-ci portable

[caption id="attachment_2445" align="aligncenter" width="169"]cliquez sur l'image cliquez sur l'image[/caption]

Comme on l'entend souvent (en tous cas si on lit des blogs de sciences), le séquençage de l'ADN se fait de plus en plus vite, de moins en moins cher, progressant à une vitesse bien supérieure aux progrès de l'informatique. Par exemple billet de Philippe Julien, de moi (génome à $1000), et bon article récent dans Le Monde.

La plupart des progrès récents sont dus à une société qui domine le marché, Illumina (voir cet article complet en anglais sur Forbes), bien que PacBio présente une alternative intéressante pour les génomes bactériens. Récemment, Mick Watson, bioinformaticien et bloggueur, a écrit sur son expérience avec un nouvel arrivant, Oxford Nanopore. Oxford Nanopore commercialise depuis très peu un séquenceur ultra-compact, le MinION, qui se branche dans la prise USB d'un ordinateur (Windows seulement apparemment pour le moment), et envoie les séquences directement dans l'ordinateur.

[caption id="" align="alignnone" width="204"] image de propagande du fabricant[/caption]

Alors qu'Illumina lit des fragments d'ADN de 100-200 nucléotides ("lettres" d'ADN) (mais plein plein !), et que PacBio lit jusqu'à 20'000 (mais plus souvent dans les 1000), MinION lit couramment des dizaines de milliers, et jusqu'à 100'000 sans problème, semble-t-il. Donc un génome bactérien d'un coup. Mike Mick Watson voit d'énormes possibilités pour un séquenceur si petit, si mobile, et si puissant, et a donc décidé d'écrire un premier logiciel permettant de traiter directement les données produites sur l'ordinateur auquel le séquenceur est branché. Il a mis une première description de sa méthode sur Bioarxiv (un serveur pour mettre des articles pas encore formellement publiés), et explique un peu sur son blog de quoi il retourne. Il tient à ce que son logiciel marche même sans bonne connection internet, pour que ce soit accessible à un vétérinaire de campagne, un médecin de brousse, etc.

Mike Mick voit un futur dans lequel ce vétérinaire, ce médecin, puisse identifier par séquençage le pathogène (bactérie, virus, etc) auquel il a affaire, et ait donc à disposition un test diagnostique rapide, exact, puissant et universel, avec lui tout le temps. Si ça marche, certaines des prédictions enthousiastes des débuts de la génomique (fin des années 1990) seront enfin en train de se réaliser, et cela va changer beaucoup de métiers et de pratiques autour de la biologie. Bon reste à voir ce que ça va donner quand ça sera réellement commercialisé à grande échelle.

(Orthographe du prénom corrigée, suite à remarque sur Twitter)

Mise à jour : Mick signale sur Twitter que le papier a été accepté :


lundi 25 août 2014

Les généticiens ne sont pas d'accord pour être instrumentalisés par un raciste

[caption id="attachment_2041" align="aligncenter" width="102"]Cliquez sur l'image Cliquez sur l'image[/caption]

Une fois de plus, un livre a été publié à grand fracas aux Etats-Unis, se proposant de montrer qu'il y a des différences entre races humaines, expliquées par la génétique. Dans ce cas précis, il prétend s'appuyer sur les travaux de ces dernières 15 années en génomique humaine, et en plus affirme apparemment que des différences même récentes, mêmes entre peuples proches, sont dues à des changements génétiques rapides. Par exemple la stabilité de la Grande Bretagne, et la révolution industrielle dans ce beau pays ? C'est parce que les enfants des riches survivaient mieux que ceux des pauvres, donc les gènes de stabilité de travail et d'intelligence des riches se sont répandus. Non vous ne rêvez pas.

L'auteur, Nicholas Wade, est un journaliste scientifique. Il affirme bien sur être purement conduit par le souci de la vérité scientifique, et n'avoir aucune intention politique. Par contre, tous ceux qui le critiquent n'ont forcément rien compris à la science de la génétique humaine moderne, et ne sont conduits que par des considérations politiques, et n'osent pas regarder la réalité en face. (Ca me rappelle un tout petit peu les réactions aux critiques de l'étude Séralini et al.)

Cet été, pendant que vous faisiez un trek en Mongolie extérieure sans réseau internet, les généticiens cités dans le livre, plus quelques autres généticiens connus pour leur travail sur les génomes et l'évolution humaine, ont écrit une lettre ouverte concernant le livre (lettre sur le site de Stanford ; la même au New York Times ; commentaire sur le site de Nature), qui dit en substance, premièrement que la principale critique publiée du livre est excellente (la critique, dans le New York Times) et qu'ils remercient son auteur, et deuxièment que la recherche en génétique des populations (l'étude des différences génétiques entre individus et entre populations) ne soutient aucunement les conclusions du livre. Je cite :
We are in full agreement that there is no support from the field of population genetics for Wade’s conjectures.

Parmi les signataires on trouve mes collègues Laurent Excoffier de Berne, Henrik Kaessmann de Lausanne, et Emmanouil Dermitzakis de Genève (tous membres de l'Institut suisse de bioinformatique). (Je n'ai pas signé parce que je ne travaille pas sur les populations humaines hors de ma collaboration avec Laurent Excoffier, voir ici.)

Je suis frappé par la fréquence des réactions du type "ce n'est pas des vrais scientifiques, ils ne disent ça que parce que c'est politiquement correct, d'ailleurs les noirs courent plus vite", par exemple sur le forum techno-geek Slashdot. Bin non, la génétique c'est compliqué et ça ne montre simplement pas les bétises de Wade en l'état de nos connaissances.

Pour finir, je renvoie à mon premier billet de blog au C@fé des sciences, sur l'existence ou non des races humaines. A ma connaissance, ce que j'y ai écrit reste valable.

vendredi 15 août 2014

Mon index Kardashian est de 1.39

famousLes chercheurs sont constamment évalués et comparés : pour avoir des postes, pour avoir des financements, pour être promus, etc. Comme lire tous les articles de quelqu'un c'est long et compliqué, et encore plus si on veut évaluer plein de gens de domaines différents, on invente plein d'indices numériques qui permettent d'évaluer à moindre effort les chercheurs. C'est bien sur plein de problèmes, comme comparer Picasso à van Gogh en fonction du nombre de tableaux peints et du prix cumulé qu'ils valent. (Voir discussions chez mysciencework, enroweb, Gaia universitas par exemples.)

Fin juilet, Neil Hall de l'Université de Liverpool, a publié un article parodique (mais dans un vrai journal, Genome Biology) proposant un "index de Kardashian". Apparemment y a quelqu'un de ce nom qui est célèbre pour aucune bonne raison. L'indice est le rapport entre le nombre de citations des articles publiés par un chercheur, et son nombre de suiveurs sur Twitter. Il montre d'abord qu'il y a une corrélation entre les deux nombres :

[caption id="attachment_2413" align="aligncenter" width="393"]figure originale du papier, avec un cercle bleu ajouté pour ma position figure originale du papier, avec un cercle bleu ajouté pour ma position[/caption]

Ensuite il propose que ceux dont le rapport est trop élevé, donc ont trop de suiveurs Twitter par rapport à leurs citations scientifiques, sont "trop célèbres". L'indice doit être calculé en prenant son nombre de citations C qui permet de prédire un nombre de suiveurs Twitter "normal" d'après l'équation de régression de la figure ci-dessus, Fc. On fait ensuite le rapport du vrai nombre de suiveurs, Fa, sur Fc, et on obtient l'indice K. Pour moi ça donne :

















CFcFaK index
629.58741.39

Ouf, les "Kardashian" sont définis au-dessus de 5. C'est bien sur une blague, bien que comme souvent avec l'ironie il y ait eu des réactions au premier degré.

Une meilleure réaction à mon avis a été de noter que dans la figure ci-dessus, le cercle ne correspond pas bien au critère K > 5, et donc refaire cela proprement (lien). Et puis du coup plein de gens ont proposé d'autres index farfelus sur Twitter : #AlternateScienceMetrics, comme :

Il y a des best of bien sur, notamment j'aime bien celui-ci (voir aussi sur Salon.com).

Tout ça c'est bien beau, mais je me considérerais vraiment célèbre quand le site parodique The Science Web mettra mon nom dans un titre : Dan Graur considers career in science (voir ce billet).

mercredi 13 août 2014

Mieux on connait notre génome, moins il a de gènes pour des protéines, et plus il en a d'autres

[caption id="attachment_2389" align="aligncenter" width="157"]cliquez sur l'image (stripscience !) cliquez sur l'image (stripscience !)[/caption]

Nouvelles de l'équipe qui annote les gènes humains : ils ont tout remis à plat, comme il le font périodiquement, à la lumière des nouvelles données et des nouvelles méthodes ; ceci est la 20ème version. On peut noter que malgré les progrès des outils informatiques, des étapes de vérification manuelle (curation ou annotation, voir aussi ce billet) restent essentielles et représentent une grosse part du travail, pour avoir la meilleure qualité possible des annotations. En d'autres termes, être aussi confiant que possible que l'on a trouvé tous les gènes, et que tout ce qu'on a trouvé est un gène.

Ce qui revient quand même à une question sempiternelle en génétique : qu'est-ce qu'un gène ? Comme une espèce, c'est mal défini, mais pour un travail donné il faut une définition pratique. Gencode annote de l'ADN qui produit un ARN (molécule qui contrairement à l'ADN quitte le noyau cellulaire), soit qui code pour une protéine, soit qui est fonctionnel en lui-même. Quand on dit "gène" d'habitude (genre "combien de gènes communs entre humain et souris ?"), on veut dire ceux qui codent pour des protéines, mais les autres peuvent aussi jouer des rôles importants, certains connus depuis longtemps (ARN ribosomaux ou de transfert), d'autres découverts plus récemment (micro ARN, long ARN non codants).

Qu'est-ce qui a changé ? Comme à chaque mise à jour du compte des gènes humains, le nombre de gènes codant pour des protéines diminue, de 20'345 à 19'942 (rappel : le nombre de 21'000 annoncé en 2003 a été estimé trop bas par beaucoup). L'équipe s'attend à ce que ce nombre descende encore un peu. Par contre, le nombre d'ARN long non codants (lncRNA) augmente, de 13'870 à 14'229. Ce n'est pas dans le billet de Gencode, mais je suis frappé par la différence de nombre de lncRNA annotés pour l'humain et les autres espèces (par exemple comparer l'humain, la souris, et le poisson zèbre). Je doute fort que ce soit tout des créations de gènes spécifiques aux primates, donc soit on a beaucoup de faux positifs chez l'humain, et ce nombre va redescendre, soit il reste beaucoup à découvrir chez les autres, ce qui a une certaine logique vu qu'ils sont moins étudiés.

L'occasion de rappeler la super citation d'Isaac Asimov :
John, when people thought the Earth was flat, they were wrong. When people thought the Earth was spherical, they were wrong. But if you think that thinking the Earth is spherical is just as wrong as thinking the Earth is flat, then your view is wronger than both of them put together.

Notre connaissance du génome humain change, mais pas en errant aléatoirement, en partant d'une approximation grossièrement correcte et en l'affinant.

mardi 12 août 2014

Des complotistes et de l'expertise scientifique (#chemtrails, #OGM, #climat etc)

[caption id="attachment_2404" align="aligncenter" width="312"]cliquez pour lire la BD (et lisez ce beau billet sur cette BD) cliquez sur l'image pour lire la BD (et lisez ce beau billet sur cette BD)[/caption]

Sur son blog Ecologie au Monde, Audrey Garric a écrit un très bon billet sur une théorie du complot franchement bizarre, les chemtrails. L'idée que les trainées d'eau condensée laissés par les avions seraient en fait des épandages de produits (chimiques !) visant à changer le climat, stériliser les gens, favoriser les cultures de Monsanto (jamais bien loin ceux-là on dirait ; mais où sont les francs-maçons ? tout se perd) (ah mais je suis rassuré, il y a un commentaire antisémite), et j'en passe. Pour une fenêtre dans la psychée complotiste non diluée, lisez les commentaires, au 2ème degré c'est assez distrayant (j'ai pas tout lu, on se lasse).

Où est-ce que je veux en venir ? Premièrement, souligner une caractéristique des théories du complot : le nombre de gens impliqués doit croître au fur et à mesure du temps qui passe et du développement de la théorie, ou de la prise en compte des limitations de la théorie d'origine. Or un bon complot a peu de comploteurs, et les chances que des milliers voire des millions de personnes disparates (généralement de pays, religions, opinions politiques, etc, différentes) participent toutes à un même complot sans qu'aucun de dévoile le pot aux roses, preuves à l'appui, est largement négligeable. Pour les chemtrails, on doit embrigader toutes les companies d'aviation civile, les armées de l'air de différents pays, les services de maintenance au sol, selon les variantes les personnels et dirigeants des companies pétrolières, etc.

C'est pareil pour toutes les théories du complot. Plus le temps passe, plus des gens raisonables et informés refusent de confirmer, plus ils doivent eux aussi être dans le complot. Ainsi, tout scientifique qui constate, comme Anne Glover (conseillère scientifique à la commission européenne, voir billet d'hier), et comme très récemment le physicien et grand vulgarisateur américain Neil deGrasse Tyson (information sur un site anti-créationiste pour le fun), que les OGM ne sont pas particulièrement dangereux, doit faire partie du complot Monsantiste (voir commentaires gratinés sur Neil deGrasse sur ce blog de généticien des plantes). Pareil pour le changement climatique, vous voyez un peu le nombre d'étudiants de thèse et de master à corrompre tous les ans ? (Attention, je ne dis pas qu'une erreur honnête ne peut pas concerner toute une communauté. On parle bien de complots ici.) Dans le cas de Neil deGrasse, il faut accepter en plus qu'il ait pris l'argent des industriels de droite sur les OGM, en le refusant sur le climat, mais pourquoi pas (voir ici).

Le deuxième point, c'est que les commentaires délirants sur le blog d'Audrey Garric, c'est ce que l'on obtient lorsque l'on baisse les barrières de la rationalité et de la demande raisonnée d'évidence. Tous ceux qui rejettent l'expertise scientifique pour une cause ou une autre, sur les OGM, le climat (voir ce billet), les vaccins (voir excellent Podcast science avec Nima de chez Sham), l'origine de l'humanité (retournez lire l'excellent blog Panda's thumb), doivent se demander quels critères il leur reste pour rejeter l'irrationalité des autres. Comment nier l'évidence sur les OGM mais l'accepter sur le climat ? Comment refuser les vaccins mais rejetter les chemtrails ? Le seul critère est-il ce qui vous plaît ou vous est expédient à un moment donné ? (Voir ce tweet post-moderniste en réaction à mon billet d'hier.)

Alors c'est facile de se moquer des conspirations qui ne vous plaisent pas, mais il faut être vigilant à ne pas accepter par paresse intellectuelle les conspirations qui nous attirent ou nous arrangent.

lundi 11 août 2014

Des ONG dont Greenpeace ne semblent pas vouloir d'une politique européenne scientifiquement fondée sur les #OGM

[caption id="attachment_2381" align="aligncenter" width="253"]cliquez sur l'image cliquez sur l'image[/caption]

Il y a un peu plus de deux semaines, j'ai écrit un billet rapide sur une lettre ouverte d'ONG environmentales, dont la plus célèbre est Greenpeace, demandant la suppression du poste de conseiller scientifique à la commission européenne. Depuis, il y a eu quelques réactions à mon billet, des développements dans les médias anglophones, et pour ce que j'en vois aucune couverture dans les médias francophones. Je vais essayer de revenir sur ces développements ici.

D'abord retour sur le contexte : la lettre demandant la suppression du poste cite un seul dossier, celui des OGM. Sur les OGM justement, Greenpeace a un historique de déformation et de citation partielle et biaisée de la recherche scientifique. La recherche scientifique montre que les OGM ne posent pas des risques de santé particuliers, et quand risques environnementaux il y a ils ne semblent pas spécifiques des OGM, et ne justifient pas par exemple une opposition sans nuances à toute solution incluant des OGM (voir exemple du riz doré dans ce billet). De même, l'alarme sur des risques de contamination comme si les OGM étaient radioactifs ou empoisonnés n'ont aucune base factuelle (voir discussion sur le miel, par exemple ce billet).

Autre élément important, la conseillère scientifique sortante, Anne Glover, a soutenu clairement un rapport scientifique rapportant ce que la recherche scientifique montre, que les OGM ne présentent pas de risques particuliers et peuvent parfois être utiles. Ce soutien (voir ici sur euractiv.fr) au travail des scientifiques et aux conclusions basées sur la recherche lui a valu bien sur d'être classée comme vendue aux lobbies. Par exemple corporateeurope.org dit que c'était juste "son opinion personnelle", qu'elle a eu tort de donner. Non, elle a soutenu un rapport d'académies scientifiques, ce n'est pas dur à comprendre quand même.

Au vu de tous ces éléments, et de la lettre elle-même, il est très difficile de ne pas conclure que les ONG signataires ne veulent pas d'un éclairage scientifique sur les discussions politiques concernant les OGM, et que c'est ce qui motive leur demande de suppression du poste. Il s'agit bien d'une demande de diminution de l'information scientifique dans le processus de décision européen.

Alors pour beaucoup ces ONG ne peuvent par principe ne faire que du bien. Je pense que les intentions des membres des ONG en question sont en effet en général bonnes, mais les faits sont les faits, et si on repousse la science, l'empiricisme et la rigueur expérimentale et méthodologique, alors les bonnes intentions ne sauvent pas de dire de très grosses bétises, et le cas échéant ces bétises vous entraînent à des actions inutiles voire destructrices. Je suis frappé dans les réactions par le crédit donné à Greenpeace, et par le peu d'écho que cette affaire a dans les médias francophones. Si un ensemble d'industriels avait écrit la même lettre, en remplaçant "OGM" par "changement climatique", j'ai le sentiment qu'on aurait eu une floraison d'articles défendant le poste de conseiller scientifique contre ces méchants lobbies. (Pour mon point de vue sur la question plus large, voir le billet "Pourquoi est-ce que l’étude Seralini sur les OGM m’énerve ?".)

Ensuite, la lettre de défense du poste de conseiller (que j'ai signé) a été portée notamment par Sense about science. Après vérification, je ne vois pas de support pour les suggestions d'Enro en commentaire que cette association serait suspecte (merci à NLN pour son commentaire instructif aussi). D'ailleurs la lettre a acquis les signatures de nombreuses associations scientifiques majeures, dont l'assocation des académies scientifiques (y a un biais vers des associations de biologie et biotechnologie, vu le sujet).

Il y a comme souvent une excellent couverture dans The Guardian. Il faut dire que Anne Glover est britanique, ça motive. Dans l'article "War of letters", on apprend que des associations scientifiques prestigieuses ont signé la lettre de Sense about science, et qu'il y a une autre lettre de soutien au poste de conseiller scientifique, par des organisations majeures de soutien de la recherche biomédicale. Ca vaut le coup de les citer, ce sont des acteurs très importants de la recherche, et des associations à but non lucratif, pas des grosses pharma, et certainement pas des outils de lobbies agro-chimiques :

Cancer Research UK, Alzheimer’s Research UK, Association of Medical Research Charities, Wellcome Trust, Patients' Network for Medical Research and Health (EGAN), NHS Europe office, Arthritis Research UK, International Brain Tumour Alliance – IBTA, Clinical Research Policy and Campaigns Advisor – Parkinson’s UK.

Et je cite :
Paul Nurse, president of the Royal Society, commented: "There will always be those who attack the messenger because they do not like the message but when that message is backed up by the scientific evidence, politicians should be smart enough to listen to the independent scientific experts."

On remarque dans l'article et ailleurs une certaine tendance à faire marche arrière de Greenpeace, en disant qu'en fait ce qu'ils veulent c'est une réforme du poste. Bin fallait le dire. Votre lettre, elle est courte et claire, et elle demande la suppression du poste. Ca ressemble plutôt à du contrôle d'erreur de communication qu'à un malentendu sincère à mon avis.

Y a un autre article dans The Guardian, qui commence par un parallèle provocateur entre la suppression du poste de conseiller scientifique à la Maison Blanche par Nixon, et la demande des ces ONG anti-OGM :
The European NGOs calling for the abolishment of the chief scientific adviser, which include Greenpeace, are taking a page right out of Nixon's playbook. Don’t like the science advice you are getting? Then fire your science adviser. Or better yet, abolish the position altogether so that you’ll never need to hear unwelcome advice in the future.

Mais l'article fait ensuite une analyse intéressante des tensions inhérentes à de tels postes de conseillers, et propose des pistes d'amélioration.

Ce billet est déjà très long, donc je reviendrais par ailleurs sur l'interpellation qui m'a été adressée sur Twitter concernant les perturbateurs endocriniens :


Par contre je ne pense pas revenir sur le commentaire étrange de Martin Pigeon de corporateeurope.org ; je n'arrive pas à voir ce qu'il veut dire, à part démontrer qu'il écrit comme un politicien. Je ne suis pas toujours d'accord avec Wackes Seppi (ni avec personne d'ailleurs), mais "gloubiboulga de commentaire" me parait un bon résumé.

Mise à jour de novembre : le poste a bien été supprimé.

vendredi 8 août 2014

Redif : Le Muséum #MNHN est bien mais nous montre une classification pré-moléculaire et erronée des mammifères

Tiens c'est l'été, je vais rediffuser des billets de mon ancien blog. Après celui sur les statistiques et celui sur le peer review, un compte-rendu un peu polémique d'une visite au Muséum d'histoire naturelle de Paris (billet d'origine sur le vieux blog).

[caption id="attachment_2364" align="aligncenter" width="164"]Cliquez sur l'image Cliquez sur l'image[/caption]

Récemment j'ai visité la grande galerie de l'évolution du Muséum national d'histoire naturelle (MNHN). L'expo est très bien faite, pour les enfants et pour les adultes, et contient plein d'infos scientifiques pertinentes. En plus ils font un excellent boulot d'expliquer clairement des concepts compliqués, comme la génétique ou la notion d'espèce. Mais voilà, je suis un chieur scientifique, alors voici mon ralâge.

Une des notions essentielles en biologie évolutive, et plus généralement pour comprendre le monde vivant, est la phylogénie, ou arbre des espèces. D'ailleurs ils expliquent cela très bien avec un arbre tout simple et mignon (vous ne trouvez pas ça mignon ?) :

[caption id="" align="alignnone" width="960"] Cet arbre simple est correct, c'est cool[/caption]

Cet arbre a plusieurs avantages. L'un, c'est qu'il montre des espèces bien distinctes, dont les relations ne font pas débat. Un autre c'est qu'il permet bien d'expliquer ce qu'est un arbre évolutif : les branchements de l'arbre montrent comment les espèces ont divergé les unes des autres au cours de l'évolution, avec en bas le temps ancien de l'origine des animaux, et en haut les espèces modernes (oui un vers de terre c'est moderne, oui monsieur, oui madame, une étoile de mer aussi, parfaitement). Donc en lisant du haut en bas on voit que les branches lient ensemble d'abord les espèces les plus proches (deux mammifères, un minou-oïde et un humanoïde), puis un peu moins proches (trois vertébrés), puis de moins en moins proches (l'étoile de mer, un deutérostome comme vous et moi), puis enfin des espèces qui n'ont en commun que d'être des animaux (c'est pas mal déjà remarquez). Un troisième avantage de cet arbre, c'est qu'il est illustré par le type d'évidence que l'on utilise pour reconstruire de tels arbres évolutifs.

A savoir que les deux mammifères, qui sont aussi les deux seuls tétrapodes de l'arbre, sont regroupés par le fait d'avoir des membres de tétrapode, et les trois vertébrés (qui sont tous des vertébrés à mâchoire, contrairement aux lamproies par exemple) sont regroupés par le fait d'avoir un crâne avec une mâchoire. Dans ces deux cas, le type d'évidence est morphologique : on observe qu'un ensemble d'espèces partagent des structures morphologiques, qui ne sont pas partagées par les autres espèces ; la façon la plus simple d'expliquer cela est que ces structures ont été héritées d'un ancêtre commun, et que donc ces espèces sont apparentées de manière plus proche entre elles qu'avec les autres espèces. Il y a plusieurs avantages à cette approche, et plusieurs désavantages.

L'avantage principal, c'est qu'on a des fossiles pour les structures morphologiques, donc on peut dans une certaine mesure dater les caractères, et tester les hypothèses d'ancêtres communs.

Les désavantages sont plus nombreux à mon avis. Premièrement, la reconnaissance et la classification de chaque caractère morphologique est quelque part subjective : la mâchoire, c'est un caractère ou plusieurs ? Deuxièmement, la morphologie peut évoluer de manière convergente. Dans les cas évidents, c'est ... bin évident, comme par exemple ailes de chauves-souris et d'oiseaux. Mais la forme des dents a été beaucoup utilisée pour classifier les mammifères, alors que des expériences ces 10 dernières années montrent que, sous l'influence d'un petit nombre de gènes, les dents peuvent changer très vite ("vite" pour un biologiste évolutif c'est cent mille ans, je dis ça comme ça), et aboutir à des formes convergentes qui trompent les meilleurs paléontologues. Troisièmement, il n'y a pas toujours de caractères morphologiques qui distinguent et regroupent les espèces qui nous intéressent.

(Je peux être biaisé, parce que je fais de l'évolution moléculaire (donc pas morphologique), mais force est de constater que l'ensemble du domaine bouge depuis 20 ans dans la direction d'une importance moindre de l'évidence morphologique.)

Alors l'autre type d'évidence montré dans l'image ci-dessus, c'est l'évidence moléculaire, venant des gènes, des protéines, ou du génome. (On m'avait fait remarquer dans les commentaires du billet d'origine que tel que c'est dessiné on croirait que animaux deutérostomiens ont en commun d'avoir de l'ADN, par rapport aux vers qui n'en auraient pas, ce qui est faux.) En première approximation, les espèces qui partagent un ancêtre commun récent ont des gènes qui se ressemblent davantage que les espèces qui partagent un ancêtre commun plus ancien. Il y a plein d'avantages à utiliser les gènes ; le désavantage c'est qu'on ne peut pas utiliser les fossiles. Premier avantage, c'est qu'on a des critères objectifs pour les identifier et les comparer. Deuxième, comme ils sont tous composés des mêmes éléments de base, on peut faire des modèles statistiques élaborés, et aller au-delà du simple "ce qui se ressemble s'assemble". Troisième, des gènes y en a plein et dans tous les êtres vivants, donc on peut accumuler assez de données pour résoudre les relations de presque n'importe quel groupe d'organismes. Par exemple ci-dessus, trouver la relation entre vertébrés, étoile de mer, et vers de terre, pour lesquels les caractères morphologiques à comparer ne se bousculent pas (et induisent en erreur, c'est une autre histoire).

Donc tout ça pour dire que l'arbre suivant, c'est une honte :

[caption id="" align="alignnone" width="960"] Cet arbre des mammifères m'offense profondément[/caption]

Cet arbre des mammifères m'offense profondément

Ce que montre cet arbre, c'est les relations entre mammifères telles qu'elles étaient comprises en 1991, juste avant que les données moléculaires (les gènes) et les méthodes statistiques / bioinformatiques ne révolutionnent tout le domaine. Durant toutes les années 1990 il y a eu beaucoup de débats sur cet arbre, et il me paraitrait normal qu'en 1994 on n'ait pas voulu mettre en avant des résultats nouveaux et controversés, dont certains se sont d'ailleurs révélés faux. Mais quand même, depuis 2001, il y a consensus sur le fait que les données moléculaires ont montré, entre autres, que les cétacés (baleines et autres) font partie des artiodactyles (bestioles à sabots), plus précisément comme cousins des hippopotames ; que rongeurs et lagomorphes (lapin-oïdes) sont proches cousins des primates ; que les insectivores sont un groupe erroné ; ou que les périssodactyles (chevaux et autres) sont cousins des carnivores.

L'arbre des mammifères a beaucoup fait débat, parce qu'on a beaucoup de données morphologiques et fossiles, étudiées par beaucoup de gens depuis longtemps, et que les relations entre les grands groupes ("ordres", les groupes cités ci-dessus) ne sont vraiment pas évidentes. Autant grouper les bestioles qui ont des pattes c'est facile, autant comment ordonner une souris, une baleine, et un chien ? Et aussi parce qu'il faut bien le dire, les relations pas évidentes en morphologie étaient souvent pas évidentes en génétique non plus. Mais, voir ci-dessus, avec plus de données et de meilleurs modèles, on y est arrivé. C'est très clair, très bien soutenu, et confirmé par plein d'autres études depuis, y compris de nouvelles découvertes fossiles.

Un point intéressant à noter, c'est que dans le débat des années 1990, les défenseurs de l'orthodoxie morphologique contre les petits morveux moléculaires et bioinformatiques étaient en grande partie concentrés dans les grands muséums d'histoire naturelle.

Et donc, je trouve que plus de 10 ans après la conclusion de cette grande aventure scientifique, les aimables collègues du muséum de Paris pourraient faire l'effort de présenter un arbre des mammifères à jour dans leur grande galerie. Merci de votre attention.

Ce billet était parti pour être court. Sa longueur tend à indiquer que le sujet sur lequel on a fait sa thèse vous tient toujours à coeur, quelques années plus tard. :-)

(Les images sont des photos que j'ai prises en visitant le Muséum, c'est pour ça qu'elles sont moches.)

lundi 4 août 2014

Redif : Diversité du peer review

Tiens c'est l'été, je vais rediffuser des billets de mon ancien blog. Après celui sur les statistiques, une explication des différentes formes de l'expertise par les pairs pour publication scientifique (peer review) (billet d'origine sur le vieux blog). Je l'ai un peu mis à jour.

http://www.dailymotion.com/video/xhkjxc_les-trompettes-de-la-renommee_music

Je me suis rendu compte lors d'une discussion sur Futura-Sciences, que la façon dont la publication scientifique fonctionne n'est pas claire pour beaucoup de personnes hors de notre tour d'ivoire. Voici donc un petit tour d'horizon, du point de vue d'un bioinformaticien.

Le modèle le plus classique est celui du journal spécialisé visant une certaine qualité. Les étapes sont alors les suivantes :

  1. Le manuscrit est reçu par un éditeur, qui est un spécialiste du domaine. Celui-ci juge s'il s'agit du type d'articles que son journal publie (domaine adéquat, écrit en anglais scientifique compréhensible). Si non, tcho. Si oui, étape suivante. Selon les journaux, entre 5% et plus de 50% des articles peuvent être rejetés à cette étape. Surtout que nombre d'éditeurs incluent dans leurs critères que le manuscrit promet de résoudre une question suffisamment importante pour leur super-duper-journal.

  2. L'éditeur choisit des experts, auxquels il envoie le manuscrit, sans masquer les auteurs. Les experts renvoient des rapports sur la qualité du manuscrit et son adéquation au journal.

  3. L'éditeur se base sur les rapports de experts pour prendre une décision. En général, le choix est : accepté tel quel (rare), accepté après changements mineurs (les experts n'auront pas besoin de re-juger), changements majeurs demandés (les experts devront rejuger, ça peut encore être accepté ou refusé après cela), ou rejeté.

  4. Les auteurs reçoivent la décision de l'éditeur accompagné des rapports anonymes des experts. Ils peuvent faire appel.


Plein de problèmes, dont le plus évident est l'asymmétrie entre les experts qui connaissent les auteurs (ce qui peut biaiser leur jugement), et les auteurs qui ne connaissent pas les experts (qui peuvent donc être salauds sans risque). Je suis personnellement favorable au double anonymat, mais c'est très rare que ce soit fait. Autre problème, l'éditeur est finalement seul maître à bord (un peu comme un arbitre dans un stade), et s'il est injuste ou incompétent c'est dommage. Heureusement il existe plein de journaux scientifiques spécialisés, donc généralement à ce niveau-là on peut s'en sortir.

Première variante, le journal méga-super-connu, typiquement Nature ou Science. A toutes les étapes, une évaluation de l'importance de la contribution est plus importante que la qualité du travail lui-même. C'est un peu la première page du Monde. C'est bien si c'est correct, mais il faut aussi que ça intéresse beaucoup de monde tout en respectant l'image plus ou moins sérieuse du journal. Le problème, c'est que les critères sont très discutables. De plus, les problèmes classiques sont amplifiés par l'importance qu'une publication dans ces journaux peut avoir pour une carrière, et le niveau de compétition correspondant. Finalement, une grosse différence est que les éditeurs sont des professionnels qui ont généralement une formation scientifique, mais ne travaillent pas comme chercheurs depuis des années. Alors que les éditeurs des journaux de spécialité sont censés être les meilleurs dans leur domaine, ceux-ci sont plutôt des personnes qui changé de métier parce qu'elles n'aimaient pas la carrière de chercheur.

Ces deux variantes existent depuis longtemps, mais avec Internet d'autres apparaissent.

D'abord, ArXiv, dont on a déjà parlé. Pas d'experts, et des éditeurs qui s'assurent juste que c'est plus ou moins scientifique. Le problème, c'est qu'on n'a aucun critère de qualité. Le bon grain et l'ivraie se couchent avec l'agneau et le lion. Ou quelque chose comme ça.

Ensuite, Biology Direct. Les auteurs reçoivent les rapports des experts non anonymes. Ce sont les auteurs qui décident de la suite à donner (changements ou pas, publier ou pas). Si les auteurs décident de publier, c'est fait, accompagné des commentaires (toujours non anonymes) des experts. Une idée qui paraît attirante, mais marche très mal en pratique. Les bons auteurs auront des scrupules à publier leur papier, les mauvais, non. Les chercheurs connus feront des critiques fortes, les chercheurs en début de carrière seront beaucoup plus hésitants.

Un modèle qui a un très fort succès, exemplifié par PLoS One, est de supprimer totalement les critères de pertinence et de significativité de l'avancée scientifique (depuis le billet d'origine, je suis devenu éditeur et j'en ai reparlé sur le blog, par exemple ici). Tout ce qui est correct et n'est pas totalement redondant avec des résultats précédemment publiés doit être publié. PLoS One est devenu le journal qui publie le plus d'articles scientifique par an, et a notamment une bonne réputation en recherche médicale. Curieusement, de nombreux collègues restent persuadés qu'il n'y a pas d'experts (il y en a, pareil que dans la formule classique), et que c'est un journal poubelle. C'est vrai que beaucoup d'articles de faible intérêt y sont publiés, mais aussi de très bons articles, parfois parce les auteurs voulaient publier vite sans s'embéter à se battre avec les éditeurs de grands journaux, parfois parce qu'il n'existait pas de journal de spécialité correspondant (pour de la recherche interdisciplinaire).

Un modèle récent est celui de Frontiers, une nouvelle série de journaux sur internet. Les experts et les auteurs dialoguent à travers un système anonyme, jusqu'à trouver un accord sur la publication ou pas de l'article, éventuellement après modifications. Cela rappelle un système qui existe pour certaines conférences d'informatique, mais où ce sont seulement les experts qui doivent discuter entre eux, de manière non anynome ; ça évite au moins l'éditeur seul maître après Dieu (et quand on connaît le rôle de Dieu en science...).

Après ce tour d'horizon des mille et une recettes, qui vous valent à coup sûr les honneurs des gazettes...

Remarque intéressante lue dans les commentaires de Slashdot :
The peer review process isn't about catching fabricated data, but about editorial quality. It may not be obvious that the two are different, but they are. 

L'expertise ne vise pas à déterminer les données falsifiées, mais à vérifier la qualité éditoriale. La différence peut paraître minime, mais elle existe.

En effet, les experts sauf accident (genre les données ont l'air très suspectes) doivent donner le bénéfice du doute aux auteurs, et supposer que le travail a été fait honnêtement. La question principale est donc de savoir si le travail a été fait de manière compétente ou non. La fraude peut être détectée, mais rarement par l'expertise par les pairs.