jeudi 1 décembre 2016

Moi qui vous cause, je parle d'open access en vidéo

cc-by-ac-dc-men-s-t-shirtVendredi 11 novembre il y avait une conférence sur l'open access à l'Université de Genève, où l'on m'avait demandé de présenter "le point de vue du chercheur". Après discussion avec les organisateurs, j'ai décidé de donner un point de vue assez subjectif, en insistant sur les méconceptions fréquentes sur l'open access, et sur les aspects pratiques et moraux pour les chercheurs.

Mon live-tweet de la conférence : hashtag #OAunige.

Ma présentation a été filmée, et la voilà :

[caption id="attachment_3321" align="aligncenter" width="300"]En cliquant vous arriverez sur la page avec la vidéo, le embed fourni ne semble pas marcher En cliquant vous arriverez sur la page avec la vidéo, le embed fourni ne semble pas marcher[/caption]

Mes diapositives sur slideshare.

Si vous ne connaissez pas l'open access, j'ai écrit plusieurs fois dessus dans ce blog : mot clé politique de publication, et notamment ici une interview au magazine de mon université, et ici un article d'opinion dans Le Temps. En bref, open access c'est quand les articles écrits (gratuitement) par les chercheurs payés par les contribuables et donateurs sont disponibles gratuitement et réutilisables. Le contraire, "toll access" (expression que j'ai apprise pendant cette conférence et que j'ai bien aimé), c'est quand on donne l'entièreté des droits de vendre et contrôler notre labeur à des éditeurs, et qu'on doit payer des abonnements chers pour le lire.

(J'ai parfois écrit "libre accès", mais je vois que tous les francophones autour de moi utilisent "open access", dont acte.)

De nombreux malentendus sur l'open access semblent dus à ce que c'est un modèle relativement récent. Donc même si quelques journaux (comme Nucleic Acids Research) sont passé du toll access à l'open access, en général les journaux anciens sont en toll access, et les journaux en open access sont récents. D'où confusion avec d'autres caractéristiques corrélées à l'age des journaux : réputation, professionnalisme, etc. C'est un thème sur lequel je reviens plusieurs fois dans la conférence et dans la discussion suivante.

L'autre thème récurrent c'est que le choix de l'open access comprend des aspects pratiques, de coût, de visibilité, mais c'est aussi et surtout une question morale : tout le monde devrait avoir accès aux résultats de la recherche publique. Ce qui n'est pas sans lien avec mon billet d'hier sur les tribunes de chercheurs d'ailleurs.

 

mercredi 30 novembre 2016

Publier des tribunes de chercheurs sous abonnement payant : pourquoi ?

Petit échange Twitter récent :


Si vous cliquez sur les liens vous pouvez lire toute la discussion. Je suis généralement pour la publication libre d'accès (open access) de toute la litérature scientifique. Mais je trouve particulièrement choquants les cas de tribunes ou bilans de la recherche explicitement à destination du public ou des décideurs, ou les concernant directement, qui sont cachés par des abonnements payants parce que... que quoi en fait ? Les auteurs pensaient que ces publications avaient davantage de prestige, donc ils seraient davantage écoutés ? Ou peut-être (probablement dans mon expérience limitée) que les auteurs ne se sont pas posés la question.

Alors sans abonnement au Monde vous ne pouvez pas lire la tribune sur les perturbateurs endocriniens. D'après Martin Clavey, les auteurs pourraient la publier ailleurs, mais (1) ils ne semblent pas l'avoir fait encore (ou mon Google-fu me trahit), (2) la version largement visible est celle du Monde, et (3) mais pourquoi ne pas l'avoir publiée visible d'emblée ? Et dans bien des cas, cette option n'existe pas.

Mise à jour : la version anglaise est librement disponible (et le copyright n'est pas clair pour moi).

Est également sorti récemment un article faisant le bilan de ce que l'on sait sur les menaces sur les pollinisateurs et les conséquences s'en suivant. Très important, non accessible sans abonnement à Nature, et non copiable ailleurs car "© 2016 Macmillan Publishers Limited, part of Springer Nature. All rights reserved". Eh oui, un aspect peu discuté du libre accès par rapport à la publication traditionnelle "toll access" est que le copyright en "open access" reste aux auteurs sous Creative Commons, alors que dans le modèle traditionnel il va aux éditeurs (qui n'ont pas écrit et ne payent pas les auteurs, eh non) qui bloquent tout et font comme ils ont envie.

Un autre exemple récent : deux articles très intéressants sur la perception par le public, les décideurs et la communauté scientifique du problème des espèces invasives, The Rise of Invasive Species Denialism et Invasion Biology: Specific Problems and Possible Solutions. Tous les deux fermés derrière abonnement chez Elsevier, "© 2016 Elsevier Ltd. All rights reserved". :-(

Alors si vous pensez que votre science est importante, rendez-la disponible ! Et ne signez pas de transferts de copyright !

Réactions sur Twitter, cliquez sur la date du tweet et déroulez le fil :

vendredi 25 novembre 2016

Commentaire sur "Vaccins : l’exception française en débat" chez {Sciences2}

Il y a un billet très intéressant sur la défiance énorme, irrationnelle et dangereuse des français envers les vaccins, sur le très bon blog {Sciences2} de Sylvestre Huet.

Pour des raisons que je ne m'explique pas, mes commentaires sur ce blog ne passent jamais, donc voici le commentaire que j'avais écrit ce matin (qui ne fait sens qu'après lecture du billet de M. Huet) :

Au-delà de l'influence des "médecines" alternatives, il me semble qu'il y a un courant plus large de défiance envers les scientifiques et de sacralisation du naturel, y compris dans une partie de l'agriculture "bio" et sa communication, l'opposition à de la recherche en génétique, etc. Des journalistes (pas M. Huet heureusement) peuvent-ils attaquer le consensus scientifique sur les OGM ou prétendre qu'un pesticide "naturel" n'est pas un pesticide, puis ne pas avoir une part de responsabilité dans la confusion générale, y compris sur les vaccins ?

jeudi 17 novembre 2016

Plus loin de l'Afrique, plus de mutations délétères mais moins de variabilité génétique humaine

L'humanité (Homo sapiens) vient d'Afrique sub-saharienne. Il y a environ 50'000 ans certains humains sont sortis d'Afrique et leurs descendants se sont dispersés un peu partout dans le monde, voir carte ci-dessous.

[caption id="attachment_3290" align="aligncenter" width="697"]Dispersion de Homo sapiens ces dernières 50'000 ans. Points colorés : échantillons utilisés dans l'article que dont il est question plus bas. Dispersion de Homo sapiens ces dernières 50'000 ans. Points colorés : échantillons utilisés dans l'article que dont il est question plus bas.[/caption]

Une question intéressante, et qui nous ramène à la question de la pertinence de la classification des humains en "races", est l'effet de cette histoire sur la diversité génétique humaine.

Pour bien comprendre ce qui va suivre, quelques éléments de génétique des populations :

Premièrement, une mutation peut avoir un effet bénéfique (super rare, améliorer un truc en le modifiant au hasard), négatif (casser un truc qui marche c'est facile), ou neutre (aucun effet, très fréquent dans les génomes d'animaux ou de plantes). Voir ce billet pour les types de sélection naturelle correspondant aux deux premiers ; les mutations neutres ne sont pas soumises à la sélection naturelle.

Deuxièmement, plus une population est grande, plus la sélection naturelle est puissante. Cette observation simple a de grandes conséquences. Lorsque la population est plus petite, la sélection naturelle est moins puissante. Alors une mutation qui a un effet faiblement négatif ne sera pas éliminée, et se comportera comme si elle était neutre. Il s'agit d'un effet continu : plus la population est petite, plus une mutation devra être grave pour être éliminée, plus de mutations se comporteront comme si elles étaient neutres.

Ca se corse et ça devient intéressant : lorsqu'il y a expansion par migration (comme lors de la sortie de certains humains d'Afrique), le groupe qui part est un sous-ensemble de la population globale. Donc déjà du départ il n'emporte pas toute la variabilité génétique. Si je prends 100 parisiens au hasard j'aurais moins de diversité (génétique, de noms de famille, de goûts vestimentaires) que dans tout Paris. Si quelques milliers d'humains sont partis d'Afrique, ils avaient moins de diversité qu'il n'y en avait dans l'humanité en Afrique. Et ces migrants, étant peu nombreux, formaient une petite population. Donc sélection naturelle faible, faible élimination de mutations délétères. Et ce phénomène se reproduit au fur et à mesure des étapes suivantes d'expansion de l'espèce : ceux qui vont plus loin sont toujours un sous-ensemble ayant perdu de la diversité de départ et ayant du mal à éviter les mutations délétères.

Est-ce que l'on observe bien cela ? C'est l'objet d'un article publié en janvier 2016 :
Henn et al 2016 Distance from sub-Saharan Africa predicts mutational load in diverse human genomes PNAS 113: E440-E449

Première figure : le taux de variabilité génétique dans les 7 populations échantillonnées sur la carte ci-dessus (les couleurs correspondent) :

[caption id="attachment_3296" align="aligncenter" width="291"]Hétérozygotie de 7 populations humaines, classées selon leur distance à l'origine africaine de l'espèce Hétérozygotie de 7 populations humaines, classées selon leur distance à l'origine africaine de l'espèce[/caption]

Que voit-on ? Le plus de variabilité génétique dans les populations descendantes des humains jamais partis du lieu d'origine de l'espèce. Et de moins en moins de variabilité génétique lorsque l'on s'éloigne de l'Afrique, pour arriver à un minimum en Amérique (il s'agit de descendants des amérindiens arrivés par le détroit de Béring), au plus loin de l'Afrique en marche à pied.

Deuxième figure, pareil mais en ne montrant que les mutations qui sont probablement délétères (ici on suppose que de l'ADN généralement conservé entre primates est probablement important, donc le modifier est probablement délétère) :

[caption id="attachment_3298" align="aligncenter" width="245"]Fréquence des mutations délétères dans 7 populations humaines Fréquence des mutations délétères dans 7 populations humaines, classées selon leur distance à l'origine africaine de l'espèce[/caption]

Que voit-on ? Plus on s'éloigne de l'Afrique, plus on a de mutations délétères accumulées, comme attendu. Plus en détail, on a :

[caption id="attachment_3299" align="aligncenter" width="500"]Pareil que la figure précédente, mais en trois catégories : peu délétères, moyennement, et très délétères. Pareil que la figure précédente, mais en trois catégories : peu délétères, moyennement, et très délétères.[/caption]

On voit que pour les mutations un peu mauvaises (à gauche et au milieu), l'effet de la distance à l'Afrique est très fort, avec un de plus un saut entre africains et les autres. Alors que pour les mutations très mauvaises (à droite), il y a un effet de la sortie d'Afrique, mais faible, et pas d'effet mesurable des migrations suivantes. On peut penser que la plupart de ces mutations très mauvaises sont éliminées même avec une population assez petite.

Conclusions : (1) la diversité de l'espèce humaine est en Afrique sub-saharienne ; (2) ce qui distingue le plus les humains hors d'Afrique sub-saharienne (y inclut tous les blancs et asiatiques) des africains (donc la plupart des noirs), ce sont des mutations à effet négatif, qui font que nous sommes moins aptes génétiquement (je dis nous parce que c'est mon cas, ne vous sentez pas visé si vous avez la chance d'être africain).

lundi 7 novembre 2016

A propos de races humaines et de tolérance au lactose

Nous parlions récemment (avant d'être déraillé par le débat OGM, comme d'hab) de tolérance au lactose chez certains humains : mutations au hasard ? et état normal = maladie.

Dans ce dernier billet, je m’étonnai de ce qu'un résultat de génétique de quelques populations humaines soit labellisé "African" et un autre "Finnish" (finois) sur un site d'information officiel américan, alors que dans l'étude originale les groupes ethniques africains concernés étaient bien spécifiés. Je pense que cela se rattache en partie à la réification (croire qu'un concept est réel) du concept de "races humaines". Pour rappel, j'avais écrit mon premier billet sur ce blog à ce sujet.

Concernant la tolérance au lactose, voici une carte de l'ancien monde avec la fréquence de la tolérance :

[caption id="attachment_3242" align="aligncenter" width="650"]Figure de Itan et al 2010 (cliquez pour l'article) Figure de Itan et al 2010 (cliquez pour l'article)[/caption]

Sur cette carte vous voyez des zones rouge-orange, qui correspondent aux origines des mutations permettant la digestion du lactose chez l'adulte (il y en a plusieurs, indépendantes, à différents endroits). A ces endroit la sélection naturelle a eu le temps d'augmenter la fréquence de la mutation dans la population jusque presque tout le monde (rouge = plus de 90% de la population tolérante). En bleu, les endroits où la mutation n'a pas encore eu le temps d'acquérir une fréquence élevée, car elle doit d'abord arriver par le jeu des migrations et des mariages / reproduction, et elle ne présente un avantage que depuis la domestication des vaches veaux cochons couvées (surtout les premiers), donc pas très longtemps en termes évolutifs.

Voici maintenant une carte des "races humaines" traditionnelles (j'ai pris le premier résultat Wikipedia, mais l'idée générale serait la même avec n'importe quelle carte) :

meyers_b11_s0476a

Est-ce qu'en louchant bien vous arrivez à faire correspondre les couleurs sur ces deux cartes ? Parce que moi, non. Et pourtant.

Le site d'information cité précédemment est une collection d'articles médicaux sur l'intolérance au lactose, et ils classifient tout le temps les gens en groupes raciaux socialement reconnus, dont "African Americans", pour lesquels on attribue les différences à l'origine génétique "africaine". Par exemple :
Frequency of Lactose Intolerance in Adults in Various Populations








































Location% Lactose Intolerant Adults
Asians, US90–100
Ibo, Yoruba, Africa90
Inuits, Greenland85
Southern Italians71
African Americans65
Caucasians, US21
British, UK6
Danes3

ou encore :
Lactose intolerance is estimated to affect 25% of the American population.
Group prevalence is as follows:
—  15% (6% to 19%) – whites
—  53% – Mexican Americans
—  62% to 100% – Native Americans
—  80% –  African Americans
—  90% –  Asian Americans

et :
Within the United States, 80–90% of African Americans, 95–100% of Native Americans, 80–90% of Asian Americans, and 50–55% of Latinos may be lactose intolerant.

En regardant ces chiffres, il est naturel de penser que les différences de tolérance au lactose sont structurées selon les "races" traditionnelles, et que notamment les africains / africains-américains ne digèrent pas le lactose. Pourtant ce n'est pas ce que l'on voit sur la première carte, qui représente les vraies données.

Plusieurs choses contribuent à cette incohérence. Premièrement, et la génétique de la lactase, et la classification en "races", suivent la géographie. On a donc un problème classique de corrélation erronée due à un facteur confondant : si A est corrélé à la géographie et que B est corrélé à la géographie, alors A et B apparaîtront corrélés. C'est pour ça que le choix de la carte des "races" n'est pas important : toute division arbitraire mais géographiquement organisée arrivera à ce type de résultat. Je suis sur qu'on trouverait des différences de tolérance au lactose entre religions, entre groupes linguistiques, etc.

Deuxièmement, on échantillonne souvent très mal la diversité humaine. Donc si je ne mesure la tolérance au lactose que dans une petite partie de l'Afrique, je peux tomber sur une région avec forte tolérance, ou forte intolérance, au lactose. Et c'est là où ça devient raciste, c'est à quelle région ou groupe humain allez-vous généraliser votre résultat. Si vous êtes d'origine européenne, vous êtes probablement sensible à la différence entre régions et pays, peut-être même savez-vous que les finnois ne sont pas scandinaves. Mais il est probable que vous ayez une idée assez vague de la diversité africaine, et qu'il soit tentant de labelliser un résultat d'une région africaine en "Afrique". C'est compliqué dans le cas des africains-américains par le fait que les traites négrières ont préférentiellement pris les gens de certaines régions (et même ethnies) pour les emmener de force en Amérique (excellente visualisation ici) ; donc les africains-américains ne portent pas la diversité génétique africaine.

Pourquoi est-ce important ? D'un point de vue pratique, la recherche et la pratique médicales américaines sont très organisées autour de ces catégories, et cela peut mener à mal estimer les risques pour des groupes en fait très hétérogènes, même si dans le cas du lactose ce n'est pas très grave probablement. Mais la recherche médicale américaine étant très influente (en gros ils sont les meilleurs, on peut être plus nuancés mais ce n'est pas le lieu), ces catégories se retrouvent reprises par plein d'études où elles ne sont pas pertinentes. (Entre parenthèses, les races sociologiquement définies sont pertinentes aux aspects sociologiques de la pratique médicale, à savoir qui a accès aux soins, à l'instruction, à l'alimentation, etc. Donc bébé, eau du bain, pas jeter.)

Et d'un point de vue plus fondamental, on retrouve régulièrement des arguments du type "les noirs courent plus vite, c'est bien la preuve" (voir ce billet de Curieux2 savoir), ou plus subtils comme les différences de tolérance au lactose, qui utilisent la corrélation entre des différences génétiques géographiquement structurées, et les "races" traditionnellement définies, pour soutenir finalement le bon gros racisme à l'ancienne. Qui n'est pas parti bien loin d'après l'actualité. :-(

En conclusion, ce n'est pas parce qu'en groupant les humains en classes grossières qu'on trouve des différences entre ces paquets, que les paquets sont "vrais" ni même utiles. Quand vous pensez diversité humaine, pensez gradients sur une carte, c'est plus joli et plus vrai que des noms dans un tableau.

(Juste après que j'ai publié ce billet, je vois un billet intéressant sur le blog du statisticien Nate Silver, connu pour ses prédictions concernant les élections américaines :  In An Election Defined By Race, How Do We Define Race?)

jeudi 3 novembre 2016

Quelques liens à propos de l'article du New York Times "GMO promises fall short" #OGM

Vu que tout le monde parle sur Twitter de l'article dans le New York Times “Doubt About the Promised Bounty of Genetically Modified Crops”, voici une petite collection de liens qui le critiquent, preuves à l'appui. En bref, l'article compare des choses ni pertinentes ni comparables et mélange tout.

La meilleure critique à ce jour : The tiresome discussion of initial GMO expectations, par Andrew Kniss (ses sources de financement, avant que vous ne demandiez). Une des figures clé de cette critique :

europeherbicideuse-1024x512

Si on choisit bien son pays de référence, on peut conclure tout et son contraire, ça rappelle un peu les rats de Séralini. ;-)

Ensuite, deux billets de blog de l'excellent Kevin Folta (pour une discussion des financements de Kevin, voir ici et chercher "transparency" dans son blog) : Rehashing a Tired Argument, et Some Actual Yield Data. Dans le premier billet il fait notamment remarquer que les modifications commercialisées ne visaient pas à augmenter les rendements en soi, et qu'on peut pas faire la somme de différents pesticides. C'est comme faire la somme des litres de bière, litres de vodka, et litres de Coca-Cola, et titrer sur la consommation globale de poisons liquides. Dans le deuxième il montre que l'on voit en fait des augmentations de production dans certains cas, mais bien sur l'agriculture c'est compliqué. Exemple :

sugar-beetSur le blog NeuroLogica, moins spécialisé en agronomie mais plutôt sceptique et scientifique en général (en France on dirait zététique je suppose), The Times Gets it Wrong on GMOs.

Nathanael Johnson est un journaliste américain qui, partant d'un point de départ anti-OGM modéré, a cherché à comprendre le sujet et a arrêté d'être anti-OGM. J'en parlais notamment dans ce billet qui avait donné lieu à une longue discussion. Il a aussi critiqué l'article du NY Times, en insistant sur l'inutilité de comparaisons à cette échelle, et il rappelle un point important :
And GMOs really aren’t all associated with industrial farming. The disease-resistant papaya is a wonderful innovation. The insect-resistant eggplant seems to be reducing pesticide use in Bangladesh. This banana, this cassava, and this rice could all truly improve the lives of small farmers if those new crops make it over the technical and political hurdles.

Le bilan de toutes ces critiques ? On ne peut pas parler de pesticides en faisant la somme des kilogrammes de produits très différents, on ne peut pas comparer OGM à non OGM en mélangeant différents types d'OGM, on ne peut pas comparer les chiffres globaux pour des pays de climat, organisation agricole et types de récoltes différents, on ne peut pas juger une technique uniquement sur un chiffre qui n'était même pas l'objectif. Enfin, si, on peut, parce qu'en comparant n'importe quoi à n'importe quoi on va toujours pouvoir obtenir le résultat qui nous arrange, et c'est bien ça le but, non ? Voir cette excellente démonstration par l'absurde (discutée dans ce billet précédent).

Pas une critique spécifique, mais un article a été publié récemment par l'INRA et AgroParisTech qui indique que l'utilisation des pesticides ne diminue en fait pas en France :
Hossarda et al 2016 Lack of evidence for a decrease in synthetic pesticide use on the main arable crops in France Science of The Total Environment 575: 152–161

Finalement, l'auteur de l'article de départ, Danny Hakim, a répondu sur Twitter, mais je n'ai pas vraiment compris en quoi cela constitue une réponse. Voici le premier Tweet, il ne les a pas lié en conversation, mais en allant à son compte on trouve tout :

Mise à jour : voir aussi liens en commentaire. Et n'hésitez pas à en mettre d'autres, de préférence avec une petite explication.

Mise à jour 2 : liste de liens commentés sur la plateforme de blogs de PLOS.

Mise à jour 3 : bon storify / collection de liens; avec notamment cette citation excellente :
I looked at how much money is spent on heating in all of Finland and compared it to how much people in Hawaii spend on heating. Very clearly, people in Finland are worse polluters.

par Alexandre Stein.

Mise à jour 3 : aller-retour très intéressant entre deux figures de la blogosphère scientifique / sceptique :

The Times Gets it Wrong on GMOs par Steven Novella, déjà cité ci-dessus.

GMOs and the skeptic movement, réponse de Massimo Pigliucci, où il dit que les "sceptiques" sont systématiquement pro-OGM à tort.

Massimo Pigliucci Responds on GMOs, réponse de Steven Novella. A mon sens, cette réponse est un des meilleurs billets de blog sur les OGM et le débat associé.

Mise à jour 4 : Could GMO corn be responsible for increasing childrens’ IQ? réponse à l'insinuation dans l'article du NY Times selon augmentation d'herbicides = augmentation de pesticides = augmentation de risques dus aux insecticides (raisonnement glissant assez courant dans les discussions OGM je trouve). En fait les insecticides dangereux ont diminué.

opcorn-1-768x439

Encore une mise à jour : une liste de liens vers des prises de position de sociétés savantes, académies, etc, sur les OGM chez Credible Hulk.

mardi 1 novembre 2016

Pourquoi refuser de débattre avec Stop #OGM ?

pewpollgmo

On vient de m'inviter à participer à un débat sur les OGM en Afrique, dans mon université. Intéressant en principe, bien que l'on puisse se demander pourquoi moi plutôt qu'un spécialiste de la génétique des plantes (par exemple).

Mais au bout de 2 minutes de coup de fil, j'apprends qu'en plus d'une représentante d'agriculture africaine (problème des coups de fil par rapport aux emails : je n'ai pas tous les noms et affiliations notés...) [voir mise à jour en bas de page] [mise à jour : page Facebook officielle], il y aura la présidente de Stop'OGM. Laquelle présidente est politicienne écologiste, je pense qu'il s'agissait d'Isabelle Chevalley (Wikipedia). Après quelques instants d'hésitation, j'ai décliné de participer. Mon interlocuteur, embarrassé, m'apprends que je ne suis pas le premier, et qu'il a bien du mal à trouver un ou une biologiste pour débattre face à Stop'OGM.

J'ai continué à discuter avec lui quelques moments, lui expliquant que si aucun biologiste ne veut débattre, il doit peut-être présenter à l'assistance ce fait et les raisons. A savoir que d'une part il y a un consensus scientifique clair sur beaucoup d'aspects des OGM, et que cette association nie ce consensus. Et d'autre part qu'un "débat" entre une personne dont le métier est de chercher la vérité et une personne dont le métier est de convaincre ne peut qu'être à sens unique. Si elle ment je fais quoi ? Je dis qu'elle ment, et j’apparais arrogant ? Je ne dis rien, et je laisse faire ? Il est clair que l'on peut enchaîner les mensonges et les demi-vérités (cf cette critique récente en anglais d'un article du New York Times [davantage de liens sur cette histoire ici]) beaucoup plus vite que l'on ne peut expliquer en détail en quoi elles sont erronées ("Gish Gallop"), et que l'on peut choisir les mensonges pour être convaincants, alors que les faits avérés et les nuances de méthodes, on ne les choisit pas pour leur pouvoir en débat mais pour leur véracité.

Et en présentant à l'assistance les raisons d'une absence de "débat", il faut avoir le courage de dire que sur les OGM, la situation est à présent aussi asymétrique que sur le changement climatique, l'existence de l'évolution, l'homéopathie ou l'efficacité des vaccins. Et comme vous ne devez pas me prendre au mot, ni prendre personne au mot quelles que soient ses qualifications ou son pouvoir rhétorique, voici quelques liens :

Un débat public n'est pas le moyen de trancher une question scientifique. Et encore moins le moyen de trancher une pseudo-question entre d'une part une position idéologique et d'autre part un consensus scientifique qui gène cette position. (Notez que je n'ai pas dit qui s'y oppose ; si vous voulez interdire les OGM pour raisons esthétiques ou autres, faites, mais si vous niez la science et que vous utilisez des arguments pseudo-scientifiques erronés, alors la science va vous gêner.)

Mise à jour : voici la page web de l'évènement, organisée par SwissAid et foraus.
Avec la participation de:
Aline Zongo, COPAGEN (Coalition pour la protection du patrimoine génétique africain) Burkina Faso
Klaus Ammann, Prof. ém. de biodiversité de l’Université de Berne et ex-directeur du Jardin botanique de Berne
Isabelle Chevalley, conseillère nationale Vert’Libéral, présidente de STOPOGM, Alliance suisse pour une agriculture sans génie génétique
Modération: Catherine Morand, SWISSAID

Donc ils ont trouvé un biologiste, Klaus Amman (Wikipedia germanophone). Je prends les paris si vous assistez au débat : (1) tout se que dira Klaus sera écarté d'office parce qu'il a travaillé avec des compagnies dont – hah ! – Monsanto ; (2) Aline Zongo représente non pas l'agriculture africaine mais l'activisme anti-OGM africain, donc débat plein de nuances en vue.

Et la page Facebook officielle.

Si vous assistez au débat, compte-rendu et point de vue (pro ou anti ou autre) bienvenu dans les commentaires.

lundi 31 octobre 2016

Intolérance au lactose : l'état normal peut-il être appelé une maladie ?

En préparant le billet précédent sur les mutations, j'ai remarqué que l'intolérance au lactose était noté dans Wikipedia francophone comme une pathologie. Je trouve que cela pose la question de ce que l'on classifie comme "pathologie" ou "maladie". L'état commun à tous les mammifères est d'exprimer la lactase (qui digère le lactose) comme bébés, et d'arrêter de l'exprimer quand ils sont sevrés et ne consomment donc plus de lait.

La plupart des humains ont conservé cet état, normal chez les mammifères : 65%  de la population humaine d'après le NIH (institut américain de la recherche médicale ; lien). Il y a deux mutations principales expliquant l'état minoritaire, dans lequel on continue à digérer le lactose du lait après le sevrage.

Parenthèse sur les gènes : parmi les gènes, beaucoup codent pour des protéines. En ce cas, une partie de l'ADN contient l'information codant pour la protéine elle-même, on appelle cela l'ADN "codant". Autour de cet ADN codant, de l'ADN non codant, dont une part ne fait rien (en première approximation), mais aussi une part qui régule le gène. Cet ADN "régulateur" dirige quand et où (dans quels types de cellules – cerveau, intestin, muscle) la protéine est exprimée. Il le fait en permettant de fixer d'autres protéines, régulatrices, mais n'entrons pas dans les détails. Ce qui est important c'est que des mutations peuvent affecter un gène soit en changeant la partie codante, soit la partie régulatrice. Complexité supplémentaire, chez les eucaryotes, dont les humains, la partie codante est souvent découpée en morceaux (exons) interrompus par du non codant (introns), lequel peut être régulateur ou non. Dé plous en plous difficile, une séquence régulatrice d'un gène peut être dans l'intron d'un autre gène.

(Accessoirement, ce genre de bazar c'est ce qu'on attend d'un système fruit de milliards d'années de mutations au hasard, pas d'une intelligence créatrice ; je dis ça pour ceux qui s'émerveillent comme le vivant est bien fait.)

Avec tous ces outils conceptuels, voici les mutations courantes du gène lactase humain :

[caption id="attachment_3195" align="aligncenter" width="665"]Mutations du gène de lactase (cliquez pour la source) Mutations du gène de lactase (cliquez pour la source)[/caption]

Le gène LPH code pour la lactase, les petites boîtes en c sont les exons, le gène voisin MCM6 (que de poésie) a aussi des petites boîtes exons et des introns les séparant, et en d on voit les mutations ("SNP" = single nucleotide polymorphism prononcé "snip" (SNP happens est un de mes t-shirt scientifiques favoris)). A gauche, les mutations dans des introns de MCM6 qui modifient la régulation de la lactase chez des soudanais, kényans ou tanzaniens, à droite celles qui le modifient chez des européens du nord (c'est pas un peu raciste d'écrire "finnois" mais "africains" ci-dessus ? j'espère y revenir dans un prochain billet [c'est fait]).

Donc on a un état à la fois ancestral et majoritaire, et un état minoritaire, mutant disons-le, du à l'une ou l'autre mutation relativement récente (on estime dans les 10'000 ans, pour une échelle la séparation avec Néanderthal c'est environ 600'000 ans).

Et pourtant c'est cet état majoritaire ancestral qui est qualifié de pathologie. Par exemple ici au NIH, ici au Mayo Clinic (gros centre hospitalier privé américain), ici un autre institut du NIH, et en français (rien de l'INSERM, homologue du NIH ?) je trouve AXA prévention ici ou le Figaro Santé ici.

Il me semble que ceci pose des questions intéressantes de ce qui doit être considéré une pathologie. Un collègue à la fois médecin et bioinformaticien me disait récemment avoir soulevé le problème pour la classification informatique des pathologies, en prenant l'exemple de sa calvitie : est-ce simplement un aspect de son apparence, ou une pathologie ? Une partie du problème est que si l'on veut classifier quelque chose dans un cadre médical, alors le concept de pathologie est simple et déjà présent. Un autre aspect est de savoir si un phénotype est gênant : être chauve peut gêner certaines personnes, surtout si cela se déclare dès l'adolescence. Mais pas d'autres. Ne pas digérer le lactose à l'état adulte pose problème si vous êtes dans une société où la plupart des gens le digèrent, et donc il est un composant normal de l'alimentation. Mais si l'absence d'une mutation avantageuse est une maladie, alors toute apparition d'une maladie mutation avantageuse créé-t-elle une maladie correspondante chez ceux qui ne l'ont pas ? Ceux d'entre nous qui ne sont ni tibétains ni andins et ne sommes pas adaptés aux hautes altitudes souffrons-nous de sensibilité à l'altitude ? Est-ce une pathologie touchant 99% des humains ?

Je pose ces questions là, je n'ai pas de réponses.

jeudi 27 octobre 2016

En évolution, les mutations sont au hasard, ça veut dire quoi au hasard ?

peruvian_corn

Un des fondements de la théorie néo-darwinienne de l'évolution par sélection naturelle est que les mutations sont au hasard. L'adaptation des êtres vivants à leur organisme, les yeux qui voient et les enzymes qui digèrent et les ailes qui volent, sont permis par la sélection naturelle qui vient après les mutations.

Ce sont le hasard et la nécessité de Monod : le hasard des mutations, la nécessité de la sélection naturelle.

Que veut dire "les mutations sont au hasard" ?

L'ADN est constitué de 4 bases : A, G, T et A. Au hasard, ça pourrait vouloir dire 1 chance sur 3 d'obtenir chacune des 3 bases possibles lors d'une mutation (pas 1 sur 4 parce que muter de A vers A ce n'est pas muter). Mais si à partir de A on a 1 chance sur 2 de muter vers G et 1 sur 4 pour C et T, n'est-ce plus du hasard ? Si je tire 2 dés et que je fais la somme, je n'ai pas 1 chance sur 11 d'obtenir chacun des nombres possibles (1+1=2 à 6+6=12), mais 1 chance sur 6 d'obtenir 7 et seulement 1 sur 36 d'obtenir 2 ou 12. La somme de deux dés n'est-elle pas du hasard ? Si, elle l'est, simplement la distribution parmi laquelle le résultat est obtenu au hasard n'est pas uniforme (toutes les possibilités ne sont pas égales). De même, les 4 bases n'ont pas la même probabilité d'être obtenues par mutation. Par exemple A et G sont de même type chimique, ce sont des purines, et une mutation A vers G (et réciproquement) est donc plus fréquente qu'une mutation de A vers C ou T.

Un génome humain fait 3,2 milliard de bases. Au hasard, ça pourrait aussi vouloir dire que toutes ces bases ont la même chance de muter à chaque génération. Mais ce n'est à nouveau pas le cas. Par exemple si beaucoup de bases identiques se suivent il y a davantage de chances d'avoir une erreur de rajout ou de perte d'une des bases (AAAAAAA devient AAAAAA ou AAAAAAAA) que pour une séquence plus complexe. Ah oui parce que les mutations ce n'est pas que des remplacements d'une base par une autre, il peut aussi y avoir des gains ou pertes de bases, ou de blocs de millers de bases, des inversions de blocs de bases, etc. Et chacun de ces types de mutation a des probabilités de se produire spécifiques.

Donc, les mutations ne sont pas uniformes.

De plus, strictement parlant, rien n'est au hasard dès que l'on sort de la physique quantique. Le résultat d'un dé est déterminé par la vitesse et l'angle auquel on l'a lancé, sa forme exacte, la surface où il atterri, etc etc. Pourtant non seulement on accepte généralement le résultat d'un dé comme "au hasard", mais un grand nombre de lancés de dés va bien suivre les attentes probabilistes. Sans entrer dans le détail des raisonnements probabilistes ici (notons juste que l'on doit raisonner en probabilités en fonction de notre ignorance de la situation – par exemple des forces agissant sur le dé), une analogie pertinente à l'évolution est que la somme des forces agissant sur le dé, et amenant un résultats ou un autre, ne doit rien aux intentions du joueur qui voudrait obtenir le chiffre le plus élevé possible.

Alors, venons-en au fait. Que veut dire au hasard dans le cadre de la théorie de l'évolution ?

Et bien c'est très simple. Au hasard, ça veut dire que les mutations se produisent indépendamment de leurs effets sur les organismes. Quand un A mute vers un G, la probabilité de cette mutation est indépendante de l'effet de la mutation sur l'organisme. La mutation se produit plus ou moins probablement selon que ce sont toutes deux des purines ou pas, selon que c'est une zone de l'ADN plus ou moins complexe, etc. Elle ne se produit pas plus ou moins probablement selon que l'organisme a besoin de cette mutation ou pas à ce moment. La somme des forces chimiques et physiques agissant sur les mutations est indépendante de l'avantage ou du désavantage sélectif de la mutation.

En termes plus formels, de connaître l'un n'apprend rien sur l'autre : de savoir quelles mutations sont probables ne me dit pas lesquelles sont avantageuses, de savoir quelles mutations sont avantageuses ne me dit pas lesquelles sont probables. Corrélation nulle.

Pourquoi est-ce important ? On ne comprend pas l'évolution du vivant si on ne comprend pas ce rôle central du hasard, et donc en quoi il consiste. On n'a pas une mutation de régulation de lactase permettant de digérer le lait chez les adultes parce qu'on en a besoin quand on élève des vaches. Lorsque l'on élève des vaches, cette mutation devient avantageuses, mais elle se produisait avant l'élevage avec la même fréquence.

vendredi 14 octobre 2016

Si je me remets à bloguer un peu plus, de quoi voulez-vous entendre parler ?

Normalement le lien du tweet vous emmène vers un sondage :

Edit : version Google pour ceux qui ne sont pas sur Twitter :

Loading...

(si embed ne marche pas et il y a écrit "Loading", aller ici : https://docs.google.com/forms/d/e/1FAIpQLSehye-4EufB5aIKfmsMsF9rTKspK8gzHsoomEYFuBA_OB-mNw/viewform)

Et puis si personne ne répond, je vais peut-être faire autre chose. Comme me retirer dans un monastère, démarrer une chaîne YouTube, ou juste tweeter.




Merci pour vos réponses ! Les gagnants (Twitter + Google) sont :



















évolution25 votes
OGM18 votes
statistiques14 votes
génome humain9 votes

Et bien sûr comme suggéré par plusieurs personnes sur Twitter ou dans les commentaires, je vais continuer à écrire sur ce qui me plaît, mais ce petit sondage aide la motivation, notamment pour parler d'évolution.

lundi 10 octobre 2016

Types de sélection naturelle, avec emojis ????

Hé bin, ça fait un moment que je n'ai pas blogué ! J'ai été un peu débordé, et après c'est difficile de reprendre le rythme.

On va redémarrer en douceur avec une illustration rigolote de la sélection naturelle que j'ai vu cet été sur Twitter :

La sélection naturelle, c'est le fait que les individus ont plus ou moins de succès de survie + reproduction et qu'une partie des différences sont dues à des différences génétiques entre eux. Les variants génétiques favorables à davantage de survie + reproduction sont favorisés.

Les émojis ci-dessus illustrent une différence souvent mal comprise entre types de sélection naturelle. Dans le détail :

  • La sélection positive (attention piège : le terme est utilisé dans un sens différent en immunologie) favorise un nouveau variant (généralement un nouveau mutant), donc accélère l'évolution. Dans le cas présenté ci-dessus, une mutation apparaît qui donne des souris aux poils foncés ; c'est avantageux par rapport aux poils clairs (peut-être sont-ils nocturnes) et la mutation s'impose dans l'espèce.

  • La sélection négative (même piège en immuno que ci-dessus) favorise ce qui établi. La même mutation donnant des poils foncés apparaît mais cette fois il est avantageux d'être clair (des souris diurnes dans les dunes de sable). Donc la sélection négative ralentit l'évolution.


Si vous avez pensé "mais comment ça se fait que les souris ne sont pas déjà sombres si elles sont nocturnes ?", vous avez raison. La plupart du temps, les organismes ont déjà fixé les variations fortement avantageuses dans leur environnement, car elles y sont depuis assez longtemps. De plus, la plupart des mutations (parmi celles qui ont un effet) affectent des aspects qui dépendent peu des détails de l'environnement (par exemple reconnaître une hormone comme l’œstrogène commune à tous les animaux vertébrés). Donc : la sélection négative est nettement plus fréquente que la sélection positive. C'est intuitif : modifiez au hasard un truc compliqué qui marche, y a nettement plus de chances de l’abîmer que de l'améliorer.

  • La sélection balancée correspond au cas plus spécial où la sélection naturelle maintien plusieurs variants génétiques en même temps. Alors attention la sélection naturelle n'agit pas pour le bien de l'espèce. Soulignez deux fois en rouge. La sélection naturelle ne peut pas maintenir de la variation du système immunitaire (par exemple) parce que c'est bon pour l'espèce, contrairement à un sélectionneur artificiel s'il était malin. La sélection naturelle agit au niveau des individus. Malgré tout il y a plusieurs mécanismes qui peuvent quand même maintenir cette diversité. Les deux les mieux compris sont (1) l'avantage hétérozygote, quand il est mieux d'avoir deux versions du gène dans un individu (exemple : mieux d'avoir des versions différentes du MHC pour se défendre contre plus de pathogènes), et (2) la sélection dépendant de la fréquence, quand c'est mieux d'être sombre quand il y a beaucoup de clairs, mais mieux d'être clair quand il y a beaucoup de sombres (exemple : mieux de manger une proie que moins de vos congénères mangent).

  • La sélection artificielle c'est grosso-modo de la sélection positive, mais avec un sélectionneur qui sait ce qu'il veut obtenir, et peut sélectionner contre l'intérêt de l'individu. En général ça peut aller très vite.

  • Le dernier point est une blague parce que la sélection disruptive favorise les phénotypes extrêmes, ce qui est généralement représenté comme une courbe bimodale, rappelée par les deux bosses du chameau (cf ici).


En résumé : sélection positive = révolution, sélection négative = conservatisme, sélection balancée = bipartisme. ;-) (Et oui parfois les révolutionnaires deviennent conservateurs, en évolution comme ailleurs...)

jeudi 4 février 2016

Séquençage de virus en temps réel sur le terrain : ça arrive pour Ebola

Fin 2015 je vous ai embêté avec les promesses du séquençage de l'ADN partout tout le temps facile pas cher. Un billet ultra rapide pour dire que ça y est, ça arrive pour de vrai :

Quick et al (centaine de co-auteurs) 2016 Real-time, portable genome sequencing for Ebola surveillance Nature doi:10.1038/nature16996

Je cite, ça vaut le coup :
In April 2015 this system was transported in standard airline luggage to Guinea and used for real-time genomic surveillance of the ongoing epidemic. We present sequence data and analysis of 142 EBOV samples collected during the period March to October 2015. We were able to generate results less than 24 h after receiving an Ebola-positive sample, with the sequencing process taking as little as 15–60 min.

Voilà, on peut amener le séquenceur dans ses bagages, aller sur le terrain, et obtenir des séquences d'ADN permettant d'identifier les souches et les mutations dans les 24h, dont moins d'une heure de séquençage proprement dit.

[caption id="attachment_3137" align="aligncenter" width="266"]en a, les bagages, en d, le labo. voilà. en a, les bagages, en d, le labo. voilà.[/caption]

Pas pour prêcher pour ma paroisse, mais la mise au point d'une bonne méthode bioinformatique a été clé pour que ça soit utile. Avec ça, ils peuvent par exemple tracer l'évolution du virus en temps presque réel :

nature16996-f3

Seule point à noter, dans ce cas leur protocole dépendait du fait qu'ils connaissaient déjà le virus, afin de l'amplifier in vitro. Si ce n'est pas le cas, ça sera possible aussi, mais plus compliqué, car il faudra séquencer de plus petites quantités d'ADN.

jeudi 28 janvier 2016

#Séralini et les #OGM : après la tragédie, la farce

Je ne comptais pas commenter sur le dernier Séralini, mais c'est devenu tellement ridicule que je ne résiste pas. Il a donc publié un "article" qui décrit la mortalité des vaches dans une ferme allemande particulière et l'attribue aux OGM sans aucun élément de preuve. Je ne vais pas dans le détail, pour une fois je vous renvoie à alerte-environnement.

Ce papier m'évoque la citation célèbre de Karl Marx :
Hegel fait remarquer quelque part que, dans l'histoire universelle, les grands faits et les grands personnages se produisent, pour ainsi dire, deux fois. Il a oublié d'ajouter : la première fois comme tragédie, la seconde comme farce.

Donc après la tragédie de 2012 (rappelez-vous, les rats torturés), voici la farce :

  • Le co-auteur de Séralini c'est le fermier qui a accusé le semencier d'être responsable de la mort de ses vaches à l'époque, et qui a été à l'époque débouté par la justice allemande.

  • Le journal est non seulement inconnu au bataillon, mais publié par un éditeur inconnu du Nigéria (il ne faut pas juger là-dessus, mais le Nigéria n'est pas connu pour sa recherche ni son édition), et contient une faute d'orthographe dans son titre : "Scholarly Journal of Agrucultural Science" (ça devrait être "agricultural").

  • L'article commence par cette phrase incroyable "Thus it was not designed as a scientific experiment". Ah bin pour une fois c'est clair. Ceci n'est pas une expérience scientifique. Ni une pipe. Ni rien.

  • Car cerise sur le gateau, le journal bidon a oublié de renouveller son domaine internet le lendemain de la conférence de presse annonçant le résultat. A pus article.


Article et résultat auquels personne ne semble porter attention, ce en quoi tout le monde a bien raison.

C'est triste un naufrage pareil quelque part.

Liens :

  • le site du journal, "This domain name expired" à l'heure où j'écris.

  • un cache webarchive, qui ne contient malheureusement pas le dernier numéro avec l'article en question.

  • une version PDF de l'article sur le site américain GMwatch. Il ne semble pas que Séralini maîtrise l'art de mettre ses publications sur son propre site web (en a-t-il un ? une recherche Google mène au CRIIGEN [oui il a un site pas à jour, voir commentaires]), ou dans un site d'archives gratuites comme biorxiv. (Remarquez l'usage du titre "professeur" jusque dans le nom du PDF ; je remarque souvent un amour des titres chez les tenants des pseudo-sciences.)

  • un commentaire amusé sur un blog scientifique anglophone.

  • la nouvelle de la disparition de l'article sur le site Retraction Watch.


Mise à jour du 2 février : le site est revenu en ligne, et un peu de contexte sur ce "journal" étrange sur le blog de Seppi.

mercredi 27 janvier 2016

Vent de folie dans les journaux scientifiques: 3- CRISPR/Cas édite l'histoire de la génomique

Allez, dernier billet dans la série (1- secte cladistes, 2- parasites de la recherche). A noter que le sujet cette fois a été couvert notemment par Le Monde (je profite de l'occasion pour saluer l'excellence du Monde sciences ces derniers temps - continuez !). Et je n'ai bêtement pas bien gardé tous les liens pertinents, donc il va manquer des trucs.

Or donc, CRISPR/Cas est la technique révolutionnaire qui permet d'éditer les génomes avec précision et puissance, facilement et pour pas cher. Et le 14 janvier, une somité de la génomique mondiale, Eric Lander, a publié :

The Heroes of CRISPR Cell 164: 18–28

Dans cet article, Eric Lander brosse l'histoire de la découverte de cette technique, en disant vouloir mettre en avant les personnes moins reconnues d'habitude. Mais, il y a quelques mais :

  • Mais parmi ces héros méconnus, que des chefs de labos, pas de doctorants ni de postdocs.

  • Mais parmi les héros très généralement connus, deux femmes, Emmanuelle Charpentier (française travaillant en Allemagne) et Jennifer Doudna (Berkeley, Californie), reçoivent nettement moins d'attention que les autres intervenants. C'est curieux, ces deux femmes sont généralement créditées de la découverte de CRISPR/Cas.

  • Mais par contre la troisième personne très connue pour CRISPR/Cas, Feng Zhang (Broad Institute, Massachusetts), a droit à un portrait étendu et flatteur.

  • Mais Eric Lander est directeur du Broad Institute, lequel est en procès avec Berkeley pour un brevet sur CRISPR/Cas, pour savoir qui de Doudna ou de Zhang a la priorité sur l'application aux cellules humaines.


Oups. Du coup, Twitter #LanderGate (depuis le Watergate, tous les scandales sont des truc-gate aux USA).

Commentaires acides de Doudna et Charpentier sur PubMed, la base de données de référence des articles en biologie et médecine (lien) disant que leur travail a été mal représenté et qu'elles n'ont pas été consultées. Plus surprenant, commentaires de George Church, qui travaille aussi au Broad avec Lander, et dit ne pas avoir été suffisamment consulté et qu'il y a de nombreuses erreurs (voir aussi ici). De nombreuses critiques notent que l'article ne signale pas le conflit d'intérêts de Lander, mais il s'avère qu'il l'a signalé au journal qui a décidé de ne pas l'afficher.

Grosse discussion sur le site PubPeer bien sûr, qui discute les articles scientifiques de manière anonyme.

Une analyse intéressante du point de la rédaction historique, qui montre bien comment Lander diminue les rôles de Doudna et Charpentier.

Deux réactions très fortes de chercheurs très connus en génomique (et tous deux connus pour leur peu d'empressement pour la diplomatie) : Michael Eisen écrit que Lander est un super-vilain fascinant, "an evil genius". De manière intéressante, une de ses conclusions c'est qu'il ne devrait pas y avoir de brevet (à noter qu'il est à Berkeley comme Doudna), et je suis assez d'accord dans ce cas-ci. Un brevet ne fera que du tort, et n'a rien à voir dans ce cas avec l'objectif affiché d'encourager l'innovation. Eisen dit aussi (et en commentaire à Cell) qu'il est contre les prix qui mettent trop en avant un petit nombre de personnes, de manière toujours injuste. Lior Pachter insiste sur la manière dont Lander efface les postdocs et doctorants de l'histoire.

Tous deux, et de nombreux autres commentateurs, ironisent sur la carte accompagnant l'article, dans laquelle le monde se réduits aux USA et à l'Europe, et où le code couleur montre bien que la seule avancée déterminante a eu lieu à Boston, lieu du Broad Institute :

[caption id="attachment_3109" align="aligncenter" width="769"]carte telle que publiée carte telle que publiée[/caption]

Exemple de tweet à ce propos :

 

Et lien rigolo tweeté suite à mon teaser plus tôt aujourd'hui :

Cet article a fait couler énormément d'encre électronique, et je n'ai pas le temps d'en faire le tour. Ceci clot donc pour le moment mon petit tour des délires des journaux scientifiques en ce début d'année 2016. :-)

Titre piqué à cet excellent tweet d'Alexis Verger :

Vent de folie dans les journaux scientifiques: 2- halte aux parasites qui osent analyser les données

Après le dogme cladiste issu du fond des ages, un nouvel épisode de "maman j'ai raté le 21ème siècle", avec l'éditorial du New England Journal of Medicine du 21 janvier. Contrairement au journal Cladistics (voir billet précédent), NEJM est très connu et reconnu, l'un des plus prestigieux de la recherche en médecine :

Dan L. Longo, M.D.*, and Jeffrey M. Drazen, M.D.* Data sharing N Engl J Med 2016; 374:276-277
* M.D. = medical doctor, parce que pour les chercheurs en médecine les titres sont souvent importants ; no comment.

Que dit l'éditorial (j'ai mis une version rapidement annotée sur Dropbox ici) ? Après avoir dit quelques mots sur la beauté théorique du partage des données, ça se gâte :
The first concern is that someone not involved in the generation and collection of the data may not understand the choices made in defining the parameters.

Les éditorialistes s'inquiètent de ce que des chercheurs n'ayant pas participé à la collecte des données ne comprennent pas les subtilités de ces données, et donc les interprètent mal. Donc ils pensent que le rapport des méthodes dans les articles, et les informations fournies avec les données, ne suffisent pas à comprendre ce qui a été fait ? C'est très inquiétant. En science, on doit rapporter les choses de manière reproductible (voir débat à propos du code scientifique).

Ca devient pire :
A second concern held by some is that a new class of research person will emerge — people who had nothing to do with the design and execution of the study but use another group’s data for their own ends, possibly stealing from the research productivity planned by the data gatherers, or even use the data to try to disprove what the original investigators had posited.

Et d'une, il risque d'émerger une classe de gens qui volent la productivité des collecteurs de données (noble occupation on le comprend). Enchanté, moi je suis prof de bioinformatique depuis 2005, et je fais ça depuis le milieu des années 1990. Margaret Dayhoff a publié le premier atlas de séquences et structures de protéines en 1965 (pas trouvé de version en ligne), et Grantham et al (conflit d'intérêts : j'ai cosigné des articles avec deux des "et al") ont découvert que différentes espèces utilisaient le code génétique universel de manière subtilement différente en analysant toutes les séquences d'ADN alors disponibles en 1980.

Et de deux, les éditorialistes ont peur que "même" de vils chercheurs utilisent les données des gentils collecteurs de données pour tenter d'invalider les hypothèses de départ. Mais c'est que ça oserait faire de la science ces vauriens ! (Bon, conflit d'intérêt, c'est ce que je fais moi, voir ici en anglais par exemple.)

On arrive à la phrase qui a le plus enflammé les réseaux sociaux des scientifiques :
There is concern among some front-line researchers that the system will be taken over by what some researchers have characterized as “research parasites.”

Ah on est des parasites ? Hop, hashtags Twitter #Iamaresearchparasite, #researchparasites et #researchparasite. Alors, là ça a réagi de partout : le storify.

Soyons justes, l'éditorial propose une solution : quand on veut analyser des données, on doit concevoir une hypothèse non évidente, contacter les auteurs de l'étude d'origine, et établir une fructueuse collaboration entre gens bien nés. Ca n'arrive en effet jamais de manière légitime que l'on veuille analyser les données de centaines d'expériences, que l'on veuille remettre en cause les analyses telles que publiées, ou que l'on veuille analyser des données publiées il y a des années par des personnes parties à la retraite ou ayant arrété de faire de la recherche. Et bien entendu ceux qui génèrent des données intéressantes ont le temps de prendre en compte et répondre de manière appropriée à toutes les demandes qui pourraient leur être faites (génome humain : plus de 18000 citations). Le bioinformaticien Claus Wilke donne sur son blog l'histoire intéressante d'un cas où il a du promettre de co-signer un papier pour avoir les données sur un soit-disant effet du jaune d'oeuf qui serait aussi mauvais pour la santé que le tabac. Ayant eu les données, il a refait l'analyse, trouvé que l'analyse de départ était faussée, et que l'hypothèse ne tenait pas. Les chercheurs en médecine concernés l'ont traité avec mépris, et il n'y a jamais eu de publication. Comme il avait signé de ne pas publier tout seul, ça en est resté là. Voilà le problème de la seule approche "collaborative" bien illustré.

Quelques autres réactions en vrac : Une traduction rigolote en anglais ordinaire. Un point de vue qui contraste cet éditorial avec les déclarations du vice-président américain sur le partage de données pour combattre le cancer. Puis un point de vue d'écologie (la science) discutant comme le partage des données peut en effet être difficile. Et une interprétation de cet éditorial comme le dernier des dinosaures mourants de l'ancienne façon de faire de la recherche bio-médicale.

Et puis c'est pas comme si ce journal avait un problème de reproducibilité des résultats, par exemple s'il avait un taux élevé d'articles rétractés :

[caption id="attachment_3107" align="aligncenter" width="494"]corrélation entre facteur d'impact et taux de rétraction, avec flèche vers le journal que dont il est question ici corrélation entre facteur d'impact et indice de rétraction, avec flèche vers le journal que dont il est question ici[/caption]

Bon 4 jours plus tard ils ont publié un correctif (ce qui montre une fois de plus l'impact des médias sociaux sur la façon de fonctionner de la science, y compris ceux qui se croient à l'abri en haut de la tour d'ivoire). Ils disent qu'ils sont gentils, parce qu'ils ont signé des accords de diffusion des données. D'ailleurs même s'ils trouvent que c'est de mauvais goût, ils vont les respecter. Mais ils réitèrent que c'est légitime de considérer ceux qui analysent les données avec suspicion pour le moins. Et dans un article dans Forbes, l'auteur principal de l'éditorial a refusé de condamner le terme "parasites". Comme dit sur le blog de Mick Watson, ce n'est pas encore des excuses, et c'est insuffisant.

Finalement le mieux qui soit sorti de tout ceci sont les dessins de RedPenBlackPen, qui dessine sur la science :



Vent de folie dans les journaux scientifiques: 1- la secte du Cladisme

Il y a eu récemment plusieurs éditoriaux ou billets d'opinion qui ont eu un certain, euh, écho sur les médias sociaux. Ils diffèrent par bien des points, mais ont en commun un certain aspect "what the fuck?" comme disent élégamment les américains.

Commençons par l'éditorial du journal Cladistics du 12 janvier (lien).  Je l'ai vu via ce tweet :

L'éditorial commence direct :
The epistemological paradigm of this journal is parsimony. There are strong philosophical arguments in support of parsimony versus other methods of phylogenetic inference (e.g. Farris, 1983).

Alors un peu de contexte. Il existe différentes méthodes pour reconstruire des arbres phylogénétiques, à savoir les relations évolutives entre espèces. Jusque dans les années 1960-70 la classification des espèces se faisait de manière très approximative, sans méthode formelle. Dans les années 1970 est apparu un mouvement appelé "cladistique", qui visait à réformer la classification des espèces en la rendant objective, suite à un livre de Willi Hennig (1966 pour l'édition anglaise). Les cladistes proposaient un critère de classification, les relations phylogénétiques. Et comme il n'existait pas de méthode objective pour reconstruire ces relations, et l'objectivité était leur objectif, ils ont aussi proposé une méthode formelle (programmable informatiquement même), dite de "parcimonie" (orthographe discutée ici ;) ). Jusque là tout va bien. Mais dès la fin des années 1970 (1978 pour être précis) Joe Felsenstein a montré que dans certains cas identifiables la parcimonie pouvait se tromper de phylogénie de manière systématique. Ce sont ensuivies deux décénnies de débats entre d'un coté des bio-statisticiens (école dont je suis issu) qui cherchaient les limites des méthodes de phylogénie et les améliorations à y apporter, et de l'autre le groupe proclamant que seul l'usage de la parcimonie fait le vrai "cladiste", pour la plupart issues de musées d'histoire naturelle. Durant ma thèse cette dispute était encore vive, et je me rappelle de discours très agressifs de Guillaume Lecointre fustigeant les fausses phylogénies des statisticiens.

Depuis la plupart des phylogénéticiens sont passés du coté statistique de la force, notamment parce que l'amélioration conjointe des ordinateurs et du séquençage d'ADN fait que nous avons des données bien adaptées au traitement statistique. Et puis quand même une méthode dont on peut montrer qu'elle est juste a quelque chose de préférable à une méthode qu'on aime bien pour des raisons historiques (voir aussi débat dans ce billet).

Et donc l'éditorial de Cladistics, journal de la Hennig society, nous renvoie en arrière vers cette époque, et sans aucune nuance ni aucune leçon apprise. Il commence par dire que ce journal, c'est parcimonie et c'est tout. Il continue dans cette veine :
(...) we do not hold in special esteem any method solely because it is novel or purportedly sophisticated. Phylogenetic data sets submitted to this journal should be analysed using parsimony. If alternative methods are also used and there is no difference among the results, the author should defer to the principles of the Society and present the tree obtained by parsimony.

J'adore "because it is novel or purpotedly sophisticated". Les éditeurs ne se laissent pas impressioner par une méthode juste parce qu'elle est nouvelle (plus récente que 1966) ou soit disant sophistiquée. Ca fait pas du tout vieux barbons.

Plus loin :
we do not consider the hypothetical problem of statistical inconsistency to constitute a philosophical argument for the rejection of parsimony

Les problèmes connus et documentés à répétition depuis 1978 ne les embêtent pas, puisqu'il ne s'agit pas d'un argument philosophique. Bin tiens. Une méthode d'estimation de phylogénie estime la mauvaise phylogénie, mais puisqu'elle est théologiquement philosophiquement pure, gardons-la.

Et une phrase qui a fait se gratter bien des têtes en biologie évolutive :
The absence of certain truth represents a philosophical limit of empirical science.

Euh... oui on ne sait pas toujours tout, mais est-ce une justification pour accepter des méthodes qui se plantent ?

Bref, cet édito a fait rire tout ce qu'internet a de biologistes évolutifs, avec un storify des tweets ici :

https://storify.com/phylogenomics/cladistics-journal-declares-long-live-parsimony

Il faut préciser que perso, faisant de la biologie évolutive, je n'ai plus rencontré ce genre d'attitudes depuis une vingtaine d'années, ce qui tend à indiquer que bien que des gens comme ça existent toujours, ils fréquentent peu les conférences habituelles de biologie évolutive. Je pense qu'ils vont entre eux à la conférence de la Hennig Society (voir à ce propos un compte-rendu rigolo de Dan Graur d'une de ces conférences ainsi que la discussion dans les commentaires).

Que penser de tout ceci ? Que le dogmatisme peut exister dans des sous-cultures de la communauté scientifique ; que ce dogmatisme est battu en brêche dans la communauté scientifique globale ; et qu'internet fait que ce genre d'attitudes s'attire le ridicule généralisé.

A bientôt pour une deuxième histoire d'éditorial étrange. Soyez sages.