vendredi 26 avril 2013

ADN de Big Foot : comment être critique de la pseudo-science sans être méprisant ?

[caption id="attachment_999" align="aligncenter" width="300"]Cliquez sur l'image Cliquez sur l'image[/caption]

J'ai été contacté récemment pour donner mon avis sur le séquençage d'ADN de Big Foot (ou Sasquatch), le "yéti" nord américain. A l'époque où ce "résultat" avait été "publié" je n'avais pas réagi, vu qu'il était suffisamment couvert à mon avis sur Le bLoug et sur Strange Stuff and Funky Things.

Les guillemets un peu lourds ci-dessus, c'est parce que les auteurs ont écrit un article très bizarre, mal écrit, avec des vidéos et photos type Men in Black / X-files comme évidence à coté des information d'ADN, lequel ADN semble être un mélange d'humain et d'autres animaux. Les méthodes utilisées ont été de collecter des échantillons de poils auprès de personnes convaincues d'avoir Big Foot dans leur jardin ou leur bois. L'article ayant été suprenemment rejeté dans tous les journaux scientifiques contactés (de l'utilité de l'expertise par les pairs), les auteurs ont créé leur "journal", qui est une page web moche qui fait très amateur, et qui ne contient qu'un article, le leur.

Ah et évidemment l'ADN qu'ils ont séquencé n'est pas publiquement disponible, officiellement parce que l'espèce Big Foot n'existe pas déjà dans les banques de données d'ADN. C'est vrai quoi, c'est pas comme s'ils avaient crée l'espèce Denisova quand il y avait besoin. Ah si. Donc article bizarrement écrit, site web étrange et créé exprès, données non disponibles. Pour soutenir des résultats hautement improbables. Pas de raisons de se méfier.

Sérieusement, le problème qui se pose à moi, c'est comment critiquer un truc pareil sans paraître hautain et méprisant ? Je dois déjà avoir échoué dans ce billet. L'argument "ça se voit à 100 km que c'est des conneries" ne sera pas très porteur auprés des personnes qui ont envie de croire qu'il y a quelque chose de vrai dans ces histoires, je le sens bien. Pourtant ça va être la réponse de tout scientifique qui jette un coup d'oeil à cette histoire. Démonter les résultats est une perte de temps manifeste, à la fois parce que c'est passer du temps à montrer qu'un truc clairement faux est faux, et parce que les partisans du complot fans de Big Foot, Yéti et Monstre du Loch Ness ne seront jamais convaincus.

On revient à un problème discuté à propos de Séralini (qui est un modèle de science comparé aux guignols dont il est question ici) : beaucoup de gens pensent que les scientifiques ont peur des résultats nouveaux et les écrasent ou les cachent, alors qu'on adore les résultats nouveaux. On est juste très stringeant quand il s'agit de les accepter. "Exceptional claims need exceptional evidence". Si vous avez trouvé une espèce d'hominidé vivant à coté des humains sans être découverte depuis des millénaires, il faut nous le prouver, et une vidéo d'une couverture agitée hors champ (voir ici - cette vidéo est vraiment dans l'article) ça va pas le faire.

Il me semble qu'on a ici un problème de communication auquel je n'ai pas de solution.

vendredi 19 avril 2013

Du génome au badome et au-delà

[caption id="attachment_976" align="aligncenter" width="294"]Cliquez pour la BD complète, qui n'a rien à voir à part d'inclure des noms ridicules Cliquez pour la BD complète, qui n'a rien à voir à part d'inclure des noms ridicules[/caption]

Suite au succès du séquençage et de l'étude des génomes, les biologistes se sont mis à inventer plein de mots se terminant en "ome" pour faire dans le vent. Un "ome", c'est l'ensemble de quelque chose, comme le génome est l'ensemble des gènes... tiens non, mais c'est pas grave. Et l'étude de l'ensemble de quelque chose, c'est en "omique", comme la génomique.

Il y a en a des plus ou moins justifiés, et cette mode en amuse certains et en énerve d'autres.

Parmi les justifiés, quasi patinés par l'age et le temps, on peut noter l'ancêtre, protéome, attesté dès 1995 dans ce papier, et dans un titre dans celui-ci peu après : l'ensemble des protéines présentes dans une cellule (ou un organe, ou un compartiment cellulaire). Et le suivant, qui de mon point de vue a réellement lancé la mode, transcriptome, d'un papier qui a eu un énorme impact, la première caractérisation systématique des ARN (transcrits, qui transfèrent l'information du gène à la cellule).

Pour les plus ridicules, on peut voir Jonathan Eisen, inventeur lui-même du terme "phylogénomique" pour l'étude de plein de phylogénies (histoires évolutives) de gènes, qui a tenu pendant un moment un registre des pires "omes" ("Bad ome"). Même s'il ne met pas à jour, on peut constater la longévité du concept de "badome" sur Twitter.

Nature a fait un bon article sur le sujet, où ils proposent notamment des règles concernant les bon ou mauvais "omes" :

























GoodomeBadome
Encapsulates a new focus(Interactome: all interactions between biomolecules)Renames existing field(Nutriome: study of nutrients)
Refers to a comprehensive collection(Transcriptome: everything transcribed from DNA to RNA)Limited in scope(Museome: sequenced DNA from objects in museum archives)
Easy to say(Phenome: comprehensive physical characteristics of an organism)Unpronounceable(tRNome: collection of transfer RNAs)
Easy to understand(Lipidome: all an organism’s fatty molecules)Obscure(Predatasome: genes used by predatory proteobacteria while invading other bacteria)

J'ai repensé à ceci parce que j'étais récemment à une conférence, et Max Haeussler, un gars qui fait du text mining (trouver l'information pertinente automatiquement dans plein de textes, en l'occurence d'articles de biologie) a présenté pour s'amuser la liste des "omics" les plus fréquents trouvés dans sa collection d'articles de biologie (quasi exhaustive). Y en a des bizarres. Profitez !

[caption id="attachment_974" align="aligncenter" width="300"]Omes. Diapo de Max Haeussler. Originellement tweeté avec sa permission.[/caption]

 

lundi 15 avril 2013

La grosse expérience, la carte et l'aventure, trois types de "Big Science"

[caption id="attachment_939" align="aligncenter" width="300"]Cliquez sur l'image Cliquez sur l'image[/caption]

Deuxième billet sur le commentaire de Sean Eddy sur ENCODE et sur les réactions à ENCODE. Le premier était sur le projet génome aléatoire.

Ce deuxième billet est sur une classification que Sean propose des projets de "Big Science", ces gros projets scientifiques qui mobilisent de nombreuses équipes et de nombreux chercheurs et coûtent très cher.

  1. La grosse expérience. En principe pas différent d'une expérience classique, avec une hypothèse à tester, des contrôles positifs (on sait qu'on doit obtenir un signal) et négatifs (on sait qu'on ne doit pas en obtenir), et un plan pour la validation des résultats. La seule différence avec une expérience classique est le coût et l'infrastructure nécessaire. Exemple : les manips pour détecter le boson de Higgs.

  2. La carte. C'est la construction d'une resource commune à beaucoup de groupes et beaucoup de projets, pouvant servir à répondre ou aider à répondre à de nombreuses questions. Mais ça n'est pas en soi le test d'une hypothèse. Décider de faire une telle carte doit être basé sur le rapport coût / bénéfice de retirer cet argent au financement des petits projets, qui d'un côté répondent à des questions scientifiques, et d'une autre construisent de petits morceaux de la carte de manière désordonnée, sans coordination ni standards communs. Si c'est un succès, on a une super resource qui sert à plein de projets, l'exemple typique étant le génome humain (ou les vraies cartes géographiques, très utiles somme toute). Si c'est un échec, on a soit une resource très chère mais peu utilisée, soit une resource mal faite et donc pas utilisable. Pour Sean Eddy, ENCODE est une carte.

  3. L'aventure, ou en traduction litérale le coin (the wedge). Un effort massif vers un objectif arbitraire et très distant, dont le but est d'organiser, améliorer, et démocratiser des technologies. Le génome humain était en même temps ce type d'aventure, de même que de poser un humain sur la lune. Plus proche de nous, les projets "cerveau humain" en Europe et aux USA sont de ce type de grosse science. C'est un succès si de nouvelles technologies et de nouvelles façons de faire de la science en sortent et ont du succès. C'est un échec si ça s'englue dans la bureaucratie d'un gros projet sans fournir ni test d'hypothèse ni resource réutilisable.


A mon avis, ENCODE est en effet une carte. Une carte dont la principale valeur est d'être plus détaillée que la précédente, tout en étant la carte d'un territoire que nous connaissions déjà pour l'essentiel. Au 19ème siècle la France a établi des cartes d'Etat Major très détaillées, plus détaillées que la carte de Cassini du 18ème, ce qui était surement très utile. Mais ils n'ont pas découverte de montagnes, de fleuve ou de villes où on n'en connaissait pas. ENCODE c'est pareil, on connaissait en gros les gènes codants, les gènes non codant, les séquences régulatrices, mais on a gagné en détail. Le problème d'après Sean Eddy (et je suis d'accord), c'est qu'une carte a été vendue (au public mais aussi aux collègues scientifiques) comme un test d'hypothèse, ce que ça n'était pas.

Dan Graur n'est pas d'accord. Il pense que les problèmes méthodologiques d'ENCODE, et notamment l'usage de lignées cellulaires bizarres, le disqualifie comme carte utile. A court terme, je pense qu'il n'a pas tort, mais à moyen terme le consortium est en train de répéter les mêmes expériences sur des échantillons plus normaux de souris, et sur des cellules souches humaines, ce qui promet d'être très utile. De plus, Dan pense que la fonction est une état trop mouvant pour être cartographié, contrairement au génome. En cela, je ne suis pas d'accord avec lui. Il me semble que l'ensemble des fonctions génomiques dans un certain tissu, organe ou état cellulaire est pertinent et utile en tant que resource pour la biologie.

De manière amusante, lorsque j'ai diffusé mon opinion sur Twitter ("IMO, #ENCODE is about improving the map of a largely charted territory #andweneedgoodmaps."), Ewan Birney, coordinateur d'ENCODE, l'a retweeté. Ce qui tend à indiquer qu'il n'est pas totalement en désaccord...

vendredi 12 avril 2013

Le génome aléatoire, un contrôle pour interpréter 15 To de données sur le génome humain

[caption id="attachment_935" align="aligncenter" width="168"]Cliquez sur l'image Cliquez sur l'image (lien corrigé)[/caption]

Il y a un nouveau papier de commentaire sur ENCODE qui est sorti, qui est court mais contient plusieurs points intéressants, donc je vais le discuter dans deux billets, dont ceci est le premier.

Comme discuté précédemment (voir ici et ici), ENCODE est un énorme consortium d'expériences pour déterminer l'activité et la fonction du génome humain. Les résultats d'ENCODE et surtout la manière dont ils ont été rapportés ont fait débat, parce qu'ils ont rapporté comme fonctionnel tout morceau d'ADN avec une activité biochimique mesurable de manière reproductible. Or il est possible (et selon beaucoup, probable) que de l'ADN qui n'a aucune fonction particulière dans l'organisme ait une activité biochimique reproductible.

Dans ce papier, Sean Eddy propose une expérience de contrôle conceptuellement simple :
To clarify what noise means, I propose the Random Genome Project. Suppose we put a few million bases of entirely random synthetic DNA into a human cell, and do an ENCODE project on it. Will it be reproducibly transcribed into mRNA-like transcripts, reproducibly bound by DNA-binding proteins, and reproducibly wrapped around histones marked by specific chromatin modifications? I think yes.

L'idée est effectivement simple : l'activité biochimique d'ADN aléatoire artificiel dans le même contexte cellulaire qu'ENCODE nous donne une mesure du bruit de fond de ces expériences. Une cellule est pleine d'enzyme modifiant l'ADN, de protéines liant l'ADN, et d'enzymes modifiant les protéines liées à l'ADN. Elles vont forcément interagir avec certains morceaux d'ADN aléatoire, pour deux raisons : certains sites d'interaction spécifiques seront dans cet ADN par hasard (de nombreux sites reconnus sont courts) ; et la spécificité des interactions n'est jamais parfaite, c'est une question d'équilibre chimique de liaisons faibles. Un facteur spécifique de ACGT fixera ACGT plus fréquemment que AGGT, mais fixera AGGT avec une certaine fréquence ... mesurable et reproductible.

Une fois une telle expérience faite, seul l'excès d'activité mesurée par rapport à ce contrôle devrait être interprété comme ayant une pertinence biologique potentielle.

Une remarque importante de Sean : dans cet ADN aléatoire il y aura surement des morceaux qui non seulement auront une activité mesurable importante, mais dont la délétion provoquerait un effet notable (un phénotype). Parce que même si cet ADN a été introduit sans aucune fonction ni prévue artificiellement ni sélectionnée naturellement, de fixer un facteur le rend moins disponible pour d'autres régions, d'ouvrir l'ADN rend les régions proches plus faciles à ouvrir aussi, etc. Ceci pose un problème important lorsque l'on sait que la mesure considérée la plus rigoureuse et "finale" pour prouver une fonction est exactement de trouver un phénotype après délétion (ou autre pertubation majeure).

A noter qu'il faudrait tester cet ADN aléatoire dans tous les types de cellules testés par ailleurs, parce que le bruit de fond sera spécifique des protéines présentes dans ces cellules.

A noter aussi que cette expérience reste très minimale, parce que notre ADN contient plein de morceaux possiblement (probablement ?) inutiles mais pas aléatoires du tout. Par exemple quand un morceau d'ADN égoïste qui parasite notre génome (un transposon) se casse la gueule, on a : une ancienne "fonction" qui n'a jamais servi la cellule ou l'organisme, un morceau d'ADN qui n'a même plus cette fonction, et pourtant un morceau d'ADN qui a toute la structure et la plupart des séquences spécifiques pour fonctionner (si votre voiture ne marche plus elle ne devient pas un blob de métal et de plastique, elle garde la plupart des caractéristiques d'une voiture).

Finalement, pour s'amuser un peu, lire la réaction outragée de Dan Graur à ce que Sean Eddy rejette dos-à-dos ENCODE et la critique de Dan.

vendredi 5 avril 2013

Comment trouver de l'information scientifique ? Evolution de l'hibernation par exemple

[caption id="attachment_924" align="aligncenter" width="199"]hypersomnie Cliquez sur l'image[/caption]

L'autre jour mon fils de 5 ans m'a demandé pourquoi nous n'hibernions pas. M'en étant échappé par une pirouette, je me suis rendu compte que je ne sais pas grand chose sur l'évolution de l'hibernation : quand est-ce apparu ? combien de fois indépendemment ? Connait-on les pressions sélectives qui le motivent (bin y a rien à bouffer en hiver je suppose) et les contraintes qui l'empêchent (pas assez de réserves de gras pour passer l'hiver ?) ? A priori les mammifères hibernent et les oiseaux migrent, est-ce vrai ? Général aux animaux qui bougent facilement ou pas ?


J'ai décidé de blogger ma recherche de réponses (au moment où j'écris ces lignes, je ne sais pas si je vais en trouver), pour illustrer la manière dont on peut trouver des réponses scientifiques pertinentes sur internet. Je précise que je ne me connecte pas via l'université, donc je n'aurais accès qu'aux mêmes resources que tout un chacun.

Première étape : Wikipedia anglophone. A de très rares exceptions près, bien plus utile pour la science que Wikipedia francophone. Ma recherche me montre qu'il n'y a pas de page sur l'évolution de l'hibernation, mais on va aller voir la page hibernation. Avant ça, on remarque des trucs intéressants dans les résultats de recherche, comme des mentions d'hibernation d'insectes et de poissons, et un lien vers la page thermorégulation qu'on va aussi ouvrir pour voir.

Bon la page hibernation ne nous avance pas des tonnes, sinon clarifier quelques définitions. Important, l'hibernation au sens strict semble limitée aux animaux endothermes, c'est-à-dire à sang chaud (homéotherme et endotherme sont différents, mais au niveau où on discute aujourd'hui on ne va pas chipoter). On apprend aussi qu'il y a débat sur le phénomène de réveils périodiques au cours de l'hibernation, bien que les références ne soient pas super récentes (la plus récente est de 2002). Le paragraphe hibernation de la page thermorégulation ne m'avance pas, passons.

Deuxième étape : Google scholar. Bien qu'ils n'en fassent pas tellement la pub, Google scan tout se qui ressemble à un article scientifique, le classe, et permet de le chercher. Les désavantages : aucun contrôle sur le fait que ça soit réellement des articles légitimes ou de la pseudo-science formattée pareil, de la confusion entre brouillons archivés et articles finaux, et surtout les résultats peuvent juste être vus à l'écran, pas exportés et retraités de diverses manières ; désavantages légers pour ce qui nous préoccupe aujourd'hui. Avantages : rapide, gratuit, classification des résultats par un mélange date, nombre de citations et pertinence des termes de recherche dans l'article (dans le titre c'est mieux que perdu dans l'article), liens vers des versions non officielles gratuites des articles (genre sur la page perso du chercheur), correction des erreurs d'orthographe ou des différences anglais américain / britannique dans votre requête, à la Google. Bref, c'est trop cool, on y va.

Plein de résultats. Alors ma tactique c'est d'ouvrir quelques-uns des articles qui ont l'air intéressants dans de nouveaux onglets, puis de restreindre la recherche aux années récentes en cliquant à gauche sur "since 2009", j'ouvre à nouveau quelques articles dans des onglets, je restreint "since 2012", je recommence, et je regarde ce qu'on a obtenu.

Dans le résumé d'un article de 1998 on apprends quelques trucs intéressants qui posent des bases sur la question :


  • Il y avait une hypothèse que la torpeur (c'est bien d'avoir gardé la page Wikipedia ouverte pour vérifier les définitions de ce genre de termes) était un état ancestral chez les mammifères, mais ce point de vue ne semble pas très soutenu. Il n'en reste pas moins que la torpeur se fait de manière similaire chez divers mammifères.

  • La torpeur serait peut-être ancestrale, mais dans un rôle lié à l'absence de sang chaud (? bizarre). L'homéothermie serait une absence de torpeur. (Donc l'hibernation serait une résurgence de l'hétérothermie ? à creuser.)

  • Chez les oiseaux, contrairement aux mammifères, la torpeur se trouve dans des groupes ayant émergé récemment. (Ouh-là, cette discussion de groupes "anciens" et "nouveaux" me fait met la puce à l'oreille sur le fait que cet article ne soit pas très solide du point de vue biologie évolutive.) Les traits les plus liés à la torpeur semblent la dépendance à des sources de nourriture instables et la taille.

  • Il est possible que la torpeur quotidienne et l'hibernation soient deux types de torpeur ayant évolué de manière indépendante, et ayant convergé vers des mécanismes physiologiques similaires.





Un article de livre (de 2000) pose aussi quelques questions intéressantes, en partant de l'exemple des echidnés, des cousins des ornithorynques. Les auteurs pensent que l'hibernation et la torpeur sont ancestraux aux mammifères, et semblent approuver de l'hypothèse que la torpeur et l'hibernation (on a au moins appris que ces deux concepts sont liés !) soient un retour vers l'état pré-homéotherme. En regardant le contenu de l'article, en partie disponible sur Google Books, on va sauter la partie spécifique aux echidnés, et arriver à la discussion plus générale. Les auteurs suggèrent que l'hibernation puisse évoluer graduellement comme un moyen de conserver de l'énergie quand il fait frais, pas forcément comme une grosse adaptation à l'absence dramatique de nourriture style marmotte en haut des Alpes. Ils pensent aussi que l'évidence soutient plutôt l'hypothèse que l'hibernation provienne d'un état ancestral, et ne soit pas une série d'inventions convergentes dans différents groupes. L'argument le plus fort étant la similarité entre mammifères placentaires, marsupiaux et monotrêmes.

J'arrive à un article beaucoup plus récent, de 2012. Deux phrases intéressante dans le résumé :
(...) hibernation is part of a specific “slow-paced” mammalian life-history tactic that is associated with increased survival, retarded physiological aging, increased maximum longevity, low rates of fecundity, and long generation times. We argue that these traits can be explained if the primary function of hibernation—at least in many species—is the reduction of extrinsic mortality risks, namely predation, under environmental conditions that are not life-threatening, but do not favor reproduction.

Leur théorie est que l'hibernation sert essentiellement à éviter les prédateurs quand il y a peu de nouriture disponible. En gros, éveillé vous avez un équilibre risque (prédateurs) - bénéfices (nouriture) ; quand le bénéfice devient trop faible, c'est déséquilibré en faveur du risque, et il vaut mieux roupiller. Il faut les prédictions suivantes :

  1. La survie devrait être beaucoup plus élevée en hibernation qu'en période d'activité.

  2. L'hibernation devrait être plus fréquente chez les petits animaux, davantage victimes de prédateurs.

  3. Les hibernateurs doivent avoir des espérances de vie plus élevées, parce que la théorie prédit que ça ne vaut le coup d'investir dans un alongement de l'espérance de vie que si on a une mortalité relativement faible du départ.

  4. L'espérance de vie devrait être la plus longue parmi les animaux combinant hibernation et autres formes d'évitement de la prédation, genre armure.


Les points 3 et 4 me paraissent difficiles à tester de manière rigoureuse, mais comme je n'ai pas accès au papier en Open Access, je ne sais pas ce qu'ils ont fait.Un bon indice est un papier un an plus ancien des mêmes auteurs, où ils disent, et je cite :
As predicted, we found an effect of hibernation on the relationships between life history attributes and body mass: small hibernating mammals generally have longer maximum life spans (50% greater for a 50 g species), reproduce at slower rates, mature at older ages and have longer generation times compared with similar-sized non-hibernators. In accordance with evolutionary theories, however, hibernating species do not have longer life spans than non-hibernators with similar survival rates, nor do they have lower reproductive rates than non-hibernators with similar maximum life spans. Thus, our combined results suggest that (i) hibernation is associated with high rates of overwinter and annual survival, and (ii) an increase in survival in hibernating species is linked with the coevolution of traits indicative of relatively slow life histories

Donc ils trouvent des corrélations qui vont dans le sens qu'ils attendent, même si une corrélation ne fait pas une preuve (je dis ça, j'en publie plein). Intéressant quand même. Leurs résultats ne font peut-être pas l'unanimité, je vois qu'un autre papier récent nous dit qu'on manque de données empiriques sur l'hibernation, et que franchement on ne sais pas grand chose.

En conclusions :

  • On comprend moins bien l'évolution de l'hibernation que je ne l'aurais cru.

  • Dans les choses que l'on sait, de manière surprenante pour moi, l'hibernation semble être une réversion vers l'état ancestral "sang froid", et les mécanismes de l'hibernation et de la torpeur seraient grosso-modo les mêmes.

  • On peut trouver plein d'informations fiables et intéressantes sur internet, si on sait où regarder et si on lit l'anglais.


Mon conseil pour la prochaine fois que vous vous posez une question de science : mettez Google scholar dans vos signets web, et partez à l'aventure.