vendredi 29 mars 2013

HeLa ! A qui est ce génome ?

En biologie moléculaire, on utilise beaucoup des cultures cellulaires, à savoir qu'on a les cellules dans une boîte de Petri pour étudier la manière dont elles fonctionnent. Mais la plupart de nos cellules ne se laissent pas cultiver facilement, et c'était encore plus vrai avant les progrès récents concernant les cellules souches. Donc on utilise beaucoup des cellules dérivées de tumeurs, qui elles se maintiennent bien en culture.

La lignée probablement la plus célèbre est la lignée HeLa, dérivée d'une tumeur d'une pauvre femme noire dans l'Amérique des années 50, Henrietta Lacks. A l'époque, on n'avait pas jugé bon de lui demander son avis, ni à sa famille. Et les cellules HeLa ont été utilisées, et continuent d'être utilisées, dans un nombre énorme d'études de biologie.

Or deux choses : un, ces cellules, comme toutes les cellules dérivées de tumeur gardées longtemps en culture, ont subi beaucoup de mutations, y compris des très grosses, et leur génome est très différent de celui d'une cellule humaine "normale". Deux, on n'est plus dans l'ère de la biologie moléculaire, mais dans celle de la génomique, donc étudier un génome anormal en faisant comme s'il était normal pose problème.

Donc récemment des chercheurs de l'EMBL (le labo européen de biologie moléculaire) ont publié le génome de HeLa (enfin, un génome, parce que je parie que différentes cultures cellulaires ont différents génomes). Ce qui est très bien d'un point de vue purement de la compréhension de la biologie, parce qu'on peut mettre les expériences précédentes en contexte.

Mais très rapidement, des personnes, au premier chef desquels Jonathan Eisen, ont émis des doutes sur l'aspect éthique du séquençage du génome dérivé de Henrietta Lacks en l'absence de tout consentement éclairé. Deux arguments s'affrontent : on peut considérer que ce génome est tellement dérivé et bizarre par rapport à l'original qu'il n'a plus grand chose à voir avec la famille Lacks ; les cellules HeLa sont une forme de vie à part, pour laquelle un consentement éclairé n'est pas nécessaire. Ou on peut considérer que c'est bien le génome de Henrietta Lacks, même avec des mutations supplémentaires, et qu'il fallait donc un consentement. A cela s'ajoute le fait que Henrietta est morte depuis longtemps, donc c'est à ses petits-enfants qui n'ont que 1/4 de son génome en moyenne qu'il faudrait demander, et l'historique sordide de l'exploitation des cellules sans consentement ni aucune forme de réflexion éthique depuis les années 50. Je n'ai pas le temps d'aller dans tous les aspects du débat en cours, Eisen maintient une excellente liste des réactions en anglais, mais deux points intéressants :

Au blog Genomes Unzipped, ils ont montré qu'à partir des expériences déjà publiées on peut déjà reconstruire beaucoup des variants génétiques d'Henrietta Lacks.

Et ceci pose à nouveau la question posée par le premier génome Aborigène (voir aussi Tom Roud), de savoir à qui appartient l'information dans un génome, sachant qu'il est partagé avec votre famille et de manière plus large les personnes venant de la même région que vous.

vendredi 22 mars 2013

C'est tellement compliqué on ne peut jamais savoir ! Pas de vaccins, pas d'OGM et pas de jus de tomate !

[caption id="attachment_901" align="aligncenter" width="135"]nepas cliquez sur l'image et goutez l'humour suisse[/caption]

Le principe de précaution dans sa forme rationnelle est une réaction qui me paraît tout-à-fait sensée face à un techno-optimisme béat (qui n'a guère plus cours depuis un très bon moment quand même je pense) et face à de potentielles élites ne se préoccupant pas des risques pour la populace (voir discussion sur le test Erin Brokovitch).

Mais ces temps-ci j'ai surtout l'impression d'avoir affaire au principe de au-secours-j'ai-peur-je-comprend-pas-et-je-ne-veux-pas-comprendre. Ce qui est frustrant pour un scientifique dont la passion est de comprendre les choses justement. Et si possible prendre en compte cette compréhension dans le choix raisonné des actions.

Point de départ, deux exemples récents ayant affecté des blogs du C@fé des sciences (discussion aussi chez Sirtin).

En commentaire d'un billet de Sirtin sur les micro-ondes, un certain Nirvan s'inquiète du mouvement des molécules d'eau qu'il/elle ingère dans les aliments réchauffés au micro-onde. En réponse, lien vers l'excellent Podcast science, ainsi qu'une comparaison très raisonable de Nima Yeganefar de l'excellent blog Sham and science sur lequel on va revenir, et que je cite parce que c'est important :
Il est certainement plus risqué de prendre sa voiture pour aller au travail tous les jours (risque mis en évidence scientifiquement, mesuré, connu) que de manger des aliments réchauffés par micro onde (risque hypothétique, jamais mis en évidence, où on ne voit même pas un mécanisme possible).

C'est important parce que nombre des peurs que l'on entend évoquer à propos de techniques diverses n'ont aucun mécanisme envisagé. Par exemple si je vois une grosse bête que je ne connais pas, je peux me méfier, il existe un mécanisme "grosse bête attaque humain" bien connu. Plus technique, si on met au point un médicament pour qu'il affecte ma maladie, ça veut dire que ce produit est actif dans mon organisme, donc il y a un risque d'effets secondaires non déraisonnable. D'où les tests extensifs et très couteux imposés à l'industrie pharmaceutique (mais pas homéopathique parce qu'on sait qu'une pilule de sucre et d'eau ne peut faire ni mal ni bien...), qui conduisent à la non commercialisation de la grande majorité des composés prometteurs. Et il reste que même après un max de tests, il peut y avoir des erreurs, et même quand il n'y a pas erreur, presque tous les médicaments sont dangereux à la mauvaise dose ou en l'absence de pathologie. Donc vente en pharmacie. Mais le mécanisme des micro-ondes on le connaît bien (la physique c'est vachement plus simple que la biologie), et on ne voit pas en quoi ça rend les aliments dangereux en soi (pour ce qui est de chauffer des aliments dans du plastique, c'est une autre affaire - il peut y avoir des risques).

Deuxième histoire sur un blog du C@fé des sciences. Sham and science justement, que je vous recommende dans le genre anti-bétises (et anti-bétise) a écrit un bon billet sur la peur des vaccins et ses conséquences funestes. Ca n'a pas manqué, réaction de militants anti-vaccins ; je vous met un lien vers la réaction de Sham and science, pas vers les imbéciles tueurs d'enfants (vous voulez que j'appelle ça comment des gens qui par méconnaissance active cherchent à empécher les gens de sauver les enfants de maladies mortelles et préventibles ?). Les raisonnement m'intéresse parce qu'il est plus proche de la biologie, et se rapproche aussi de ce que l'on entend sur les OGM, que dont j'ai causé plusieurs fois sur ce blog.

En gros, la biologie ça serait très compliqué (vrai), en équilibre naturel (mouais bof), donc il ne faudrait surtout jamais la pertuber, surtout avec des choses qu'on n'a jamais fait. On voit bien ce raisonnement dans une vidéo de PH Gouyon où il explique que les OGM sont dangereux parce qu'on ne peut jamais savoir ce qui va se passer quand on met un gène dans un nouvel environnement génique. Même si ce gène était dans un autre aliment que vous mangiez, même si le produit de ce gène était déjà dans votre alimentation, là, interaction, paf, on peut pas savoir.

Alors, premièrement, on peut chercher à savoir au lieu de dire "on peut pas". Ca s'appelle la recherche scientifique, et en ce qui concerne les OGM c'est freiné par les arracheurs qui saccagent régulièrement les champs expérimentaux universitaires. Donc si on est empéché de chercher à savoir, c'est sur que c'est dur de savoir. Mais globalement y a des études faites ailleurs qu'en Europe, et y a des gens et du bétail qui mangent des OGM à grande échelle, donc on peut à-peu-près savoir. Pour les vaccins, c'est encore mieux, la recherche se fait sans arrachage et ça fait super longtemps qu'on observe les gens qui se font vacciner (si vous avez des enfants, vous savez qu'ils voient beaucoup le pédiatre au début de leur vie, avant pendant après les vaccins).

Deuxièmement, en ce qui concerne les OGM, on revient toujours au même point, qui est qu'il y en a de toutes sortes. Il y a donc des OGM dans lesquels on a mis dans une variété de riz un gène d'une autre variété de riz. Je pense qu'on a une certaine expérience de ce que ce gène fait dans un contexte (très compliqué je vous l'accorde) de riz. En ce qui concerne les vaccins, on a une très bonne idée de comment fonctionne le système immunitaire. On revient au point sur les médicaments en général : si c'est actif dans votre corps, ça ne peut pas être sans risques. C'est donc une question de coût-bénéfice. Sauver les vies de millions d'enfants et d'adultes tous les ans à coup sûr, contre le risque qu'il y ait peut-être un effet secondaire super rare ou super pas grave (seules possibilités pour qu'on ne l'ait pas encore remarqué) ? J'hésite.

Notez que c'est vrai que la biologie c'est compliqué, et qu'on peut découvrir des choses qu'on ne connaissait pas. Notez aussi que c'est les scientifiques qui les découvrent et les publient et avertissent le public, pas les pseudo-scientifiques conspirationistes. Notez aussi que plus notre connaissance avance, plus les problèmes qu'on découvre ont des chances d'être rares ou peu graves pour pas qu'on les ait vu avant. Ainsi, le mélange du jus de pamplemousse avec certains médicaments provoque des effets secondaires pouvant être graves. On est dans un cas pas hyper fréquent, et décrit dans la litérature scientifique depuis plus de 20 ans, mais il a fallu du temps pour bien vérifier. Un point à relever c'est que le mécanisme en cause est compréhensible, connu, et cohérent avec nos connaissances précédentes : les enzymes P450 sont connues depuis très longtemps pour leur rôle de détoxification qui les poussent à dégrader nos médicaments. Donc les dosages tiennent compte de leur effet et on prend assez de médicament pour en dégrader et encore en avoir. Des populations produisant des formes plus ou moins actives de ces enzymes ont donc besoin de doses différentes de médicaments. Le jus de pamplemousse contient des composés qui sont des inhibiteurs de certaines P450 (au fait, c'est dégueulasse que les principaux articles sur ce sujet de santé publique ne soient pas libre d'accès).

Revenons à l'argument : c'est compliqué, au secours. Je voudrais vous faire remarquer deux choses : un, nous avons tous un génome différent. Non seulement nous avons une combinaison d'allèles hérités de nos parents qui est probablement unique, sauf les vrais jumeaux, mais nous avons chacun une centaine de mutations nouvelles. Deux, chaque individu animal ou plante que nous mangeons, de même (avec moins de variété dans les espèces domestiques, mais d'un autre coté plein de variété dans par exemple les bactéries des fromages). Donc tous les jours vous réalisez dans votre alimentation des mélanges biologiques complexes jamais vu avant. Et vous survivez à la plupart de vos repas ! Waouh. Bon on peut minimiser cela en mangeant tous les repas la même chose très peu variée, mais je prends les paris sur ce qui sera meilleur pour la santé, ça ou un régime varié n'hésitant pas à essayer de nouvelles choses. Sans compter le bénéfice gustatif.

En fait un système peut être complexe mais avoir des comportements robustes, et être en grande partie prédictible. Dire à tout bout de champ "c'est compliqué, faut pas chercher à comprendre, faut rien toucher", ça n'avance pas beaucoup les choses. Reconnaître la complexité (et je vous mets au défi de trouver un biologiste, un médecin, un agronome qui la nie) et travailler avec, oui ça avance la connaissance. Et reconnaître que tous nos choix sont une question de gestion de risques jamais nuls, et de rapport coût / bénéfice, peut permettre de faire des choix raisonnés. La pondération des coûts et des bénéfices peut être très subjective, mais il faut le faire en connaissance de cause.

samedi 16 mars 2013

Le cerveau humain diffère-t-il de celui des singes ? La réponse dans l'expression des gènes

[caption id="attachment_866" align="aligncenter" width="96"]monkey Cliquez sur l'image[/caption]

C'est la semaine du cerveau ! "Du cerveau" vous pensez tout-de-suite au votre ou au mien à la limite, au cerveau humain. Mais tous les vertébrés ont un cerveau.

[caption id="" align="aligncenter" width="312"] Illustration Alain Prunier – http://alain-prunier.com/blog/[/caption]

Je suis toujours géné par les études qui visent à trouver ce qui nous rend unique, ce qui fait des humains des êtres tellement à part, parce que je ne suis pas convaincu que ça soit évidemment vrai. Avant de chercher à comprendre les causes d'un phénomène, j'aime bien m'assurer que le phénomène soit réel. Alors est-ce que les humains sont spéciaux, ou est-ce que cela nous semble seulement ainsi parce que nous sommes humains ? Je ne dis pas que je soit sur qu'il n'y ait rien de particulier à notre espèce, mais ne mettons pas la charrue avant les boeux. Par exemple il y a plein d'études qui comparent notre génome à d'autres génomes de mammifères pour trouver des gènes humain-spécifique, ou des changements génétiques tout petits humain-spécifique, et c'est publié avec des titres triomphants : on a trouvé les gènes ou les mutations qui font de nous des humains ! Mais qu'est-ce qui me dit qu'en comparant des génomes de rongeurs je n'aurais pas trouvé autant de différences qui font de la souris domestique Mus musculus ce qu'elle est, par rapport à la primitive souris des steppes Mus spicilegus ? Et les différences génétiques qui distinguent la mouche du vinaigre de la mouche des séchelles, hein ? Donc avant de me bassiner avec plein de petites différences, j'aimerais qu'on me montre en quoi elles sont intéressantes.

C'est pourquoi j'avais beaucoup aimé à l'époque un article novateur du groupe de Svante Pääbo, qui a aussi découvert le Denisova et plein d'autres trucs. Il faut d'abord se rappeler que les gènes pour être actifs doivent exprimer leur produit, qui fera le boulot (voir ce billet). Donc même s'il y a peu de différences en gènes entre deux cellules, il peut y avoir de grosses différences dues à l'expression différente de ces gènes. Par exemple, toutes les cellules de votre corps ont les mêmes gènes, mais ça fait du muscle ou du cerveau ou du gras selon l'expression des gènes (qui est aussi régulée selon votre activité et votre alimentation semble-t-il). De même on peut penser qu'une partie des différences entre espèces à génome très similaire, comme humain et chimpanzé ou souris domestique et souris des steppes, soit due à des différences d'expression des gènes. Ces différences elles-mêmes étant encodées dans le génome, dans les séquences régulatrices, voir discussion d'ENCODE en septembre.

Or donc, Enard et al en 2002 (article d'accès payant dans Science) ont comparé l'expression des gènes entre cerveaux d'humain, de chimpanzé et de gorille, pour voir s'il y avait de grosses différences qui expliqueraient notre cerveau de ouf. Des différences, y en a. Jusque-là, je ne serais pas impressioné, pour les raisons évoquées ci-dessus. Mais il ont aussi ajouté plein de contrôles :

  • l'expression des gènes dans les cerveaux de gorille et de chimpanzé se ressemble plus que le chimpanzé ne ressemble à l'humain, bien que le chimpanzé soit plus proche parent de l'humain ; ceci implique que l'expression dans le cerveau ait évolué plus vite chez l'humain.

  • en faisant la même expérience mais avec les globules blancs du sang, les expressions de gènes des trois espèces semblent avoir évolué à la même vitesse, donc l'accélération est au moins en partie cerveau-spécifique.

  • en faisant les mêmes comparaisons entre trois rongeurs, on ne voit de différences ni pour le cerveau ni pour les globules blancs ; ergo, c'est bien humain-spécifique.


Alors cette étude ne date pas d'hier, donc pour écrire ce billet j'ai essayé de me mettre un peu à jour. En commençant par un article de revue (qui résume les autres articles de manière critique et synthétique) du labo de Yoav Gilad (ex postdoc de Pääbo, mais presque tout les bons dans ce domaine lui sont liés semble-t-il), de juillet 2012 (article payant dans Nature Reviews Genetics). Déjà il ne dit pas que Enard 2002 soit tout faux, mais il parle surtout de résultats plus récents.

Un premier résultat cool est que l'expression des gènes semble retardée dans le développement embryonnaire et de l'enfant humain par rapport aux autres primates. Ceci est une confirmation moléculaire de ce que l'on pensait depuis longtemps sur des bases morphologiques et développementales, à savoir que les humains soient néoténiques, signifiant que nos adultes ressemblent aux jeunes de nos ancêtres. Dans une autre étude, ils ont trouvé que les différences d'expression entre humains et autres primates concernaient surtout deux "modules" de gènes, l'un s'occupant de la gestion de l'énergie par le cerveau et l'autre du développement embryonnaire du cerveau. D'un autre coté, plusieurs études semblent avoir trouvé des variations importantes d'expression entre espèces pour d'autres organes et d'autres espèces que le cerveau humain.

Dans une grosse étude récente (dont notre co-bloggueur Philippe Julien est co-auteur, et fait par des collègues dans mon université), il a été trouvé que l'expression des gènes évolue généralement lentement dans le cerveau, sauf chez les primates, et que les modules de gènes à évolution spécifiquement accélérés le sont spécifiquement chez l'humain.

Donc il semble bien qu'il y ait des différences significatives et objectives entre cerveau humain et autres mammifères, même avec le chimpanzé notre frère.

Mais, il y a un mais, l'expression des gènes contrairement au génome varie avec notre environnement, notre état de santé, notre nourriture, l'heure du jour ou de la nuit, la cause de la mort si on vient de mourir (et on arrive rarement à prélever du cerveau sur des animaux ou des personnes vivantes). Or autant on peut bien controler tous ces paramètres pour les souris, autant pour les chimpanzés en cage c'est faisable mais un peu plus compliqué, autant pour les humains c'est n'importe quoi. On prend ce qu'on a comme cadavre ayant donné à la science et on espère qu'il n'était pas trop drogué. De plus, les humains à de très rares exceptions près (et même les chasseurs-ceuilleurs cuisent leur viande) vivent dans un environnement très différent de celui des autres primates. Quelle serait l'expression des gènes d'un chimpanzé vivant comme un humain, et réciproquement ? Il faut bien avouer qu'on n'en sait rien.

Donc des résultats très intéressants, qui confirment notre intuition qu'il y a quelque chose à voir dans cette direction générale des différences d'expression des gènes et des différences entre cerveaux de primates, mais pas encore de conclusion ferme. A suivre et bonne fin de semaine du cerveau.

lundi 11 mars 2013

Semaine du cerveau, y a beau

Cette semaine, semaine spéciale cerveau au C@fé des sciences. Lisez-y plein de beaux billets, et notez que le mien, au lieu de sortir le vendredi comme d'habitude, sortira samedi matin dans un souci de cohérence.

Je vous dit déjà, il portera sur :

Le cerveau humain diffère-t-il de celui des singes ? La réponse dans l’expression des gènes

Bonne semaine !

vendredi 8 mars 2013

Carl Woese a révolutionné la biologie puis est mort sans prix Nobel

[caption id="attachment_857" align="aligncenter" width="98"]pieuvre cliquez sur l'image[/caption]

Tiens on parlait de phylogénie moléculaire, revenons sur un très grand monsieur de la biologie, qui est mort fin 2012 : Carl Woese. Peut-on imaginer un physicien ou un chimiste qui aurait changé par sa recherche le premier chapitre des livres d'introduction à la matière, et en fait la façon dont on considère toute sa discipline, mais n'aurait pas eu de prix Nobel ? Mais voilà, il n'y a pas de prix Nobel en biologie, mais en médecine, ce qui n'est pas la même chose. C'est dégoutant, voilà ce que c'est.

On pensait bien depuis Dawin et ses successeurs que toutes les espèces vivantes étaient apparentées, et que leurs relations avaient la forme d'un arbre. De manière très célèbre, la seule figure dans l'Origine des espèces est un schéma d'arbre des espèces, et la plus ancienne trace de cet idée date de ses brouillons en 1837 :

I think

Dans le siècle et demi qui a suivi, on a fait pas mal de progrès pour faire des arbres phylogénétiques des grosses espèces qu'on voit à l'oeil nu et qui ont plein de caractères permettant aisément de retrouver les parentés les plus évidentes. Les animaux et les plantes donc. Mais pour les micro-organismes, et notamment les bactéries, on restait coincé dans une approche pré-Darwinienne. On classait en gros et petits, en ronds et en longs, en qui réagissent à ce produit chimique et qui ne réagissent pas, et bien sur qui rendent malade ou pas.

Carl Woese a eu le premier l'idée que la génétique moléculaire fournissait des outils pour étudier l'histoire évolutive des bactéries. Toutes les bactéries partagent certaines molécules qui s'occupent de fonctions fondamentales à la survie de la cellule, comme la traduction des gènes en protéines (merci d'applaudir le ribosome !). De manière frappante, surtout par rapport à nos connaissances de l'époque, les gènes codant pour ces molécules, notamment l'ARNr 16S, sont suffisamment conservées entre espèces très différentes pour les comparer, classifier les similarités et les différences, et utiliser cette information pour non seulement classer les espèces au sens de Linné, les ranger dans de jolies boîtes, mais les classer au sens de Darwin, retrouver leur histoire évolutive, leurs relations de parenté. Mieux, ces gènes sont comparables entre les bactéries et les animaux ou les plantes ! Pour la première fois depuis Darwin, en 1977, on peut tracer un arbre phylogénétique incluant toutes les sortes d'espèces vivantes.

Et cet arbre était plein de surprises ! Animaux, plantes et champignons représentent une part de toute petite de la diversité du vivant, trois petites branches tardives au sein de l'embranchement des eucaryotes, qui inclut aussi toutes sortes de microbes dont les cellules marchent à-peu-près comme les notres. Et les autres microbes, qui zont pas de vrai noyau à chromosomes, se partagent en deux groupes d'âge et d'importance équivalent chacun aux eucaryotes, les bactéries "vraies" et les archées, d'abord trouvées dans des environnements dits extrêmes, sources très chaudes, eau très salée, mileu riche en sulfure, etc.

Cette découverte a eu plein de conséquences, je vais surement en oublier. Il devenait possible de classer le vivant de manière phylogénétique. Il devenait possible de classer des espèces dont on ne savait rien que l'ADN. Il devenait possible de comparer des espèces n'ayant aucun trait commun. Avant cela, même classer les relations entre insectes, vertébrés et vers n'était pas faisable. La diversité du monde microscopique devenait visible. Depuis, on a fait plein de progrès, on a nuancé cet arbre en découvrant l'abondance du transfert latéral de gènes entre espèces microbiennes, on a découvert une diversité encore plus grande en séquençant de l'ADN de l'environnement et en le classifiant, on a bien sur grandement amélioré et nos techniques de séquençage d'ADN et d'analyse phylogénétique, mais la contribution de Woese demeure immense.

Et le manque de Nobel met en évidence de la manière la plus forte possible que nous n'avons pas de prix Nobel en biologie.

vendredi 1 mars 2013

Notre génome n'est pas fonctionnel à 80% et je reste poli, moi #ENCODE

[caption id="attachment_839" align="aligncenter" width="138"]girafe Cliquez sur l'image[/caption]

Vous vous rappelez d'ENCODE ? Un méga gros projet de caractérisation de la fonction du génome humain, qui a publié ses résultats en septembre. J'en avais causé ici, et il y avait aussi un bon billet sur le blog bioinfo-fr. Comme discuté à l'époque, l'affirmation selon laquelle 80% du génome était supposément fonctionnelle avait causé pas mal de débats à l'époque, avec notamment les chercheurs en évolution des génomes très peu convaincus, c'est le moins qu'on puisse dire.

Critiquer sur des blogs, c'est bien, mais pour que cela ait un impact dans la communauté scientifique, il faut publier un article dans une revue sérieuse, et il faut que cet article soit lu. Dan Graur et collègues viennent de publier un article remarquable à bien des égards, avec ces objectifs à coeur (et peut-être un tout petit peu l'objectif de faire parler d'eux ;-) ). Déclaration de conflits d'intérêts : j'ai travaillé avec Dan en postdoc il y a longtemps.

L'article est :
On the immortality of television sets: “function” in the human genome according to the evolution-free gospel of ENCODE, Genome Biology and Evolution online before print

Le ton est ... disons inhabituel dans un article scientifique. Je vous invite à aller le lire si vous êtes à l'aise en anglais (il est Libre d'accès). Là pour le coup on a un article scientifique qui n'est pas écrit de manière chiante ! Dan est un habitué du coup, ayant écrit dans le passé les célèbres articles suivants :

Reading the entrails of chickens: molecular timescales of evolution and the illusion of precision. Trends Genet. 2004 Feb;20(2):80-6. (Critique très dure des datations moléculaires, voir billet récent sur les mammifères.)

The Permian bacterium that isn't. Mol Biol Evol. 2001 Jun;18(6):1143-6 (Démontage en règle d'un article rapportant une soi-disant bactérie vivante de 250 Millions d'années d'âge.)

Le ton surprenant de l'article sur ENCODE inclut des phrases telles que :
ENCODE accomplishes these aims mainly by playing fast and loose with the term “function,” by divorcing genomic analysis from its evolutionary context and ignoring a century of population genetics theory, and by employing methods that consistently overestimate functionality, while at the same time being very careful that these estimates do not reach 100%. More generally, the ENCODE Consortium has fallen trap to the genomic equivalent of the human propensity to see meaningful patterns in random data.

Sur le fond, que disent-ils ?

D'abord, qu'il faut distinguer en biologie entre la fonction "sélectionnée", c'est-à-dire qui a un impact sur la survie et la reproduction de l'organisme, par exemple pour le coeur pomper le sang, et la fonction "causale", par exemple pour le coeur faire bouboum-bouboum. La fonction causale existe, elle n'est pas fausse, mais elle n'a que peu d'intérêt pour comprendre la biologie. Graur et al. accusent le consortium ENCODE d'avoir confondu ces deux sens de fonction, en rapportant comme fonctionnel de manière pertinente (= sélectionnée même si ENCODE ne le dit pas) tout ce qui a une fonction détectable expérimentalement. Ce qu'un commentateur de mon billet précédent a excellemment résumé par "ça bouge quand on l’agite".

Le titre de l'article s'explique par l'affirmation de Graur et al. que toute fonction pertinente doit pouvoir être cassée, et le sera si le temps passe et qu'aucune sélection ne l'empêche. Ils affirment que la définition utilisée par ENCODE revient donc à dire qu'il y a des fonctions équivalentes à une télévision immortelle. Rigolo mais bon passons aux choses sérieuses.

Ils sont conscients qu'il peut être difficile de détecter la sélection, qui ne se traduit pas forcément par un ADN parfaitement conservé, mais citent des arguments connus en génétique des populations comme le coût de la sélection sur les mutations dans des régions fonctionnelles (mutational load) pour dire que 80% fonctionnel paraît très invraisemblable en l'état de nos connaissances. Ils citent une étude liée à ENCODE (mais un peu à part) qui trouve au maximum 9% de notre génome sous pression sélective.

Une critique particulièrement dure de la logique d'ENCODE, et probablement correcte est qu'ils les accusent du sophisme (raisonnement erroné) de l'affirmation du conséquent :

  • des régions fonctionnelles du génomes ont une propriété (sont transcrites, l'ADN est accessibles aux enyzmes, etc) ;

  • on trouve beaucoup d'ADN qui a cette propriété ;

  • donc tout cet ADN est des régions fonctionnelles.


Or on sait que tous les processus moléculaires dans une cellule ont une composante stochastique (au hasard quoi), parce qu'on a affaire à très peu de molécules.

Graur et al. critiquent ensuite les 5 principale propriétés utilisées par ENCODE :

  • La transcription, à savoir que l'ADN est copié en ARN qui sert à être traduit en protéines, qui font des choses (enzymes, muscles, tout ça). On sait que des régions non fonctionnelles sont transcrites, notamment les introns, qui sont découpés de l'ARN avant traduction. De même les pseudogènes ou les transposons défaillants, tous transcrits, connus depuis longtemps pour leurs absence de fonction (en tous cas liée à la transcription). A noter qu'on ne dit pas juste que ces choses sont non fonctionnelles parce qu'on ne sait pas ce qu'elles font. Par exemple Graur et al. citent une étude qui a enlevé 96 introns de levures et n'en ont trouvé que 3 qui ont un impact sur la croissance. Or les levures ont un génome beaucoup plus sélectionné que nous, ayant des tailles de population beaucoup beaucoup plus grandes.

  • Les modifications des histones, les protéines qui organisent l'ADN dans la cellule. Une étude de 2010 a trouvé que seul 2% de ces modifications chimiques affectent la fonction d'une manière détectable. On peut avoir raté des trucs, mais dire que toutes ces modifications sont fonctionnelles semble légèrement exagéré en effet.

  • L'ouverture de la chromatine, à savoir que l'ADN est accessible aux protéines. Dans ce cas, ils font une simple affirmation du conséquent, rien à dire de plus.

  • La liaison par des facteurs de transcription, les protéines qui activent ou répressent les gènes. Graur et al ne sont pas convaincus par des sites de liaison détectés de 400 à 800 nucléotides alors que tous les sites de liaison bien déterminés sont de l'ordre de 6 à 14 nucléotides. Ca se discute. Bref.

  • La méthylation du dinucléotide CpG. Bon c'est technique, mais Graur défendent, probablement à raison, que la méthylation est simplement une propriété chimique de CpG et ne dit rien sur la fonction locale de l'ADN.


Une critique très importante, que je traite à part bien que dans le papier elle soit inclue dans le point sur la transcription, est que ENCODE a largement utilisé des cellules tumorales (des cancers en boite de Petri). Il y a une bonne raison pratique : on en a plein, et il y avait besoin de beaucoup de matériel pour faire ENCODE. Mais voilà, dans ces cellules tout est détraqué, et on sait que ni la transcription, ni la structure de l'ADN ne sont comme dans une cellule de notre corps. Non seulement c'est détraqué, mais dans le sense de davantage de transcription et davantage d'activité dans tous les sens. Je confirme, vu que dans mon labo on a essayé d'utiliser ces données et on a du abandonner pour cette raison (pas que ça soit inutile, mais pas utile pour comprendre l'évolution humaine qui nous intéresse).

Une critique un peu technique est qu'apparemment dans leurs statistiques ENCODE a préféré minimiser les faux négatifs (ne rien rater, au risque de détecter des erreurs) que les faux positifs (ne détecter que des trucs corrects, au risque de rater des choses).

Graur et al. discutent de manière assez technique, et correcte (Graur est auteur du livre de référence en évolution moléculaire), des erreurs de biologie évolutive dans la compréhension du "junk DNA" par certains biologistes des génomes. Le plus important à comprendre c'est qu'on ne s'attend pas, sur des bases théoriques solides, à ce que le génome d'organismes à petite population tels que les mammifères (petite par rapport au nombre de bactéries par exemple) soit entièrement fonctionnel, mais au contraire qu'il contiennent beaucoup de choses qui sont inutiles et se sont accumulées par hasard.

Finalement, ils ont une réflexion que je trouve très intéressante sur le contraste entre "grosse science" (CERN, génome humain, etc) et "petite science" (le labo normal où chacun fait ses expériences). Ils proposent que le rôle principal de la grosse science est de générer des données, mais pas de les interpréter, ce qui doit être fait par des chercheurs individuels. Très méchamment, ils disent qu'ENCODE a fait comme les théologiens, ils ont cherché à donner un sens à chaque lettre du texte.

Et pour finir, un peu de ton irrévérent. Ils citent un leader du projet génome humain disant qu'ENCODE est le Google Maps du génome humain, en commentant que non, ENCODE est encore pire que Apple Maps. Puis citent l'adage selon lequel "si c'est trop beau pour être vrai, c'est que c'est trop beau pour être vrai."

Et le coup de grâce :
The ENCODE results were predicted by one of its lead authors to necessitate the rewriting of textbooks (Pennisi 2012). We agree, many textbooks dealing with marketing, mass-media hype, and public relations may well have to be rewritten.