vendredi 24 janvier 2014

Les #OGM n'existent pas, et ça nous fait oublier l'essentiel

[caption id="attachment_1701" align="aligncenter" width="150"]Cliquez sur l'image Cliquez sur l'image[/caption]

Bien sur que les OGM existent, stricto sensu. Mais au sens où le terme "OGM" est utilisé dans le discours public il ne veut rien dire. Les OGM sont le produit d'une technique. Toute phrase "Les OGM verbe complément" n'a de sens que si elle discute de la technique.

Phrases faisant sens :
Les OGM sont plus rapides à produire que les variétés par croisement.
Pour développer des OGM il faut des compétences en biologie moléculaires.
Mise à jour : voir commentaire intéressant de Wackes Seppi.
Phrases ne faisant pas sens :
"OGM = agriculture toxique".
Les OGM sont des poisons.
Les OGM causent des alergies.
Mise à jour : Martin Clavey me signale un exemple intéressant de phrase contre-sens pro-OGM :
Les OGM pour enrayer la famine?
(on peut en faire vraiment beaucoup en fait des qui ne font pas sens.)

Deux nouvelles dans l'actualité relativement récente m'amènent à (re-)clarifier ce point.

Les pommes Arctic Apples (voir explication sur Passeur de sciences) sont modifiées pour qu'un gène présent dans les pommes (et les pommiers) ne s'exprime pas, c'est-à-dire ne soit pas actif. Si j'ai bien compris (ref dans un article, page Wikipedia, page de la companie) c'est l'ensemble des copies du gène PPO (y en a plusieurs) qui sont toujours là mais dont l'expression est bloquée.

Ce qui est important pour la discussion dans le contexte de ce billet, c'est que la plupart des points débattus sur les OGM "usual suspects" ne sont pas pertinents : il n'y a aucun matériel génétique étranger ajouté.

Autre information récente, la discussion sur le miel au Parlement Européen : les parlementaires ont considéré que du miel produit avec en partie du pollen issu de plantes OGM n'était pas différent de miel produit autrement. Et en effet, le fait d'être "OGM" n'est pas une qualité physique que se transmet à travers toutes les transformations biologiques, contrairement par exemple à la radioactivité ou à la présence de métaux lourds. Un OGM, c'est un organisme dont l'ADN a été modifié. Mais l'ADN est une très grosse molécule biologique présente en quantité faible ; la plupart des transformations biologiques, comme la mort et encore plus la digestion, vont la casser. Après digestion, on a des nucléotides, mais plus de l'ADN, pas plus qu'un tas de lettres n'est un roman de Tolstoï. Donc l'ADN modifié n'aura pas en soit d'influence sur le miel, produit d'une digestion et d'un "tri" des sucres par les abeilles (en gros le miel c'est des sucres). Il est possible par ailleurs qu'un OGM contienne des molécules actives pas présentes dans le non OGM, enquel cas ces molécules pourraient aller un petit peu dans le miel.

Mais on revient à ce qui est illustré par les Artic Apples : selon les OGM, on aura ou non ajout d'une substance. Autre exemple, plus connu, les plantes Round-Up Ready bien un gène de bactérie rajouté, mais il s'agit de l'homologue (voir ce billet) d'un gène que les plantes ont déjà. Rien ne change, sauf que cet homologue n'est pas inactivé par le glyphosate (le Round-Up). Ah et puis les plantes sont généralement traitées au glyphosate, mais d'autres plantes aussi, et sinon d'autres herbicides sont utilisés.

Pourquoi est-ce important ? Parce que la focalisation sur le terme "OGM" comme catégorie idéalisée à la Platon entraîne des blocages énormes, et une énorme dépense d'énergie qui finalement rate sa cible.

C'est avec ce genre de réification du concept OGM qu'on se retrouve avec des gens apparemment intelligents comme Nassim Taleb qui nous explique que les OGM c'est un risque systémique énorme. Mais il réussi à faire cela sans jamais se pencher sur la question de ce qu'est un OGM. Je suis moins fort en maths que Taleb, mais je n'arrive pas à voir la menace de déséquilibre pour la planète dans le fait qu'une pomme ne brunisse pas parce qu'elle a une enzyme sous-exprimée, ou qu'un riz a de la vitamine A dans ses graines (Golden Rice ; voir ce billet et celui-ci et celui-là). Le pire qui va arriver, c'est que ces plantes si elles quittent nos champs auront un désavantage sélectif et seront éliminées. Oui il faut faire attention (voir billet sur les limites de la science), mais non tout OGM n'est pas porteur d'un risque global cataclysmique.

Vous voulez militer contre le brevetage du vivant ? Faites-le, c'est très important ! Mais en se focalisant sur les OGM, vous laissez breveter des avancées médicales, des plantes hybrides, et des organismes mutants (mais par mutagenèse non dirigée alors c'est OK). Par contre vous bloquez la recherche publique sur de potentiels OGM non brevetés (potentiels parce que vu l'opposition aux OGM, les labos publics laissent tomber).

Vous voulez être informé sur les pesticides ? C'est très important aussi, oui ! Mais en se focalisant sur les OGM, vous ratez les discussions sur d'autres pesticides, autrement plus nocifs (notamment pour les abeilles d'ailleurs), et vous bloquez le développement de plantes résistant mieux aux pathogènes sans traitement (par exemple en augmentant leur système immunitaire - c'est faisable mais pas fait, encore à cause des oppositions). (A ce propos, je note avec intérêt la récente décision française d'interdire les pesticides aux jardiniers amateurs - à suivre.)

Vous êtes contre la monoculture ! Alors diversifiez vos achats, faites attention à la provenance de ce que vous achetez, et même proposez des lois récompensant les pluricultures moins rentables (ou le maintien de systèmes tels que le bocage). Mais en insistant sur les OGM, vous bloquez les développements de plantes pouvant pousser dans des conditions plus diverses, ce qui permettrait de mieux exploiter chaque milieu, tandis la monoculture, qui date de bien avant les OGM, se porte très bien, merci pour elle.

Moi je serais tout pour par exemple noter sur les fruits et légumes quels pesticides ont été utilisés (y compris dans le bio, grand utilisateur de sulfate de cuivre ou de Rotenone, lequel cause Parkison chez les rats ; voir cet article), lesquels sont issus de variétés brevetées, lesquels ont été récoltés dans une exploitation non monoculture, etc. Mais l'information selon laquelle une pomme a un gène silencé ou un riz fait de la vitamine A non seulement dans les feuilles mais aussi dans les graines, quel rapport ?

Finalement, après une discussion twitter avec Mike Eisen et Vincent Lynch, je me suis dit que si on veut vraiment (comme beaucoup de militants verts américains) étiqueter les OGM, faisons au moins la différence. Etiquetons les OGM avec substance ajoutée (par exemple le maïs Bt, voir ce billet), mais pas ceux sans (comme le Round Up Ready ou Artic Apple). C'est pas un beau compromis, ça ?

Et je vous en prie, arrêtons avec les phrases "Les OGM sont ou font ceci cela". Merci !

jeudi 16 janvier 2014

Pour mille balles, t'as un génome humain

[caption id="attachment_1684" align="aligncenter" width="165"]cliquez sur l'image cliquez sur l'image[/caption]

Announce fracassante cette semaine dans le monde du séquençage d'ADN : la société Illumina, leader du domaine, va commercialiser deux nouvelles machines : le NextSeq 500, qui vise le marché des "petits" clients, et le HiSeq X 10, qui vise au contraire les très gros centres. (Pour le contexte du séquençage ADN moderne, je vous recommande ce billet sur le blog BiopSci.)

Le NextSeq 500, c'est pour reprendre le marché de l'entrée de gamme apparemment, notamment par rapport à Ion Torrent. D'après un blog généralement bien informé le NextSeq tuerait Ion Torrent, mais à $250'000 contre $80'000 pour Ion Torrent ça ne me paraît pas si évident.

Mais le plus important dans cette annonce est le X10. Illumina promet avec cette machine de passer la barre symbolique des $1000 pour un génome humain. Mais il faut y mettre le prix du ticket d'entrée : il faut acheter minimum 10 machines, et pour que ça vaille le coup, il faut les faire tourner en permanence. Dans ces conditions, vous séquencez 18'000 génomes par an. Le prix inclut également le logiciel pour analyser les données, et donc ce que vous obtenez c'est les variations entre humains : ce qui dans notre ADN fait que chacun de nous est unique (pas encore clair pour moi si c'est seulement les mutations d'une base, ou aussi les gros changements). Ces variations peuvent être déjà connues ou nouvelles, cela peut être un génome sain ou tumoral. Par contre, grosse limitation, le logiciel limite l'usage à l'humain seulement. Ceci alors que la technique est clairement applicable telle quelle à n'importe quelle espèce, de l'ADN c'est de l'ADN.

Point intéressant, les $1000 comprennent l'amortissement de la machine et les personnels pour la faire fonctionner, donc c'est pour de vrai. Par contre les scientifiques ou médecins pour interpréter les résultats, c'est autre chose. D'ailleurs c'est là que le goulot d'étranglement risque d'être, et partout dans le monde on pousse à intégrer davantage la génomique et la bioinformatique au cursus des médecins.

Illumina annonce donc avoir ajouté un nouveau point au graphe de la décroissance du coût du séquençage, nettement plus rapide que la décroissance du coût informatique (loi de Moore) depuis quelques années déjà :

[caption id="attachment_1685" align="aligncenter" width="300"]moore_illumina Image prise dans la doc publicitaire d'Illumina, donc je ne garanti pas la véracité, surtout du dernier point (ajouté par eux)[/caption]

A noter qu'avec cette annonce pas mal de collègues commencent à s'inquiéter de la situation de quasi-monopole, ou en tous cas de très forte dominance (style Google ou Facebook), d'Illumina sur le séquençage d'ADN. Ce n'est pas trivial, il s'agit de lire nos génomes, d'obtenir des informations sur les mutations médicalement pertinentes ou la biodiversité. Un point qui me dérange depuis l'arrivée des nouvelles technologies de séquençage c'est qu'elles sont toutes basées sur des protocoles propriétaires auxquels on est obligés de faire confiance. Dans l'autre sens, quand un système comme Illumina domine suffisamment longtemps (c'est aussi le cas d'Affymétrix dans un autre domaine de biologie), les alternatives logicielles et statistiques ouvertes et potentiellement concurentes voient le jour et sont testés et améliorées (voir billet sur les méthodes bioinformatiques en génomique).


Alors à quoi vont servir ces machines ? Des petits pays ont déjà annoncé leur ambition de séquencer les génomes de toute la population, comme les îles Faroe, et la Grande Bretagne et l'Arabie saoudite veulent séquencer 100'000 patients chacun. On se rapproche du séquençage du génome de chaque nouveau-né à la naissance. Bien sur, ça n'est pas parce qu'on peut le faire qu'on doit le faire (voir billet sur les limites de la science). Mais clairement, on le peut. Il est temps d'ouvrir sérieusement la discussion pour savoir si on doit le faire.

En tous cas, GATTACA GATACA approche à grands pas, que nous soyons prêts ou non.

lundi 23 décembre 2013

Billets les plus lus de 2013 : OGM, chalutage, informatique et humour

[caption id="attachment_1667" align="aligncenter" width="142"]cliquez sur l'image cliquez sur l'image[/caption]

Fin de l'année, le moment de faire des bilans. Quels sont les billets les plus lus sur ce blog ?

  1. Le Golden Rice OGM : la science sauverait des vies si les bobos ne la bloquaient pas. Tout ce qu'il faut : mot-clé (OGM) à fort impact social, titre provocateur, repris sur d'autres réseaux. A noter qu'à ma surprise, c'est le seul billet OGM dans cette petite liste.

  2. Signer une pétition contre le chalutage en eau profonde : que dit la litérature scientifique ? Autre sujet à fort impact social, en lien avec une pétition très diffusée. Ce qui est rigolo pour les théoriciens du complot c'est que le premier peut être perçu comme anti-écolo, et celui-ci comme anti-industrie. Bon y a probablement peu de lecteurs communs aux deux billets, donc ils ne vont pas remarquer.

  3. Doit-on montrer le code informatique des scientifiques même s’il est moche ? Ah ça me fait bien plaisir, un billet plutôt geek et technique, comme quoi il n'y a pas que les gros débats évidents qui intéressent les lecteurs de blogs scientifiques.

  4. Rions un peu avec les méthodes scientifiques et Twitter. L'humour geek a un certain succès, même s'il génère bien sur moins de commentaires que les autres sujets. A nouveau, ça me fait bien plaisir.


Quelques remarques d'ordre général :

Certains billets ont une durée de vie très longue (j'ai encore plein de hits sur le billet de 2012 sur Pierre-Henri Gouyon), alors que d'autres ont un pic rapide qui retombe (celui sur le chalutage typiquement).

La plupart de mes billets ont des commentaires constructifs, ce qui me fait très plaisir. Merci à mes commentateurs !

Très peu de lecteurs cliquent sur les liens. Je mets toujours des liens vers mes sources, les articles scientifiques ou billets de blogs ou sources statsitiques, et seulement de l'ordre de 2% des lecteurs cliquent sur autre chose qu'une BD. De même, quand je suis lié par des sites très lus comme L'Express, ça m'apporte peu de lecteurs, donc là aussi on clique peu. Comme quoi mon comportement personnel n'est pas représentatif.

Peu de chercheurs actifs bloguent, surtout en français. Et quand je blogue vraiment sur des résulats scientifiques, de mon labo ou de la litérature, bin j'ai peu de lecteurs et peu de commentaires. Mais je vais continuer, na.

Bonne année à tous !

lundi 25 novembre 2013

Signer une pétition contre le chalutage en eau profonde : que dit la litérature scientifique ?

[caption id="attachment_1635" align="aligncenter" width="210"]cliquez, c'est un peu long mais ça vaut le coup (puis elle a besoin de moi pour avoir du traffic je pense). cliquez, c'est un peu long mais ça vaut le coup (puis elle a besoin de moi pour avoir du traffic je pense).[/caption]

Vous avez peut-être entendu parler de la BD de Pénélope Bagieu dénonçant le chalutage (un type de pêche) en eau profonde, et appelant à signer une pétition pour faire interdire cette pratique. La BD a été très lue et partagée, et par conséquent discutée dans les médias. Par exemple un billet de blog dans Le Monde de "vérification", ou un article de FranceTV Info avec le même objectif de mettre en balance les arguments de la BD et des pêcheurs.

Apprenant l'existence de la pétition, j'ai d'abord vérifié informellement auprès de collègues connaissant mieux que moi ce sujet, et ayant reçu confirmation que le chalutage profond est considéré comme catastrophique, j'ai signé et diffusé sur Twitter. Maintenant vu le tour que prend le débat, et le manque dramatique de références scientifiques dans les articles "il a dit, elle a dit, va savoir" qu'on nous propose, j'ai décidé de prendre quelques minutes pour regarder l'état de la litérature scientifique (l'assoc Bloom qui propose la pétition a aussi une biblio anémique - sérieusement, vous ne pouvez pas faire mieux ?).

Rappel : trouver de l'info scientifique sérieuse sur le web, si on lit l'anglais, c'est facile.

Donc prenons le chemin de Google Scholar, après un petit tour sur Wikipedia pour trouver qu'en anglais on dit "deep sea trawling".

Notons tout-de-suite que toutes les références que j'ai trouvées (dans une recherche très rapide, je le précise - si des lecteurs veulent corriger avec de la bibliographie sérieuse ils sont les bienvenus) vont dans le sens de la BD et de la pétition. Quelques exemples :

L'article "Sustainability of deep-sea fisheries", Marine Policy 2012 (à propos de cet article, voir mises à jour en bas de page), n'est pas accessible librement malheureusement (pour lire tous mes ralâges à ce sujet, mot clé politique de publication, et d'abord celui-ci), mais je cite un gros morceau du résumé, qui est relativement clair :
The deep sea is by far the largest but least productive part of the oceans, although in very limited places fish biomass can be very high. Most deep-sea fishes have life histories giving them far less population resilience/productivity than shallow-water fishes, and could be fished sustainably only at very low catch rates if population resilience were the sole consideration. But like old-growth trees and great whales, their biomass makes them tempting targets while their low productivity creates strong economic incentive to liquidate their populations rather than exploiting them sustainably (Clark's Law). Many deep-sea fisheries use bottom trawls, which often have high impacts on nontarget fishes (e.g., sharks) and invertebrates (e.g., corals), and can often proceed only because they receive massive government subsidies. The combination of very low target population productivity, nonselective fishing gear, economics that favor population liquidation and a very weak regulatory regime makes deep-sea fisheries unsustainable with very few exceptions. Rather, deep-sea fisheries more closely resemble mining operations that serially eliminate fishable populations and move on.

Bon ça dit en gros la même chose que la BD. Un autre article, de 2010, dans la même revue confirme que cette pêche n'est pas rentable sans subventions. Je précise que je ne connais pas cette revue.

Par contre je connais Proceedings of the Royal Society, très sérieux, et on y lit dans un article de 2009 de plus d'accès libre :
The depth-related declines in abundance are, however, consistent with the effects of deep-water fishing. Significant changes in abundance were detected only in fishes whose depth ranges fell at least partly within the fishing grounds, in both target and non-target species. This pattern of widespread declines in abundance can be best explained by high rates of mortality among the fishes that escape through the net, as well as those that are brought to the surface and subsequently discarded (Basson et al. 2002). It is also possible that habitat modification by trawling has effects on a wide range of fish species by changing the availability of refugia and food (Collie et al. 1997).

Le reste de l'article dit que le chalutage profond affecte aussi significativement les espèces vivant encore plus profond, à cause des perturbations majeures que cela cause.

Un article un peu plus vieux (2004) dans un journal de Ecological Society of America (une société savante, pas une organisation militante) dit que : "Bottom trawling in particular has caused considerable destruction of these communities around the world. Due to their extreme longevity and slow growth, recovery is likely to be in the order of decades or even centuries."

Il y a aussi un "point de vue" dans Nature, journal / magazine scientifique, qui défend l'interdiction du chalutage profond.

Donc il semble que passer 1/2 h sur le web scientifique confirme que le message essentiel de la BD et de la pétition est correct. Il est possible que des détails ne le soient pas, mais il me semble qu'un article comme celui du blog Big Browser du Monde soit plutôt dans une logique "Marchants de doute" (finalement, y aurait pas débat ?) que dans une logique d'atteindre une confiance suffisante dans les résultats scientifiques pour agir. Je note aussi un article bizarre dans le Nouvel Obs qui dit que le problème principal est la pêche illégale. C'est par une doctorante "sur la gouvernance internationale des pêches et plus particulièrement sur les problématiques liées à la pêche illicite, non déclarée et non réglementée", donc je comprend bien que ce sujet lui tienne à coeur, mais quel rapport ? Ca ne montre pas que le chalutage profond ne soit pas très dommageable à ce que je comprenne.

Finalement, je dois réagir au communiqué de l'assoc Bloom "La vérite d'Intermarché sur la pêche profonde et celle de Monsanto sur les OGM aussi ?". Apparemment, sur le chalutage profond, comme sur le changement climatique, les écologistes ont la connaissance scientifique de leur côté. Essayez de garder cet avantage, je vous en prie, et évitez de tout mélanger et de brouiller votre message avec le déni de science concernant les OGM (voir notamment ce billet sur Séralini et celui-ci sur le Riz doré). Ca serait pas super, de baser ses décisions, toutes, sur des données correctes et vérifiables ? Allez, chiche.

(Edition pour préciser ma pensée : il ne faudrait pas que le débat soit "à qui faites vous confiance, une ONG ou une entreprise, les écolos ou les patrons ?", mais "quels sont les faits, que savons-nous, que pouvons-nous en conclure ?".)

Puis, allez signer la pétition quand même.

-------

Mise à jour : l'association Bloom a maintenant une bibliographie scientifique sérieuse sur son site : 70 publications scientifiques (références seulement) ; 32 publications scientifiques (un sous-ensemble des précédents, avec résumés en anglais extraits des articles). C'est très bien, c'est même excellent. J'y retrouve les refs que j'ai trouvées indépendemment pour la plupart. J'ai aussi trouvé au moins une erreur : les refs 2 et 4 dans les 70 sont la même, qui est celle que je cite en premier dans ce billet.

Mise à jour 2 : la première auteure le premier auteur de cette fameuse publication Marine Policy 2012 (ref 2 et 4 des 70 de Bloom), Eliott Norse, est interviewé dans L'Express rubrique Chercheurs d'Actu (en plus ils me citent).

Mise à jour 3 : cet article Norse et al. est d'accès fermé, mais une recherche Google Scholar vous donne facilement des liens vers des versions téléchargeables. Après c'est entre vous et votre conscience hein.

jeudi 21 novembre 2013

Je suis vieux : la bande son de ma thèse

[caption id="attachment_1625" align="aligncenter" width="168"]cliquez, si si. cliquez, si si.[/caption]

L'an dernier et celui d'avant j'ai écrit des notes "signes que je suis vieux" (2011, 2012). Pour changer un peu de marqueur d'époque, voici ce que j'écoutais pendant ma thèse (je ne listerais pas les vieilleries genre Bob Dylan, Lou Reed [snif] et Brassens que j'écoutais aussi, seulement les trucs nouveaux à l'époque). Si vous n'aimez pas mes goûts, peu me chaud chaut, mais admettez que d'avoir un t-shirt Glastonbury 1997 ça me date.

  • Mano Solo, choc monstre de mon début de thèse, vu en concert assez de fois pour le voir se détériorer puis aller mieux (genre il pouvait se tenir debout sur scène), puis pour le perdre, pour avoir été insulté par son attitude envers le public et impressionné par sa présence. A écouter seul dans le noir quand ta thèse te déprime.

  • Miossec, second choc francophone de ces années-là. Pas très joyeux tout ça, mais la classe les paroles la musique et l'énergie en concert. J'ai encore quelque part un morceau de tambourin cassé par Miossec aux Eurockéennes, et un enregistrement pirate perso sur bande magnétique (qualité garantie pourrie).

  • Restons dans la déprime : les Eels, plutôt vers la fin de ma thèse.

  • A propos de Glastonbury, moi qui vous cause j'y ai vu Radiohead, il parait que c'est un des meilleurs concerts de l'histoire du festival. J'y ai aussi découvert Beck, même que snobisme ultime j'ai acheté le vinyle 33 tours à Londres, et je n'ai plus rien pour le jouer. Ach so.

  • Pulp, rois des mélodies trop belles. Supergrass, rois de l'énergie.

  • Blur contre Oasis, que les médias arrétaient pas de comparer à Beatles contre Stones.

  • Enfin, je veux rendre ici hommage à Radio Brume, qui a enrichi ma culture musicale, m'a permis de tenir des journées de manips (oui j'ai fait de la biologie expérimentale, oui j'ai arrété, oui j'en suis très content) sans interruptions publicitaires, et aussi hommage à mes collègues de labo qui ont supporté Brume même quand c'était très expérimental. N'empêche que c'est comme ça que j'ai découvert Miossec et Louise Attaque un an avant mes copains, me permettant de laisser libre cours à mon snobisme.

lundi 4 novembre 2013

Les méthodes bioinformatiques utilisées en génomique sont importantes #methodsmatter #BigScience

[caption id="attachment_1620" align="aligncenter" width="137"]cliquez sur l'image cliquez sur l'image[/caption]

A l'occasion du projet ENCODE, j'ai déjà évoqué les avantages et inconvénients de la Big Science en biologie (billet ENCODE, billets sur critiques d'ENCODE 1 et 2, billet Big Science). Il y a en ce moment un débat très animé sur blogs et Twitter, concernant une question importante sur ces gros projets : les méthodes bioinformatiques utilisées.

Cela a commencé par ce billet de Lior Pachter, suivi de ce commentaire de Jeff Leek, et ce droit de réponse sur le blog de Lior. Si la question vous intéresse, je vous conseille fortement de lire non seulement les billets mais les commentaires. Il y a également une discussion Twitter intense, avec notamment les tweets de Lior, de Manolis Dermitzakis, et de Tuuli Lappalainen, et les hashtags #GTEx et #methodsmatter. La discussion comprend du beau monde en génomique et en bioinformatique. Quel est le débat ?

La discussion porte sur l'analyse de données de RNA-seq. Les gènes s'expriment (sont actifs) en étant transcrits en ARN. Plus un gène est actif, plus il y a d'ARN. Dans le RNA-seq, on séquence (on lit) des tas de petits morceaux d'ARN. On a davantage de morceaux lus pour les ARN correspondant aux gènes plus exprimés. Bon résumé de la méthode dans deux billets du site Bioinfo-fr : Analyse des données de séquençage à ARN et L'analyse de données RNA-seq: mode d'emploi. Ce deuxième fait aussi apparaître certains des soucis qu'on peut avoir.

Lior Pachter a remarqué que plusieurs gros projets, certains publiés comme ENCODE, d'autre encore en cours comme GTEx, utilisent une méthode bioinformatique de traitement du RNA-seq qui n'a jamais été publiée en tant que telle, donc n'est pas décrite formellement, n'a pas été évaluée, et n'a jamais été utilisée hors dédits consortiums (les auteurs de la méthode sont membres des consortiums Big Science en question). Il a essayé de comprendre la méthode (et Lior n'est pas un nul, il est notamment auteur de la méthode la plus utilisée, CuffLinks), sans grand succès, puis il l'a testée empiriquement sur les données de GTEx, parce que c'est ça qui l'intéressait. Et d'après ses tests, la méthode n'a que 10% du pouvoir statistique des méthodes plus habituellement utilisées dont il est l'auteur. Ce qui l'a conduit à écrire un billet de blog au titre provocateur "GTEx jette 90% de ses données".

Dans la discussion qui s'en est suivie, il y a plusieurs éléments. L'un est une défense spécifique de GTEx. Manolis fait remarquer à juste titre qu'ils n'ont pas encore publié leurs résultats, donc qu'il est un peu tôt pour critiquer leurs choix méthodologiques, et note aussi que (1) ayant beaucoup beaucoup de données, ils ont du prendre en compte l'efficacité computationnelle des méthodes (à savoir que CuffLinks plantait leurs ordinateurs apparemment), et (2) ils avaient contacté la bande à Lior pour avoir de l'aide, sans succès.

Un élément plus important pour moi est le rôle en effet des méthodes bioinformatiques dans de tels projets. Cela implique plusieurs niveaux. Le projet Big Science est sensé fournir des resources (des données réutilisables) et des conclusions biologiques. Si on ne comprend pas les méthodes, si elles ne sont pas connues et reconnues par ailleurs, alors (1) cela limite la réutilisation, et (2) cela diminue notre confiance dans leurs résultats. Ainsi dans mon labo on essaye d'utiliser les données RNA-seq d'ENCODE, mais ils ont utilisé la même méthode dont discute Lior, et cela nous gène pour faire confiance dans les données prétraitées qu'ils nous fournissent, sans compter que des membres de l'équipe ont perdu pas mal de temps à essayer de comprendre quelque chose qui n'était juste pas bien expliqué. Et du coup, on a du mal à reproduire des résultats sur lesquels on aimerait construire.

A  noter que Lior avait aussi écrit une critique d'ENCODE, disponible sur ArXiv seulement.

Certains ont répondu à la discussion que peu importe, nous embêtent les bioinformaticiens, toutes les méthodes donnent les mêmes résultats. D'où le hashtag #methodsmatter de Lior, et sa réponse ironique "toutes les données me donnent les mêmes résultats" (vu d'avion, c'est presque vrai). Et là je suis complètement d'accord avec Lior. Bien sûr, pour trouver que la myosine est exprimée dans le muscle, peu importe la méthode. Mais pour associer des formes différences de l'ARN d'un même gène à des variations inter-individuelles dans l'ADN régulateur proche du gène, et autres subtilités qui sont l'essentiel du message biologique que l'on cherche avec ces très gros jeux de données, oui cent fois oui les méthodes comptent, et c'est limite irresponsable de suggérer autrement. Il faut rappeler que (1) les gros jeux de données coutent cher, donc on veut en tirer le signal maximum, d'où l'importance de méthodes statistiques puissantes, et (2) la définition d'un biais c'est une méthode qui converge avec une confiance croissante vers un résultat faux lorsqu'on a plus de données. Donc gros jeux de données = importance de faire attention aux biais.

Finalement un point important à retenir de cette discussion, comme celle qui a suivi la publication d'ENCODE, c'est que grâce aux blogs et à Twitter ces gros projets se font sous la supervision de plus en plus proche et réactive d'une communauté qui n'a pas peur de faire connaître ses critiques, et que ces mêmes plateformes permettent aux scientifiques des gros projets de répondre, créant un dialogue constructif. Et ça c'est une très bonne nouvelle pour le progrès de la recherche en biologie et en sciences en général.

Note de dernière minute : il vient de sortir une grosse évaluation des méthodes RNA-seq, que je n'ai pas encore lue (communiqué de presse avec liens vers papiers - accès fermés), mais qui semble trouver que CuffLinks (de Lior) marche bien.

Mise à jour : de manière suprenante, les papiers de l'équipe GTEx, ENCODE, et ces évaluation de méthodes RNA-seq sont affichés comme reliés par l'EBI (voir communiqué de presse ci-dessus), pourtant l'évaluation n'inclut pas la méthode Flux Capacitor utilisée par ENCODE et GTEx. Cela semble moyennement cohérent a priori, mais je continue à suivre la discussion. A noter aussi qu'à la lecture, CuffLinks ne semble pas forcément en effet la meilleure méthode.

vendredi 1 novembre 2013

Notes sur ma semaine en sciences 11 : de bonnes nouvelles et de la stochasticité

[caption id="attachment_1604" align="aligncenter" width="140"]Cliquez sur l'image Cliquez sur l'image[/caption]

  • Sur le blog Elysa Chlorotica, un très bon commentaire sur les fameux crânes de Dmanisi et l'évolution humaine. Voir aussi ce commentaire sur le blog de PLOS.

  • Un papier récent quantifie les problèmes expérimentaux dans l'estimation de la transcription dans une seule cellule, permettant potentiellement de quantifier les composants stochastiques et déterministes de l'expression des gènes au niveau cellulaire (voir cette revue [accès fermé, en anglais], ce petit billet de blog [en anglais], et mon râlage précédent concernant les arguments de JJ Kupiec sur la stochasticité de l'expression des gènes).

  • Youpi ! Notre projet commun avec 3 autres labos lausannois sur la comparaison entre espèces des interactions gène-environnement dans le vieillissement a été accepté, on va recevoir plein de sous ! Chers théoriciens du complot, ça ne veut pas dire que je peux m'acheter une nouvelle Ferrari, mais que je peux embaucher un doctorant. C'est une très bonne nouvelle (franchement, qu'est-ce que je ferais d'une Ferrari ?).

  • Mon collègue lyonnais Guy Perrière a écrit un article grand public sur la génomique et la bioinformatique dans Pour la Science, accès payant ici. Il fait un bon point sur la croissance des données de séquence disponibles dans des banques centralisées, et des problèmes posés par les nouvelles technologies très haut débit : paradoxalement, on produit tant de données qu'on n'arrive plus à les partager, et donc on arrive à un ralentissement de la croissance des données aisément disponibles.

  • De super belles photos de microscopie sur le site de Wired.

  • Un article sur notre base de données Selectome a été accepté pour publication. On pré-calcule la sélection Darwinienne (créatrice de nouveauté, par opposition à la sélection conservatrice) sur plein plein de gènes et de périodes évolutives, et vous y donne accès. Principale nouveauté : un meilleur contrôle qualité des données, donc moins de faux positifs. Le futur : des programmes plus rapides, qui nous permettront de faire les calculs sur encore plus de données. Tagada.

  • Très bonne "histoire derrière le papier" sur le Dinoblog, qui permet de voir comment progresse la connaissance en paléontologie (lentement et avec plein de détails chiants, comme toute la science) et avec une discussion intéressante du concept de fossile vivant, même si perso je ne l'aime pas trop (le terme). Puis c'est des requins, ce qui est toujours cool. Petit râlage : pourquoi ne pas mettre un lien vers le papier lui-même ?

  • Article expliquant la bioinformatique au grand public (anglais, accès libre) : Explain Bioinformatics to Your Grandmother! Mais pourquoi toujours les grand-mères ? Excellent commentaire sur le papier, voir aussi mon commentaire dans un billet précédent.

vendredi 11 octobre 2013

Notes sur ma semaine en sciences 10

[caption id="attachment_1588" align="aligncenter" width="159"]Cliquez sur l'image Cliquez sur l'image[/caption]

  • On a un nouveau format de réunions d'équipe, où on essaye de réfléchir à partir de nouvelles scientifiques à la façon dont la bioinformatique pourrait aider. Bien sûr cette semaine le thème venait des Nobel, et en discutant on s'est demandé si quelqu'un avait déjà essayé de classifier non pas les protéines en fonction de leur compartiment sub-cellulaire, mais les complexes de protéines (une protéine agit rarement seule). Une recherche rapide après la réunion me montre que ça n'est pas évident que ça ait été fait (ce qui ne garanti rien bien sur), mais que d'après ce papier récent ça pourrait être en effet pertinent. Quelqu'un du groupe ayant demandé pourquoi ça n'a pas déjà été fait si c'est si intéressant, cela m'a rappelé la citation suivante de l'autobiographie de Feynman, quand il prend des cours de biologie pour voir, et pose des questions qui lui paraissent simples :


"Nobody knew. It turned out that it was not understood at that time. So right away I found out something about biology: it was very easy to find a question that was very interesting, and that nobody knew the answer to. In physics you had to go a little deeper before you could find an interesting question that people didn’t know."

(bien sur c'est possible que des gens aient essayé, que ça ne soit pas possible, et qu'ils n'aient pas publié leurs résultats négatifs. Ou que je ne sois simplement pas au courant.)




  • Karim sur Sweet Random Science se demande où est la science dans les films de science-fiction, et justement je trouve ceci sur les blogs de PLOS : une enseignante qui utilise Bienvenue à GATACA pour l'enseignement de la génétique.

  • Fait ch..r, notre projet de cours de Génomique des populations a été refusé par EMBO, surtout à cause de l'utilisation de la génomique des fourmis comme exemple pratique. A re-essayer avec un cas d'étude plus intéressant pour les collègues biologiste moléculaires ?

  • Après presque 4 mois d'attente sans réponse des experts, et un changement d'éditeur, pour un article soumis à Bioinformatics, j'en ai mis une copie dans ArXiv. Je me rends compte que je devrais faire ceci systématiquement pour tous nos articles soumis.

  • On interviewe en ce moment des candidats profs d'entomologie dans mon département, et lors de lors leurs présentations orales j'apprends plein de trucs sur les insectes.

    • Saviez-vous qu'alors que nous détectons une odeur à 1 milliard de molécules par cm3, et un chien le fait à 1 million, mais un papillon de nuit y arrive avec seulement 10 molécules par cm3 ? Il semble que les insectes volants arrivent à se repérer à l'odorat tout en volant rapidement, et que pour cela il faille une très grande sensibilité.

    • Les moustiques femelles s'accouplent de préférence avec des mâles dont le bourdonnement des ailes est en harmonie avec le leur apparemment. Et moi qui pensait que le bzzzz n'était là que pour m'empécher de dormir. Par ailleurs, ils piqueraient de préférence l'arrière des jambes pour être loin de nos oreilles (qui les repèrent) et nos mains (qui paf ! le moustique).

    • Il y a des espèces qui sont 100% femelles, mais utilisent les mâles d'autres espèces pour la reproduction : le génome du mâle est ensuite élminé des cellules sexuelles (gamètes), mais contribue au corps (soma). Certains molusques font la même chose, mais avec seulement des mâles. Il y a plein d'autres modes de reproduction rigolos.



  • A ce propos, ça me frappe le nombre de gens qui cherchent un poste dans la recherche, mais qui ne nous facilitent pas la vie pour trouver leurs publications, leur recherche, etc. Faites-vous des profils Google Scholar, ISI Web of science, LinkedIn, etc. Ca prends quelques minutes et vous serez nettement plus visibles. Si vous n'en faites qu'un, Google Scholar à mon avis : publis, citations, accessible à tous.

  • Prix Nobel de chimie pour de la chimie computationnelle, autant dire presque de la bioinformatique / biologie computationnelle ! Ce qui pose la question : si on donnait un prix Nobel à des bioinformaticiens, lesquels ?

  • Via Ars Technica, je trouve une revue des études sur la sécurité des OGM, qui confirme qu'il n'y a pas de risque alimentaires / santé humaine, mais que les conséquences environementales ne sont pas toujours bien étudiées. A l'heure actuelle, aucune conséquence négative n'est bien documentée, mais cela reste possible. Ca dépend bien sûr de l'OGM : des insectes herbivores résistants c'est potentiellement génant, des plantes qui produisent plus de vitamine A ça ne l'est pas.

  • A propos de riz doré, très bon appel au bon sens à l'occasion de la journée de la vision sur le site de l'Institut philippin de recherche sur le riz.

  • Page professionnelle d'un jeune prof de Stanford pleine d'humour : "I obtained my Ph.D. from Stanford in 1997, which has made me the second most famous person in my family after my cousin who is a professional horse trainer."

  • La rétraction d'articles scientifiques par ce qu'on a trouvé des erreurs est un sujet toujours sensible. Pamela Ronald, connue pour son travail sur le riz notamment, et auteure d'un livre sur la nouriture de demain avec son mari prof d'agriculture bio, a retracté deux articles et raconte l'histoire de manière exemplaire sur un blog. Voire aussi une plus ancienne discussion sur la façon de mettre les rétractions sur son CV, sur l'indispensable site Retraction Watch.

lundi 7 octobre 2013

Les Ranacaudas expliquent la spéciation et la sélection naturelle aux enfants

[caption id="attachment_1572" align="aligncenter" width="188"]Ranacaudas Ranacaudas[/caption]

[caption id="attachment_1570" align="aligncenter" width="154"]stupiddesign Cliquez sur l'image pour une parodie de Intelligent Design[/caption]

J'ai acheté cet été à mes enfants Petit à petit (Au pays des Ranacaudas), un livre qui explique l'évolution par sélection naturelle aux enfants. C'est la traduction française de Little Changes, un livre écrit par une biologiste évolutive, Tiffany Taylor, qui a reçu le soutien de la société européenne de biologie évolutive pour faire appel à un illustrateur.


Une fois passé les petits trucs de language énervants dans toute traduction, c'est excellent, et mon fils de 6 ans en a redemandé. Je vais en profiter pour expliquer quelques-uns des concepts qui sont traités dans le livre. Le livre raconte l'histoire des ranacaudas, des animaux imaginaires vaguement primatoïdes.

Premier point, rapidement traité : le temps profond de la biologie évolutive. "Il y a très longtemps, et même plus longtemps que cela". Un concept que nous (biologistes évolutifs, géologues, astrophysiciens etc) manipulons tout le temps mais qui ne dit rien à la plupart des gens. Tiens une petite blague scientifique pour la route : Combien faut-il de biologistes évolutifs pour changer une ampoule électrique ? Un seul, mais ça lui prend 8 millions d'années.

Deuxième point, très important : la diversité au sein d'une espèce. "De loin elles semblaient toutes identiques, de près toutes étaient différentes." Quelqu'un a dit que la génétique doit résoudre deux mystères : pourquoi tous les chats sont-ils différents ? Et pourquoi les petits des chats sont-ils toujours des chats ? C'est aussi une question posée à la biologie évolutive, et c'est le génie de Darwin que d'avoir compris le lien entre les deux questions (même s'il ne comprenait pas l'hérédité). De manière importante, les ranacaudas varient dans des traits qui seront importants dans l'histoire, comme la forme de la queue, mais aussi dans des traits pas importants, comme le visage. En effet, la variation naturelle affecte tout le génome, et quasiment tous les traits étudiables qui sont in fine codés dans ce génome (le "phénotype"). La variation n'est pas là pour permettre l'évolution ou la sélection naturelle, mais en première approximation parce qu'aucun mécanisme de copie ne peut être parfait, donc il y a des erreurs, qui génèrent la variation. Celle-ci est générée indépendamment de son rôle potentiel.

Ensuite on nous montre que parmi ces ranacaudas, certains préfèrent manger dans les arbres, d'autres dans l'eau. C'est un mécanisme de séparation de populations, par l'exploitation de resources différentes. Il est très débattu de savoir si une telle séparation peut mener à la spéciation, à savoir que les deux populations vivant ensemble mais ayant des différences de mode de vie deviendraient deux espèces séparée. Une telle spéciation serait dite sympatrique, et seuls quelques cas sont connus.

L'autre mode de spéciation, c'est l'allopatrie, quand les espèces sont géographiquement séparées. C'est probablement le mode principal de spéciation. Cela arrive aux ranacaudas quand une innondation sépare ceux qui mangent dans les arbres, et vivent maintenant en haut des collines loin de l'eau, de ceux qui mangent dans l'eau.

C'est alors que la sélection naturelle peut exprimer toute sa force ! Le livre explique bien que la sélection principale est de se reproduire et s'assurer que ses rejetons survivent (et non pas, comme on le représente souvent, de se battre avec des prédateurs à longueur de journée). On représente les ranacaudas devant apporter beaucoup de nouriture à leurs petits pour qu'ils survivent. Du coup, ceux qui arrivent à collecter davantage de nouriture ont davantage d'enfants qui survivent. Et il y a une explication de l'hérédité, à savoir que les enfants resemblent à leurs parents tout en étant un peu différents.

Alors ceux de la colline qui ont des variations permettant mieux de ceuillir les fruits des arbres ont davantage d'enfants, leur resemblant, et les traits facilitant la vie parmi les arbres deviennent plus fréquents dans cette population. En parallèle, les traits permettant de mieux se nourir dans l'eau deviennent plus fréquents dans l'autre population. Jusqu'à ce que au bout de beaucoup de générations tous les ranacaudas de la colline partagent les traits de ceuilleur dans les arbres, et tous ceux de la rivière partagent les traits de pêcheur. Attention, il reste de la variation et de la diversité. Mais il est maintenant facile de distinguer du premier coup d'oeil les deux types. Et quand ils se rencontrent à nouveau, ce sont deux espèces différentes !

Il y a un excellent dessin montrant des changements graduels parallèles d'un même type ancestral aux deux espèces de ranacaudas éventuelles.

La conclusion du livre invite les enfants à remarquer que de telles histoires peuvent expliquer bien de la variation entre espèces qu'ils peuvent voir par exemple au zoo. Comme souvent dans la vulgarisation de l'évolution, l'accent est mis sur la sélection naturelle : on invite les enfants à remarquer les adaptations type long cou de la girafe.

Au final, un livre qui couvre pas mal de concepts de manière simple et ludique. Je recommende recommande.

vendredi 4 octobre 2013

Notes sur ma semaine en sciences 9 : de retour, avec un gouvernement américain fermé et un peu d'humour

[caption id="attachment_1559" align="aligncenter" width="194"]Cliquez sur l'image Cliquez sur l'image[/caption]

Les étudiants sont dans les amphis et les salles de TP, mes diapos sont en ligne, ma demande d'argent pour le labo est déposée, je vais essayer de recommencer à bloguer un peu.

  • Le gouvernement américain ferme, cela a de lourdes conséquences pour la recherche scientifique, qui n'est pas considérée comme "essentielle", et même pour de nombreuses fonctions technologiques et médicales : plus de nouvelles études cliniques, plus d'évaluations de médicaments, plus d'analyse sauf sommaire des données géologiques (espérons que pas de gros tremblement de terre), etc etc. Un bon bilan en anglais sur un blog néo-zélandais des conséquences pour le reste du monde ici. Des captures d'écran des sites web scientifiques plus ou moins fermés sur le blog de Jonathan Eisen. L'info en temps réel avec #scienceshutdown.

  • D'ailleurs cette fermeture montre la dépendance que nous avons tous envers les infrastructures scientifiques américaines. Le principal outil pour chercher des articles scientifiques en biologie et médecine, PubMed, est américain. Il y a une version européenne, EuropePMC, mais elle dépend de PubMed (et PubMedCentral) pour ses mise à jour. Faut qu'on se réveille. Pas que pour l'Europe, mais tout le monde, américains compris, a intérêt à ce que le système soit davantage redondant en cas de problèmes.

  • Excellent billet d'Alexandre Moati sur les formes du doute, de la vraie science au mensonge propagandier des companies de tabac.

  • Autre excellent bilet de Sham sur les négationistes du changement climatique (voir aussi sur Sciences2).

  • Un article provocateur affirme que les modifications que les humains font aux écosystèmes peuvent en fait augmenter la biodiversité. Vu le nombre d'espèces qu'on dégomme, j'ai des doutes, mais c'est une réflexion intéressante et argumentée.

  • J'ai retrouvé mon rapport bibliographique de master (DEA à l'époque), datant quand même de 1993, pour retrouver certaines références bibliographiques des années 1980. Le formatage et surtout les figures et équations sont un peu foireuses, because que c'est du MSWord et pas du LaTeX, mais en gros c'est lisible.

  • Je suis sur que vous vous demandez sur quoi porte ma demande d'argent. Bioinformatics search for adaptive evolution in vertebrate development. Ah-haa!

  • Rock'n'science lance une chaîne de blagues scientifiques. En voici une petite assez geek quand même. On demande à des scientifiques de démontrer que tous les nombres impairs sont premiers. Mathématicien : 1 est premier, 3 est premier, par induction tous les impairs sont premiers. Informaticien : 1 est premier, 3 est premier, 5 est premier, 7 est premier, Segmentation fault. Biologiste : 1 est un modèle pour étudier les nombres impairs ; il est premier, donc les nombres impairs sont premiers. Physicien : 1 est premier, 3 est premier, 5 est premier, 7 est premier, 9 est presque premier, 11 est premier...

  • Encore une toute petite ? Il y a 10 sortes de personnes, ceux qui savent compter en binaire et ceux qui ne savent pas.

  • Du vrai humour : un excellent article parodique : Cleavage of SuperPower protein determines the superpower in a tissue dependent manner.

  • Du vrai-faux humour : Mike Eisen attire notre attention en prétendant brièvement être l'auteur du terrible article sur des bactéries à l'arsenic, pour démonter une pseudo-étude visant à montrer que les journaux Open Access sont mauvais.