lundi 23 décembre 2013

Billets les plus lus de 2013 : OGM, chalutage, informatique et humour

[caption id="attachment_1667" align="aligncenter" width="142"]cliquez sur l'image cliquez sur l'image[/caption]

Fin de l'année, le moment de faire des bilans. Quels sont les billets les plus lus sur ce blog ?

  1. Le Golden Rice OGM : la science sauverait des vies si les bobos ne la bloquaient pas. Tout ce qu'il faut : mot-clé (OGM) à fort impact social, titre provocateur, repris sur d'autres réseaux. A noter qu'à ma surprise, c'est le seul billet OGM dans cette petite liste.

  2. Signer une pétition contre le chalutage en eau profonde : que dit la litérature scientifique ? Autre sujet à fort impact social, en lien avec une pétition très diffusée. Ce qui est rigolo pour les théoriciens du complot c'est que le premier peut être perçu comme anti-écolo, et celui-ci comme anti-industrie. Bon y a probablement peu de lecteurs communs aux deux billets, donc ils ne vont pas remarquer.

  3. Doit-on montrer le code informatique des scientifiques même s’il est moche ? Ah ça me fait bien plaisir, un billet plutôt geek et technique, comme quoi il n'y a pas que les gros débats évidents qui intéressent les lecteurs de blogs scientifiques.

  4. Rions un peu avec les méthodes scientifiques et Twitter. L'humour geek a un certain succès, même s'il génère bien sur moins de commentaires que les autres sujets. A nouveau, ça me fait bien plaisir.


Quelques remarques d'ordre général :

Certains billets ont une durée de vie très longue (j'ai encore plein de hits sur le billet de 2012 sur Pierre-Henri Gouyon), alors que d'autres ont un pic rapide qui retombe (celui sur le chalutage typiquement).

La plupart de mes billets ont des commentaires constructifs, ce qui me fait très plaisir. Merci à mes commentateurs !

Très peu de lecteurs cliquent sur les liens. Je mets toujours des liens vers mes sources, les articles scientifiques ou billets de blogs ou sources statsitiques, et seulement de l'ordre de 2% des lecteurs cliquent sur autre chose qu'une BD. De même, quand je suis lié par des sites très lus comme L'Express, ça m'apporte peu de lecteurs, donc là aussi on clique peu. Comme quoi mon comportement personnel n'est pas représentatif.

Peu de chercheurs actifs bloguent, surtout en français. Et quand je blogue vraiment sur des résulats scientifiques, de mon labo ou de la litérature, bin j'ai peu de lecteurs et peu de commentaires. Mais je vais continuer, na.

Bonne année à tous !

lundi 25 novembre 2013

Signer une pétition contre le chalutage en eau profonde : que dit la litérature scientifique ?

[caption id="attachment_1635" align="aligncenter" width="210"]cliquez, c'est un peu long mais ça vaut le coup (puis elle a besoin de moi pour avoir du traffic je pense). cliquez, c'est un peu long mais ça vaut le coup (puis elle a besoin de moi pour avoir du traffic je pense).[/caption]

Vous avez peut-être entendu parler de la BD de Pénélope Bagieu dénonçant le chalutage (un type de pêche) en eau profonde, et appelant à signer une pétition pour faire interdire cette pratique. La BD a été très lue et partagée, et par conséquent discutée dans les médias. Par exemple un billet de blog dans Le Monde de "vérification", ou un article de FranceTV Info avec le même objectif de mettre en balance les arguments de la BD et des pêcheurs.

Apprenant l'existence de la pétition, j'ai d'abord vérifié informellement auprès de collègues connaissant mieux que moi ce sujet, et ayant reçu confirmation que le chalutage profond est considéré comme catastrophique, j'ai signé et diffusé sur Twitter. Maintenant vu le tour que prend le débat, et le manque dramatique de références scientifiques dans les articles "il a dit, elle a dit, va savoir" qu'on nous propose, j'ai décidé de prendre quelques minutes pour regarder l'état de la litérature scientifique (l'assoc Bloom qui propose la pétition a aussi une biblio anémique - sérieusement, vous ne pouvez pas faire mieux ?).

Rappel : trouver de l'info scientifique sérieuse sur le web, si on lit l'anglais, c'est facile.

Donc prenons le chemin de Google Scholar, après un petit tour sur Wikipedia pour trouver qu'en anglais on dit "deep sea trawling".

Notons tout-de-suite que toutes les références que j'ai trouvées (dans une recherche très rapide, je le précise - si des lecteurs veulent corriger avec de la bibliographie sérieuse ils sont les bienvenus) vont dans le sens de la BD et de la pétition. Quelques exemples :

L'article "Sustainability of deep-sea fisheries", Marine Policy 2012 (à propos de cet article, voir mises à jour en bas de page), n'est pas accessible librement malheureusement (pour lire tous mes ralâges à ce sujet, mot clé politique de publication, et d'abord celui-ci), mais je cite un gros morceau du résumé, qui est relativement clair :
The deep sea is by far the largest but least productive part of the oceans, although in very limited places fish biomass can be very high. Most deep-sea fishes have life histories giving them far less population resilience/productivity than shallow-water fishes, and could be fished sustainably only at very low catch rates if population resilience were the sole consideration. But like old-growth trees and great whales, their biomass makes them tempting targets while their low productivity creates strong economic incentive to liquidate their populations rather than exploiting them sustainably (Clark's Law). Many deep-sea fisheries use bottom trawls, which often have high impacts on nontarget fishes (e.g., sharks) and invertebrates (e.g., corals), and can often proceed only because they receive massive government subsidies. The combination of very low target population productivity, nonselective fishing gear, economics that favor population liquidation and a very weak regulatory regime makes deep-sea fisheries unsustainable with very few exceptions. Rather, deep-sea fisheries more closely resemble mining operations that serially eliminate fishable populations and move on.

Bon ça dit en gros la même chose que la BD. Un autre article, de 2010, dans la même revue confirme que cette pêche n'est pas rentable sans subventions. Je précise que je ne connais pas cette revue.

Par contre je connais Proceedings of the Royal Society, très sérieux, et on y lit dans un article de 2009 de plus d'accès libre :
The depth-related declines in abundance are, however, consistent with the effects of deep-water fishing. Significant changes in abundance were detected only in fishes whose depth ranges fell at least partly within the fishing grounds, in both target and non-target species. This pattern of widespread declines in abundance can be best explained by high rates of mortality among the fishes that escape through the net, as well as those that are brought to the surface and subsequently discarded (Basson et al. 2002). It is also possible that habitat modification by trawling has effects on a wide range of fish species by changing the availability of refugia and food (Collie et al. 1997).

Le reste de l'article dit que le chalutage profond affecte aussi significativement les espèces vivant encore plus profond, à cause des perturbations majeures que cela cause.

Un article un peu plus vieux (2004) dans un journal de Ecological Society of America (une société savante, pas une organisation militante) dit que : "Bottom trawling in particular has caused considerable destruction of these communities around the world. Due to their extreme longevity and slow growth, recovery is likely to be in the order of decades or even centuries."

Il y a aussi un "point de vue" dans Nature, journal / magazine scientifique, qui défend l'interdiction du chalutage profond.

Donc il semble que passer 1/2 h sur le web scientifique confirme que le message essentiel de la BD et de la pétition est correct. Il est possible que des détails ne le soient pas, mais il me semble qu'un article comme celui du blog Big Browser du Monde soit plutôt dans une logique "Marchants de doute" (finalement, y aurait pas débat ?) que dans une logique d'atteindre une confiance suffisante dans les résultats scientifiques pour agir. Je note aussi un article bizarre dans le Nouvel Obs qui dit que le problème principal est la pêche illégale. C'est par une doctorante "sur la gouvernance internationale des pêches et plus particulièrement sur les problématiques liées à la pêche illicite, non déclarée et non réglementée", donc je comprend bien que ce sujet lui tienne à coeur, mais quel rapport ? Ca ne montre pas que le chalutage profond ne soit pas très dommageable à ce que je comprenne.

Finalement, je dois réagir au communiqué de l'assoc Bloom "La vérite d'Intermarché sur la pêche profonde et celle de Monsanto sur les OGM aussi ?". Apparemment, sur le chalutage profond, comme sur le changement climatique, les écologistes ont la connaissance scientifique de leur côté. Essayez de garder cet avantage, je vous en prie, et évitez de tout mélanger et de brouiller votre message avec le déni de science concernant les OGM (voir notamment ce billet sur Séralini et celui-ci sur le Riz doré). Ca serait pas super, de baser ses décisions, toutes, sur des données correctes et vérifiables ? Allez, chiche.

(Edition pour préciser ma pensée : il ne faudrait pas que le débat soit "à qui faites vous confiance, une ONG ou une entreprise, les écolos ou les patrons ?", mais "quels sont les faits, que savons-nous, que pouvons-nous en conclure ?".)

Puis, allez signer la pétition quand même.

-------

Mise à jour : l'association Bloom a maintenant une bibliographie scientifique sérieuse sur son site : 70 publications scientifiques (références seulement) ; 32 publications scientifiques (un sous-ensemble des précédents, avec résumés en anglais extraits des articles). C'est très bien, c'est même excellent. J'y retrouve les refs que j'ai trouvées indépendemment pour la plupart. J'ai aussi trouvé au moins une erreur : les refs 2 et 4 dans les 70 sont la même, qui est celle que je cite en premier dans ce billet.

Mise à jour 2 : la première auteure le premier auteur de cette fameuse publication Marine Policy 2012 (ref 2 et 4 des 70 de Bloom), Eliott Norse, est interviewé dans L'Express rubrique Chercheurs d'Actu (en plus ils me citent).

Mise à jour 3 : cet article Norse et al. est d'accès fermé, mais une recherche Google Scholar vous donne facilement des liens vers des versions téléchargeables. Après c'est entre vous et votre conscience hein.

jeudi 21 novembre 2013

Je suis vieux : la bande son de ma thèse

[caption id="attachment_1625" align="aligncenter" width="168"]cliquez, si si. cliquez, si si.[/caption]

L'an dernier et celui d'avant j'ai écrit des notes "signes que je suis vieux" (2011, 2012). Pour changer un peu de marqueur d'époque, voici ce que j'écoutais pendant ma thèse (je ne listerais pas les vieilleries genre Bob Dylan, Lou Reed [snif] et Brassens que j'écoutais aussi, seulement les trucs nouveaux à l'époque). Si vous n'aimez pas mes goûts, peu me chaud chaut, mais admettez que d'avoir un t-shirt Glastonbury 1997 ça me date.

  • Mano Solo, choc monstre de mon début de thèse, vu en concert assez de fois pour le voir se détériorer puis aller mieux (genre il pouvait se tenir debout sur scène), puis pour le perdre, pour avoir été insulté par son attitude envers le public et impressionné par sa présence. A écouter seul dans le noir quand ta thèse te déprime.

  • Miossec, second choc francophone de ces années-là. Pas très joyeux tout ça, mais la classe les paroles la musique et l'énergie en concert. J'ai encore quelque part un morceau de tambourin cassé par Miossec aux Eurockéennes, et un enregistrement pirate perso sur bande magnétique (qualité garantie pourrie).

  • Restons dans la déprime : les Eels, plutôt vers la fin de ma thèse.

  • A propos de Glastonbury, moi qui vous cause j'y ai vu Radiohead, il parait que c'est un des meilleurs concerts de l'histoire du festival. J'y ai aussi découvert Beck, même que snobisme ultime j'ai acheté le vinyle 33 tours à Londres, et je n'ai plus rien pour le jouer. Ach so.

  • Pulp, rois des mélodies trop belles. Supergrass, rois de l'énergie.

  • Blur contre Oasis, que les médias arrétaient pas de comparer à Beatles contre Stones.

  • Enfin, je veux rendre ici hommage à Radio Brume, qui a enrichi ma culture musicale, m'a permis de tenir des journées de manips (oui j'ai fait de la biologie expérimentale, oui j'ai arrété, oui j'en suis très content) sans interruptions publicitaires, et aussi hommage à mes collègues de labo qui ont supporté Brume même quand c'était très expérimental. N'empêche que c'est comme ça que j'ai découvert Miossec et Louise Attaque un an avant mes copains, me permettant de laisser libre cours à mon snobisme.

lundi 4 novembre 2013

Les méthodes bioinformatiques utilisées en génomique sont importantes #methodsmatter #BigScience

[caption id="attachment_1620" align="aligncenter" width="137"]cliquez sur l'image cliquez sur l'image[/caption]

A l'occasion du projet ENCODE, j'ai déjà évoqué les avantages et inconvénients de la Big Science en biologie (billet ENCODE, billets sur critiques d'ENCODE 1 et 2, billet Big Science). Il y a en ce moment un débat très animé sur blogs et Twitter, concernant une question importante sur ces gros projets : les méthodes bioinformatiques utilisées.

Cela a commencé par ce billet de Lior Pachter, suivi de ce commentaire de Jeff Leek, et ce droit de réponse sur le blog de Lior. Si la question vous intéresse, je vous conseille fortement de lire non seulement les billets mais les commentaires. Il y a également une discussion Twitter intense, avec notamment les tweets de Lior, de Manolis Dermitzakis, et de Tuuli Lappalainen, et les hashtags #GTEx et #methodsmatter. La discussion comprend du beau monde en génomique et en bioinformatique. Quel est le débat ?

La discussion porte sur l'analyse de données de RNA-seq. Les gènes s'expriment (sont actifs) en étant transcrits en ARN. Plus un gène est actif, plus il y a d'ARN. Dans le RNA-seq, on séquence (on lit) des tas de petits morceaux d'ARN. On a davantage de morceaux lus pour les ARN correspondant aux gènes plus exprimés. Bon résumé de la méthode dans deux billets du site Bioinfo-fr : Analyse des données de séquençage à ARN et L'analyse de données RNA-seq: mode d'emploi. Ce deuxième fait aussi apparaître certains des soucis qu'on peut avoir.

Lior Pachter a remarqué que plusieurs gros projets, certains publiés comme ENCODE, d'autre encore en cours comme GTEx, utilisent une méthode bioinformatique de traitement du RNA-seq qui n'a jamais été publiée en tant que telle, donc n'est pas décrite formellement, n'a pas été évaluée, et n'a jamais été utilisée hors dédits consortiums (les auteurs de la méthode sont membres des consortiums Big Science en question). Il a essayé de comprendre la méthode (et Lior n'est pas un nul, il est notamment auteur de la méthode la plus utilisée, CuffLinks), sans grand succès, puis il l'a testée empiriquement sur les données de GTEx, parce que c'est ça qui l'intéressait. Et d'après ses tests, la méthode n'a que 10% du pouvoir statistique des méthodes plus habituellement utilisées dont il est l'auteur. Ce qui l'a conduit à écrire un billet de blog au titre provocateur "GTEx jette 90% de ses données".

Dans la discussion qui s'en est suivie, il y a plusieurs éléments. L'un est une défense spécifique de GTEx. Manolis fait remarquer à juste titre qu'ils n'ont pas encore publié leurs résultats, donc qu'il est un peu tôt pour critiquer leurs choix méthodologiques, et note aussi que (1) ayant beaucoup beaucoup de données, ils ont du prendre en compte l'efficacité computationnelle des méthodes (à savoir que CuffLinks plantait leurs ordinateurs apparemment), et (2) ils avaient contacté la bande à Lior pour avoir de l'aide, sans succès.

Un élément plus important pour moi est le rôle en effet des méthodes bioinformatiques dans de tels projets. Cela implique plusieurs niveaux. Le projet Big Science est sensé fournir des resources (des données réutilisables) et des conclusions biologiques. Si on ne comprend pas les méthodes, si elles ne sont pas connues et reconnues par ailleurs, alors (1) cela limite la réutilisation, et (2) cela diminue notre confiance dans leurs résultats. Ainsi dans mon labo on essaye d'utiliser les données RNA-seq d'ENCODE, mais ils ont utilisé la même méthode dont discute Lior, et cela nous gène pour faire confiance dans les données prétraitées qu'ils nous fournissent, sans compter que des membres de l'équipe ont perdu pas mal de temps à essayer de comprendre quelque chose qui n'était juste pas bien expliqué. Et du coup, on a du mal à reproduire des résultats sur lesquels on aimerait construire.

A  noter que Lior avait aussi écrit une critique d'ENCODE, disponible sur ArXiv seulement.

Certains ont répondu à la discussion que peu importe, nous embêtent les bioinformaticiens, toutes les méthodes donnent les mêmes résultats. D'où le hashtag #methodsmatter de Lior, et sa réponse ironique "toutes les données me donnent les mêmes résultats" (vu d'avion, c'est presque vrai). Et là je suis complètement d'accord avec Lior. Bien sûr, pour trouver que la myosine est exprimée dans le muscle, peu importe la méthode. Mais pour associer des formes différences de l'ARN d'un même gène à des variations inter-individuelles dans l'ADN régulateur proche du gène, et autres subtilités qui sont l'essentiel du message biologique que l'on cherche avec ces très gros jeux de données, oui cent fois oui les méthodes comptent, et c'est limite irresponsable de suggérer autrement. Il faut rappeler que (1) les gros jeux de données coutent cher, donc on veut en tirer le signal maximum, d'où l'importance de méthodes statistiques puissantes, et (2) la définition d'un biais c'est une méthode qui converge avec une confiance croissante vers un résultat faux lorsqu'on a plus de données. Donc gros jeux de données = importance de faire attention aux biais.

Finalement un point important à retenir de cette discussion, comme celle qui a suivi la publication d'ENCODE, c'est que grâce aux blogs et à Twitter ces gros projets se font sous la supervision de plus en plus proche et réactive d'une communauté qui n'a pas peur de faire connaître ses critiques, et que ces mêmes plateformes permettent aux scientifiques des gros projets de répondre, créant un dialogue constructif. Et ça c'est une très bonne nouvelle pour le progrès de la recherche en biologie et en sciences en général.

Note de dernière minute : il vient de sortir une grosse évaluation des méthodes RNA-seq, que je n'ai pas encore lue (communiqué de presse avec liens vers papiers - accès fermés), mais qui semble trouver que CuffLinks (de Lior) marche bien.

Mise à jour : de manière suprenante, les papiers de l'équipe GTEx, ENCODE, et ces évaluation de méthodes RNA-seq sont affichés comme reliés par l'EBI (voir communiqué de presse ci-dessus), pourtant l'évaluation n'inclut pas la méthode Flux Capacitor utilisée par ENCODE et GTEx. Cela semble moyennement cohérent a priori, mais je continue à suivre la discussion. A noter aussi qu'à la lecture, CuffLinks ne semble pas forcément en effet la meilleure méthode.

vendredi 1 novembre 2013

Notes sur ma semaine en sciences 11 : de bonnes nouvelles et de la stochasticité

[caption id="attachment_1604" align="aligncenter" width="140"]Cliquez sur l'image Cliquez sur l'image[/caption]

  • Sur le blog Elysa Chlorotica, un très bon commentaire sur les fameux crânes de Dmanisi et l'évolution humaine. Voir aussi ce commentaire sur le blog de PLOS.

  • Un papier récent quantifie les problèmes expérimentaux dans l'estimation de la transcription dans une seule cellule, permettant potentiellement de quantifier les composants stochastiques et déterministes de l'expression des gènes au niveau cellulaire (voir cette revue [accès fermé, en anglais], ce petit billet de blog [en anglais], et mon râlage précédent concernant les arguments de JJ Kupiec sur la stochasticité de l'expression des gènes).

  • Youpi ! Notre projet commun avec 3 autres labos lausannois sur la comparaison entre espèces des interactions gène-environnement dans le vieillissement a été accepté, on va recevoir plein de sous ! Chers théoriciens du complot, ça ne veut pas dire que je peux m'acheter une nouvelle Ferrari, mais que je peux embaucher un doctorant. C'est une très bonne nouvelle (franchement, qu'est-ce que je ferais d'une Ferrari ?).

  • Mon collègue lyonnais Guy Perrière a écrit un article grand public sur la génomique et la bioinformatique dans Pour la Science, accès payant ici. Il fait un bon point sur la croissance des données de séquence disponibles dans des banques centralisées, et des problèmes posés par les nouvelles technologies très haut débit : paradoxalement, on produit tant de données qu'on n'arrive plus à les partager, et donc on arrive à un ralentissement de la croissance des données aisément disponibles.

  • De super belles photos de microscopie sur le site de Wired.

  • Un article sur notre base de données Selectome a été accepté pour publication. On pré-calcule la sélection Darwinienne (créatrice de nouveauté, par opposition à la sélection conservatrice) sur plein plein de gènes et de périodes évolutives, et vous y donne accès. Principale nouveauté : un meilleur contrôle qualité des données, donc moins de faux positifs. Le futur : des programmes plus rapides, qui nous permettront de faire les calculs sur encore plus de données. Tagada.

  • Très bonne "histoire derrière le papier" sur le Dinoblog, qui permet de voir comment progresse la connaissance en paléontologie (lentement et avec plein de détails chiants, comme toute la science) et avec une discussion intéressante du concept de fossile vivant, même si perso je ne l'aime pas trop (le terme). Puis c'est des requins, ce qui est toujours cool. Petit râlage : pourquoi ne pas mettre un lien vers le papier lui-même ?

  • Article expliquant la bioinformatique au grand public (anglais, accès libre) : Explain Bioinformatics to Your Grandmother! Mais pourquoi toujours les grand-mères ? Excellent commentaire sur le papier, voir aussi mon commentaire dans un billet précédent.

vendredi 11 octobre 2013

Notes sur ma semaine en sciences 10

[caption id="attachment_1588" align="aligncenter" width="159"]Cliquez sur l'image Cliquez sur l'image[/caption]

  • On a un nouveau format de réunions d'équipe, où on essaye de réfléchir à partir de nouvelles scientifiques à la façon dont la bioinformatique pourrait aider. Bien sûr cette semaine le thème venait des Nobel, et en discutant on s'est demandé si quelqu'un avait déjà essayé de classifier non pas les protéines en fonction de leur compartiment sub-cellulaire, mais les complexes de protéines (une protéine agit rarement seule). Une recherche rapide après la réunion me montre que ça n'est pas évident que ça ait été fait (ce qui ne garanti rien bien sur), mais que d'après ce papier récent ça pourrait être en effet pertinent. Quelqu'un du groupe ayant demandé pourquoi ça n'a pas déjà été fait si c'est si intéressant, cela m'a rappelé la citation suivante de l'autobiographie de Feynman, quand il prend des cours de biologie pour voir, et pose des questions qui lui paraissent simples :


"Nobody knew. It turned out that it was not understood at that time. So right away I found out something about biology: it was very easy to find a question that was very interesting, and that nobody knew the answer to. In physics you had to go a little deeper before you could find an interesting question that people didn’t know."

(bien sur c'est possible que des gens aient essayé, que ça ne soit pas possible, et qu'ils n'aient pas publié leurs résultats négatifs. Ou que je ne sois simplement pas au courant.)




  • Karim sur Sweet Random Science se demande où est la science dans les films de science-fiction, et justement je trouve ceci sur les blogs de PLOS : une enseignante qui utilise Bienvenue à GATACA pour l'enseignement de la génétique.

  • Fait ch..r, notre projet de cours de Génomique des populations a été refusé par EMBO, surtout à cause de l'utilisation de la génomique des fourmis comme exemple pratique. A re-essayer avec un cas d'étude plus intéressant pour les collègues biologiste moléculaires ?

  • Après presque 4 mois d'attente sans réponse des experts, et un changement d'éditeur, pour un article soumis à Bioinformatics, j'en ai mis une copie dans ArXiv. Je me rends compte que je devrais faire ceci systématiquement pour tous nos articles soumis.

  • On interviewe en ce moment des candidats profs d'entomologie dans mon département, et lors de lors leurs présentations orales j'apprends plein de trucs sur les insectes.

    • Saviez-vous qu'alors que nous détectons une odeur à 1 milliard de molécules par cm3, et un chien le fait à 1 million, mais un papillon de nuit y arrive avec seulement 10 molécules par cm3 ? Il semble que les insectes volants arrivent à se repérer à l'odorat tout en volant rapidement, et que pour cela il faille une très grande sensibilité.

    • Les moustiques femelles s'accouplent de préférence avec des mâles dont le bourdonnement des ailes est en harmonie avec le leur apparemment. Et moi qui pensait que le bzzzz n'était là que pour m'empécher de dormir. Par ailleurs, ils piqueraient de préférence l'arrière des jambes pour être loin de nos oreilles (qui les repèrent) et nos mains (qui paf ! le moustique).

    • Il y a des espèces qui sont 100% femelles, mais utilisent les mâles d'autres espèces pour la reproduction : le génome du mâle est ensuite élminé des cellules sexuelles (gamètes), mais contribue au corps (soma). Certains molusques font la même chose, mais avec seulement des mâles. Il y a plein d'autres modes de reproduction rigolos.



  • A ce propos, ça me frappe le nombre de gens qui cherchent un poste dans la recherche, mais qui ne nous facilitent pas la vie pour trouver leurs publications, leur recherche, etc. Faites-vous des profils Google Scholar, ISI Web of science, LinkedIn, etc. Ca prends quelques minutes et vous serez nettement plus visibles. Si vous n'en faites qu'un, Google Scholar à mon avis : publis, citations, accessible à tous.

  • Prix Nobel de chimie pour de la chimie computationnelle, autant dire presque de la bioinformatique / biologie computationnelle ! Ce qui pose la question : si on donnait un prix Nobel à des bioinformaticiens, lesquels ?

  • Via Ars Technica, je trouve une revue des études sur la sécurité des OGM, qui confirme qu'il n'y a pas de risque alimentaires / santé humaine, mais que les conséquences environementales ne sont pas toujours bien étudiées. A l'heure actuelle, aucune conséquence négative n'est bien documentée, mais cela reste possible. Ca dépend bien sûr de l'OGM : des insectes herbivores résistants c'est potentiellement génant, des plantes qui produisent plus de vitamine A ça ne l'est pas.

  • A propos de riz doré, très bon appel au bon sens à l'occasion de la journée de la vision sur le site de l'Institut philippin de recherche sur le riz.

  • Page professionnelle d'un jeune prof de Stanford pleine d'humour : "I obtained my Ph.D. from Stanford in 1997, which has made me the second most famous person in my family after my cousin who is a professional horse trainer."

  • La rétraction d'articles scientifiques par ce qu'on a trouvé des erreurs est un sujet toujours sensible. Pamela Ronald, connue pour son travail sur le riz notamment, et auteure d'un livre sur la nouriture de demain avec son mari prof d'agriculture bio, a retracté deux articles et raconte l'histoire de manière exemplaire sur un blog. Voire aussi une plus ancienne discussion sur la façon de mettre les rétractions sur son CV, sur l'indispensable site Retraction Watch.

lundi 7 octobre 2013

Les Ranacaudas expliquent la spéciation et la sélection naturelle aux enfants

[caption id="attachment_1572" align="aligncenter" width="188"]Ranacaudas Ranacaudas[/caption]

[caption id="attachment_1570" align="aligncenter" width="154"]stupiddesign Cliquez sur l'image pour une parodie de Intelligent Design[/caption]

J'ai acheté cet été à mes enfants Petit à petit (Au pays des Ranacaudas), un livre qui explique l'évolution par sélection naturelle aux enfants. C'est la traduction française de Little Changes, un livre écrit par une biologiste évolutive, Tiffany Taylor, qui a reçu le soutien de la société européenne de biologie évolutive pour faire appel à un illustrateur.


Une fois passé les petits trucs de language énervants dans toute traduction, c'est excellent, et mon fils de 6 ans en a redemandé. Je vais en profiter pour expliquer quelques-uns des concepts qui sont traités dans le livre. Le livre raconte l'histoire des ranacaudas, des animaux imaginaires vaguement primatoïdes.

Premier point, rapidement traité : le temps profond de la biologie évolutive. "Il y a très longtemps, et même plus longtemps que cela". Un concept que nous (biologistes évolutifs, géologues, astrophysiciens etc) manipulons tout le temps mais qui ne dit rien à la plupart des gens. Tiens une petite blague scientifique pour la route : Combien faut-il de biologistes évolutifs pour changer une ampoule électrique ? Un seul, mais ça lui prend 8 millions d'années.

Deuxième point, très important : la diversité au sein d'une espèce. "De loin elles semblaient toutes identiques, de près toutes étaient différentes." Quelqu'un a dit que la génétique doit résoudre deux mystères : pourquoi tous les chats sont-ils différents ? Et pourquoi les petits des chats sont-ils toujours des chats ? C'est aussi une question posée à la biologie évolutive, et c'est le génie de Darwin que d'avoir compris le lien entre les deux questions (même s'il ne comprenait pas l'hérédité). De manière importante, les ranacaudas varient dans des traits qui seront importants dans l'histoire, comme la forme de la queue, mais aussi dans des traits pas importants, comme le visage. En effet, la variation naturelle affecte tout le génome, et quasiment tous les traits étudiables qui sont in fine codés dans ce génome (le "phénotype"). La variation n'est pas là pour permettre l'évolution ou la sélection naturelle, mais en première approximation parce qu'aucun mécanisme de copie ne peut être parfait, donc il y a des erreurs, qui génèrent la variation. Celle-ci est générée indépendamment de son rôle potentiel.

Ensuite on nous montre que parmi ces ranacaudas, certains préfèrent manger dans les arbres, d'autres dans l'eau. C'est un mécanisme de séparation de populations, par l'exploitation de resources différentes. Il est très débattu de savoir si une telle séparation peut mener à la spéciation, à savoir que les deux populations vivant ensemble mais ayant des différences de mode de vie deviendraient deux espèces séparée. Une telle spéciation serait dite sympatrique, et seuls quelques cas sont connus.

L'autre mode de spéciation, c'est l'allopatrie, quand les espèces sont géographiquement séparées. C'est probablement le mode principal de spéciation. Cela arrive aux ranacaudas quand une innondation sépare ceux qui mangent dans les arbres, et vivent maintenant en haut des collines loin de l'eau, de ceux qui mangent dans l'eau.

C'est alors que la sélection naturelle peut exprimer toute sa force ! Le livre explique bien que la sélection principale est de se reproduire et s'assurer que ses rejetons survivent (et non pas, comme on le représente souvent, de se battre avec des prédateurs à longueur de journée). On représente les ranacaudas devant apporter beaucoup de nouriture à leurs petits pour qu'ils survivent. Du coup, ceux qui arrivent à collecter davantage de nouriture ont davantage d'enfants qui survivent. Et il y a une explication de l'hérédité, à savoir que les enfants resemblent à leurs parents tout en étant un peu différents.

Alors ceux de la colline qui ont des variations permettant mieux de ceuillir les fruits des arbres ont davantage d'enfants, leur resemblant, et les traits facilitant la vie parmi les arbres deviennent plus fréquents dans cette population. En parallèle, les traits permettant de mieux se nourir dans l'eau deviennent plus fréquents dans l'autre population. Jusqu'à ce que au bout de beaucoup de générations tous les ranacaudas de la colline partagent les traits de ceuilleur dans les arbres, et tous ceux de la rivière partagent les traits de pêcheur. Attention, il reste de la variation et de la diversité. Mais il est maintenant facile de distinguer du premier coup d'oeil les deux types. Et quand ils se rencontrent à nouveau, ce sont deux espèces différentes !

Il y a un excellent dessin montrant des changements graduels parallèles d'un même type ancestral aux deux espèces de ranacaudas éventuelles.

La conclusion du livre invite les enfants à remarquer que de telles histoires peuvent expliquer bien de la variation entre espèces qu'ils peuvent voir par exemple au zoo. Comme souvent dans la vulgarisation de l'évolution, l'accent est mis sur la sélection naturelle : on invite les enfants à remarquer les adaptations type long cou de la girafe.

Au final, un livre qui couvre pas mal de concepts de manière simple et ludique. Je recommende recommande.

vendredi 4 octobre 2013

Notes sur ma semaine en sciences 9 : de retour, avec un gouvernement américain fermé et un peu d'humour

[caption id="attachment_1559" align="aligncenter" width="194"]Cliquez sur l'image Cliquez sur l'image[/caption]

Les étudiants sont dans les amphis et les salles de TP, mes diapos sont en ligne, ma demande d'argent pour le labo est déposée, je vais essayer de recommencer à bloguer un peu.

  • Le gouvernement américain ferme, cela a de lourdes conséquences pour la recherche scientifique, qui n'est pas considérée comme "essentielle", et même pour de nombreuses fonctions technologiques et médicales : plus de nouvelles études cliniques, plus d'évaluations de médicaments, plus d'analyse sauf sommaire des données géologiques (espérons que pas de gros tremblement de terre), etc etc. Un bon bilan en anglais sur un blog néo-zélandais des conséquences pour le reste du monde ici. Des captures d'écran des sites web scientifiques plus ou moins fermés sur le blog de Jonathan Eisen. L'info en temps réel avec #scienceshutdown.

  • D'ailleurs cette fermeture montre la dépendance que nous avons tous envers les infrastructures scientifiques américaines. Le principal outil pour chercher des articles scientifiques en biologie et médecine, PubMed, est américain. Il y a une version européenne, EuropePMC, mais elle dépend de PubMed (et PubMedCentral) pour ses mise à jour. Faut qu'on se réveille. Pas que pour l'Europe, mais tout le monde, américains compris, a intérêt à ce que le système soit davantage redondant en cas de problèmes.

  • Excellent billet d'Alexandre Moati sur les formes du doute, de la vraie science au mensonge propagandier des companies de tabac.

  • Autre excellent bilet de Sham sur les négationistes du changement climatique (voir aussi sur Sciences2).

  • Un article provocateur affirme que les modifications que les humains font aux écosystèmes peuvent en fait augmenter la biodiversité. Vu le nombre d'espèces qu'on dégomme, j'ai des doutes, mais c'est une réflexion intéressante et argumentée.

  • J'ai retrouvé mon rapport bibliographique de master (DEA à l'époque), datant quand même de 1993, pour retrouver certaines références bibliographiques des années 1980. Le formatage et surtout les figures et équations sont un peu foireuses, because que c'est du MSWord et pas du LaTeX, mais en gros c'est lisible.

  • Je suis sur que vous vous demandez sur quoi porte ma demande d'argent. Bioinformatics search for adaptive evolution in vertebrate development. Ah-haa!

  • Rock'n'science lance une chaîne de blagues scientifiques. En voici une petite assez geek quand même. On demande à des scientifiques de démontrer que tous les nombres impairs sont premiers. Mathématicien : 1 est premier, 3 est premier, par induction tous les impairs sont premiers. Informaticien : 1 est premier, 3 est premier, 5 est premier, 7 est premier, Segmentation fault. Biologiste : 1 est un modèle pour étudier les nombres impairs ; il est premier, donc les nombres impairs sont premiers. Physicien : 1 est premier, 3 est premier, 5 est premier, 7 est premier, 9 est presque premier, 11 est premier...

  • Encore une toute petite ? Il y a 10 sortes de personnes, ceux qui savent compter en binaire et ceux qui ne savent pas.

  • Du vrai humour : un excellent article parodique : Cleavage of SuperPower protein determines the superpower in a tissue dependent manner.

  • Du vrai-faux humour : Mike Eisen attire notre attention en prétendant brièvement être l'auteur du terrible article sur des bactéries à l'arsenic, pour démonter une pseudo-étude visant à montrer que les journaux Open Access sont mauvais.

vendredi 20 septembre 2013

Notes sur ma semaine en sciences 8 : Débordé à la rentrée

[caption id="attachment_1548" align="aligncenter" width="300"]Cliquez sur l'image Cliquez sur l'image[/caption]

Bon une note courte cette semaine pour expliquer qu'en cette deuxième moité de septembre je ne vais pas trop avoir le temps de bloguer, parce que :

  • J'ai co-organisé un cours pour doctorants d'une semaine, Bioinformatics in the Chalet (c'était super !).

  • Les cours de l'université ont repris, dont mon cours Introduction à la bioinformatique qui change peu, et le cours Sequence a genome qui change tous les ans vu le projet.

  • Je dois écrire et soumettre le projet de financement principal de mon labo au Fonds national suisse pour la science d'ici le 1er octobre.

  • Je dois défendre, avec mes co-applicants, une autre demande de financement.

  • J'ai un doctorant qui en rédaction finale de thèse et a besoin d'un petit peu de retour de ma part.

  • Notre filière Bioinformatique de master est passée de 3 étudiants lausannois à 13 (plus des genevois), et ça fait plein de problèmes à régler dans l'urgence (même si sur le moyen et long terme on est contents d'avoir plein d'étudiants).


Donc je me noie un peu, j'ai quand même encore une vie à coté, alors Tcho pour le moment, et à bientôt !

 

vendredi 6 septembre 2013

Notes sur ma semaine en sciences 7

[caption id="attachment_1533" align="aligncenter" width="282"]cliquez sur l'image, juste parce que j'aime bien ce blog de StripSciences cliquez sur l'image, juste parce que j'aime bien ce blog de StripSciences[/caption]

  • On a fété à Lausanne cette semaine les 15 ans de l'Institut suisse de bioinformatique (SIB). Cet institut permet de fédérer les bioinformaticiens dans toutes les universités suisses, de maintenir des resources bioinformatiques de manière pérenne, notamment des bases de données, et d'assurer la formation continue à la bioinformatique. L'histoire du SIB est intéressante, puisque c'est parti d'une crise : SwissProt, la base de données de référence sur les protéines, n'était plus soutenue par le Fonds national suisse pour la science, parce que bin ça n'est pas de la recherche. L'annonce de la fermeture de Swissprot avait succité un tel tollé qu'une solution a été trouvée, et le SIB est né, avec un engagement vers la maintenance à long terme de resources utiles à tout le monde

  • D'ailleurs cette année c'est aussi les 20 ans d'ExPASy, qui a été la première page web de biologie au monde, et est maintenant le portail des resources bioinformatiques du SIB.

  • Un article intéressant en ce qui concerne les efforts jamais finis pour comprendre le génome humain, pertinent aussi à la tension qui existe entre génomique fonctionnelle (si je le détecte, c'est important ! d'ailleurs, cancer) et génomique évolutive (si ça n'est pas conservé, ça n'est pas important ! d'ailleurs, génome de l'onion). Les gènes eucaryotes (y compris animaux et plantes) sont en morceaux (exons) dans le génome, lesquels sont ensuite assemblés au niveau du transcrit (ARN) et traduits en protéines. Certains exons ne sont pas toujours utilisés, et la plupart des gènes ont ainsi de nombreux transcrits alternatifs. Depuis que la fréquence élevée de la transcription alternative a été découverte, il y a débat entre ceux qui pensent que c'est pour l'essentiel fonctionnel, ainsi un gène peut produire de nombreuses protéines, et ceux qui pensent que c'est pour l'essentiel des erreurs du système moléculaire (voir rôle du hasard). En faveur du second point de vue, les importantes différences entre espèces même proches, plutôt en faveur de mécanismes aléatoires. Dans ce papier récent (PNAS, libre d'accès) les auteurs ont comparé par bioinformatique les transcrits alternatifs de 6 espèces de primates (dont l'humain), et ont découvert que la plupart se comportent comme attendu au hasard, mais qu'une importante minorité de 1643 gènes a des exons utilisés de manière très spécifique dans certains organes de manière conservée entre primates, et a donc probablement une fonction spécifique. J'aime beaucoup quand on va au-delà du débat fonctionnel contre neutre, et que l'on quantifie la part de chacun. Bien sur, ce résultat est provisoire, étant basé sur des données limitées à 6 primates et 5 organes.

  • D'après le blog collectif anti-créationiste Panda's Thumb, deux petites companies de chimie viennent d'être condamnées pour avoir montré qu'un plastique sans bisphénol-A, donc vendu comme une alternative saine et sans risques, présente en fait des risques similaires au BPA en ce qui concerne la disruption hormonale. Ceci est très très dangereux : il doit être possible de tester un produit qui est en vente et de rendre public ses résultats, même si et surtout si ils montrent un danger potentiel du produit.

  • Le Fonds national suisse pour la science vient de publier la version grand public et en français de son rapport sur les OGM: PDF à télécharger ; Pôle national de recherche ayant conduit au rapport.

  • Super billet de blog par Ewan Birney (coordonateur de la deuxième phase d'ENCODE, co-directeur de l'European bioinformatics institute) sur ce qui fait la dynamique de San Francisco et la Silicon Valley, et comment cela peut être reproduit ailleurs. Il insiste sur un facteur essentiel : d'excellentes universités de recherche ! Plusieurs !

lundi 2 septembre 2013

Sujet science et société sur ENCODE pour nos étudiants

[caption id="attachment_1508" align="aligncenter" width="212"]essay cliquez sur l'image[/caption]

Avec un collègue membre du consortium ENCODE, nous proposons le sujet suivant dans notre cours "science et société" (voir aussi ce billet):

En septembre 2012 s'est conclue la phase 2 du projet international ENCODE (ENCyclopedia Of Dna Elements), qui vise à construire une liste exhaustive des éléments fonctionnels du génome humain, y compris les gènes et les éléments régulateurs. Cette conclusion s'est concrétisée par la mise à disposition de 15 Tb de données génomiques, et 30 articles publiés simultanément dans 3 journaux scientifiques. A l'occasion de ces publications, des commentaires virulents portaient sur l'assertion selon laquelle 80% du génome humain serait fonctionnel. Les auteurs des articles du consortium ENCODE se sont vu reproché d'avoir utilisé une définition abusive de la fonctionnalité.

Dans ce travail, vous discuterez de la pertinence et du rôle des projets de la "Big Science", de la manière dont les chercheurs impliqués dans ces projets devraient communiquer leurs résultats aux autres scientifiques et au public, et de ce que les scientifiques ne faisant pas de la Big Science peuvent ou doivent en attendre.

références :
http://encodeproject.org/
http://www.nature.com/encode/threads
http://genomeinformatician.blogspot.co.uk/2012/09/encode-my-own-thoughts.html
http://gbe.oxfordjournals.org/content/5/3/578
http://dx.doi.org/10.1016/j.cub.2013.03.023

---------

Les étudiants sont en 2ème année de biologie, par groupes de 10. Le cours est obligatoire, et ils doivent choisir un projet proposé par un enseignant de biologie ou de sciences humaines. Ca va des OGM à la vie synthétique, du racisme au créationisme.

Mes billet précédents sur ENCODE :

#ENCODE : La revanche du retour du fils du génome humain

Notre génome n’est pas fonctionnel à 80% et je reste poli, moi #ENCODE

Le génome aléatoire, un contrôle pour interpréter 15 To de données sur le génome humain

vendredi 30 août 2013

Notes sur ma semaine en sciences 6

[caption id="attachment_1515" align="aligncenter" width="173"]cliquez sur l'image cliquez sur l'image[/caption]

  • Joe Felsenstein, le chercheur le plus connu en phylogénie et méthodes d'évolution moléculaire (dans notre petit cercle, je n'hésiterais pas à le qualifier de légende vivante) raconte ses souvenirs d'étudiant à la Marche sur Washington contre la ségrégation raciale, il y a 50 ans.

  • Une étude médicale australienne liste plus de 150 traitements apparemment inutiles, ou en tout cas qui manquent d'évidence qu'ils sont utiles, de "Arthroscopic surgery for knee osteoarthritis" à "Hospitalisation for bed rest in multiple pregnancy". L'article, la liste de traitements.

  • Liste en cours de construction (n'hésitez pas à contribuer) des journaux scientifiques acceptant des soumissions qui avaient été mises sur ArXiv auparavent.

  • Discussion intéressante sur un blog de bioinformatique concernant la différence entre significativité du test (par ex. p < 1%) et magnitude de l'effet (par ex. 2 fois plus d'expression) dans les contextes des puces à ADN (microarrays) et du RNA-seq.

  • Excellent article de fond sur le riz doré Golden Rice dans le New York Times.

  • J'ai acheté la traduction française du livre "Au pays des Ranacaudas", qui explique la spéciation et la sélection naturelle aux enfants. Malgrès quelques tournures un peu bizarres dues à la traduction d'un livre pour enfants en vers, gros succès auprès de mon fils de 6 ans. Je recommende.

  • Je suis bête, je m'invente du travail. Ma proposition de cours pour doctorants "Blogging and using Twitter for scientific communication" a été acceptée. Maitenant faut l'organiser. J'ai déjà trouvé ceci et ceci.

  • Un excellent commentaire sur le Golden Rice de la part d'un économiste, Alexander Stein, qui a fait sa thèse sur la question : son blog, sa page professionnelle avec ses publications sur le sujet. Répond aux commentaires du type "qu'ils mangent de la brioche des carottes". Lire notamment un excellent commentaire de sa part sur la pertinence des investissements dans le Golden Rice par rapport à d'autres investissements possibles. Quand je vois la quantité de travail fait sur ces questions, et quand je lis ce que Greenpeace écrit, je ne peux que conclure qu'ils sont de mauvaise foi.

  • Un papier intéressant (libre d'accès) sur la comparaison des chromosomes sexuels de serpents. Les serpents, comme les oiseaux, ont un système ZZ (mâle) ZW (femelle). Comme ces chromosomes sont plus ou moins différenciés (dans différentes espèces le W est plus ou moins différent du Z), cela permet de tester des hypothèses sur les rôles respectifs de l'abondance de mutations chez les mâles (davantage de divisions cellulaires pour faire un spermatozoide qu'un ovule), de la sélection de gènes spécifiquement avantageux pour un sexe ou l'autre, et de l'absence de recombinaison sur le W.

  • En écrivant mon prochain projet de recherche, j'ai cherché des exemples de phénotypes morphologiques clairement non adaptatifs (des trucs qui se voient et qui ne servent à rien, en gros). Ca n'est pas évident, mais la couleur des organismes vivant très profond dans la mer me paraît un bon candidat. Pas de lumière : la couleur ne peut pas être importante, si ?

  • La 2ème compétition pour savoir quelle méthode bioinformatique marche la mieux pour prédire la fonction des protéines a été lancée. Un problème difficile. J'hésite à entrer cette année ; c'est intéressant mais ça prend du temps d'autres projets. Détails sur le blog de Iddo Friedberg.

  • Mike Eisen, militant acharné pro-Open Access et anti Impact Factor (voir mes billets sur politique de publication), demande dans quels journaux les gens ont publié pour avoir un poste de prof. Malheureusement pour lui, les journaux pas forcément ouverts à haut facteur d'impact semblent dominer. Discussion sur Twitter.

  • Un collègue m'a contacté pour écrire un livre sur les OGM. J'ai décliné, je préfère écrire sur ce blog sur plein de sujets, et avancer ma recherche quand même.

  • Un article de biologie évolutive pas encore publié officiellement, mais mis dans ArXiv (explication dans ce billet), est commenté dans Nature. Je ne sais pas si c'est une première, mais ça montre que les esprits changent. D'ailleurs mon journal préféré, Molecular Biology and Evolution, autorise aussi depuis peu les articles à y être soumis après avoir été déposés dans ArXiv. A propos de l'article lui-même, excellent commentaire sur le blog de John Hawks (avec photo du musée des Eyzies, coucou le Dinoblog).

vendredi 23 août 2013

Notes sur ma semaine en sciences 5

(pas d'image, le wifi de l'hotel est trop lent.)

  • Pierre Barthélémy du blog Passeur de sciences sur Le Monde évite d'habitude de parler d'OGM. Il y a une actualité scientifique intéressante sur le sujet (utilisation d'interférence ARN), il fait un billet, et qu'est-ce qui domine les commentaires ? Des trucs à coté de la plaque sur Monsanto et le bio, des remarques négatives sur le ton de son titre, et des remarques particulièrement constructives sur la photo d'illustration. Faut pas désespérer.

  • Article très intéressant (accès fermé hélas) qui montre un modèle de prédiction très précise de l'expression de gènes de levure en fonction de l'affinité précise (et manipulable expérimentalement) de l'ADN devant le gène (le promoteur) pour des protéines de régulation (facteurs de transcription). N'en déplaise à M. Kupiec.

  • Je passe le gros de la semaine au congrès européen de biologie évolutive ESEB. Il faudrait que j'en fasse un compte-rendu sur ce blog, ça serait pas cool ça ? Mais du coup j'ai peu d'autres nouvelles neuves. Ce qui m'a frappé dans la conférence cette année ? Le pouvoir de la génomique à unir des domaines qui avaient peu en commun, de la génétique moléculaire à l'étude de la spéciation, de l'hybridation et la domestication à l'expression des gènes et l'évolution de la morphologie jusqu'à la sélection naturelle et l'étude de l'impact du changement climatique. Et plein d'études sur les papillons et les épinoches.

  • Un hybride journal / blog sur l'intersection médecine et biologie évolutive : The Evolution & Medicine Review.

lundi 19 août 2013

Redif : #Wikipedia est une excellente source d'informations scientifiques et médicales

On continue la rediffusion de vieux billets. Un autre de janvier 2012 (original sur blogspot) :









cliquez sur l'image (et n'oubliez pas de cliquer sur le point rouge)

Je commence ce billet par une constatation double : beaucoup de mes collègues et moi-même faisons un usage abondant et pertinent de Wikipedia dans notre vie professionnelle (vous croyez que je connais tous les gènes, tous les organes, toutes les bestioles ?) ; et d'autre part beaucoup de personnes à l'université continuent à décourager les étudiants d'utiliser Wikipedia, et à le traiter comme une sous-resource, pour paresseux. Je trouve ça choquant, et je le prouve.

Une étude récente (malheureusement d'accès payant paradoxalement) dans le journal Psychological Medecine a comparé l'information concernant des pathologies liées à la schizophrénie (5 pathologies) ou à la dépression (5 pathologies) entre différentes sources d'information : les sites internet arrivant en tête de recherches pour "depression" ou "schizophrenia" (14 sites au total), y compris Wikipedia mais aussi des sites plus officiels, comme celui du National Institute of Mental Health, ainsi que l'Encyclopedia Britanica en ligne, et un livre de psychiatrie utilisé en études de médecine.

En comparant ces différentes ressources, ils trouvent, et je cite :
The quality of information about depression and schizophrenia on Wikipedia was generally rated higher than other centrally controlled resources, including 14 mental health-related websites, Encyclopaedia Britannica and Kaplan & Sadock’s Comprehensive Textbook of Psychiatry.

En d'autres termes, et comme ils précisent plus loin, les articles de Wikipedia sur des sujets de santé contiennent peu d'erreurs factuelles, malgré un certain manque de couverture. Ils sont également bien référencés, mais paradoxalement peuvent être difficiles à comprendre. Ils sont généralement meilleurs en moyenne que les autres sources, y compris le livre spécialisé.

De manière intéressante aussi, bien qu'un avantage majeur de Wikipedia sur le livre est sa mise à jour fréquente et rapide, le livre fait mieux que la plupart des sites web officiels. Ces sites sont moins bons que le livre, mais pas plus à jour. Au moins, ils sont gratuits.

Ceci nous amène à un second point, qui est qu'il est difficile de maintenir de l'information scientifique ou médicale à jour de manière centralisée, avec des ressources forcément limitées.

Il y a un autre article récent sur ce sujet dans le numéro spécial annuel sur les bases de données en biologie (NAR Database, entièrement gratuit) : les auteurs discutent de l'intégration entre Wikipedia, ou d'autres approches participatives, avec des bases de données spécialisées de biologie. Ils partent de leur expérience positive avec les bases de données Pfam (domaines protéiques) et Rfam (ARNs fonctionnels) : les données structurées sont dans une base de données SQL dédiée, mais les annotations en texte qui décrivent la fonction des molécules passent par Wikipedia. Plus précisément, à un moment ils ont exporté toute leur information vers Wikipedia, et depuis ils récupèrent toutes les modifications qui sont faites dans les pages Wikipedia correspondantes, et les remettent dans Pfam et Rfam.

Par exemple, l'article sur mon domaine préféré, de liaison aux hormones des récepteurs nucléaires d'hormones : dans la page Pfam il y a de l'information textuelle, avec un bouton "Edit in Wikipedia". On clique dessus, et on arrive sur la page Wikipedia correspondante, en mode édition directement qui plus est. Et là-dedans vous avez de jolies boîtes avec de l'information structurée venant de Pfam. C'est beau c'est grand c'est magnifique.

Ils ont des curateurs qui vérifient les infos venant de Wikipedia, et ils en acceptent 99%. Ils ont des milliers d'éditions par an, donc beaucoup d'informations pertinentes, à jour, et ... gratuites. Et disponibles à tous !

Ils regardent aussi d'autres modèles d'intégration avec Wikipedia, et les limitations. Par exemple, Wikipedia a un critère d'intérêt général, qui fait qu'on peut avoir une entrée par gène humain, ou par domaine protéique (partagé par plein de protéines), mais pas une entrée par gène de poisson épinoche, ou par variant de gène humain. Une autre limitation est la règle "pas de travaux inédits", qui interdit d'ajouter des infos que vous avez obtenu de vous-même, même par une méthode toute bête et simple. Or une base de données scientifique ne peut pas toujours accepter ces limitations. Et les wiki spécialisés ne marchent généralement pas aussi bien que Wikipedia, c'est peu de le dire.

Leur conclusion, et c'est là où je trouve que ces deux articles à priori bien distincts se rejoignent, est que nous ne pourrons maintenir à jour une information pertinente en biologie (et médecine donc) qu'en s'alliant à Wikipedia (et autres ressources des foules) de manière intelligente. Je suis bien d'accord, d'ailleurs j'utilise déjà Wikipedia. Il ne me reste plus qu'à devenir intelligent.

vendredi 16 août 2013

Notes sur ma semaine en sciences 4

[caption id="attachment_1468" align="aligncenter" width="259"]cliquez sur l'image cliquez sur l'image[/caption]

  • Un bilan de 451 additifs alimentaires autorisés aux Etats-Unis entre 1997 et 2012 indique que l'expertise n'a jamais été indépendente, et qu'elle a été faite par un employé de la compagnie concernée dans 22% des cas. Clairement, un système à revoir. Article d'accès libre.

  • J'ai commencé à écrire ma prochaine demande de financement au Fonds national suisse pour la science (je sais, pour un français dire "fonds national" ça sonne bizarre). On peut poser la question de la pertinence de l'écriture de ces projets, sachant que le meilleur prédicteur du succès d'un chercheur est sa productivité passée. Donc en regardant la mienne, on peut raisonablement s'attendre à ce que premièrement je continue à obtenir des résultats et à les publier, deuxièmement ces résultats ne changent pas la face du monde, et troisièmement qu'ils soient quand même utiles et cités par des collègues. Mais cet exercice est quand même important et utile. Cela me force à réfléchir à la cohérence de ce qu'on veut faire, au contexte international, et à convaincre des collègues de la pertinence de nos projets. Je pense que cela vaut le coup.

  • Un compte-rendu intéressant d'analyse de la vigueur hybride dans le maïs cultivé : le fait qu'on obtient de meilleurs rendements en croisant deux souches pures bien choisies qu'en sélectionnant une souche seule (et c'est pourquoi la plupart des paysans rachètent des graines tous les ans, OGM ou pas).

  • Un collègue améliore la productivité du manioc en Colombie grâce aux champignons microscopiques, j'y reviendrais. Communiqué de presse, article libre d'accès.

  • Une nouvelle technique de compression de données spécifique aux génomes humains permet de ternir l'information génomique d'une personne en 2,5 Mb. A noter que cela suppose qu'on ait un génome de référence et qu'on ne code que les différences, donc le point de départ n'est que de 84 Mb, pas 3,2 Gb. C'est quand même 37% de mieux que le record précédent. Article (accès fermé).

  • Un prototype de riz OGM qui fournit un anticorps contre un virus mortel (rotavirus) dans le Tiers Monde (news dans Nature). Mais me direz-vous, y a qu'à les rendre riches au lieu de faire des biotechnologies (y a vraiment un commentaire comme ça hélas). Sérieusement, c'est encore loin de l'application sur le terrain, mais c'est une approche originale et intéressante. Le risque bien sur c'est qu'alors que c'est relativement facile d'adapter un vaccin aux changements d'un virus, un OGM qui produit un anticorps donné risque d'être compliqué à mettre à jour quand le virus va évoluer une résistance.

  • C'est officiel : si vous utilisez Gmail, vous abandonnez toute prétention à avoir une correspondence privée. Comme remarqué par Nicolas Le Novère, cela s'applique à toutes les communications passant par des tiers (en tous cas aux Etats-Unis).

  • Commentaire Slashdot que je trouve intéressant : la carrière de Steve Jobs aurait consisté à rendre réelles les promesses de la "mère de toutes les démos".

  • Intéressant par rapport au débat sur le libre accès aux publications scientifiques (open access) : alors que certains collègues arguent que le libre accès pose problème dans le Tiers Monde (parce qu'il faut payer pour publier), une université nigérianne a arrété ses abonnements (qui coutent très cher) et se repose presque exclusivement sur le libre accès. Interview dans The Guardian.

  • Un billet de blog de Edzart Ernst, professeur de médecines alternatives, qui explique que sa formation de médecin ne comprenait pas d'apprentissage du pensée critique, et que c'est ses tentatives de comprendre l'homéopathie qui ont formé son esprit critique et son scepticisme.

  • Dan Graur attaque une étude de génomique, et l'auteur répond. Presque comme des grandes personnes. Blog de Graur.

  • Le poster présentant notre base de données Bgee sur l'expression des gènes et l'évolution pour la conférence ESEB (European society for evolutionary biology) est dans FigShare.

  • Ca nous est tous arrivés, mais Rosie Redfield le discute publiquement (comme toute sa science d'ailleurs) : des compétiteurs qui "oublient" de citer votre travail quand ils se basent dessus pour le leur.

  • Un petit ralage sur mon blog anglophone concernant l'abus du terme "dogme" dans les publications scientifiques.

  • Dans un parallèle que je trouve intéressant avec la conclusion de mon billet de lundi sur la génomique des cellules HeLa, un billet de blog qui note que les "Big Data" nous retournent à une vie de village sans vie privée.

jeudi 15 août 2013

Détruire les essais Golden Rice #OGM c'est comme détruire un laboratoire médical ou un entrepot MSF

[caption id="attachment_1457" align="aligncenter" width="174"]cliquez sur l'image cliquez sur l'image[/caption]

Vous avez probablement entendu que des personnes ont détruit des essais concernant le riz Golden Rice dont on a déjà beaucoup parlé ici (ce billet et celui-ci). Il y a un bon billet de Yann Kindo sur son blog concernant ce riz et cette destruction (c'est énervant qu'on puisse pas librement commenter sur Mediapart ; pourquoi tenir son blog là ?). Evidemment on lui reproche son ton strident ; c'est vrai quoi, faut être poli avec les pauvres gens qui détruisent la recherche visant à sauver des vies. Bref je ne vais pas discuter en détail à nouveau, mais juste revenir sur une analogie :

Dans mon premier billet sur le Golden Rice, j'ai fait une analogie avec le travail d'urgence de MSF, la Croix Rouge, etc. Ca ne résout pas les problèmes de fond, mais c'est très important. Il y a eu des gens pour reprendre cette analogie en disant que justement l'aide à Haïti avait plein de problèmes.

Alors poussons l'analogie : quel serait l'équivalent de détruire les essais Golden Rice aux Philippines, faits par un organisme public local à but non lucratif ?

Première analogie : l'industrie pharmacologique, comme l'industrie agronomique, fait parfois de vilaines choses. Donc haro sur toute recherche pharmacologique, qui est toute liée d'une manière ou d'une autre à l'industrie, c'est sur, et n'a pour vocation que de rendre les gens dépendants des médicaments, alors qu'ils n'ont qu'à avoir une saine ! Donc : détruisons les laboratoires publics faisant de la recherche sur des traitements dans les pays du Tiers Monde.

Deuxième analogie : MSF et la Croix Rouge ne sont pas tout roses non plus. Parfois y a des scandales dans l'humanitaire, n'ayons pas peur de le dire. Et puis en fournissant de l'aide, on entretient la dépendence de pays pauvres envers les pays industrialisés. Donc : détruisons les laboratoires de MSF, la Croix Rouge, et autres. Il faut surtout éviter qu'ils mettent en place des structures adaptées au terrain, qui ne serviront qu'à permettre le propagande de l'industrie pharma !

Au cas bien improbable où ces analogies ne vont auraient pas convaincu de l'utilité, voire la nécessité, de détruire la recherche publique locale concernant les problèmes de santé de pays pauvres, voici une pétition pour condamner ces destructions.

Voir aussi un bon billet sur un blog en anglais, dont je cite un excellent commentaire :
People riot over not being able to feed their kids, not over people trying to help.

Ce qui me met à l'esprit une dernière analogie. Il fut un temps où j'étais très actif dans le militantisme des droits de l'homme. Régulièrement il se trouvait des gens pour nous reprocher de nous occuper de problèmes lointains plutôt que des problèmes qu'eux trouvaient plus urgent locallement. Quand je leur posais la question, ces personnes n'étaient que rarement actives elles-mêmes (je n'écris pas "jamais" parce que je ne suis pas sur, mais je ne me rappelle pas d'un contre-exemple). Par contre on avait d'excellentes relations avec les militants qui eux s'occupaient des problèmes locaux (syndicalistes, aide alimentaire aux pauvres, aide aux sans abris, etc). Il me semble en lisant les commentaires sur le Golden Rice qu'on a à nouveau d'un coté des gens qui n'ont aucune solution mais sont très critiques de celle-ci, et d'un autre coté des gens comme Hellen Keller International ou les agronomes philippins qui eux cherchent des solutions, et sont ouverts à celle-ci si elle marche.

Choisi ton camp, camarade.

----

Mise à jour : l'excellent FAQ en anglais de l'International Rice Research Institute aux Philippines.

lundi 12 août 2013

La famille de Henrietta Lacks est d'accord pour qu'on utilise le génome HeLa, ce qui pose de nouvelles questions

[caption id="attachment_1407" align="aligncenter" width="164"]Cliquez sur l'image Cliquez sur l'image[/caption]

On a parlé précédemment du séquençage du génome HeLa, qui était à la fois très utile parce qu'il s'agit de cellules très utilisées en biologie moléculaire, génomique, et recherche biomédicale (plus de 76'000 articles publiés), et à la fois problématique éthiquement parce que ces cellules sont dérivées d'une patiente noire américaine dans les années 1950 sans autorisation ni consultation éthique. Conséquence de cette situation, le génome des cellules HeLa a été séquencé, mais la séquence a été retirée des bases de données pendant une discussion avec la famille. Laquelle discussion a maintenant abouti.

A noter qu'entre temps une deuxième version du génome, plus détaillée, a été obtenue et soumise à Nature ; elle vient d'être publiée. Et je cite du commentaire de Nature :
The paper’s reviewers did not raise privacy concerns before recommending it for publication; nor did Nature.

Comme cette deuxième séquence est de meilleure qualité, ils ont pu trouver l'origine probable de la tumeur, une intégration d'un virus dans le génome.

Les données ne sont pas publiquement disponibles, comme c'est normalement le cas pour toutes les données génomiques ayant fait l'objet de publications scientifiques, mais sont disponibles sur demande par des chercheurs devant justifier pourquoi ils en ont besoin, et devant ensuite rendre des comptes sur l'usage qui en est fait. Deux membres de la famille d'Henrietta Lacks font partie du comité qui va évaluer les demandes.

Comme le fait remarquer un responsable de bioéthique, on ne va pas pouvoir faire cela pour chaque famille dans laquelle un génome est séquencé. Le directeur du NIH (qui finance la recherche biomédicale américaine), Francis Collins, a d'ailleurs déclaré que ce cas restera unique. Mais comme noté dans l'article du New York Times, il faut que les personnes dont les tissues ou les génomes seront utilisés dans de futures études sur le cancer se sentent confiantes qu'elles seront prises en compte.

Certains collègues sont mécontents de cet arrangement, parce que cela ajoute encore des règles à une recherche que certains resentent déjà comme sur-régulée (par exemple sur ce blog). Plus pertinent à mon sens, Michael Eisen pose quelques bonnes questions sur son blog :

  • Quand et dans quelles conditions est-ce que les héritiers de quelqu'un doivent pouvoir décider de l'usage des données ? Et s'ils ne sont pas d'accord ? Est-ce limité aux héritiers légaux, ou à tous ceux qui partagent une proportion significative (combien ?) du génome (un cousin vaut un petit-enfant) ?

  • Quand quelqu'un donne son accord pour l'utilisation d'échantillons, il y a souvent une condition permettant de retirer le consentement apparemment. Est-ce que les héritiers peuvent aussi retirer le consentement, et jusque quand ?

  • Une partie du problème avec les HeLa est qu'elles ne sont pas anonymes. Mais il est possible de retrouver la famille et parfois l'individu probable d'origine d'une séquence d'ADN déjà. L'anonymat en génomique comme sur internet devient de plus en plus difficile à mettre en oeuvre.


Michael Eisen fait remarquer très justement à mon sens que nos sociétés sont baties autour de la liberté et de la responsabilité individuelles, mais en génomique (et en génétique d'ailleurs) cette individualité perd son sens. Toute décision que vous prenez concernant vos données génomiques affecte tous ceux qui vous sont apparentés de manière proche.

C'est en quelque sorte un aspect du "village planétaire". En plus des aspects prévus, on a la perte de vie privée, les voisins qui vous regardent et les ragots. En version génome + internet. Mais où va-t-on, je vous le demande ?

vendredi 9 août 2013

Ma semaine en sciences 3

[caption id="attachment_1410" align="aligncenter" width="114"]Cliquez si vous avez le temps Cliquez si vous avez le temps[/caption]

  • Une collègue de l'EBI (European Bioinformatics Institute), Jenny Cham, a une super page de notes-BD qu'elle prend lors des présentations auxquelles elle assiste : sur Flickr.

  • Vidéos cool de démo d'adaptation de médicaments potentiels à des protéines par des collègues du SIB (Swiss Institute of Bioinformatics) : click2drug.

  • RefSeq, une banque de données bioinformatique de séquences de gènes, fête ses 10 ans : communiqué au NCBI. 4000% et des brouettes de croissance durant ce temps.

  • Dans un compte-rendu de débat sur les OGM à Hawai, j'ai été frappé par l'extrait suivant (blog) :


Most people know something about the dramatic improvements society has seen since that particular era when it comes to automobile safety, control of exposure to secondary smoke, protection against egregious manifestations of racial and gender discrimination.  Most people have a concept of how far we have come since the 1960s with regard to a host of technologies in medicine and electronics.  What is unfamiliar to most people outside of agriculture is that there have been comparably dramatic improvements with respect to the safety of agricultural pest control technologies.

En effet, les personnes qui ne travaillent ni dans l'agriculture, ni dans les biotechnologies, tendent à considérer que l'on va faire les mêmes erreurs que l'on a fait avec, par exemple, le DDT. Ce n'est jamais impossible, mais nous avons maintenant énormément de contrôles, de tests et de standards que nous n'avions pas avant la prise de conscience des risques médicaux et environnementaux. C'est comme si vous utilisiez les taux d'accident d'avion des années 1920 pour refuser de prendre l'avion aujourd'hui. Ce qui ne veut pas dire que la biotechnologie ni les avions aient un risque zéro, qui n'existe pas.




  • Aussi sur les OGM : un pathogène décime les cultures d'oranges. Solution court terme : plus de pesticides, de plus en plus. Solution moyen terme : un OGM résistant, probablement avec un gène d'épinard. Devinez s'il y a davantage d'opposition aux pesticides ou à la recherche d'un OGM ? Excellent article dans le New York Times.

  • Des chercheurs ont trouvé qu'en rajoutant de la taurine à des lipides de plantes, notamment de soja, ils pouvaient faire croître un poisson carnivore à un taux similaire à ce qu'il a avec une alimentation à base de poisson. C'est potentiellement important, parce que la pisciculture est à l'heure actuelle largement dépendante d'aliments à base de poissons (péchés) pour nourir des poissons de culture (carnivores, et plus populaires avec les consommateurs parce que miam miam), ce qui est un non sens écologique et économique. L'article (accès fermé).

  • Pas vraiment de la science, mais deux BD web de ouf magnifiques : Boulet tout en hauteur, et la fin de l'incroyable BD Time de XKCD (voir ici). (L'humour geek fait partie du périmètre de ce blog après tout.)

  • Un nouvel article dans PLOS Biology (libre d'accès) propose et soutient expérimentalement un modèle pour expliquer les variations stochastiques de l'expression des gènes. Curieusement, ils ne citent pas Kupiec, quelle injustice. Excellent commentaire (aussi libre accès) de l'article, qui commence ainsi :


If a gene's promoter were a light switch, you'd probably call an electrician. That's because rather than simply turning on and off in a limited and predictable way, many genes—whose expression is controlled by their promoters—are expressed in bursts, with expression fluctuating randomly over time.

Notes hebdomadaires précédentes.

 

lundi 5 août 2013

Redif : Génétique médicale : plus c'est gros, moins c'est beau

Tiens c'est l'été, je vais rediffuser quelques vieux billets. Voici un de janvier 2012 (original sur blogspot) :









cliquez sur l'image

Sur l'excellent blog Genomes Unzipped, plusieurs scientifiques des génomes (génomiciens ?) ont eu une discussion d'un effet curieux et intéressant de génétique médicale et surtout psychiatrique. Il n'y a pas si longtemps, ces études se basaient sur des échantillons tout petits, pour des raisons pratiques. Et il se publiait régulièrement des corrélations très fortes entre gènes (ou plutôt variants génomiques) et maladies psychiatriques. Plus les tailles d'échantillons ont augmenté, grâce aux progrès techniques, et plus les effets sont devenus faibles, jusqu'à être non significatifs dans toutes les études sérieuses récentes. Le graphe ci-dessous montre cet effet, avec des effets très fortement positifs ou négatifs pour les petits échantillons à gauche, et des effets presque nuls (rapport de 1 pour la fréquence de symptômes entre personnes avec et sans une mutation) pour les gros échantillons à droite.

L'explication est corrélée (haha) à celle traitée dans un billet récent pour Google correlate. Les études petites ont une forte variance (il y a beaucoup d'erreur sur la mesure), et on en fait beaucoup de ces études. A force d'essayer de tout corréler avec un symptôme, il sort des corrélations fausses positives, qui semblent fortes mais ne reflètent aucune relation causale sous-jacente. Dans les études récentes, on fait peu d'études mais à grande échelle, où le bruit aléatoire est minimisé. On voit alors le vrai signal, à savoir qu'il n'y en a presque pas.

Comme le disent les collègues, les petites études se comportent comme des générateurs aléatoires de résultats, lorsqu'il n'y a pas d'effet fort à détecter.

Par exemple, en 1992 une mutation du gène ACE a été trouvée qui augmentait les chances d'attaque cardiaque d'un facteur 3. Mais les études suivantes ont échoué à reproduire le résultat, tandis que le même gène se retrouvait dans plein d'autres études supposément lié à toutes sortes de pathologies. Ce gène était apparu sur le radar par hasard au début, et ensuite tout le monde l'a étudié. Les résultat négatifs (probablement plein, va savoir) n'ont pas été publiés, les résultats (faux) positifs, si. Avec le recul, ACE ne semble pas jouer de rôle particulier dans les attaques cardiaques.

Ce qui motive les collègues de Genomes Unzipped, c'est une étude récente qui fait comme si 20 ans d'expérience ne s'étaient pas accumulés, et rapporte un lien entre la "prosocialité" et un gène très étudié (récepteur à l'oxytocine), sur la base de 23 personnes. Pourtant, des études à large échelle (5117 personnes, 1'252'387 marqueurs génétiques) montrent qu'on ne trouve avec les données présentes aucun lien entre personnalité et gènes.

Les Genomes Unzipped boys ne jettent pas le bébé avec l'eau du bain, mais notent que les liens qui existent probablement entre génétique et traits complexes, tels que la personnalité, demanderont des études très larges pour être établis, étant donné que ce sont des effets faibles (et probablement avec des interactions complexes entre gènes, mais c'est une autre histoire).

Le blog de Nature montre que le même phénomène peut affecter des tests génétiques qui sont d'ores et déjà approuvés et commercialisés : le test pour CYP2C19 est approuvé par la FDA, pour déterminer quel traitement utiliser pour des maladies cardiovasculaires. Dans une méta-analyse (analyse combinée de plein d'études précédentes) avec 42'016 patients et 32 études, il n'y a aucun lien entre le gène et le médicament ! Je cite :
While there initially appeared to be a relationship, there was evidence it was biased by the small size of studies. When analysis was restricted to larger studies the association disappeared.


Je finirais en notant, en dehors de la génétique, que les faux positifs sont aussi un problème pour les tests HIV conduits sur le terrain en Afrique. Comme quoi comprendre les statistiques et le design expérimental peut être vraiment important.