vendredi 30 août 2013

Notes sur ma semaine en sciences 6

[caption id="attachment_1515" align="aligncenter" width="173"]cliquez sur l'image cliquez sur l'image[/caption]

  • Joe Felsenstein, le chercheur le plus connu en phylogénie et méthodes d'évolution moléculaire (dans notre petit cercle, je n'hésiterais pas à le qualifier de légende vivante) raconte ses souvenirs d'étudiant à la Marche sur Washington contre la ségrégation raciale, il y a 50 ans.

  • Une étude médicale australienne liste plus de 150 traitements apparemment inutiles, ou en tout cas qui manquent d'évidence qu'ils sont utiles, de "Arthroscopic surgery for knee osteoarthritis" à "Hospitalisation for bed rest in multiple pregnancy". L'article, la liste de traitements.

  • Liste en cours de construction (n'hésitez pas à contribuer) des journaux scientifiques acceptant des soumissions qui avaient été mises sur ArXiv auparavent.

  • Discussion intéressante sur un blog de bioinformatique concernant la différence entre significativité du test (par ex. p < 1%) et magnitude de l'effet (par ex. 2 fois plus d'expression) dans les contextes des puces à ADN (microarrays) et du RNA-seq.

  • Excellent article de fond sur le riz doré Golden Rice dans le New York Times.

  • J'ai acheté la traduction française du livre "Au pays des Ranacaudas", qui explique la spéciation et la sélection naturelle aux enfants. Malgrès quelques tournures un peu bizarres dues à la traduction d'un livre pour enfants en vers, gros succès auprès de mon fils de 6 ans. Je recommende.

  • Je suis bête, je m'invente du travail. Ma proposition de cours pour doctorants "Blogging and using Twitter for scientific communication" a été acceptée. Maitenant faut l'organiser. J'ai déjà trouvé ceci et ceci.

  • Un excellent commentaire sur le Golden Rice de la part d'un économiste, Alexander Stein, qui a fait sa thèse sur la question : son blog, sa page professionnelle avec ses publications sur le sujet. Répond aux commentaires du type "qu'ils mangent de la brioche des carottes". Lire notamment un excellent commentaire de sa part sur la pertinence des investissements dans le Golden Rice par rapport à d'autres investissements possibles. Quand je vois la quantité de travail fait sur ces questions, et quand je lis ce que Greenpeace écrit, je ne peux que conclure qu'ils sont de mauvaise foi.

  • Un papier intéressant (libre d'accès) sur la comparaison des chromosomes sexuels de serpents. Les serpents, comme les oiseaux, ont un système ZZ (mâle) ZW (femelle). Comme ces chromosomes sont plus ou moins différenciés (dans différentes espèces le W est plus ou moins différent du Z), cela permet de tester des hypothèses sur les rôles respectifs de l'abondance de mutations chez les mâles (davantage de divisions cellulaires pour faire un spermatozoide qu'un ovule), de la sélection de gènes spécifiquement avantageux pour un sexe ou l'autre, et de l'absence de recombinaison sur le W.

  • En écrivant mon prochain projet de recherche, j'ai cherché des exemples de phénotypes morphologiques clairement non adaptatifs (des trucs qui se voient et qui ne servent à rien, en gros). Ca n'est pas évident, mais la couleur des organismes vivant très profond dans la mer me paraît un bon candidat. Pas de lumière : la couleur ne peut pas être importante, si ?

  • La 2ème compétition pour savoir quelle méthode bioinformatique marche la mieux pour prédire la fonction des protéines a été lancée. Un problème difficile. J'hésite à entrer cette année ; c'est intéressant mais ça prend du temps d'autres projets. Détails sur le blog de Iddo Friedberg.

  • Mike Eisen, militant acharné pro-Open Access et anti Impact Factor (voir mes billets sur politique de publication), demande dans quels journaux les gens ont publié pour avoir un poste de prof. Malheureusement pour lui, les journaux pas forcément ouverts à haut facteur d'impact semblent dominer. Discussion sur Twitter.

  • Un collègue m'a contacté pour écrire un livre sur les OGM. J'ai décliné, je préfère écrire sur ce blog sur plein de sujets, et avancer ma recherche quand même.

  • Un article de biologie évolutive pas encore publié officiellement, mais mis dans ArXiv (explication dans ce billet), est commenté dans Nature. Je ne sais pas si c'est une première, mais ça montre que les esprits changent. D'ailleurs mon journal préféré, Molecular Biology and Evolution, autorise aussi depuis peu les articles à y être soumis après avoir été déposés dans ArXiv. A propos de l'article lui-même, excellent commentaire sur le blog de John Hawks (avec photo du musée des Eyzies, coucou le Dinoblog).

vendredi 23 août 2013

Notes sur ma semaine en sciences 5

(pas d'image, le wifi de l'hotel est trop lent.)

  • Pierre Barthélémy du blog Passeur de sciences sur Le Monde évite d'habitude de parler d'OGM. Il y a une actualité scientifique intéressante sur le sujet (utilisation d'interférence ARN), il fait un billet, et qu'est-ce qui domine les commentaires ? Des trucs à coté de la plaque sur Monsanto et le bio, des remarques négatives sur le ton de son titre, et des remarques particulièrement constructives sur la photo d'illustration. Faut pas désespérer.

  • Article très intéressant (accès fermé hélas) qui montre un modèle de prédiction très précise de l'expression de gènes de levure en fonction de l'affinité précise (et manipulable expérimentalement) de l'ADN devant le gène (le promoteur) pour des protéines de régulation (facteurs de transcription). N'en déplaise à M. Kupiec.

  • Je passe le gros de la semaine au congrès européen de biologie évolutive ESEB. Il faudrait que j'en fasse un compte-rendu sur ce blog, ça serait pas cool ça ? Mais du coup j'ai peu d'autres nouvelles neuves. Ce qui m'a frappé dans la conférence cette année ? Le pouvoir de la génomique à unir des domaines qui avaient peu en commun, de la génétique moléculaire à l'étude de la spéciation, de l'hybridation et la domestication à l'expression des gènes et l'évolution de la morphologie jusqu'à la sélection naturelle et l'étude de l'impact du changement climatique. Et plein d'études sur les papillons et les épinoches.

  • Un hybride journal / blog sur l'intersection médecine et biologie évolutive : The Evolution & Medicine Review.

lundi 19 août 2013

Redif : #Wikipedia est une excellente source d'informations scientifiques et médicales

On continue la rediffusion de vieux billets. Un autre de janvier 2012 (original sur blogspot) :









cliquez sur l'image (et n'oubliez pas de cliquer sur le point rouge)

Je commence ce billet par une constatation double : beaucoup de mes collègues et moi-même faisons un usage abondant et pertinent de Wikipedia dans notre vie professionnelle (vous croyez que je connais tous les gènes, tous les organes, toutes les bestioles ?) ; et d'autre part beaucoup de personnes à l'université continuent à décourager les étudiants d'utiliser Wikipedia, et à le traiter comme une sous-resource, pour paresseux. Je trouve ça choquant, et je le prouve.

Une étude récente (malheureusement d'accès payant paradoxalement) dans le journal Psychological Medecine a comparé l'information concernant des pathologies liées à la schizophrénie (5 pathologies) ou à la dépression (5 pathologies) entre différentes sources d'information : les sites internet arrivant en tête de recherches pour "depression" ou "schizophrenia" (14 sites au total), y compris Wikipedia mais aussi des sites plus officiels, comme celui du National Institute of Mental Health, ainsi que l'Encyclopedia Britanica en ligne, et un livre de psychiatrie utilisé en études de médecine.

En comparant ces différentes ressources, ils trouvent, et je cite :
The quality of information about depression and schizophrenia on Wikipedia was generally rated higher than other centrally controlled resources, including 14 mental health-related websites, Encyclopaedia Britannica and Kaplan & Sadock’s Comprehensive Textbook of Psychiatry.

En d'autres termes, et comme ils précisent plus loin, les articles de Wikipedia sur des sujets de santé contiennent peu d'erreurs factuelles, malgré un certain manque de couverture. Ils sont également bien référencés, mais paradoxalement peuvent être difficiles à comprendre. Ils sont généralement meilleurs en moyenne que les autres sources, y compris le livre spécialisé.

De manière intéressante aussi, bien qu'un avantage majeur de Wikipedia sur le livre est sa mise à jour fréquente et rapide, le livre fait mieux que la plupart des sites web officiels. Ces sites sont moins bons que le livre, mais pas plus à jour. Au moins, ils sont gratuits.

Ceci nous amène à un second point, qui est qu'il est difficile de maintenir de l'information scientifique ou médicale à jour de manière centralisée, avec des ressources forcément limitées.

Il y a un autre article récent sur ce sujet dans le numéro spécial annuel sur les bases de données en biologie (NAR Database, entièrement gratuit) : les auteurs discutent de l'intégration entre Wikipedia, ou d'autres approches participatives, avec des bases de données spécialisées de biologie. Ils partent de leur expérience positive avec les bases de données Pfam (domaines protéiques) et Rfam (ARNs fonctionnels) : les données structurées sont dans une base de données SQL dédiée, mais les annotations en texte qui décrivent la fonction des molécules passent par Wikipedia. Plus précisément, à un moment ils ont exporté toute leur information vers Wikipedia, et depuis ils récupèrent toutes les modifications qui sont faites dans les pages Wikipedia correspondantes, et les remettent dans Pfam et Rfam.

Par exemple, l'article sur mon domaine préféré, de liaison aux hormones des récepteurs nucléaires d'hormones : dans la page Pfam il y a de l'information textuelle, avec un bouton "Edit in Wikipedia". On clique dessus, et on arrive sur la page Wikipedia correspondante, en mode édition directement qui plus est. Et là-dedans vous avez de jolies boîtes avec de l'information structurée venant de Pfam. C'est beau c'est grand c'est magnifique.

Ils ont des curateurs qui vérifient les infos venant de Wikipedia, et ils en acceptent 99%. Ils ont des milliers d'éditions par an, donc beaucoup d'informations pertinentes, à jour, et ... gratuites. Et disponibles à tous !

Ils regardent aussi d'autres modèles d'intégration avec Wikipedia, et les limitations. Par exemple, Wikipedia a un critère d'intérêt général, qui fait qu'on peut avoir une entrée par gène humain, ou par domaine protéique (partagé par plein de protéines), mais pas une entrée par gène de poisson épinoche, ou par variant de gène humain. Une autre limitation est la règle "pas de travaux inédits", qui interdit d'ajouter des infos que vous avez obtenu de vous-même, même par une méthode toute bête et simple. Or une base de données scientifique ne peut pas toujours accepter ces limitations. Et les wiki spécialisés ne marchent généralement pas aussi bien que Wikipedia, c'est peu de le dire.

Leur conclusion, et c'est là où je trouve que ces deux articles à priori bien distincts se rejoignent, est que nous ne pourrons maintenir à jour une information pertinente en biologie (et médecine donc) qu'en s'alliant à Wikipedia (et autres ressources des foules) de manière intelligente. Je suis bien d'accord, d'ailleurs j'utilise déjà Wikipedia. Il ne me reste plus qu'à devenir intelligent.

vendredi 16 août 2013

Notes sur ma semaine en sciences 4

[caption id="attachment_1468" align="aligncenter" width="259"]cliquez sur l'image cliquez sur l'image[/caption]

  • Un bilan de 451 additifs alimentaires autorisés aux Etats-Unis entre 1997 et 2012 indique que l'expertise n'a jamais été indépendente, et qu'elle a été faite par un employé de la compagnie concernée dans 22% des cas. Clairement, un système à revoir. Article d'accès libre.

  • J'ai commencé à écrire ma prochaine demande de financement au Fonds national suisse pour la science (je sais, pour un français dire "fonds national" ça sonne bizarre). On peut poser la question de la pertinence de l'écriture de ces projets, sachant que le meilleur prédicteur du succès d'un chercheur est sa productivité passée. Donc en regardant la mienne, on peut raisonablement s'attendre à ce que premièrement je continue à obtenir des résultats et à les publier, deuxièmement ces résultats ne changent pas la face du monde, et troisièmement qu'ils soient quand même utiles et cités par des collègues. Mais cet exercice est quand même important et utile. Cela me force à réfléchir à la cohérence de ce qu'on veut faire, au contexte international, et à convaincre des collègues de la pertinence de nos projets. Je pense que cela vaut le coup.

  • Un compte-rendu intéressant d'analyse de la vigueur hybride dans le maïs cultivé : le fait qu'on obtient de meilleurs rendements en croisant deux souches pures bien choisies qu'en sélectionnant une souche seule (et c'est pourquoi la plupart des paysans rachètent des graines tous les ans, OGM ou pas).

  • Un collègue améliore la productivité du manioc en Colombie grâce aux champignons microscopiques, j'y reviendrais. Communiqué de presse, article libre d'accès.

  • Une nouvelle technique de compression de données spécifique aux génomes humains permet de ternir l'information génomique d'une personne en 2,5 Mb. A noter que cela suppose qu'on ait un génome de référence et qu'on ne code que les différences, donc le point de départ n'est que de 84 Mb, pas 3,2 Gb. C'est quand même 37% de mieux que le record précédent. Article (accès fermé).

  • Un prototype de riz OGM qui fournit un anticorps contre un virus mortel (rotavirus) dans le Tiers Monde (news dans Nature). Mais me direz-vous, y a qu'à les rendre riches au lieu de faire des biotechnologies (y a vraiment un commentaire comme ça hélas). Sérieusement, c'est encore loin de l'application sur le terrain, mais c'est une approche originale et intéressante. Le risque bien sur c'est qu'alors que c'est relativement facile d'adapter un vaccin aux changements d'un virus, un OGM qui produit un anticorps donné risque d'être compliqué à mettre à jour quand le virus va évoluer une résistance.

  • C'est officiel : si vous utilisez Gmail, vous abandonnez toute prétention à avoir une correspondence privée. Comme remarqué par Nicolas Le Novère, cela s'applique à toutes les communications passant par des tiers (en tous cas aux Etats-Unis).

  • Commentaire Slashdot que je trouve intéressant : la carrière de Steve Jobs aurait consisté à rendre réelles les promesses de la "mère de toutes les démos".

  • Intéressant par rapport au débat sur le libre accès aux publications scientifiques (open access) : alors que certains collègues arguent que le libre accès pose problème dans le Tiers Monde (parce qu'il faut payer pour publier), une université nigérianne a arrété ses abonnements (qui coutent très cher) et se repose presque exclusivement sur le libre accès. Interview dans The Guardian.

  • Un billet de blog de Edzart Ernst, professeur de médecines alternatives, qui explique que sa formation de médecin ne comprenait pas d'apprentissage du pensée critique, et que c'est ses tentatives de comprendre l'homéopathie qui ont formé son esprit critique et son scepticisme.

  • Dan Graur attaque une étude de génomique, et l'auteur répond. Presque comme des grandes personnes. Blog de Graur.

  • Le poster présentant notre base de données Bgee sur l'expression des gènes et l'évolution pour la conférence ESEB (European society for evolutionary biology) est dans FigShare.

  • Ca nous est tous arrivés, mais Rosie Redfield le discute publiquement (comme toute sa science d'ailleurs) : des compétiteurs qui "oublient" de citer votre travail quand ils se basent dessus pour le leur.

  • Un petit ralage sur mon blog anglophone concernant l'abus du terme "dogme" dans les publications scientifiques.

  • Dans un parallèle que je trouve intéressant avec la conclusion de mon billet de lundi sur la génomique des cellules HeLa, un billet de blog qui note que les "Big Data" nous retournent à une vie de village sans vie privée.

jeudi 15 août 2013

Détruire les essais Golden Rice #OGM c'est comme détruire un laboratoire médical ou un entrepot MSF

[caption id="attachment_1457" align="aligncenter" width="174"]cliquez sur l'image cliquez sur l'image[/caption]

Vous avez probablement entendu que des personnes ont détruit des essais concernant le riz Golden Rice dont on a déjà beaucoup parlé ici (ce billet et celui-ci). Il y a un bon billet de Yann Kindo sur son blog concernant ce riz et cette destruction (c'est énervant qu'on puisse pas librement commenter sur Mediapart ; pourquoi tenir son blog là ?). Evidemment on lui reproche son ton strident ; c'est vrai quoi, faut être poli avec les pauvres gens qui détruisent la recherche visant à sauver des vies. Bref je ne vais pas discuter en détail à nouveau, mais juste revenir sur une analogie :

Dans mon premier billet sur le Golden Rice, j'ai fait une analogie avec le travail d'urgence de MSF, la Croix Rouge, etc. Ca ne résout pas les problèmes de fond, mais c'est très important. Il y a eu des gens pour reprendre cette analogie en disant que justement l'aide à Haïti avait plein de problèmes.

Alors poussons l'analogie : quel serait l'équivalent de détruire les essais Golden Rice aux Philippines, faits par un organisme public local à but non lucratif ?

Première analogie : l'industrie pharmacologique, comme l'industrie agronomique, fait parfois de vilaines choses. Donc haro sur toute recherche pharmacologique, qui est toute liée d'une manière ou d'une autre à l'industrie, c'est sur, et n'a pour vocation que de rendre les gens dépendants des médicaments, alors qu'ils n'ont qu'à avoir une saine ! Donc : détruisons les laboratoires publics faisant de la recherche sur des traitements dans les pays du Tiers Monde.

Deuxième analogie : MSF et la Croix Rouge ne sont pas tout roses non plus. Parfois y a des scandales dans l'humanitaire, n'ayons pas peur de le dire. Et puis en fournissant de l'aide, on entretient la dépendence de pays pauvres envers les pays industrialisés. Donc : détruisons les laboratoires de MSF, la Croix Rouge, et autres. Il faut surtout éviter qu'ils mettent en place des structures adaptées au terrain, qui ne serviront qu'à permettre le propagande de l'industrie pharma !

Au cas bien improbable où ces analogies ne vont auraient pas convaincu de l'utilité, voire la nécessité, de détruire la recherche publique locale concernant les problèmes de santé de pays pauvres, voici une pétition pour condamner ces destructions.

Voir aussi un bon billet sur un blog en anglais, dont je cite un excellent commentaire :
People riot over not being able to feed their kids, not over people trying to help.

Ce qui me met à l'esprit une dernière analogie. Il fut un temps où j'étais très actif dans le militantisme des droits de l'homme. Régulièrement il se trouvait des gens pour nous reprocher de nous occuper de problèmes lointains plutôt que des problèmes qu'eux trouvaient plus urgent locallement. Quand je leur posais la question, ces personnes n'étaient que rarement actives elles-mêmes (je n'écris pas "jamais" parce que je ne suis pas sur, mais je ne me rappelle pas d'un contre-exemple). Par contre on avait d'excellentes relations avec les militants qui eux s'occupaient des problèmes locaux (syndicalistes, aide alimentaire aux pauvres, aide aux sans abris, etc). Il me semble en lisant les commentaires sur le Golden Rice qu'on a à nouveau d'un coté des gens qui n'ont aucune solution mais sont très critiques de celle-ci, et d'un autre coté des gens comme Hellen Keller International ou les agronomes philippins qui eux cherchent des solutions, et sont ouverts à celle-ci si elle marche.

Choisi ton camp, camarade.

----

Mise à jour : l'excellent FAQ en anglais de l'International Rice Research Institute aux Philippines.

lundi 12 août 2013

La famille de Henrietta Lacks est d'accord pour qu'on utilise le génome HeLa, ce qui pose de nouvelles questions

[caption id="attachment_1407" align="aligncenter" width="164"]Cliquez sur l'image Cliquez sur l'image[/caption]

On a parlé précédemment du séquençage du génome HeLa, qui était à la fois très utile parce qu'il s'agit de cellules très utilisées en biologie moléculaire, génomique, et recherche biomédicale (plus de 76'000 articles publiés), et à la fois problématique éthiquement parce que ces cellules sont dérivées d'une patiente noire américaine dans les années 1950 sans autorisation ni consultation éthique. Conséquence de cette situation, le génome des cellules HeLa a été séquencé, mais la séquence a été retirée des bases de données pendant une discussion avec la famille. Laquelle discussion a maintenant abouti.

A noter qu'entre temps une deuxième version du génome, plus détaillée, a été obtenue et soumise à Nature ; elle vient d'être publiée. Et je cite du commentaire de Nature :
The paper’s reviewers did not raise privacy concerns before recommending it for publication; nor did Nature.

Comme cette deuxième séquence est de meilleure qualité, ils ont pu trouver l'origine probable de la tumeur, une intégration d'un virus dans le génome.

Les données ne sont pas publiquement disponibles, comme c'est normalement le cas pour toutes les données génomiques ayant fait l'objet de publications scientifiques, mais sont disponibles sur demande par des chercheurs devant justifier pourquoi ils en ont besoin, et devant ensuite rendre des comptes sur l'usage qui en est fait. Deux membres de la famille d'Henrietta Lacks font partie du comité qui va évaluer les demandes.

Comme le fait remarquer un responsable de bioéthique, on ne va pas pouvoir faire cela pour chaque famille dans laquelle un génome est séquencé. Le directeur du NIH (qui finance la recherche biomédicale américaine), Francis Collins, a d'ailleurs déclaré que ce cas restera unique. Mais comme noté dans l'article du New York Times, il faut que les personnes dont les tissues ou les génomes seront utilisés dans de futures études sur le cancer se sentent confiantes qu'elles seront prises en compte.

Certains collègues sont mécontents de cet arrangement, parce que cela ajoute encore des règles à une recherche que certains resentent déjà comme sur-régulée (par exemple sur ce blog). Plus pertinent à mon sens, Michael Eisen pose quelques bonnes questions sur son blog :

  • Quand et dans quelles conditions est-ce que les héritiers de quelqu'un doivent pouvoir décider de l'usage des données ? Et s'ils ne sont pas d'accord ? Est-ce limité aux héritiers légaux, ou à tous ceux qui partagent une proportion significative (combien ?) du génome (un cousin vaut un petit-enfant) ?

  • Quand quelqu'un donne son accord pour l'utilisation d'échantillons, il y a souvent une condition permettant de retirer le consentement apparemment. Est-ce que les héritiers peuvent aussi retirer le consentement, et jusque quand ?

  • Une partie du problème avec les HeLa est qu'elles ne sont pas anonymes. Mais il est possible de retrouver la famille et parfois l'individu probable d'origine d'une séquence d'ADN déjà. L'anonymat en génomique comme sur internet devient de plus en plus difficile à mettre en oeuvre.


Michael Eisen fait remarquer très justement à mon sens que nos sociétés sont baties autour de la liberté et de la responsabilité individuelles, mais en génomique (et en génétique d'ailleurs) cette individualité perd son sens. Toute décision que vous prenez concernant vos données génomiques affecte tous ceux qui vous sont apparentés de manière proche.

C'est en quelque sorte un aspect du "village planétaire". En plus des aspects prévus, on a la perte de vie privée, les voisins qui vous regardent et les ragots. En version génome + internet. Mais où va-t-on, je vous le demande ?

vendredi 9 août 2013

Ma semaine en sciences 3

[caption id="attachment_1410" align="aligncenter" width="114"]Cliquez si vous avez le temps Cliquez si vous avez le temps[/caption]

  • Une collègue de l'EBI (European Bioinformatics Institute), Jenny Cham, a une super page de notes-BD qu'elle prend lors des présentations auxquelles elle assiste : sur Flickr.

  • Vidéos cool de démo d'adaptation de médicaments potentiels à des protéines par des collègues du SIB (Swiss Institute of Bioinformatics) : click2drug.

  • RefSeq, une banque de données bioinformatique de séquences de gènes, fête ses 10 ans : communiqué au NCBI. 4000% et des brouettes de croissance durant ce temps.

  • Dans un compte-rendu de débat sur les OGM à Hawai, j'ai été frappé par l'extrait suivant (blog) :


Most people know something about the dramatic improvements society has seen since that particular era when it comes to automobile safety, control of exposure to secondary smoke, protection against egregious manifestations of racial and gender discrimination.  Most people have a concept of how far we have come since the 1960s with regard to a host of technologies in medicine and electronics.  What is unfamiliar to most people outside of agriculture is that there have been comparably dramatic improvements with respect to the safety of agricultural pest control technologies.

En effet, les personnes qui ne travaillent ni dans l'agriculture, ni dans les biotechnologies, tendent à considérer que l'on va faire les mêmes erreurs que l'on a fait avec, par exemple, le DDT. Ce n'est jamais impossible, mais nous avons maintenant énormément de contrôles, de tests et de standards que nous n'avions pas avant la prise de conscience des risques médicaux et environnementaux. C'est comme si vous utilisiez les taux d'accident d'avion des années 1920 pour refuser de prendre l'avion aujourd'hui. Ce qui ne veut pas dire que la biotechnologie ni les avions aient un risque zéro, qui n'existe pas.




  • Aussi sur les OGM : un pathogène décime les cultures d'oranges. Solution court terme : plus de pesticides, de plus en plus. Solution moyen terme : un OGM résistant, probablement avec un gène d'épinard. Devinez s'il y a davantage d'opposition aux pesticides ou à la recherche d'un OGM ? Excellent article dans le New York Times.

  • Des chercheurs ont trouvé qu'en rajoutant de la taurine à des lipides de plantes, notamment de soja, ils pouvaient faire croître un poisson carnivore à un taux similaire à ce qu'il a avec une alimentation à base de poisson. C'est potentiellement important, parce que la pisciculture est à l'heure actuelle largement dépendante d'aliments à base de poissons (péchés) pour nourir des poissons de culture (carnivores, et plus populaires avec les consommateurs parce que miam miam), ce qui est un non sens écologique et économique. L'article (accès fermé).

  • Pas vraiment de la science, mais deux BD web de ouf magnifiques : Boulet tout en hauteur, et la fin de l'incroyable BD Time de XKCD (voir ici). (L'humour geek fait partie du périmètre de ce blog après tout.)

  • Un nouvel article dans PLOS Biology (libre d'accès) propose et soutient expérimentalement un modèle pour expliquer les variations stochastiques de l'expression des gènes. Curieusement, ils ne citent pas Kupiec, quelle injustice. Excellent commentaire (aussi libre accès) de l'article, qui commence ainsi :


If a gene's promoter were a light switch, you'd probably call an electrician. That's because rather than simply turning on and off in a limited and predictable way, many genes—whose expression is controlled by their promoters—are expressed in bursts, with expression fluctuating randomly over time.

Notes hebdomadaires précédentes.

 

lundi 5 août 2013

Redif : Génétique médicale : plus c'est gros, moins c'est beau

Tiens c'est l'été, je vais rediffuser quelques vieux billets. Voici un de janvier 2012 (original sur blogspot) :









cliquez sur l'image

Sur l'excellent blog Genomes Unzipped, plusieurs scientifiques des génomes (génomiciens ?) ont eu une discussion d'un effet curieux et intéressant de génétique médicale et surtout psychiatrique. Il n'y a pas si longtemps, ces études se basaient sur des échantillons tout petits, pour des raisons pratiques. Et il se publiait régulièrement des corrélations très fortes entre gènes (ou plutôt variants génomiques) et maladies psychiatriques. Plus les tailles d'échantillons ont augmenté, grâce aux progrès techniques, et plus les effets sont devenus faibles, jusqu'à être non significatifs dans toutes les études sérieuses récentes. Le graphe ci-dessous montre cet effet, avec des effets très fortement positifs ou négatifs pour les petits échantillons à gauche, et des effets presque nuls (rapport de 1 pour la fréquence de symptômes entre personnes avec et sans une mutation) pour les gros échantillons à droite.

L'explication est corrélée (haha) à celle traitée dans un billet récent pour Google correlate. Les études petites ont une forte variance (il y a beaucoup d'erreur sur la mesure), et on en fait beaucoup de ces études. A force d'essayer de tout corréler avec un symptôme, il sort des corrélations fausses positives, qui semblent fortes mais ne reflètent aucune relation causale sous-jacente. Dans les études récentes, on fait peu d'études mais à grande échelle, où le bruit aléatoire est minimisé. On voit alors le vrai signal, à savoir qu'il n'y en a presque pas.

Comme le disent les collègues, les petites études se comportent comme des générateurs aléatoires de résultats, lorsqu'il n'y a pas d'effet fort à détecter.

Par exemple, en 1992 une mutation du gène ACE a été trouvée qui augmentait les chances d'attaque cardiaque d'un facteur 3. Mais les études suivantes ont échoué à reproduire le résultat, tandis que le même gène se retrouvait dans plein d'autres études supposément lié à toutes sortes de pathologies. Ce gène était apparu sur le radar par hasard au début, et ensuite tout le monde l'a étudié. Les résultat négatifs (probablement plein, va savoir) n'ont pas été publiés, les résultats (faux) positifs, si. Avec le recul, ACE ne semble pas jouer de rôle particulier dans les attaques cardiaques.

Ce qui motive les collègues de Genomes Unzipped, c'est une étude récente qui fait comme si 20 ans d'expérience ne s'étaient pas accumulés, et rapporte un lien entre la "prosocialité" et un gène très étudié (récepteur à l'oxytocine), sur la base de 23 personnes. Pourtant, des études à large échelle (5117 personnes, 1'252'387 marqueurs génétiques) montrent qu'on ne trouve avec les données présentes aucun lien entre personnalité et gènes.

Les Genomes Unzipped boys ne jettent pas le bébé avec l'eau du bain, mais notent que les liens qui existent probablement entre génétique et traits complexes, tels que la personnalité, demanderont des études très larges pour être établis, étant donné que ce sont des effets faibles (et probablement avec des interactions complexes entre gènes, mais c'est une autre histoire).

Le blog de Nature montre que le même phénomène peut affecter des tests génétiques qui sont d'ores et déjà approuvés et commercialisés : le test pour CYP2C19 est approuvé par la FDA, pour déterminer quel traitement utiliser pour des maladies cardiovasculaires. Dans une méta-analyse (analyse combinée de plein d'études précédentes) avec 42'016 patients et 32 études, il n'y a aucun lien entre le gène et le médicament ! Je cite :
While there initially appeared to be a relationship, there was evidence it was biased by the small size of studies. When analysis was restricted to larger studies the association disappeared.


Je finirais en notant, en dehors de la génétique, que les faux positifs sont aussi un problème pour les tests HIV conduits sur le terrain en Afrique. Comme quoi comprendre les statistiques et le design expérimental peut être vraiment important.

vendredi 26 juillet 2013

Notes sur ma semaine en sciences

[caption id="attachment_1380" align="aligncenter" width="185"]cliquez pour voir un tweet rigolo sur notre conférence cliquez pour voir un tweet rigolo sur notre conférence[/caption]

Voir précédent billet de notes pour le principe.

  • Peut-être le meilleur article grand public que j'ai lu sur les OGM (en anglais) : article sur PBS (média public américain). C'est basé sur l'interview d'un chercheur en biologie végétale et agronomie qui vient d'une famille de fermiers, et travaille avec des fermiers aux Etat-Unis et en Asie. Il travaille avec les paysans, cherche des moyens d'être plus efficace en utilisant moins de pesticides, particulièrement dans les conditions de sécurité et de standards faibles des pays pauvres, et voit les OGM comme un bon outil pour ça. Il a été surpris et choqué par la réaction des anti-OGM urbains. Lisez tout l'article avant d'être content ou furieux.

  • J'ai co-organisé un workshop, Quest for Orthologs, cette semaine. C'est fou tous les détails dont il faut s'occuper quand on est l'organisateur ! Excellentes discussions geeky sur les standards et formats pour parler d'orthologues, et sur l'utilisation que l'on peut en faire (voir ce billet et celui-ci).

  • Observation intéressante dans la discussion durant le workshop: des simulations peuvent être très utiles pour montrer quand est-ce qu'une méthode ne marche pas, mais ne permetten pas de montrer qu'une méthode marche sur les vraies données (très complexes en biologie).

  • PLOS Computational Biology a une série intéressante (et libre d'accès) sur la bioinformatique appliquée à la médecine : Translational Bioinformatics.

  • Une bactérie avec 12'356 gènes protéiques ! Comme une mouche. Pour comparaison, E. coli qu'on étudie le plus et qui est dans notre ventre a environ 4'300 gènes. C'est une cyanobactérie, donc qui fait de la photosynthèse. Les chloroplastes qui permettent la photosynthèse dans les cellules des plantes vertes sont des cyanobactéries absorbées par les cellules eucaryotes. Article dans Genome Biology and Evolution (accès fermé).

  • Dans le récent congrès de biologie computationnelle ISMB/ECCB, Nadja, une étudiante du labo, a eu un prix pour son poster, et Romain, un ex-étudiant du labo maintenant en Grande Bretagne, en a eu un autre pour le sien. Yo !

  • Kevin Folta, biologiste des plantes qui a déjà utilisé son blog pour discuter avec une anti-OGM (mentionné ici), et qui a proposé en vain à des anti-OGM de collaborer pour reproduire une expérience (mentionné ici), a proposé de débattre avec les participants à une conférence anti-OGM. Surprenamment pour des gens qui cherchent à faire toute la lumière et à comprendre la réalité des choses, ils ont refusé. C'est la vie, comme disent les français.

  • Le génome d'un rotifère bdeloide, publié dans Nature (libre accès), permet de comprendre un peu mieux comment un groupe large d'organismes multicellulaires survit sans reproduction sexuée depuis des dizaines de millions d'années. Très bon compte-rendu dans Le Monde.

  • Une évaluation de tous les logiciels d'assemblage de génomes (passer de petits fragments d'ADN séquencés à un génome complet) arrive à la triste conclusion que pour le moment c'est la cata. Excellente collection de liens sur le site de l'Assemblathon.

  • Réflexion intéressante dans le journal Current Biology sur l'historique de l'héroïne et l'impact de l'interdiction des drogues "récréatives" sur le développement de la neurobiologie. En gros l'auteur défend que la prohibition sauve peu de vies, mais en coûte beaucoup en inhibant la recherche et développement en pharmacologie neurologique. D'accès fermé malheureusement.

  • Une analyse suggère que les micro-organismes ne forment pas d'espèces à proprement parler, d'après des arguments mathématiques. Pas eu le temps de lire, mais idée intéressante. Papier libre accès.

  • Un article (libre accès) indique que des anti-fongiques appliqués aux plantes à fleurs peuvent affecter les abeilles en les rendant plus sensibles à des infections fongiques. Potentiellement très important.

  • Un billet de blog attire mon attention sur un concours de compression de données spécifiquement pour les séquences d'ADN. Intersection intéressante d'informatique et de génomique.

lundi 22 juillet 2013

Réflexions sur le blog SciLog de J.J. Kupiec et le hasard en biologie

[caption id="attachment_1153" align="aligncenter" width="164"]Cliquez sur l'image Cliquez sur l'image (suis-je le rat ? le rat me lit-il ? sommes-nous tous le rat de quelqu'un ?)[/caption]

Il y a un nouvel arrivant dans le (trop petit) monde des blogs scientifiques francophones : SciLogs.fr, déclinaison française d'une plateforme internationale dépendant de Pour la Science (déclinaison française de Scientific American). Dans les premiers billets de ces blogs, il y en avait un de JJ Kupiec sur le rôle du hasard en biologie moléculaire et les conséquences pour la possibilité de synthétiser le vivant. Ce billet pour moi pose aussi la question du rôle des blogs en science.

Kupiec aime mettre "en avant le caractère foncièrement stochastique du fonctionnement interne des êtres vivants". Là où ça devient étrange c'est qu'il affirme qu'il y a quelques années cela était "quasi hérétique". Et il ajoute :
On suppose actuellement que chez un être vivant, l’ordre macroscopique, c’est-à-dire ce qui passe à notre niveau, provient d’un ordre microscopique. Les molécules, protéines et séquences d’ADN, principalement, interagissent de manière séquentielle de manière toujours identique, en formant des cascades d’interactions desquelles tout hasard est exclu.

Cette citation m'a choqué, parce qu'ayant étudié la biologie moléculaire entre 1988 et 1992, et étant depuis resté en recherche à l'interface biologie moléculaire - évolution - informatique, je ne reconnais rien de cette description. J'ai appris que les interactions moléculaires ont une composante aléatoire importante, et je n'ai jamais vécu ni entendu un supposé dogme de l'absence de hasard en biologie.

La biologie moléculaire dans ses détails est de la chimie, avec deux spécificités : des molécules souvent très grosses et complexes, et surtout pour ce qui nous concerne très peu d'exemplaires de chaque molécule. Quand on prend une réaction chimique typique, on a des nombres énormes de chaque molécule entrant en jeu. Ceux qui ont eu des cours de chimie se rappellent peut-être d'avoir raisonné en "moles". Une mole c'est 6x1023 machins (molécules d'habitude). Ces nombres énormes permettent d'énoncer des lois statistiques très fiables concernant par exemple la vitesse d'une réaction ou les concentrations à l'équilibre (ça dépend surtout de la concentration en fait). Dans chaque cellule vous avez quatre molécules correspondant à chaque type d'ADN (par exemple pour un gène donné). Donc quand une protéine se lie à un site donné d'ADN, le rôle du hasard moléculaire (qui tient davantage de la physique que de la chimie à ce point) est moins visible comme une moyenne statistique type "gaz parfait" que comme le résultat de quelques lancers de dé. Mais (il y a un mais) en biologie on n'a pas beaucoup de molécules par cellule, mais on a beaucoup de cellules ! (1013 cellules humaines et 1014 cellules bactériennes environ dans notre corps.) Donc c'est pas Avogadro mais ça commence à moyenner. Du coup on a tendance à voir ces phénomènes stochastiques (ça veut dire au hasard) comme des phénomènes statistiques, des équilibres par exemple entre attachement-détachement de deux molécules.

Kupiec et moi avons eu un dialogue dans les commentaires de son blog [note de 2017 : de nombreux commentaires dont les miens et ceux de Nicolas Le Novère semblent avoir disparu !], où sont aussi intervenus deux spécialistes de la modélisation en biologie, Nicolas Le Novère, et Tom Roud. Je vous invite à lire cet échange.

Je veux revenir d'abord sur un point important soulevé par Nicolas : on savait que le hasard jouait un rôle, mais on le prenait peu en compte dans nos modèles. En effet, notre modélisation du vivant s'améliore au fur et à mesure que nous progressons dans nos méthodes expérimentales et mathématiques. Et logiquement, plus on veut étudier les choses à des niveaux détaillés (peu de cellules ou peu de temps), plus la stochasticité joue un rôle important. Mais dire qu'il y a eu un dogme niant le hasard, dire que la biologie des systèmes ou la biologie synthétique se font en fermant les yeux sur ses effets destructeurs, je suis désolé mais c'est faux (d'ailleurs aucune citation de Kupiec pour le soutenir malgré mes requêtes). On est tous conscients que nos modèles sont insuffisants, ce qui est pourquoi on travaille à les améliorer, les affiner, déterminer leurs zones d'application et les zones où ils ne s'appliquent pas ou mal. Par exemple les modèles de biologie des systèmes récents prennent explicitement en compte la stochasticité, et il y a une vague de "single cell genomics" qui s'occupe essentiellement de la quantifier pour des phénomènes tels que l'expression des gènes dont parle Kupiec.

Puis je vais passer pour un gros snob raleur là, mais les gens qui se la jouent génie incompris qui révolutionne la science je me méfie (la productivité de M. Kupiec hors blogs : PubMed, Google Scholar). Faut lire les commentaires quand il est interviewé sur {Sciences2} concernant ENCODE, c'est assez intéressant (l'interview aussi fait génie méconnu ; et je vois ailleurs dans {Sciences2} qu'il a inventé le terme ontophylogénèse, l'invention de mots étant typique du génie méconnu). Alors si on veut révolutionner la biologie, j'ai un conseil, c'est de faire des expériences ou des modèles meilleurs que les autres et de les publier. Peut-être que JJ Kupiec a parlé de stochasticité de l'expression avant les autres, mais je doute que personne n'y ait pensé, et ce qui est important en sciences c'est ce qu'on fait d'une idée. D'autres que Kupiec développent des modèles mathématiques et des expériences pour quantifier cette stochasticité, et c'est ça qui est important.

Autant je me réjouis de voir une nouvelle plateforme de blog scientifiques francophones, autant je recommende à mes collègues de blogger, autant je ne pense pas que de renforcer la perception déjà trop répandue d'un establishment scientifique conservateur écrasant des Galilée par centaines soit très constructif, ni de présenter une version faussée de l'histoire et de l'état de sa discipline pour se mettre en avant. Je suis bien en peine de voir ce que le billet de Kupiec apporte à la compréhension de la biologie ou de la science au public.

Je note pour finir que la plupart des nouveaux blogs de Scilogs ont commencé par expliquer des trucs intéressants ! Je recommande notamment Best of bestioles et Intelligence mécanique. :-)

(Billet retardé par la semaine OGM et autres évènements, mais voici.)