lundi 31 août 2015

Les scientifiques en conférence en costard-cravate, je vois pas souvent. Démonstration.

[caption id="attachment_2930" align="aligncenter" width="229"]cliquez cliquez[/caption]

Y a un truc que je trouve toujours bizarre dans les films et séries télés où on voit des scientifiques, c'est que quand ils vont à une conférence tout le monde est habillé en costume-cravate ou tailleur trois pièces. Et ils font un effort particulier pour s'habiller quand c'est eux qui doivent parler devant tout le monde. Par exemple il y a un épisode de Big Bang Theory dans lequel Léonard est stressé par la manière dont il doit s'habiller pour donner une présentation de ses résultats, et il y va éventuellement en costume cravate.

Dans mon expérience, les scientifiques vont aux conférences et donnent des présentations comme ils sont habillés d'habitude, c'est-à-dire dans un mélange de t-shirts, jeans, chemises, jupes et parfois cravates (y en a qui aiment – rarement les plus jeunes).

Ce qui me donne l'occasion de ramener ma fraise sur le sujet, c'est la conférence européenne de biologie évolutive ESEB. Elle s'est tenue très récemment dans mon université, et les photos viennent d'être mises en ligne : Lien Picasa.

Le gars en costard cravate au début est le recteur (≈ président) de l'université. Après, je vous laisse voir. Voici mon directeur de département, et nouveau président de la société de biologie évolutive, debout sur une table pour la conclusion de son discours de cloture :

[caption id="attachment_2928" align="aligncenter" width="200"]Laurent Keller avec sa plus belle cravate Laurent Keller avec sa plus belle cravate[/caption]

Bien sûr, ça peut être différent entre domaines. Je suis quand même allé à des conférences de biologie moléculaire, de biologie évolutive, d'informatique, et de biologie médicale. Les seuls que je voit s'habiller avec cravate etc systématiquement, ce sont certains médecins et certains biologistes en recherche médicale. Et bien sûr les représentants de l'industrie, qui du coup se voient à 100 km en général.

Alors appel aux nombreux réalisateurs et costumiers qui me lisent : la prochaine, pas la peine de déguiser les scientifiques en pingouins, merci.

Mise à jour depuis Twitter :

vendredi 28 août 2015

Pacman ! Avec de l'ADN et des acides aminés !

[caption id="attachment_2910" align="aligncenter" width="210"]cliquez sur le lien, c'est trop beau, trop cool, trop tout, allez sérieux cliquez sur le lien, c'est trop beau, trop cool, trop tout, allez sérieux[/caption]

Syed Hussain Ather, un étudiant d'un collègue américain (Matthew Hahn, mentionné ici), vient de rendre disponible sur github un programme Python rigolo qui reproduit PacMan mais en version biologie moléculaire : on mange de l'ARN, et on fabrique des protéines.

https://github.com/HussainAther/dnapacman

Pour traduire l'ADN en protéines, il est en effet transcrit en ARN. Les nucléotides d'ADN sont A, C, G et T (comme dans "Bienvenue à GATACA"), alors que ceux de l'ARN sont A, C, G, U (donc "Bienvenue à GAUACA"). L'ARN peut alors être traduit en protéines, composé de 20 acides aminés. Pour faire correspondre 4 nucléotides à 20 acides aminés, il y a un code basé sur des triplets de nucléotides. En effet, 41 = 4, pas assez ; 42 = 16 pas assez ; 43 = 64, davantage que 20, cool. Ces triplets s'appellent "codons". (Notez que ça veut dire qu'il y a plusieurs codons pour un même acide aminé.) Pour que la traduction démarre, il faut un codon "start", AUG (codé par ATG dans l'ADN), qui code pour l'acide aminé méthionine (symbole M). Il y a dans le code standard trois codons "stop", qui arrêtent la traduction.

[caption id="attachment_2915" align="aligncenter" width="300"]code génétique de Wikipedia code génétique standard (depuis Wikipedia)[/caption]

Dans DNA-PacMan (qui à mon avis devrait s'appeler RNA-PacMan, mais passons), il faut donc se balader en mangeant des nucléotides, et dès qu'on a mangé un AUG on commence à fabriquer des acides aminés, jusqu'à manger un codon stop ... ou se faire manger par un fantôme.

C'est un programme simple qu'il faut lancer directement avec Python, et les résultats s'affichent dans une console terminale. Ce qui accentue encore le coté geek. ;-)

pacman1pacman2

mercredi 26 août 2015

Introduction au bricolage de significativité des tests statistiques

[caption id="attachment_2893" align="aligncenter" width="205"]cliquez pour lire la BD cliquez pour lire la BD[/caption]

Il y aurait beaucoup à dire si la manipulation volontaire ou involontaire de la significativité statistique, et d'ailleurs si vous êtes sages c'est un sujet sur lequel j'ai l'intention de revenir. Mais en attendant un billet plus sérieux, voici un jeu proposé par le site de statistiques FiveThirtyEight.

Le paragraphe suivant est un peu chiant, vous pouvez le sauter pour aller à la partie amusante. Ou le lire, c'est un blog sciences ici après tout.

Lorsque l'on veut déterminer si une relation observée pourrait l'être aisément par hasard, ou est suffisamment peu probable pour être intéressante, on calcule la valeur dite "p". De manière pas très intuitive, c'est la probabilité d'observer les données (ou un résultat encore plus extrême) si "l'hypothèse nulle était vraie", c'est--à-dire s'il ne se passait rien d'intéressant. Par exemple si on compare deux mesures pour voir si elles sont corrélées (la taille des gens et le nombre de chansons dans leur ipod/smartphone), si on a un p élevé ça veut dire qu'on a une probabilité élevée de voir ces mesures alors qu'il n'y a pas de corrélation. Alors qu'on a un p faible si on avait peu de chances d'observer ça par hasard. Habituellement, on fixe une limite en dessous de laquelle on rejette l'hypothèse nulle. Par exemple, limite à 5%, p observé à 2%, on rejette l'hypothèse "pas de relation entre taille et nombre de chansons". Du coup on accepte implicitement l'hypothèse "il y a une relation", même si c'est un peu sioux (pour critique voir billets bayésiens ici et ailleurs au cafe-sciences). Mais ces maths ont été calculées en supposant que vous n'observiez qu'une série de mesures, et rapportiez votre résultat fidèlement. Or si vous observez plein de séries, même s'il ne se passe rien (l'hypothèse nulle est vraie), on aura parfois des valeurs extrêmes par hasard (par exemple dans 1 cas sur 50 p ≤ 2% = 1/50ème) (voir ancien billet sur Google Trends). Si on fait ça assez et qu'on ne rapporte sournoisement que le p le plus faible, on a un magnifique résultat "significatif" qui ne signifie rien du tout. La plupart des choses peuvent se mesurer de plusieurs manières. La taille, c'est la taille en cm, ou divisée par l'âge, ou le poids ; le nombre de chansons, c'est leur nombre, leur longueur d'écoute totale, seulement celles écoutées récemment ? Donc avec une seule série d'observations on peut faire plein de comparaisons.

Le site FiveThirtyEight, dans un billet sur les problèmes de la science ("Science Isn’t Broken. It’s just a hell of a lot harder than we give it credit for.") propose aux lecteurs d'essayer plusieurs manières de mesurer d'une part le taux de Démocrates ou Républicains au pouvoir aux Etats-Unis, et d'autre part plusieurs manières de mesurer l'économie. Ainsi, en jouant avec les paramètres, on peut obtenir des résultats montrant que les Démocrates sont bons ou mauvais pour l'économie, avec des tests statistiques tout-à-fait "significatifs". Essayez en cliquant ci-dessous :

[caption id="attachment_2884" align="aligncenter" width="300"]cliquez pour aller jouer au "p-value hacking" cliquez pour aller jouer au "p-value hacking"[/caption]

Ce qui est terrible c'est qu'un résultat final d'un tel tripatouillage, pris en isolation, est techniquement correct (pas de fraude, pas de trucage visible), mais pourtant représente volontairement mal la réalité. Alors que le but des statistiques est de nous aider à mieux représenter et comprendre la réalité. Ceci est l'illustration d'un problème important en recherche scientifique : les chercheurs peuvent modifier leur analyse jusqu'à trouver un résultat apparemment convaincant et conforme à leurs attentes, mais qui en fait n'a pas réellement été testé.

C'est le "p-value hacking", que j'ai essayé de traduire par "bricolage de significativité" dans le titre, et c'est un problème important. Les solutions sont difficiles, mais la plus importante est d'avoir le problème à l'esprit.

Pour finir une petite blague statistique en anglais (vu ici) : "that's rather mean" "you mean average? that's a standard error." (traduction difficile, jouant sur mean = méchant ou moyenne ; average = moyenne ; standard error = erreur typique ou erreur-type). Bon ça m'a fait rire, je suis un horrible geek, désolé.

mardi 25 août 2015

L'agriculture kényane prend le chemin des #OGM, les journalistes du Monde ne prennent pas le chemin du sens critique

[caption id="attachment_2891" align="aligncenter" width="300"]cliquez pour une blague de mauvais goût cliquez pour une blague de mauvais goût[/caption]

Alors que j'essaye de me botter le derrière pour finir quelques billets de blogs avec un peu de substance, que vois-je dans Le Monde ? Un article sur "L'agriculture kényane prend le chemin des OGM" qui cite plusieurs choses erronées sans la moindre distance. Imagine-t-on un article qui cite "les vaccins donnent des maladies comme l'autisme" sans aucun recul ? Parce que c'est le niveau.


D'abord notons la citation "Les scientifiques du pays sont à l’unisson derrière le discours du vice-président". On ne saura pas pourquoi les scientifiques sont à l'unisson favorables à un truc aussi mauvais. Peut-être sommes-nous tous des monstres. Ou peut-être y a-t-il des faits intéressants à obtenir en leur parlant ? On ne saura pas, aucun n'est cité. Ni aucun scientifique étranger d'ailleurs. C'est clair, les plantes, les virus, les gènes, tout ça est étranger aux scientifiques.

En détail :
...moratoire sur les importations d’OGM, instauré en 2012, suite à une étude démontrant que le maïs transgénique pouvait provoquer des cancers chez des rats de laboratoire.

Il ne peut s'agir que de la pseudo-étude de Séralini et al, qui n'a rien démontré du tout. Une phrase plus juste aurait été "qui a soulevé le soupçon que le maïs transgénique pouvait provoquer des cancers chez des rats de laboratoire, mais depuis été retirée et jamais reproduite."
"Le maïs MON810 disperse autour de lui une toxine qui fait chuter le nombre d’abeilles et la biodiversité, contamine les plantes aux alentours."

Les abeilles, on peut comprendre, si on met du maïs Bt (ce qui est le cas de MON810) qui contient un insecticide, quoiqu'aucun lien avec les problèmes des abeilles n'ait jamais été montré malgré plusieurs études. Le Bt ciblant les lépidoptères (voir discussion sur l'effet sur d'autres espèces ici). Et on peut toujours rappeler que le même Bt est utilisé en agriculture bio, en pulvérisation. (Edition : en plus les OGM contrairement aux pulvérisations conventionnelles ou bio ne dispersent rien du tout.) Les plantes aux alentours, j'ai un peu plus de mal. Comment un insecticide peut-il leur faire du mal ? On peut aussi rappeler l'étude montrant un gain de biodiversité des insectes avec des OGM Bt. Bref, affirmation très forte qui n'est soutenue par aucun élément factuel.

Je suis encore plus perdu car l'article parle de protéger le maïs d'un virus, ce qui est possible par OGM dans certains cas (notamment papaye à Hawaï), mais n'a rien à voir avec l'insecticide Bt. Je suppose que c'est un effet secondaire de la mise dans le même sac de tous les OGM dans la plupart des discours, mais il faut bien répéter que chaque OGM est différent, c'est juste une technique pour obtenir ce que l'on veut. Ce que l'on veut, c'est très divers. Juste avant les phrases citées ci-dessus, on note d'ailleurs que les "OGM de Monsanto, résistants au virus, apparaissent comme une solution d’urgence". Si c'est ceux résistants à un virus, ce n'est pas le MON810 alors ?
"On ne maîtrise pas non plus les conséquences sur la santé : des études montrent que les OGM peuvent avoir des effets sur les reins, provoquer des allergies ou des problèmes sexuels."

Là c'est carrément bizarre. Chaque fois que je lis un article grand public sur les OGM je découvre de nouveaux maux qu'il sont sensés causer (voir ici par exemple). Des problèmes sexuels ? Parce qu'un maïs résiste aux insectes ou à un virus ? Comment pourquoi ? Ca cause aussi les ongles incarnés ? Pour les allergies, on rappelle que les OGM sont testés à ce propos, contrairement à toutes les autres variétés générées par mutagenèse ou hybridation, et qu'on commence à avoir pas mal d'expérience là-dessus.
Plus inquiétants, selon Justus Lavi, « la levée du moratoire, et l’autorisation de culture OGM au Kenya, seraient une porte ouverte pour les OGM sur tout le continent. »

Là on touche finalement au même fond du problème qu'avec le riz doré ou les moustiques à descendance stérile. Il y a un tel investissement moral et pratique dans le refus de principe des OGM qu'il est inacceptable qu'un OGM particulier fasse partie de la solution à un problème particulier.

Je me répète, mais si quelqu'un ne veut pas d'OGM pour des raisons philosophiques, qu'il le dise. Mais il faut arrêter de répéter à l'infini des choses simplement fausses, et de tout mélanger sous l'étiquette somme toute trompeuse "OGM".

dimanche 9 août 2015

Le principe de précaution est-il toujours appliqué sans discernement ?

[caption id="attachment_2855" align="aligncenter" width="180"]cliquez cliquez[/caption]

Dans un article récent de l'excellent blog Kidisciences, il y a un article qui fait un bon point sur l'idée persistente (mais apparemment fausse) qu'il ne faut pas nager après avoir mangé : Info ou intox : Il faut attendre deux heures avant d’aller nager après avoir mangé Une phrase m'a frappé dans ce billet :
En fait, comme souvent avec le principe de précaution – qui est toujours appliqué sans discernement – on fait en vérité plus de dégâts en croyant les éviter.

D'une part, je comprends la frustration des auteurs. Le principe de précaution est souvent utilisé en effet comme le principe "je ne comprends pas, donc non", ou le principe "c'est nouveau, on ne peut pas garantir 0% risque, donc non". Mais le principe de précaution dans son intention n'est pas sans discernement me semble-t-il. Il dit qu'en l'absence de données on peut déjà prendre des précautions, notamment en cas de soupçons de risques pour l'environnement ou la santé. Comme je le comprends, bien appliqué, il n'exclut ni de continuer la recherche, ni de réviser les mesures de précaution à la lumière de données plus complètes lorsqu'elles deviennent disponibles. Au contraire dirais-je. Ca a donné lieu à une petite discussion Twitter avec le principal auteur du billet, Alan de Podcastscience :


Donc voici la réponse plus longue que je lui avais promise : le principe de précaution il me semble peut se baser sur des faits. Clairement, les peurs font partie de l'équation, mais si c'est rationnel (et on peut être d'accord que la plupart des prises de décision dans notre monde ne le sont que partiellement) alors les peurs font place aux faits au fur et à mesure du progrès des connaissances. En termes bayésiens : Proba(conséquences négatives sachant faits) = Proba(faits si des conséquences négatives) x Proba(conséquences négatives) / Proba(faits) Lorsqu'on a peu de faits informatifs, l'équation est dominée de manière rationnelle par la probabilité de conséquences négatives en l'absence de faits. Lorsque les faits deviennent informatifs, l'équation devient dominée par ces derniers, notamment à travers le terme Proba(faits si des conséquences négatives) (voir ce billet).

Pour revenir à l'exemple inépuisable des OGM, appliquer le principe de précaution quand ils étaient nouveaux et que l'on savait relativement peu n'était pas forcément irrationnel. Aujourd'hui, appliquer ce principe de manière générale aux OGM, avec ce que l'on sait, est par contre bien "sans discernement". Mais l'appliquer encore aujourd'hui au saumon OGM en l'état des connaissances me parait justifié, "avec discernement" pourrais-je dire.

Voilà, ne jetons pas le bébé d'un principe qui peut être utile avec l'eau du bain des abus par des politiciens et lobbys divers.

(Ce billet et la discussion dans les commentaires sont discutés sur le site de Journal International de Médecine.)