jeudi 16 janvier 2014

Pour mille balles, t'as un génome humain

[caption id="attachment_1684" align="aligncenter" width="165"]cliquez sur l'image cliquez sur l'image[/caption]

Announce fracassante cette semaine dans le monde du séquençage d'ADN : la société Illumina, leader du domaine, va commercialiser deux nouvelles machines : le NextSeq 500, qui vise le marché des "petits" clients, et le HiSeq X 10, qui vise au contraire les très gros centres. (Pour le contexte du séquençage ADN moderne, je vous recommande ce billet sur le blog BiopSci.)

Le NextSeq 500, c'est pour reprendre le marché de l'entrée de gamme apparemment, notamment par rapport à Ion Torrent. D'après un blog généralement bien informé le NextSeq tuerait Ion Torrent, mais à $250'000 contre $80'000 pour Ion Torrent ça ne me paraît pas si évident.

Mais le plus important dans cette annonce est le X10. Illumina promet avec cette machine de passer la barre symbolique des $1000 pour un génome humain. Mais il faut y mettre le prix du ticket d'entrée : il faut acheter minimum 10 machines, et pour que ça vaille le coup, il faut les faire tourner en permanence. Dans ces conditions, vous séquencez 18'000 génomes par an. Le prix inclut également le logiciel pour analyser les données, et donc ce que vous obtenez c'est les variations entre humains : ce qui dans notre ADN fait que chacun de nous est unique (pas encore clair pour moi si c'est seulement les mutations d'une base, ou aussi les gros changements). Ces variations peuvent être déjà connues ou nouvelles, cela peut être un génome sain ou tumoral. Par contre, grosse limitation, le logiciel limite l'usage à l'humain seulement. Ceci alors que la technique est clairement applicable telle quelle à n'importe quelle espèce, de l'ADN c'est de l'ADN.

Point intéressant, les $1000 comprennent l'amortissement de la machine et les personnels pour la faire fonctionner, donc c'est pour de vrai. Par contre les scientifiques ou médecins pour interpréter les résultats, c'est autre chose. D'ailleurs c'est là que le goulot d'étranglement risque d'être, et partout dans le monde on pousse à intégrer davantage la génomique et la bioinformatique au cursus des médecins.

Illumina annonce donc avoir ajouté un nouveau point au graphe de la décroissance du coût du séquençage, nettement plus rapide que la décroissance du coût informatique (loi de Moore) depuis quelques années déjà :

[caption id="attachment_1685" align="aligncenter" width="300"]moore_illumina Image prise dans la doc publicitaire d'Illumina, donc je ne garanti pas la véracité, surtout du dernier point (ajouté par eux)[/caption]

A noter qu'avec cette annonce pas mal de collègues commencent à s'inquiéter de la situation de quasi-monopole, ou en tous cas de très forte dominance (style Google ou Facebook), d'Illumina sur le séquençage d'ADN. Ce n'est pas trivial, il s'agit de lire nos génomes, d'obtenir des informations sur les mutations médicalement pertinentes ou la biodiversité. Un point qui me dérange depuis l'arrivée des nouvelles technologies de séquençage c'est qu'elles sont toutes basées sur des protocoles propriétaires auxquels on est obligés de faire confiance. Dans l'autre sens, quand un système comme Illumina domine suffisamment longtemps (c'est aussi le cas d'Affymétrix dans un autre domaine de biologie), les alternatives logicielles et statistiques ouvertes et potentiellement concurentes voient le jour et sont testés et améliorées (voir billet sur les méthodes bioinformatiques en génomique).


Alors à quoi vont servir ces machines ? Des petits pays ont déjà annoncé leur ambition de séquencer les génomes de toute la population, comme les îles Faroe, et la Grande Bretagne et l'Arabie saoudite veulent séquencer 100'000 patients chacun. On se rapproche du séquençage du génome de chaque nouveau-né à la naissance. Bien sur, ça n'est pas parce qu'on peut le faire qu'on doit le faire (voir billet sur les limites de la science). Mais clairement, on le peut. Il est temps d'ouvrir sérieusement la discussion pour savoir si on doit le faire.

En tous cas, GATTACA GATACA approche à grands pas, que nous soyons prêts ou non.

20 commentaires:

  1. Je partage totalement ton point de vue. Très bon article, comme d'hab !
    J'en ai justement un en cours qui touche à ça sur bioinfo-fr mais qui n'avance pas trop, il faut que je m'y remette avec cette nouvelle actu...
    Dernière chose, petite typo à "GATTACA", tu as inséré une mutation dans le titre : délétion d'un T ;) (cf. http://en.wikipedia.org/wiki/Gattaca)

    RépondreSupprimer
  2. Oups, merci pour les compliments et la correction.

    RépondreSupprimer
  3. Excellent !

    Meilleurs voeux pour la Nouvelle Année, avec beaucoup de billets du même tonneau...

    RépondreSupprimer
  4. […] Announce fracassante cette semaine dans le monde du séquençage d’ADN : la société Illumina, leader du domaine, va commercialiser deux nouvelles machines : le NextSeq 500, qui vise le marché des « petits » clients, et le HiSeq X 10, qui vise au...  […]

    RépondreSupprimer
  5. On sait combien de temps prend un séquençage avec cette machine ?
    Ils vendent le logiciel d'analyse, mais peut-on exploiter le résultat avec d'autres logiciel que ceux fournis par leur soins ?

    RépondreSupprimer
  6. 3 jours pour un "run", qui fournit 16 génomes d'un coup.

    Pour le logiciel, les gens se posent en effet la question. Il parait impossible qu'ils bloquent tout-à-fait l'usage d'autres logiciels, mais ils peuvent le rendre plus difficile. La question se pose surtout pour l'application à d'autres espèces, où la limitation est purement logicielle (et artificielle probablement).

    RépondreSupprimer
  7. Hello,
    Avez vous un lien indiquant que l'analyse sera fait sur l'instrument, avec des logiciels propriétaires? Je ne crois pas avoir vu ça…
    A priori, je ne crois pas tellement à la promesse de $1000 par génome. Je pense que tout le monde paiera un peu plus cher pour encore quelque temps. Les calculs d'Illumina n'inclut pas tous les couts d'un Genome Center ;-)

    RépondreSupprimer
  8. Merci !

    Ils peuvent bloquer le traitement par un autre logiciel si le séquençage généré est dans un format propriétaire crypté.

    Le séquençage animal peut aussi être interdit par la licence.

    RépondreSupprimer
  9. Pour ce qui est du logiciel, j'ai interprété le passage suivant du blog de BioMickWatson :
    The “human only” mode is nothing to do with chemistry, it is to do with software, which means you can probably hack it to sequence other species, but you’ll likely break your warranty. ... The big difference is that CG’s limitation is technical, whereas Illumina’s is imposed by software, and I don’t know how the non-human communities are going to take that.

    La doc spécifie que "Instrument configuration" inclut "Data collection and analysis software". Après je n'en sais pas vraiment plus, c'est vrai.

    Toute info supplémentaire d'un membre d'un Genome Center sera très bienvenue. :-)

    RépondreSupprimer
  10. Un élément important qui n'est pas pris en compte dans votre commentaire et bien évidemment dans l'annonce Illumina est que nous sommes entrés depuis 2 ans environ dans l'ère du séquençage de la cellule unique (voir par exemple Owens. Genomics: The single life. Nature, 2012 ou Shapiro et al. Single-cell sequencing-based technologies will revolutionize whole-organism science. Nat.Rev.Genet. 2013. Un premier résultat fondamental est que le génome des cellules d'un individu est beaucoup plus variable que nous ne le pensions. Nous ne savons plus de combien de types cellulaires différents nous sommes constitués, en tout cas bien plus que 200 comme communément admis. Conclusion que va t'on réellement apprendre en terme cout/valeur du séquençage d'un génome "moyen" issu sans doute d'une population de cellules sanguines (faciles à prélever) ? Combien de type cellulaires différents faudra t'il séquencer pour apporter une réelle plus value en terme de santé humaine ? Quid des infrastructures informatiques (stockage et traitement de volume de données sans commune mesure à ce que nous connaissons) et des compétences bioinformatiques/statistiques nécessaires ? etc.
    C'est un progrès technologique sans aucun doute mais avant que cela ne révolutionne la médecine et notre vie quotidienne il faudra un peu de temps. Cela viendra mais il faudra sans doute encore beaucoup d'années de travail et d'investissements de recherche. Ceci dit seules les prédictions qui portent sur le passé sont démontrées...

    RépondreSupprimer
  11. Je suis d'accord que le single-cell genomics est intéressant, mais je ne pense pas que cela invalide la génomique individuelle. De même que la variation entre individus n'invalide pas à mon sens l'intérêt de connaître "le" génome d'une espèce.
    La variation entre individus est généralement d'un ordre de grandeur plus faible que celle entre espèces, et celle entre cellules de probablement deux ordres de grandeur encore plus faible.

    RépondreSupprimer
  12. Bon, maintenant, je peux officiellement en parler!
    Pas de génome à $1000 pour le moment, mais clairement, plus de génomes séquencés, plus vite, moins cher. Plein de challenges (informatique, statistique, translationnel, etc), mais on y croit!

    RépondreSupprimer
  13. Vous avez parfaitement raison d'attirer l'attention sur le "single-cell genomics" et les questions de mosaicismes (déjà qu'en anglais c'est dur à dire, mais alors en français….).
    Mais ce sont la des questions complémentaires et qui peuvent être abordés avec la même technologie de séquençage. Par exemple, le Genome Center ou je travaille (a New York) compte utiliser le HiSeq X 10 pour le Whole-Genome et nos HiSeq 2500 pour les autres expériences (RNA-Seq, single-cell, microbiome, exomes (?), etc)

    RépondreSupprimer
  14. Précision : je n'ai pas écrit (ni pensé) que le single-cell invalidait la génomique individuelle mais plus simplement qu'elle a forcément des limites et qu'il y a donc de nouveaux challenges à relever. L'ordre de grandeur des variations entre espèces, individus et cellules d'un organisme multicellulaire est bien évidement de niveau très différents mais en biologie il n'y a pas que la taille qui compte. Exemple : les quelques mutations "fondatrices" dans les cancers et leur importance dans l'histoire naturelle des tumeurs pour des traitements personnalisés éventuels.

    RépondreSupprimer
  15. L'autre limitation évidente du "génome selon Illumina" est qu'il y a de nombreuses régions non-séquencables avec des fragments de 150bp. Les technologies long-reads (PacBio ou Oxford Nanopore) joue et joueront un rôle pour combler cette niche et étudier ces régions.

    RépondreSupprimer
  16. Dis comme ça, totalement d'accord !

    RépondreSupprimer
  17. Vrai, et d'ailleurs en génomique bactérienne pas mal de collègues passent au tout PacBio.

    RépondreSupprimer
  18. Bien entendu. Non seulement, le genome evolue au cours des divisions cellulaires (l'evolution ne s'arrete pas a la generation des gametes et a la formation du zygote), mais il y toutes les recombinaisons dans le systeme immunitaire, le chaos complet dans les neurones, et bien sur les modifications epigenetiques. La recherche est effectivement a ce niveau desormais.
    En revanche, le sequencage du genome global est en train d'atteindre la clinique. L'hopital du coin (qui je l'avoue n'est pas n'importe lequel puisqu'il abrite le LMB) a un centre de sequencage Illumina pour les patients. Cette nouvelle plateforme lui conviendra parfaitement.

    RépondreSupprimer
  19. Il y a un livre de Franck Thilliez qui s'appelle GATACA avec un seul T, donc la mutation est fonctionnelle ;)

    http://www.amazon.fr/Gataca-Franck-Thilliez/dp/2265087432

    RépondreSupprimer