La publication récente d’une séquence complète du génome humain par le consortium Telomere to Telomere m’a portée à réfléchir sur l’histoire de nos efforts collectifs pour mieux comprendre notre patrimoine génétique. On pourrait dire que nous marquons l’avènement du projet Génome humain (PGH), cette année. Il y a 21 ans, les premières ébauches de la séquence du génome humain étaient publiées par l’International Human Genome Sequencing Consortium, une entité publique américaine menée par les National Institutes of Health (NIH), et par l’entité commerciale Celera Genomics, fondée par Craig Venter. Et il s’agissait réellement de « premières ébauches »; environ 90 % de l’euchromatine (régions typiquement riches en gènes) a été analysée. L’annonce a provoqué une chaîne de conférences de presse et d’articles décrivant des versions de plus en plus complètes du séquençage du génome en son entier. Trois ans plus tard, soit le 21 octobre 2004, l’International Human Genome Sequencing Consortium publiait son avant-dernier papier, intitulé « Finishing the euchromatic sequence of the human genome » (La complétion de la séquence euchromatique du génome humain). À tous les égards, il s’agit d’une des plus grandes réalisations scientifiques et technologiques du dernier siècle. Un des aspects les plus intéressants de son achèvement est la manière dont les technologies disponibles ont contribué à régir la stratégie, et même la politique, autour de cet effort monumental.

 

Alta, Utah – Le berceau du projet Génome humain. [Image Source]

Les débuts

La frise chronologique du PGH est toujours accessible dans les archives du site web de l’Oakridge National Laboratory. Même dans sa forme actuelle — à peine fonctionnelle — elle révèle l’histoire fascinante d’une idée vraisemblablement impossible lorsqu’elle est venue à l’esprit d’un groupe de 19 scientifiques, bloqués par la neige dans une station de ski à Alta, en Utah, en 1984. Le groupe se confrontait au défi de déterminer les mutations d’ADN des survivants, et des enfants des survivants, des attaques nucléaires sur Hiroshima et Nagasaki. Les méthodes existantes ne remontaient pas le nombre de mutations anticipé. Mais l’avènement du clonage moléculaire, de l’électrophorèse sur gel en champ pulsé et d’autres technologies miracles créaient l’impression d’une potentielle solution. L’année suivante, la Human Genome Initiative était proposée par le Département de l’Énergie (DOE) après une étude de faisabilité à Santa Fe, au Nouveau-Mexique. En 1987, l’initiative a été approuvée et un premier projet de budget, mis de l’avant. Enfin, en 1990, les NIH et le DOE annonçaient un premier plan quinquennal, intitulé «Understanding Our Genetic Inheritance. The US Human Genome Project» (Comprendre notre héritage génétique. Le projet Génome humain des É.-U.). Avec son budget de 200 M$ (l’équivalent de 3 G$ en 1990 ou 6 G$ aujourd’hui), le projet avait pour objectif d’achever le séquençage du premier génome humain en 15 ans.

Lauréats de prix Nobel en 1980: P. Berg, W. Gilbert et F. Sanger (gauche à droite)

Maxam, Gilbert et Sanger: la course bat son plein

En 1985, la notion du séquençage du génome humain en son entier représentait une pensée scientifique réellement révolutionnaire, les technologies du temps n’étant pas adaptées à la tâche. Voilà quatre ans, le prix Nobel de chimie de 1980 avait été accordé à deux parties: à P. Berg pour ses études fondamentales de la biochimie des acides nucléiques avec une attention portée à l’ADN recombinant, et à W. Gilbert et F. Sanger (un second prix Nobel pour ce dernier) pour leurs contributions à la détermination des séquences des bases des acides nucléiques. Mais on savait toujours par quelle approche de séquençage — celle de Gilbert ou de Sanger — s’avérerait la plus efficace. Maxam et Gilbert avaient conçu une méthode purement chimique pour le séquençage des acides nucléiques qui demandait plusieurs étapes, mais pouvait être effectuée sur l’ADN à double brin. En revanche, l’approche à Sanger nécessitait de l’ADN simple brin. Au début et au milieu des années 1980, les deux méthodes étaient encore largement employées et les avantages de l’approche à Sanger, dont la fiabilité (à condition d’avoir accès à des enzymes et nucléotides de haute qualité) et les lectures plus longues commençaient tout juste à être reconnues. Les deux approches avaient néanmoins des lectures limitées (environ 200 à 250 bases pour Maxam-Gilbert et 350 à 500 pour Sanger) et exigeaient une fragmentation de l’ADN génomique avant l’analyse. Étant donnée la nature manuelle du séquençage par gel en plaques, déterminer le séquençage d’un seul ARNm humain moyen représentait une œuvre digne d’être publiée dans une importante revue scientifique. Le temps d’analyse moyen pour un fragment d’ADN prêt pour le séquençage était d’environ six heures, et produisait une lecture de 350 à 500 bases avec 10 à 20 fragments d’ADN analysés par plaque; la vitesse de traitement d’un postdoctorant compétent était donc fulgurante à 1,7 à 2,0 kb par heure. Le génome humain haploïde étant composé d’environ trois milliards de bases, on calculait donc qu’une seule station nécessiterait, au minimum, 171 années pour séquencer des fragments se chevauchant minimalement pour ensuite être assemblés et former une séquence de référence.

Tracer le chemin

Par ailleurs, le tout venait avec une mise en garde: cet ensemble de fragments d’ADN se chevauchant minimalement n’existait toujours pas. On ne pouvait cerner si quelqu’un était même en mesure de créer cet ensemble, ou comment organiser les fragments pour créer une séquence complète, étant donné le fait que le génome humain contient de nombreuses répétitions de séquences, lesquelles sont plus longues que la lecture moyenne possible par les technologies du temps. Force était de constater qu’un préalable indispensable pour atteindre l’objectif déclaré de produire une séquence du génome humain de référence était d’avoir une carte physique du génome qui contiendrait des informations sur l’ordre et l’espacement de certaines caractéristiques génomiques qui pourrait être cernées dans les fragments à séquencer. Ceci permettrait l’organisation de la multitude de lectures nécessaire à la détermination de la séquence du génome humain. Conséquemment, la communauté scientifique a mis de considérables efforts au cours des 14 prochaines années (le décompte débutant lors de la fatidique rencontre à Alta) dans l’élaboration de cartes physiques du génome humain de plus en plus détaillées, ainsi que dans la réalisation de bibliothèques de plus en plus complètes de fragments d’ADN (clones), lesquels étaient produits et cartographiés dans le génome à l’aide de techniques de biologie moléculaire plus sophistiquées. Le travail était pleinement appuyé par la communauté scientifique, non seulement puisqu’il était considéré comme absolument nécessaire au succès du projet, mais aussi pour sa nature «équitable», permettant à des groupes relativement restreints de contribuer de manière importante au succès de cette énorme entreprise.

Sanger l’emporte et se fait automatiser

Parallèlement aux considérables efforts déployés pour créer la carte physique du génome humain complet, un effort visait à rationaliser et ensuite automatiser le séquençage de l’ADN afin d’augmenter considérablement la vitesse de traitement. Se révélant plus facile à automatiser, le séquençage de Sanger a gagné la bataille; il ne nécessitait pas de réactions chimiques compliquées et, atout supplémentaire, fournissait des lectures plus longues. Mais le facteur le plus important s’est avéré le fait que la machinerie utilisée par cette technologie dans la synthèse de l’ADN était suffisamment robuste et polyvalente pour permettre le marquage des nucléotides, à la biotine au début et ensuite à la coloration fluorescente, obviant au radiomarquage. Fritz Pohl faisait état de la première méthode de séquençage de l’ADN colorimétrique non radioactive en 1984. En 1986, le groupe de Leroy Hood a publié une méthode permettant l’analyse d’une séquence d’ADN automatisée à base de fluorescence, une technologie qui a permis à Applied Biosystems d’offrir le premier séquenceur automatique d’ADN (ABI370/373). La machine a permis les premiers projets massifs de séquençage, par exemple le recensement de tous les gènes humains exprimés par l’entremise « d’étiquettes de séquence transcrite » (EST). En 1995, une autre percée technologique a vu le jour: l’ABI Prism 310, qui a fait disparaitre le fichu problème de verser les gels en plaques grandes et minces (jusqu’à 0,4 mm), simplifiant et accélérant ainsi la technique de séquençage. Enfin, en 1997, une autre percée technologique: le séquenceur d’ADN à capillaires ABI3700 était lancé. Son prospectus vantait ses 96 capillaires, une configuration « dotant le système 3700 de la capacité d’analyser 96 échantillons en simultané jusqu’à 16 fois par jour pour un total de 16 × 96 = 1536 échantillons par jour. » Autrement dit, les utilisateurs pouvaient anticiper qu’ils recevraient des séquences faramineuses de 768 kb par jour.

Venter soulève l’indignation

Cette augmentation sans précédent de la capacité de séquençage rend subitement possible une autre approche: le séquençage de novo de génomes complexes sans l’élaboration d’une collection de fragments d’ADN chromosomique organisée, une approche « tronquée » face au séquençage. La faisabilité théorique d’une telle approche avait été établie en 1995 par l’équipe de Leroy Hood. Dans un papier intitulé « Pairwise End Sequencing: A Unified Approach to Genomic Mapping and Sequencing » (Le séquençage d’extrémités par paires: une approche unifiée à la cartographie et le séquençage du génome), l’équipe a démontré qu’un génome complexe d’envergure peut être séquencé en n’utilisant qu’un assortiment de fragments clonés aléatoirement d’au moins deux grandeurs, lesquels seraient sous-clonés aléatoirement, séquencés et organisés selon la détermination de ces séquences d’extrémités par paires dans les contigs assemblés à partir des sous-clones. Deux ans plus tard à peine, en 1997, Craig Venter, fondateur de l’Institute of Genome Research et de Celera Genomics, annonçait que son équipe « (ferait) le séquençage du génome humain à elle-même » en trois ans et avec un budget de 300 M$, soit un dixième du coût estimé originalement par le projet Génome humain, un projet international et public.

Il va sans dire que l’annonce de Venter a fait un tollé dans la communauté de la génomique. D’une part, elle semblait rendre obsolète l’énorme effort consacré à cartographier le génome et à organiser les clonothèques. D’autre part, elle faisait mal paraitre les leaders et partisans du projet public: après avoir dépensé 10 fois le budget de Venter et malgré le fait qu’ils œuvraient depuis le lancement officiel du projet sept ans plus tôt en 1990, leur calendrier proposé prévoyait sept autres années (2005) avant la publication de la première ébauche. Et, enfin, la communauté scientifique était outrée par les plans de Venter d’offrir un accès payé à la séquence génomique aux entités commerciales. Je me souviens encore de l’atmosphère chargée lors de la rencontre à Cold Spring Harbor en 1997 durant laquelle Venter a fait son annonce. Personne ne connaissait encore le détail de la chose (l’internet tel que nous le connaissons n’existait pas), mais des rumeurs circulaient de discussions à huis clos entre les NIH et le Wellcome Trust. Ce n’est que très tard en fin de journée, vers 22 h, que Craig Venter s’est tenu sur le podium pour présenter son idée. Il a essentiellement quitté la scène sous les huées des spectateurs scandalisés. L’ancien directeur des NIH Francis Collins et l’ancien chef de Wellcome Trust se sont ensuite présentés au podium pour proclamer l’infaillibilité du projet Génome humain public et que le Wellcome Trust consacrerait les ressources nécessaires afin d’assurer la compétitivité du projet et un accès libre et sans restrictions à ses résultats.

Craig Venter (à gauche) et Francis Collins (à droite), avec l’ancien président américain Bill Clinton, annonçant la première carte du projet Génome humain. [Source de l’image]

L’initiative de Venter a néanmoins occasionné une réévaluation importante de la stratégie du PGH. Au final, les deux équipes (celles de Venter et de PGH) ont opté pour une solution hybride composée de l’approche tronquée et des informations cartographiques, ayant comme résultat des publications révolutionnaires simultanées en 2001. Et, finalement, l’animosité à l’égard de Craig Venter dans la communauté de la génomique n’a pas duré longtemps: les gens qui l’avaient hué en 1997 l’ont chaleureusement applaudi lors d’un discours sur son projet métagénomique à grande échelle quelques années plus tard.

Dernières remarques

Aujourd’hui, lorsque je fais le survol des nombreuses années de ma vie professionnelle, témoigner du premier PGH demeure une expérience unique. Le PGH a essentiellement établi un nouveau paradigme dans les sciences biologiques, agissant comme principal catalyseur dans l’élaboration de nouvelles technologies révolutionnaires — lesquelles sont devenues des forces tectoniques à part entière, rendant obsolètes certains efforts importants tout en ouvrant de nouvelles pistes. Il s’agit d’un modèle qui s’est répété, le sujet d’actualité étant maintenant la diversité génétique des humains et comment nous pouvons utiliser cette base de connaissances pour contribuer de façon significative à nos vies. C’est quelque chose qui n’aurait pas pu être accompli sans cette première génération de technologies de séquençage qui ont permis la réussite du PGH. La phase suivante de percées s’est ensuivie, ce qui nous a menés aux technologies du séquençage de nouvelle génération (SNG), qui ont fait une pratique de routine du séquençage de génomes individuels, tout en permettant l’étude de génomes et de transcriptomes de cellules uniques. Restez à l’affût de notre blogue pour un prochain article qui explorera en profondeur la prochaine phase de notre évolution technologique: le SNG.

Précédent

Ressources récentes

Blogue

février 3, 2023

L’oncologie de précision de pointe, là où se trouve le patient

Cette année, la Journée mondiale contre le cancer a pour thème « Pour des soins plus justes ». Chez Imagia Canexia Health, l’équité en matière de santé est un pilier de notre travail. Ainsi, aujourd’hui, notre Médecin en chef Dr David Huntsman engage une conversation pour mettre en valeur comment notre approche axée sur les communautés améliore l’accès aux soins oncologiques issus de la génomique pour toutes et tous.