La première ébauche du génome humain était publié il y a exactement 20 ans. Il a fallu près de trois ans pour le terminer, pour un coût de près d'un milliard de dollars. le projet Génome humain il a permis aux scientifiques de lire, presque de bout en bout, les 3 milliards de paires de bases d'ADN (ou "lettres") qui définissent biologiquement un être humain.
C'était une entreprise d'époque. Ce projet a permis à une nouvelle génération de chercheurs d'identifier de nouvelles cibles pour les traitements contre le cancer, conçu souris avec système immunitaire humain et même en construire un site Web où vous pouvez parcourir l'ensemble du génome humain comme s'il s'agissait de Google Maps.
Le premier génome humain complet a été généré à partir d'une poignée de donneurs anonymes. L'objectif était de produire un génome de référence représentant plus d'un individu. Comme prévu, il ne suffisait pas de comprendre la grande diversité des populations humaines dans le monde. Il n'y a pas deux personnes identiques et aucun génome ne se ressemble. Si les chercheurs voulaient comprendre avec plus de précision l'humanité dans toute sa diversité, un seul génome humain ne suffirait pas.
Des milliers ou des millions d'entre eux devraient être séquencés: et c'est précisément l'objet d'un projet en cours.
Comprendre la diversité génétique


La richesse de la diversité génétique parmi les personnes est ce qui rend chaque personne unique. Mais les changements génétiques provoquent également de nombreux maux et rendent certains groupes de personnes plus sensibles à certaines maladies que d'autres.
Au moment du projet sur le génome humain, les chercheurs séquençaient également les génomes complets d'organismes plus simples tels que souris , les mouches des fruits , levure e des plantes . L'énorme effort réalisé pour générer ces premiers génomes a conduit à une révolution dans la technologie nécessaire à la lecture des génomes. Une technologie qui a évolué au point qu'aujourd'hui il ne faut pas des années et des millions d'euros pour séquencer tout un génome humain. Maintenant il faut quelques jours et coûte moins d'un millier d'euros.
Des milliers de génomes
Les progrès technologiques ont permis aux scientifiques de séquencer les génomes complets de milliers d'individus du monde entier. Des initiatives telles que Consortiums d'agrégation du génome ils font de grands efforts pour collecter et organiser ces données éparses. Jusqu'à présent, ce groupe a pu collecter près de 150.000 241 génomes. Dans cet ensemble de données, les chercheurs ont trouvé plus de XNUMX millions de différences dans les génomes des personnes, avec une moyenne d'une variante toutes les huit paires de bases .
La plupart de ces variations sont très rares et n'auront aucun effet sur une personne. Cependant, parmi eux, se cachent des variantes aux conséquences physiologiques et médicales importantes. Par exemple, certaines variantes du gène BRCA1 prédisposent certains groupes de femmes, comme les juifs ashkénazes, au cancer tout ovaires et seins. D'autres variantes de ce gène portent Les Nigérianes connaîtront une mortalité plus élevée que la normale pour le cancer du sein.
Comment identifier ces variantes du génome humain?
La meilleure façon pour les chercheurs d'identifier ces types de variantes au niveau de la population consiste à effectuer des études comparant les génomes de grands groupes de personnes avec un groupe témoin. Mais les maladies sont compliquées. Le mode de vie, les symptômes et le délai d'apparition d'un individu peuvent varier considérablement, et l'effet de la génétique sur de nombreuses maladies est difficile à distinguer. Le pouvoir prédictif de la recherche actuelle en génomique est trop faible pour exclure bon nombre de ces effets parce que il n'y a pas assez de données génomiques .
Comprendre la génétique de maladies complexes, en particulier celles liées aux différences génétiques entre les groupes ethniques, est essentiellement un problème de big data. Et les chercheurs ont besoin de plus de données. Beaucoup plus de données.
1.000.000 XNUMX XNUMX génomes


Pour répondre au besoin de plus de données, les National Institutes of Health ont lancé un programme appelé Nous tous . Le projet vise à collecter des informations génétiques, des dossiers médicaux et des habitudes de santé à partir d'enquêtes et d'appareils portables de plus d'un million de personnes aux États-Unis en 10 ans. Il a ouvert ses portes au public en 2018 et plus de 270.000 personnes ont fourni des échantillons depuis lors.
Le grand potentiel de ce projet réside dans la possibilité de faire des recherches en croisant les données les plus disparates. Un neuroscientifique pourrait rechercher des variations génétiques associées à la dépression en tenant compte, par exemple, des niveaux d'exercice. Un oncologue pourrait rechercher des variantes liées au risque de cancer de la peau en fonction des différences ethniques.
Avec un million de génomes humains, nous aurons une richesse extraordinaire de données pour découvrir les effets de la variation génétique sur la maladie, non seulement pour les individus, mais aussi au sein de différents groupes de personnes.
La forêt sombre du génome humain


Un autre avantage de ce projet est qu'il permettra aux scientifiques de se renseigner sur des parties du génome humain qui sont actuellement très difficiles à étudier. La plupart des recherches génétiques ont porté sur les parties du génome qui codent pour les protéines. Cependant, ceux-ci ne représentent que les1,5% du génome humain.
Une recherche prometteuse porte sur l'ARN, une molécule qui transforme les messages codés dans l'ADN d'une personne en protéines. Cependant, les ARN qui proviennent de 98,5% du génome humain non producteur de protéines ont une foule d'autres fonctions. Certains de ces RNA sont impliqués dans des processus tels que manière in quel cancer se propage , développement embryonnaire ou contrôle du chromosome X chez les femmes. Étant donné que le projet All of Us comprend toutes les parties codantes et non codantes du génome, ce sera de loin le plus grand ensemble de données disponible pour faire la lumière sur ces mystérieux ARN.