L'ADN est comme un collier de perles enfermé dans un espace minuscule. Depuis des décennies, nous étudions la séquence de ces perles : les bases A, T, C et G qui constituent le code génétique. Mais ce qui importe vraiment, c'est la façon dont ce collier se replie. Les boucles, les replis et les structures tridimensionnelles déterminent quels gènes sont activés et lesquels restent inactifs. MIX-HIC è le premier modèle multimodal d'intelligence artificielle qui peut déchiffrer cette architecture cachée. Oui, monsieur, le génome 3D. Il y parvient en intégrant deux types d'informations : des cartes montrant quelles parties de l'ADN se touchent dans l'espace (appelées Hi-C) et des signaux chimiques indiquant où l'ADN est accessible (signatures épigénomiques). Qu'est-ce que cela signifie ? Examinons cela ensemble, calmement.
Le génome 3D n'est pas un détail : c'est le mécanisme.
Une cellule hépatique et un neurone possèdent le même ADN. Pourtant, leurs fonctions sont totalement différentes. Le secret ne réside pas dans la séquence, mais en forme. Lorsque l'ADN forme un boucle de chromatineElle rapproche des régions éloignées du génome. Une boucle de chromatine est comme un pont moléculaire reliant un interrupteur au gène qu'il est censé contrôler. La forme de la boucle joue le rôle de l'interrupteur. Si la boucle ne se forme pas, le gène reste inactif. Si elle se forme au mauvais endroit, le gène s'active de manière inappropriée.
L’étude du génome 3D s’est jusqu’à présent apparentée à l’assemblage d’un puzzle dont les pièces proviennent de différentes boîtes. Les scientifiques disposaient de cartes de contact de l'ADN, montrant quelles régions se touchent dans l'espace. Ils possédaient également le traces épigénomiquesCes données révèlent les régions de l'ADN « ouvertes », prêtes à être lues. Cependant, elles ont été analysées séparément, à l'aide de méthodes spécialisées. En pratique, la vision d'ensemble a été perdue.

MIX-HIC apprend deux langues et les nuances des deux.
L'équipe deUniversité de science et de technologie de Hong Kong MIX-HIC a développé un système qui révolutionne l'approche. Il a été formé à plus de [nombre] utilisateurs. 1,2 million d'échantillons appariés de cartes Hi-C et de signatures épigénomiques : le plus grand ensemble de données jamais créé pour l’étude du génome 3D. Son architecture est ingénieuse : le système ne se contente pas de fusionner les différents types de données. Il apprend à reconnaître à la fois les caractéristiques communes aux deux modalités et les caractéristiques uniques de chacune. C’est comme un traducteur qui non seulement maîtrise deux langues, mais comprend aussi les nuances culturelles.
Lors des tests, MIX-HIC a surpassé toutes les méthodes existantes dans trois tâches clés. Prénom: prédire comment l'ADN s'organisera en 3D dans différents types de cellules, avec des améliorations jusqu'à 9,3% par rapport aux meilleurs systèmes précédents. Selon l'une: identifier les boucles de chromatine avec une précision sans précédent. troisième: prédire le niveau d'activité d'un gène est une information essentielle pour comprendre la fonction cellulaire.
En cas de données manquantes, imaginez-les
Les données Hi-C sont coûteuses et difficiles à obtenir. Elles sont souvent manquantes. MIX-HIC résout également ce problème : grâce à son apprentissage approfondi, le système peut « imaginer » l’organisation du génome 3D même à partir de seules traces épigénomiques. C’est comme un détective reconstituant une scène de crime avec peu d’indices, fort de son expérience acquise sur des milliers d’affaires précédentes. Cette approche de « sémantique unifiée » permet au système de combler les lacunes des données expérimentales tout en préservant la précision de ses prédictions. Bien sûr, une supervision humaine est nécessaire – il ne s’agit pas d’un oracle de Delphes – mais le gain de temps est considérable.
Les maladies ne sont pas simplement des séquences anormales.
De nombreuses maladies (des cancers aux maladies génétiques rares) ne sont pas dues à de simples erreurs dans la séquence d'ADN, mais à des problèmes d'organisation du génome tridimensionnel. Un gène important pour la suppression des tumeurs peut être désactivé car la structure tridimensionnelle empêche les facteurs de régulation de l'atteindre. Ou encore, une mutation peut ne pas modifier directement un gène, mais plutôt altérer une boucle de chromatine qui le contrôle à distance.
Grâce à MIX-HIC, les chercheurs peuvent désormais analyser le génome 3D de patients spécifiques afin d'identifier ces problèmes structurels. Cela ouvre la voie à des diagnostics plus précis : Comprendre précisément les anomalies au niveau de l'organisation de l'ADN d'un patient. Et des thérapies ciblées qui tiennent compte non seulement des gènes mutés, mais aussi de l'altération de l'ensemble de l'architecture génomique. Comme c'est déjà le cas en nutrition personnalisée, où la génomique et l'IA révolutionnent notre façon de prendre soin de notre santé.

Génome 3D : Amplifie les capacités, ne les remplace pas
Ce système accélère la recherche fondamentale : au lieu de mener des expériences longues et coûteuses pour chaque type cellulaire, les chercheurs peuvent utiliser MIX-HIC pour explorer virtuellement des milliers de scénarios et identifier les plus prometteurs pour des tests en laboratoire. Cet outil démocratise l’accès à la génomique de précision, la rendant plus rapide et plus abordable. Les méthodes développées pour modéliser ces signaux faibles peuvent également être utilisées en astronomie, en défense planétaire et pour surveiller l’impact des technologies humaines sur notre environnement spatial.
MIX-HIC illustre comment l'intelligence artificielle peut amplifier les capacités humaines en recherche scientifique. Elle ne remplace pas les scientifiques : elle leur offre un outil pour déchiffrer l'une des énigmes les plus complexes de la biologie : comment la structure tridimensionnelle de notre génome orchestre la symphonie de la vie cellulaire.
Et lorsque la musique est désaccordée, peut-être pourra-t-il nous dire ce que nous pouvons faire pour la réharmoniser.
