En combinant biologie moléculaire, génomique et chromosomes artificiels, avec l’appui d'intelligence artificielle (IA), une équipe de l'Institut Pasteur explore comment une molécule d’ADN se comporte quand elle entre dans un noyau d’une cellule eucaryote. Leurs travaux, récemment publiés dans la prestigieuse revue Science, révèle des destins très différents suivant la composition des séquences.
Les transferts de molécules d’ADN d’une espèce à une autre sont des évènements relativement fréquents à l’échelle évolutive, mais pas seulement. Par exemple, lorsqu’un microbe, virus ou bactérie, infecte un organisme, son ADN peut pénétrer dans les cellules de l’hôte, s’introduire dans leur noyau, voire s’intégrer au génome. Alors, la cellule hôte, comme l’ADN microbien – ADN étranger ou exogène – peuvent s’en trouver sensiblement modifiés…
Les réactions ancestrales de l’ADN restent encore largement méconnues
On sait que la composition des séquences d’ADN1, la structure de la chromatine2, les motifs nucléotidiques3 varient non seulement d'une espèce à l'autre, mais également au sein d'un même génome. Tout cela reflète également des milliards d'années d'évolution. Ainsi, lorsque de l’ADN exogène envahit ou intègre le noyau d’une cellule hôte, il est confronté à des mécanismes de régulation et à des règles sous lesquelles il n’a pas forcément évolué. La manière dont les cellules hôtes traitent de telles molécules d’ADN dès leur entrée dans le noyau, voire finissent par adopter ces séquences exogènes, reste largement inexplorée.
1. Séquence d’ADN : organisation des 4 bases A-T et G-C (les éléments chimiques qui le composent) dans la molécule d’ADN2. Chromatine : substance formée d’ADN et de protéines, qui constitue le génome des cellules eucaryotes. On l’appelle aussi nucléosome.
3. Motifs nucléotidiques : ces éléments qui constituent la base de l'ADN et déterminent l'ordre des nucléotides A, T, G, C dans une molécule
Étudier de l’ADN bactérien dans un eucaryote, la levure
Quelle est la réponse d’un hôte eucaryote en réaction à l’intégration d’ADN étranger dans son noyau ? Et quels sont les niveaux de régulation du génome impliqué dans la régulation de cet ADN étranger ? Le sujet a été étudié à l’Institut Pasteur par une vingtaine de chercheuses et chercheurs de l’unité de Régulation spatiale des génomes.
Romain Koszul, directeur de l’unité, a impulsé le projet à la suite d’un séminaire donné en 2016 à l’Institut Pasteur par Carole Lartigue, chercheuse à l’INRAE de Bordeaux. Cette dernière avait présenté ses travaux au Craig Venter Institute, visant à utiliser la levure de boulangerie comme hôte intermédiaire à la synthèse et au transfert de génomes bactérien du genre Mycoplasma. En effet la levure, un micro-organisme unicellulaire eucaryote, modèle historique de prédilection des généticiens, se prête bien à l'hébergement et la manipulation d'ADN exogène. Le projet est donc parti d'une question simple :
« Au départ, notre démarche était purement exploratoire et, comme on dit, guidée par la curiosité. Nous nous sommes demandés comment s’organise dans le noyau le génome de la levure quand on le fait coexister un génome bactérien entier. Puis les données ont été de plus en plus nombreuses, les questions aussi… C‘était comme dérouler une pelote de laine ! »
L’ADN bactérien reste-t-il muet ou devient-il très actif, une fois dans la cellule hôte ?
Trois caractéristiques principales ont été explorées pour déterminer comment l’ADN exogène s’adapte à son hôte.
- D’abord, la composition de la chromatine s’y formant : diffère-t-elle de la chromatine de l’hôte ?
- Ensuite, sa transcription : cet ADN étranger est-il activement transcrit en ARN, ou bien reste-t-il inactif, c’est-à-dire « muet » transcriptionnellement ?
- Enfin, son organisation tridimensionnelle dans l’espace nucléaire : ce grand ruban de code génétique est-il déroulé, ou bien replié sur lui-même ?
En croisant résultats d’expériences fonctionnelles et analyses bio-informatiques, les chercheurs ont démontré la transcription de l’ADN exogène dépend de sa composition en paire de bases AT et GC. De plus, l’absence de transcription de l’ADN exogène le conduit à former un compartiment nucléaire dans lequel il se retrouve séquestré, à l’écart des chromosomes de levure activement transcrits, conduisant ainsi à une partition du génome.
Ensuite, l’équipe a voulu savoir dans quelle mesure la séquence génomique de l’ADN étranger, qui impacte ces éléments peut être utilisée pour prévoir la manière dont il va s’adapter à sa « cellule d’accueil ». C’est là qu’est intervenue l’intelligence artificielle (IA). Une application de deep learning4 conçue avec le concours de l’équipe ADN Répété, Chromatine, Evolution dirigée par Julien Mozziconacci au Museum national d’histoire naturelle (MNHN), une équipe avec laquelle Romain Koszul collabore depuis plus de dix ans.
4. Deep learning : algorithmes dotés d’une capacité d’apprentissage (ou deep learning, ou apprentissage profond), qui sont au cœur du regain d’intérêt pour l’intelligence artificielle depuis quelques années.Lire pour en savoir plus : Intelligence artificielle : les réseaux neuronaux artificiels ont le vent en poupe
La composition de l’ADN bactérien détermine directement son destin
Jacques Serizay, post-doctorant en bio-informatique et co-premier auteur de l’étude, a piloté l’intégration de données expérimentales multi-omiques et s’est assuré que les résultats d’IA obtenus par l’équipe du Museum étaient cohérents avec ces observations : « Nous avons utilisé une IA développée par le Museum capable de simuler un très grand nombre de scénarios, selon les caractéristiques de la levure et de l’ADN étranger. Nous avons surtout fait varier la séquence de cet ADN, et le nombre de paires de bases G ou C. »
Plus de 10 000 hypothèses ont ainsi pu être testées in silico, et leurs résultats ont permis de confirmer une conclusion expérimentale importante : la composition de l’ADN exogène détermine directement son destin. Lorsque son taux de paires G ou C est similaire à celui du génome de la levure, il devient très actif. Il s’entremêle aux chromosomes rencontrés, et va donc facilement s’adapter. À l’inverse, si son taux de G ou C est faible, l’ADN se montre très discret, inactif et se replie dans un coin du noyau sous forme de globule.
De nombreuses applications peuvent découler de cette étude et sa méthodologie. « D’autres systèmes d’IA peuvent être développés pour prédire le comportement de séquences invasives, dans des contextes très différents, éclaire Romain Koszul. Déjà, il nous sert régulièrement au labo, pour tester des hypothèses dans d’autres projets ! »
Source
Sequence-dependent activity and compartmentalization of foreign DNA in a eukaryotic nucleus, Science, 6 février 2025.