Structure et fonction de la chromatine

Positionnement des nucléosomes

Le génome eucaryote est emballé dans une sous-unité répétitive connue sous le nom de nucléosome, qui consiste en 146 pb d’ADN enroulé presque deux fois autour d’un octamère de protéines histones basiques. Toutes les transactions de l’ADN eucaryote, de la transcription à la réparation de l’ADN en passant par la recombinaison, se produisent dans le contexte de l’emballage de ce nucléosome. Comme l’ADN enroulé autour du nucléosome et l’ADN situé entre les nucléosomes diffèrent par leur accessibilité et leurs caractéristiques structurelles, l’emplacement précis des nucléosomes le long du génome s’est avéré d’une grande importance pour comprendre la fonction du génome. Dans un certain sens, on peut considérer l’emballage chromatinien du génome comme un « ensemble de filtres » qui affecte la production génomique en cachant ou en exposant alternativement les éléments clés de l’ADN régulateur, permettant à la même molécule d’ADN d’exprimer de multiples programmes fonctionnels distincts selon son état d’emballage précis. Notre laboratoire s’intéresse depuis longtemps à la biologie structurelle du génome – quelles sont les règles qui sous-tendent l’encapsulation génomique, et quelles sont les implications fonctionnelles des différents états d’encapsulation ?

Nous nous sommes concentrés sur la levure bourgeonnante S. cerevisiae comme organisme modèle pratique pour étudier la structure de la chromatine à l’échelle du génome, où nous avons développé des méthodes d’analyse de l’architecture de la chromatine à l’échelle du génome. Par exemple, pour générer des cartes génomiques du positionnement des nucléosomes, nous utilisons le fait que la nucléase micrococale (MNase) a une préférence pour l’ADN de liaison par rapport à l’ADN nucléosomal – la séparation par taille des fragments d’ADN restant après la digestion par la MNase donne une « échelle » régulière avec une taille unitaire répétitive. L’analyse à l’échelle du génome des fragments de la taille d’un mononucléosome par un réseau en tuiles ou par séquençage profond (MNase-seq) fournit ensuite un catalogue des régions protégées par les nucléosomes (Yuan et al, Science 2005), révélant à la fois les emplacements des nucléosomes « bien positionnés » qui sont présents au même endroit dans la plupart des cellules, et les emplacements des régions « floues » où l’emplacement des nucléosomes varie entre les cellules. L’une des plus grandes surprises de ces premières cartes de nucléosomes a été le fait que la majorité des nucléosomes (~70%) dans la levure bourgeonnante sont relativement bien positionnés, malgré le fait bien connu que la grande majorité de l’ADN génomique a peu ou pas de préférence thermodynamique intrinsèque pour l’incorporation dans les nucléosomes. Nous avons continué à étudier les aspects du positionnement des nucléosomes chez la levure bourgeonnante, en utilisant à la fois des approches génétiques traditionnelles (Weiner et al, Genome Res 2010) ainsi que des études de génomique comparative (Tsankov et al, PLoS Bio 2010, Hughes et al, Mol Cell 2012) pour éclairer les forces responsables du positionnement des nucléosomes in vivo.

Les leçons tirées des cartes de nucléosomes de levure se sont largement avérées générales dans une multitude d’espèces soumises à la cartographie des nucléosomes à l’échelle du génome, avec un certain nombre de concepts clés qui émergent (Figure 1). Premièrement, les promoteurs actifs et en attente sont appauvris en nucléosomes, tout comme les amplificateurs actifs. Deuxièmement, les nucléosomes qui bordent les éléments régulateurs sont bien positionnés. Les nucléosomes sont positionnés avec une précision décroissante à des distances plus grandes, ce qui conduit à un modèle de nucléosome plus flou plus loin (~1000-2000pb) des nucléosomes de frontière. Troisièmement, les gènes hautement transcrits ont tendance à avoir une occupation plus faible des nucléosomes et un positionnement moins précis, très probablement en raison de l’action de l’ARN polymérase II et de ses facteurs associés. Enfin, la densité de la matrice des nucléosomes (distance moyenne entre deux nucléosomes adjacents) peut varier, principalement en raison de facteurs trans. Nous continuons à étudier le positionnement des nucléosomes dans une certaine mesure chez la levure, avec un intérêt actif pour la décomposition en molécules uniques des mesures d’ensemble.

Dynamique des histones

Les essais épigénomiques capturent des instantanés d’états cellulaires complexes. Contrairement à la séquence d’ADN, qui est très stable, la chromatine peut être très dynamique, ce qui soulève la question des échelles de temps pertinentes qui régissent les structures chromatiniennes. Cette question est liée, mais distincte, de la question de l’hétérogénéité au sein d’une population cellulaire. Lorsque nous observons un nucléosome « flou » dans une mesure d’ensemble, l’emplacement du nucléosome change-t-il uniquement lors de la division cellulaire (stable) ou toutes les quelques secondes (dynamique) – une large gamme d’échelles de temps est cohérente à la fois avec l’observation d’ensemble et avec la distribution des états de la cellule unique. Cette question s’applique à toute la gamme des structures trouvées in vivo, des interactions chromosomiques à longue portée aux modifications chimiques des nucléosomes. Pour comprendre la fonction des structures observées, il faudra en fin de compte connaître les échelles de temps pertinentes pour les structures en question.

Pour caractériser la dynamique de la chromatine à l’échelle du génome, nous avons adapté des méthodes de pule-chase codées génétiquement pour caractériser les taux de renouvellement des nucléosomes indépendants de la réplication à l’échelle du génome (Dion et al, Science 2007). Ces études révèlent un renouvellement indépendant de la réplication au niveau des gènes transcrits, avec un remplacement particulièrement rapide des histones dans les régions régulatrices (promoteurs et amplificateurs). Des études de mutants menées par de nombreux laboratoires, dont le nôtre, ont permis de mieux comprendre les mécanismes cellulaires responsables du remplacement des histones.

Sur des échelles de temps plus longues, la question de la dynamique des histones est essentielle à toute compréhension mécaniste de la façon dont les états de la chromatine sont copiés d’une génération à l’autre. Pour comprendre le mécanisme par lequel les états de la chromatine pourraient être hérités, il est nécessaire de comprendre les défis uniques posés par la dynamique des protéines histones pendant la réplication. Tout d’abord, pendant la réplication génomique, le passage de la fourche de réplication perturbe les contacts histone-ADN, et les anciennes histones doivent se réassocier aux chromosomes filles à un endroit proche de leur emplacement d’origine sur le chromosome mère. Sinon, les informations épigénétiques spécifiques à un locus seraient déplacées de façon aléatoire à chaque génération. Deuxièmement, les histones anciennes ne représentent que la moitié des histones de chaque nouveau génome, et les histones restantes sont nouvellement synthétisées au cours de chaque phase S. Cela implique un certain passage de l’information de l’ancienne à la nouvelle. Cela implique un certain passage de l’information des anciens aux nouveaux histones, car sinon les anciens états de la chromatine seraient rapidement dilués par les nouveaux histones.

Pour tenter de mesurer l’ampleur du mouvement des nucléosomes pendant la réplication génomique, nous avons utilisé un système de pulse-chase génétique développé par le laboratoire van Leeuwen dans lequel l’induction de la recombinaison Cre-Lox entraîne le passage d’une histone H3 marquée par un épitope à un nouvel épitope. Ce système nous a permis de désactiver une étiquette H3 ancestrale et de suivre ensuite la disposition génomique de l’H3 ancestrale pendant plusieurs divisions cellulaires (Radman-Livaja et al, PLoS Bio 2011). À notre grande surprise, nous avons constaté que les vieilles protéines histones ne s’accumulent pas dans les loci à régulation épigénétique tels que les subtélomères, mais qu’elles s’accumulent plutôt aux extrémités 5′ des gènes longs et mal transcrits. Comme prévu, les vieilles histones ne s’accumulent pas aux loci présentant un renouvellement rapide des histones, mais nous avons également constaté que le mouvement de 3′ à 5′ des vieilles histones le long des régions codantes et le mouvement des histones pendant la réplication sont nécessaires pour expliquer les modèles de rétention des histones ancestrales que nous observons. Plus important encore, nous avons constaté que les vieilles histones ne se réassocient pas avec les génomes filles à l’endroit précis d’où elles se sont dissociées, mais qu’au contraire, les histones maternelles restent dans un rayon de ~400 pb de leur emplacement d’origine pendant la réplication, fournissant ainsi la première mesure de ce paramètre crucial. Ainsi, tout héritage des états de la chromatine doit se produire à l’échelle de ~5-10 domaines de nucléosomes plutôt qu’à la résolution d’un seul nucléosome. Ces résultats contraignent donc la quantité maximale d’information théoriquement portée par la chromatine entre les générations.

Modifications des histones

La structure en perles sur une corde de la fibre de chromatine n’est pas composée de perles uniformes, car la composition chimique des nucléosomes individuels peut en principe être extrêmement variable d’un nucléosome à l’autre, avec des conséquences importantes pour la fonction du génome. Plus spectaculaire encore, les protéines histones peuvent être modifiées chimiquement, avec une prodigieuse variété de modifications post-traductionnelles (acétylation, méthylation, phosphorylation, ubiquitylation, et bien d’autres) sur de multiples résidus dans toutes les histones. Ces modifications chimiques peuvent altérer les propriétés chimiques et physiques du nucléosome, mais servent également à moduler la liaison par les protéines qui reconnaissent l’état modifié (par exemple, ne se lient qu’aux H3K4 tri-méthylés).

Cette incroyable diversité de modifications des histones conduit naturellement à la question de savoir ce que tout cela signifie – pourquoi tant de modifications des histones se produisent-elles dans la cellule ? Nous nous intéressons depuis longtemps à la question de savoir comment la complexité combinatoire contribue à la régulation de la chromatine. Combien de combinaisons de modifications distinctes se produisent (figure 2), et peut-on associer des combinaisons spécifiques de modifications à des résultats spécifiques de manière à pouvoir déchiffrer le code ? Nous avons adopté deux approches à ces questions, basées sur 1) la cartographie à l’échelle du génome des modifications des histones à la résolution des mononucléosomes (Liu et al, PLoS Bio 2005, Weiner et al, Mol Cell 2015), et 2) l’analyse des changements transcriptionnels dans la levure bourgeonnante portant soit des histones mutantes, soit des délétions d’enzymes modifiant les histones (Dion et al, PNAS 2005, Weiner et al, PLoS Bio 2012).

En se concentrant d’abord sur la cartographie génomique, les efforts à grande échelle de cartographie de l’état des histones dans de multiples systèmes modèles révèlent un certain nombre d’aspects conservés de la structure de la chromatine. Premièrement, le processus de transcription laisse une empreinte massive sur la chromatine, avec différentes modifications d’histones déposées par les formes d’initiation (extrémité 5′ des gènes) et d’élongation (extrémités médiane et 3′) de l’ARN polymérase. Les marques à l’extrémité 5′ des gènes comprennent la di/tri-méthylation de H3K4 (H3K4me3), l’hyper acétylation des queues de H3 et H4 (H3K4/9/14/18/27ac et H4K5/8/12ac), les variantes de H3.3 et H2A.Z, et l’acétylation de H3K56. Les nucléosomes du corps du gène sont typiquement marqués par H3K36me3 et H3K79me3, et sont généralement quelque peu appauvris en acétylations de la queue des histones. Ensuite, les éléments régulateurs distaux, tels que les amplificateurs, sont marqués par H3K4me1/2 mais pas par H3K4me3. D’autres marques d’histones distinguent les amplificateurs réprimés, positionnés et actifs, la méthylation et l’acétylation de H3K27 marquant les amplificateurs réprimés et actifs, respectivement. Troisièmement, deux formes majeures de chromatine répressive sont associées à des modifications spécifiques des histones. L’hétérochromatine classique (y compris les télomères et de nombreuses séquences répétitives) est marquée par la méthylation de H3K9, tandis que les gènes réprimés par les facteurs du groupe polycomb sont marqués par H3K27me3. Les nucléosomes méthylés H3K27 peuvent être soit dans un état réprimé et dépourvu d’autres marques, soit dans un état « bivalent » en combinaison avec la marque active H3K4me3. Enfin, les nucléosomes associés aux centromères contiennent souvent la protéine H3-like CENP-A, et pendant la phase M, un large domaine péricentrique de nucléosomes est marqué avec H3S10ph. Dans l’ensemble, il y a une correspondance frappante de l’état des histones avec la fonction des régions génomiques, et à cause de cela, la cartographie des modifications des histones est une méthode efficace pour découvrir des gènes et des éléments régulateurs.

Pour en revenir aux fonctions des modifications des histones, une approche systématique pour comprendre les fonctions des modifications combinatoires des histones a été l’analyse du génome entier des changements d’expression des gènes observés chez les mutants d’histones. Ces études montrent généralement que les mutants d’histones présentent une complexité phénotypique relativement faible résultant de différentes combinaisons de mutants d’histones. Ceci est observé à la fois dans les études se concentrant sur des mutants ponctuels d’histones spécifiques et leurs combinaisons, ainsi que dans les études se concentrant sur les mutants de délétion des enzymes de modification des histones. Par exemple, nous avons systématiquement examiné les 16 mutations combinatoires possibles parmi les 4 lysines de la queue de l’histone H4, et nous avons constaté que la mutation de trois des résidus (lysines 5, 8 et 12) avait des effets indiscernables sur l’expression génétique, tandis que la lysine 16 a été confirmée comme ayant des effets uniques sur l’expression génétique (Dion et al, PNAS 2005). En outre, les défauts d’expression génique dans les mutants combinatoires étaient peu différents des combinaisons linéaires des mutations composantes – en d’autres termes, l’effet du double mutant H4K5,16R sur l’expression génique pourrait être prédit en ajoutant les ensembles de données K5R et K16R.

Contrairement aux effets modestes de nombreuses délétions modifiant les histones observés à l’état d’équilibre, les études de gènes uniques suggèrent que les régulateurs de la chromatine ont des rôles importants dans les processus dynamiques qui sont masqués à l’état d’équilibre. Cela nous a motivés à étudier les régulateurs de la chromatine dans le contexte de la reprogrammation transcriptionnelle, en utilisant le stress au diamide chez la levure comme paradigme pratique pour induire des changements transcriptionnels massifs (Weiner et al, PLoS Bio 2012). Nous constatons que la majorité des régulateurs de la chromatine ont des effets plus importants sur la cinétique d’induction/répression des gènes que sur les niveaux d’ARNm à l’état stable, ce qui confirme que les études dynamiques peuvent identifier des fonctions inattendues pour les régulateurs de la chromatine. Le regroupement de mutants de délétion présentant des défauts d’expression génique similaires permet d’identifier des complexes connus, et l’analyse conjointe de mutants d’histones et de mutants de délétion permet d’associer de nombreuses enzymes de modification des histones à leurs sites cibles. En combinant les données fonctionnelles avec les données de cartographie à l’échelle du génome, nous avons identifié un rôle surprenant pour la méthylation H3K4 dépendante de Set1 (une marque  » activatrice « ) dans la répression des gènes de la biogenèse ribosomale. Ensemble, ces données fournissent une riche vue multimodale sur le rôle des régulateurs de la chromatine dans la dynamique de l’induction et de la répression des gènes, et suggèrent que la compréhension des myriades de rôles de la structure de la chromatine dans la régulation des gènes à l’échelle du génome nécessitera d’étendre les analyses de mutants aux études cinétiques.

Repliage du chromosome

Alors que la structure unidimensionnelle de la chromatine est de mieux en mieux comprise, notre compréhension du pliage tridimensionnel du génome dans le noyau a traditionnellement pris du retard. Cela dit, au cours de la dernière décennie, cet écart a été considérablement réduit grâce au développement par Dekker et ses collègues de la famille de techniques 3C (Chromosome Conformation Capture). Dans ces méthodes, la chromatine est soumise à une réticulation in vivo pour capturer les interactions entre les loci chromosomiques. Le génome est ensuite fragmenté, généralement avec des enzymes de restriction, et la ligature de l’ADN est utilisée pour capturer les interactions entre les loci chromosomiques qui étaient en contact les uns avec les autres in vivo. L’abondance des produits de ligature entre deux régions chromosomiques est souvent interprétée comme une mesure de la fréquence/probabilité de contact, ou de proximité, entre la paire de loci, fournissant une vue de la structure chromosomique qui est quelque peu analogue à la vue de la structure des protéines générée par les techniques de RMN. Les variantes de 3C à l’échelle du génome, telles que Hi-C, ont révélé un certain nombre de caractéristiques organisationnelles des génomes eucaryotes à des résolutions de plus en plus fines, de l’échelle des territoires chromosomiques complets, aux compartiments actifs et inactifs de plusieurs Mb, aux domaines de contact (TAD) de centaines de Kb, aux boucles d’exhausteurs-promoteurs.

Bien que de nombreux facteurs aient un impact sur la résolution effective d’un ensemble de données 3C/Hi-C, notamment la profondeur de séquençage et la complexité de la bibliothèque, une limite cruciale à la résolution génomique est la taille des fragments générés avant que les interactions physiques ne soient capturées par ligature. Étant donné que la majorité des expériences 3C reposent sur des enzymes de restriction pour fragmenter le génome, elles sont limitées à une résolution de ~1 kb dans le meilleur des cas. Pour améliorer la résolution des techniques 3C, nous avons donc développé une technique 3C à haute résolution, appelée « Micro-C », dans laquelle la fragmentation du génome est réalisée à l’aide de la nucléase micrococale (MNase) pour permettre l’analyse du repliement des chromosomes à la résolution d’un mononucléosome. La résolution améliorée offerte par Micro-C a permis l’identification de domaines d’interaction chromosomique – « CID » – dans la levure bourgeonnante qui n’avaient pas été appréciés auparavant en utilisant une technique 3C basée sur les enzymes de restriction (Hsieh et al, Cell 2015). Un protocole Micro-C révisé incorporant de longs réticulants, que nous avons nommé  » Micro-C XL « , a non seulement récapitulé les structures chromatiniennes locales précédemment révélées par Micro-C, mais a également récupéré de manière robuste des caractéristiques d’ordre supérieur telles que les interactions centromère-centromère (Hsieh et al, Nature Methods 2016).

Notre méthode donne un aperçu du repliement du génome de la levure à toutes les échelles de longueur d’intérêt. À des échelles plus grandes, la configuration Rabl des chromosomes est vue comme un regroupement de centromères, et des interactions entre les télomères des bras de chromosomes de longueur similaire. La chromatine centromérique présente également une forme caractéristique en « X » résultant du fait que les deux bras du chromosome s’éloignent statistiquement du centromère et forment ensemble une structure en épingle à cheveux sur environ ~20 kb, alors que les centromères sont relativement isolés des bras du chromosome. À plus haute résolution (figure 3), les gènes de la levure bourgeonnante et de la levure de fission sont organisés en domaines d’interaction chromosomique (CID), qui s’étendent généralement de 1 à 5 gènes, et qui sont en quelque sorte similaires aux « domaines d’association topologique » décrits dans une multitude d’autres organismes modèles. Les frontières entre les CID se situent au niveau des promoteurs actifs, des gènes fortement exprimés et des gènes d’ARNt. La concordance de multiples approches indépendantes de l’analyse du repliement des chromosomes permet d’espérer que nous nous approchons d’une véritable compréhension des structures adoptées par les chromosomes dans la cellule.

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.