Kromatinstruktur og funktion

Nukleosomplacering

Det eukaryote genom er pakket ind i en gentagende underenhed kendt som nukleosomet, der består af 146 bp DNA, som er viklet næsten to gange omkring en oktamer af basale histonproteiner. Alle eukaryote DNA-transaktioner, fra transkription til DNA-reparation til rekombination, finder sted i forbindelse med denne nukleosomale indpakning. Da det DNA, der er viklet rundt om nukleosomet, og det DNA, der er placeret mellem nukleosomerne, adskiller sig fra hinanden med hensyn til tilgængelighed og strukturelle egenskaber, har det vist sig, at nukleosomernes præcise placering langs genomet er af stor betydning for forståelsen af genomets funktion. I en vis forstand kan man betragte kromatinpakningen af genomet som et “filtersæt”, der påvirker genomets output ved skiftevis at skjule eller blotlægge centrale regulerende DNA-elementer, hvilket gør det muligt for det samme DNA-molekyle at udtrykke flere forskellige funktionelle programmer afhængigt af dets præcise pakningstilstand. Vores laboratorium har længe været interesseret i genomets strukturelle biologi – hvad er de regler, der ligger til grund for genomisk pakning, og hvad er de funktionelle implikationer af forskellige pakningstilstande?

Vi har fokuseret på den spirende gær S. cerevisiae som en praktisk modelorganisme til at studere kromatinstruktur i hele genomet, hvor vi har udviklet metoder til analyse af kromatinarkitektur i hele genomet. For at generere genomiske kort over nukleosomernes placering gør vi f.eks. brug af det faktum, at mikrokalknuklease (MNase) foretrækker linker-DNA frem for nukleosomalt DNA – størrelsesadskillelse af de DNA-fragmenter, der er tilbage efter MNasefordøjelsen, resulterer i en regelmæssig “stige” med gentagende enhedsstørrelser. En genomdækkende analyse af de resulterende fragmenter af mononukleosomstørrelse ved hjælp af tiling array eller dyb sekventering (MNase-seq) giver derefter et katalog over nukleosombeskyttede regioner (Yuan et al., Science 2005), der både afslører placeringen af “velplacerede” nukleosomer, som er til stede samme sted i det meste af cellepopulationen, og placeringen af “uklare” regioner, hvor nukleosomernes placering varierer fra celle til celle. Blandt de største overraskelser fra disse tidlige nukleosomkort var den kendsgerning, at størstedelen af nukleosomer (~70%) i spirende gær er relativt velplacerede, på trods af den længe kendte kendsgerning, at langt størstedelen af genomisk DNA har lille eller ingen iboende termodynamisk præference for inkorporering i nukleosomer. Vi har fortsat med at undersøge aspekter af nukleosom-positionering i budding yeast ved hjælp af både traditionelle genetiske tilgange (Weiner et al, Genome Res 2010) og sammenlignende genomiske undersøgelser (Tsankov et al, PLoS Bio 2010, Hughes et al, Mol Cell 2012) for at belyse de kræfter, der er ansvarlige for nukleosom-positionering in vivo.

Læren fra gærnukleosomkortlægninger har i vid udstrækning vist sig at være generel i en lang række arter, der er genstand for genomdækkende nukleosomkortlægning, med en række nøglekoncepter, der opstår (figur 1). For det første er aktive og poisede promotorer udtømt for nukleosomer, ligesom aktive forstærkere er udtømt for nukleosomer. For det andet er nukleosomer, der grænser op til regulerende elementer, velplacerede. Nukleosomer er placeret med aftagende præcision i større afstande, hvilket fører til en mere uklar nukleosom-skabelon længere væk (~1000-2000bp) fra grænsenukleosomer. For det tredje har højt transskriberede gener tendens til at have en lavere nukleosombelægning og mindre præcis positionering, sandsynligvis på grund af RNA-polymerase II og de dertil knyttede faktorer. Endelig kan nukleosomtemplatets tæthed (den gennemsnitlige afstand mellem to tilstødende nukleosomer) variere, hovedsagelig på grund af transfaktorer. Vi fortsætter med at studere nukleosom-positionering i et vist omfang i gær, med en aktiv interesse i enkeltmolekyl-dekomponering af ensemble-målinger.

Histone dynamics

Epigenomiske assays indfanger øjebliksbilleder af komplekse cellulære tilstande. I modsætning til DNA-sekvensen, som er meget stabil, kan kromatin være meget dynamisk, hvilket rejser spørgsmålet om de relevante tidsskalaer, der styrer kromatinstrukturer. Dette spørgsmål er beslægtet med, men adskilt fra spørgsmålet om heterogenitet i en cellepopulation. Når vi observerer et “uklart” nukleosom i en ensemble-måling, ændres nukleosomets placering så kun ved celledeling (stabilt) eller med få sekunders mellemrum (dynamisk) – en bred vifte af tidsskalaer er i overensstemmelse med både ensemble-observationen og fordelingen af enkeltcelletilstande. Dette spørgsmål gælder for alle de strukturer, der findes in vivo, fra kromosomale interaktioner over store afstande til kemiske modifikationer af nukleosomer. For at forstå funktionen af de observerede strukturer vil det i sidste ende være nødvendigt at kende de relevante tidsskalaer for de pågældende strukturer.

For at karakterisere kromatindynamikken genom-dækkende har vi tilpasset genetisk kodede pule-chase-metoder til at karakterisere replikationsuafhængige nukleosomomsætningshastigheder genom-dækkende (Dion et al, Science 2007). Disse undersøgelser afslører replikationsuafhængig omsætning ved transskriberede gener, med særlig hurtig histonudskiftning ved regulatoriske regioner (promotorer og enhancers). Mutantundersøgelser fra mange laboratorier, herunder vores, har givet mekanistisk indsigt i det cellulære maskineri, der er ansvarligt for histonudskiftning.

Over længere tidsskalaer er spørgsmålet om histondynamik nøglen til enhver mekanistisk forståelse af, hvordan kromatintilstande kopieres fra den ene generation til den næste. For at forstå den mekanisme, hvormed kromatintilstande kan nedarves, er det nødvendigt at forstå de unikke udfordringer, som histonproteindynamikken under replikation giver anledning til. For det første forstyrrer passage af replikationsgaflen under genomisk replikation histon-DNA-kontakterne, og gamle histoner skal reassociere sig med datterkromosomer på et sted tæt på deres oprindelige placering på moderkromosomet. Ellers ville locus-specifik epigenetisk information blive blandet tilfældigt hver generation. For det andet udgør gamle histoner kun den ene halvdel af histonerne på hvert nyt genom, og de resterende histoner syntetiseres på ny i løbet af hver S-fase. Dette indebærer en vis informationsoverførsel fra gamle til nye histoner, da gamle kromatintilstande ellers hurtigt ville blive fortyndet af nye histoner.

For at forsøge at måle omfanget af nukleosombevægelse under genomisk replikation gjorde vi brug af et genetisk pulse-chase-system udviklet af van Leeuwen-laboratoriet, hvor induktion af Cre-Lox-rekombination resulterer i et skift fra et epitopmærket histon H3 til et nyt epitopmærke. Dette system gjorde det muligt for os at slukke for et forfødt H3-tag og efterfølgende følge den genomiske disposition af det forfødte H3 i flere celledelinger (Radman-Livaja et al, PLoS Bio 2011). Til vores store overraskelse fandt vi, at gamle histonproteiner ikke akkumuleres ved epigenetisk regulerede loci som f.eks. subtelomererne, men i stedet akkumuleres ved 5′-enderne af lange, dårligt transskriberede gener. Som forventet akkumuleres gamle histoner ikke ved loci, der udviser hurtig histonomsætning, men vi fandt også, at 3′- til 5′-bevægelse af gamle histoner langs kodningsregioner og histonbevægelse under replikation er nødvendig for at forklare de mønstre af forfædres histonretention, som vi observerer. Vigtigst er det, at vi finder, at gamle histoner ikke genforenes med dattergenomer på præcis det sted, hvorfra de blev dissocieret, men at moderhistoner i stedet forbliver inden for ~400 bp af deres oprindelige placering under replikationen, hvilket giver den første måling af denne afgørende parameter. Enhver nedarvning af kromatintilstande må således ske på en skala på ~5-10 nukleosomdomæner snarere end på en enkelt nukleosomopløsning. Disse resultater begrænser derfor den maksimale mængde information, der teoretisk set bæres af kromatin mellem generationer.

Histonmodifikationer

Kromatinfibrenes perler på en snor-struktur består ikke af ensartede perler, da den kemiske sammensætning af individuelle nukleosomer i princippet kan være ekstremt variabel fra nukleosom til nukleosom, hvilket har vigtige konsekvenser for genomets funktion. Mest dramatisk er det, at histonproteinerne kan modificeres kemisk, idet der forekommer en utrolig række posttranslationelle modifikationer (acetylering, methylering, fosforylering, ubiquitylering og mange flere) ved flere rester i alle histonerne. Disse kemiske modifikationer kan ændre nukleosomets kemiske og fysiske egenskaber, men tjener også til at modulere bindingen af proteiner, der genkender den modificerede tilstand (f.eks. binder de kun til trimetyleret H3K4).

Denne utrolige mangfoldighed af histonmodifikationer fører naturligt nok til spørgsmålet om, hvad det hele betyder – hvorfor forekommer der så mange histonmodifikationer i cellen? Vi har længe været interesseret i spørgsmålet om, hvordan kombinatorisk kompleksitet bidrager til kromatinregulering. Hvor mange forskellige kombinationer af modifikationer forekommer (figur 2), og kan specifikke kombinationer af modifikationer matches med specifikke resultater, således at koden kan dechifreres? Vi har anvendt to tilgange til disse spørgsmål, baseret på 1) kortlægning af histonmodifikationer i hele genomet ved mononukleosomopløsning (Liu et al, PLoS Bio 2005, Weiner et al, Mol Cell 2015) og 2) analyse af transkriptionelle ændringer i budding yeast, der bærer enten mutante histoner eller deletioner af histonmodificerende enzymer (Dion et al, PNAS 2005, Weiner et al, PLoS Bio 2012).

Med fokus først på genomisk kortlægning afslører storstilede bestræbelser på histontilstandskortlægning i flere modelsystemer en række konserverede aspekter af kromatinstrukturen. For det første efterlader transkriptionsprocessen et massivt fodaftryk på kromatin, med forskellige histonmodifikationer deponeret af initierings- (5′-enden af generne) og elongationsformerne (midter- og 3′-enderne) af RNA-polymerase. Mærkerne i genernes 5′-ender omfatter H3K4 di/tri-methylering (H3K4me3), H3- og H4-halehyperacetylering (H3K4/9/14/18/18/27ac og H4K5/8/12ac), H3.3- og H2A.Z-varianter og H3K56-acetylering. Genkropsnukleosomer er typisk markeret med H3K36me3 og H3K79me3 og er generelt noget udtømt for histonhaleacetyleringer. For det andet er distale reguleringselementer, såsom enhancers, markeret med H3K4me1/2, men ikke H3K4me3. Andre histonmærker skelner mellem undertrykte, i gangværende og aktive enhancere, idet H3K27-methylering og -acetylering markerer henholdsvis undertrykte og aktive enhancere. For det tredje er to hovedformer af repressivt kromatin forbundet med specifikke histonmodifikationer. Klassisk heterokromatin (herunder telomerer og mange repetitive sekvenser) er markeret med H3K9-methylering, mens gener, der undertrykkes af polycomb-gruppefaktorer, er markeret med H3K27me3. H3K27-methylerede nukleosomer kan enten være i en undertrykt tilstand og mangle andre mærker eller i en “bivalent” tilstand i kombination med det aktive mærke H3K4me3. Endelig indeholder nukleosomer, der er associeret med centromerer, ofte det H3-lignende CENP-A-protein, og i M-fasen er et bredt pericentrisk domæne af nukleosomer markeret med H3S10ph. Samlet set er der en slående overensstemmelse mellem histontilstanden og funktionen af genomiske regioner, og på grund af dette er kortlægning af histonmodifikationer en effektiv metode til at opdage gener og reguleringselementer.

For at komme til histonmodifikationernes funktioner har en systematisk tilgang til at forstå funktionerne af kombinatoriske histonmodifikationer været helgenomanalyse af ændringer i genekspressionen, der er observeret i histonmutanter. Sådanne undersøgelser finder typisk, at histonmutanter udviser relativt lille fænotypisk kompleksitet som følge af forskellige kombinationer af histonmutanter. Dette ses både i undersøgelser, der fokuserer på specifikke histonpunktmutanter og deres kombinationer, og i undersøgelser, der fokuserer på deletionsmutanter af histonmodificerende enzymer. F.eks. undersøgte vi systematisk alle 16 mulige kombinationsmutationer blandt de 4 lysiner i histon H4-halen og fandt, at mutation af tre af resterne (lysinerne 5, 8 og 12) havde uadskillelige virkninger på genekspressionen, mens lysin 16 blev bekræftet at have unikke virkninger på genekspressionen (Dion et al, PNAS 2005). Desuden var genekspressionsdefekter i kombinatoriske mutanter kun lidt forskellige fra lineære kombinationer af komponentmutationerne – med andre ord kunne effekten af H4K5,16R-dobbeltmutanten på genekspression forudsiges ved at lægge K5R- og K16R-datasættene sammen.

I modsætning til de beskedne virkninger af mange histonmodificerende deletioner, der observeres ved steady-state, tyder enkeltgenstudier på, at kromatinregulatorer har vigtige roller i dynamiske processer, der er maskeret ved steady-state. Dette har motiveret os til at studere kromatinregulatorer i forbindelse med transkriptionel reprogrammering ved hjælp af diamidstress i gær som et praktisk paradigme til induktion af massive transkriptionelle ændringer (Weiner et al, PLoS Bio 2012). Vi finder, at størstedelen af kromatinregulatorer har større virkninger på geninduktion/repressionskinetik end de har på steady-state mRNA-niveauer, hvilket bekræfter, at dynamiske undersøgelser kan identificere uventede funktioner for kromatinregulatorer. Gruppering af deletionsmutanter med lignende genekspressionsdefekter identificerer kendte komplekser, og at fælles analyse af histonmutanter og deletionsmutanter forbinder mange histonmodificerende enzymer med deres målsteder. Ved at kombinere funktionelle data med kortlægningsdata for hele genomet identificerede vi en overraskende rolle for Set1-afhængig H3K4-methylering (et “aktiverende” mærke) i repressionen af ribosomale biogenese-gener. Tilsammen giver disse data et rigt multimodalt syn på kromatinregulatorers rolle i geninduktion og repressionsdynamik og antyder, at forståelsen af de utallige roller af kromatinstruktur i genregulering på en genom-dækkende skala vil kræve en udvidelse af mutantanalyser til kinetiske undersøgelser.

Kromosomfoldning

Mens den 1-dimensionelle struktur af kromatin er i stigende grad velforstået, er vores forståelse af den tredimensionelle foldning af genomet i kernen traditionelt sakket bagud. Når det er sagt, er denne kløft i løbet af det seneste årti blevet dramatisk indsnævret takket være Dekker og kollegers udvikling af 3C-familien (Chromosome Conformation Capture) af teknikker. I disse metoder krydsbindes kromatin in vivo for at indfange interaktioner mellem kromosomale loci. Derefter fragmenteres genomet, typisk med restriktionsenzymer, og der anvendes DNA-ligering til at opfange interaktioner mellem kromosomale loci, som var i kontakt med hinanden in vivo. Hyppigheden af ligationsprodukter mellem to kromosomområder fortolkes ofte som et mål for hyppigheden/sandsynligheden for kontakt eller nærhed mellem loci-parret, hvilket giver et billede af kromosomstrukturen, der er noget analogt med det billede af proteinstrukturen, der fremkommer ved hjælp af NMR-teknikker. Genombredde varianter af 3C, såsom Hi-C, har afsløret en række organisatoriske træk ved eukaryote genomer med stadig finere opløsninger, fra hele kromosomale territorier til aktive og inaktive kompartmenter på flere Mb, til kontaktdomæner (TAD’er) på hundrede kb og til enhancer-promoter-sløjfer.

Mens mange faktorer påvirker den effektive opløsning af et 3C/Hi-C-datasæt, herunder sekventeringsdybde og bibliotekskompleksitet, er en afgørende grænse for genomisk opløsning størrelsen af de fragmenter, der genereres, før fysiske interaktioner indfanges via ligation. Da størstedelen af 3C-baserede eksperimenter er afhængige af restriktionsenzymer til fragmentering af genomet, er de i bedste fald begrænset til ~1 kb opløsning. For at forbedre opløsningen af 3C-baserede teknikker har vi derfor udviklet en 3C-baseret teknik med høj opløsning, kaldet “Micro-C”, hvor fragmentering af genomet udføres ved hjælp af mikrokokkal nuklease (MNase) for at muliggøre mononukleosomopløsningsanalyse af kromosomfoldning. Den forbedrede opløsning, som Micro-C giver, gjorde det muligt at identificere kromosomalt interagerende domæner – “CID’er” – i spirende gær, som ikke tidligere var blevet vurderet ved hjælp af en restriktionsenzymbaseret 3C-teknik (Hsieh et al., Cell 2015). En revideret Micro-C-protokol, der inkorporerer lange crosslinkers, som vi kaldte “Micro-C XL”, gengav ikke kun de lokale kromatinstrukturer, der tidligere blev afsløret af Micro-C, men genfindes også robust højere ordensfunktioner såsom centromer-centromer-interaktioner (Hsieh et al, Nature Methods 2016).

Vores metode giver indsigt i gærgenomfoldning på alle interessante længdeskalaer. På større skalaer ses Rabl-konfigurationen af kromosomer som klynge af centromerer og interaktioner mellem telomerer af kromosomparme af samme længde. Centromerisk kromatin viser også en karakteristisk “X”-form, der skyldes, at kromosomets to arme begge statistisk set fører væk fra centromeren sammen i en hårnålslignende struktur i ca. ~20 kb, hvorimod centromerer er relativt isolerede fra kromosomparmene. Ved højere opløsning (figur 3) er generne i både knoppegær og fissionsgær organiseret i kromosomalt interagerende domæner (CID’er), der typisk omfatter 1-5 gener, og som på nogle måder ligner de “topologisk associerende domæner”, der er beskrevet i en lang række andre modelorganismer. Grænserne mellem CID’er opstår ved aktive promotorer, højt eksprimerede gener og tRNA-gener. Overensstemmelsen mellem flere uafhængige tilgange til analyse af kromosomfoldning giver håb om, at vi nærmer os en sand forståelse af de strukturer, som kromosomer har vedtaget i cellen.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.