Struttura e funzione della cromatina

Posizionamento del nucleosoma

Il genoma eucariotico è impacchettato in una subunità ripetitiva nota come nucleosoma, che consiste di 146 bp di DNA avvolti quasi due volte intorno a un ottamero di proteine istone di base. Tutte le transazioni del DNA eucariotico, dalla trascrizione alla riparazione del DNA alla ricombinazione, avvengono nel contesto dell’imballaggio di questo nucleosoma. Poiché il DNA avvolto intorno al nucleosoma e il DNA situato tra i nucleosomi differiscono per accessibilità e caratteristiche strutturali, le posizioni precise dei nucleosomi lungo il genoma si sono rivelate di grande importanza per la comprensione della funzione del genoma. In un certo senso, si può pensare all’imballaggio della cromatina del genoma come a un “set di filtri” che influenza l’output genomico nascondendo o esponendo alternativamente elementi chiave del DNA regolatore, permettendo alla stessa molecola di DNA di esprimere molteplici programmi funzionali distinti a seconda del suo preciso stato di imballaggio. Il nostro laboratorio è stato a lungo interessato alla biologia strutturale del genoma – quali sono le regole alla base dell’impacchettamento genomico e quali sono le implicazioni funzionali dei diversi stati di impacchettamento?

Ci siamo concentrati sul lievito in erba S. cerevisiae come comodo organismo modello per studiare la struttura della cromatina a livello genomico, dove abbiamo sviluppato metodi di analisi a livello genomico dell’architettura della cromatina. Per esempio, per generare mappe genomiche del posizionamento dei nucleosomi, sfruttiamo il fatto che la nucleasi micrococcica (MNase) ha una preferenza per il DNA linker rispetto al DNA nucleosomico – la separazione dimensionale dei frammenti di DNA rimanenti dopo la digestione della MNase dà come risultato una “scala” regolare con unità di dimensioni ripetute. L’analisi a livello genomico dei frammenti risultanti di dimensioni mononucleosomiche mediante tiling array o mediante sequenziamento profondo (MNase-seq) fornisce quindi un catalogo delle regioni protette dai nucleosomi (Yuan et al, Science 2005), rivelando sia le posizioni dei nucleosomi “ben posizionati” che sono presenti nella stessa posizione nella maggior parte della popolazione cellulare, sia le posizioni delle regioni “sfocate” in cui la posizione dei nucleosomi varia tra le cellule. Tra le più grandi sorprese di queste prime mappe dei nucleosomi c’era il fatto che la maggior parte dei nucleosomi (~70%) nel lievito in erba sono relativamente ben posizionati, nonostante il fatto a lungo compreso che la maggior parte del DNA genomico ha poca o nessuna preferenza termodinamica intrinseca per l’incorporazione nei nucleosomi. Abbiamo continuato a studiare gli aspetti del posizionamento dei nucleosomi nel lievito in erba, utilizzando sia approcci genetici tradizionali (Weiner et al, Genome Res 2010) che studi genomici comparativi (Tsankov et al, PLoS Bio 2010, Hughes et al, Mol Cell 2012) per illuminare le forze responsabili del posizionamento dei nucleosomi in vivo.

Le lezioni apprese dalle mappe dei nucleosomi del lievito si sono in gran parte dimostrate generali in una moltitudine di specie soggette alla mappatura dei nucleosomi a livello di genoma, con una serie di concetti chiave emergenti (Figura 1). In primo luogo, i promotori attivi e in bilico sono privi di nucleosomi, così come gli enhancer attivi. In secondo luogo, i nucleosomi che confinano con elementi regolatori sono ben posizionati. I nucleosomi sono posizionati con precisione decadente a distanze maggiori, portando ad un modello nucleosoma più fuzzy più lontano (~ 1000-2000bp) da nucleosomi confine. In terzo luogo, i geni altamente trascritti tendono ad avere una minore occupazione dei nucleosomi e un posizionamento meno preciso, molto probabilmente a causa dell’azione della RNA polimerasi II e dei suoi fattori associati. Infine, la densità del template del nucleosoma (distanza media tra due nucleosomi adiacenti) può variare, soprattutto a causa di fattori trans. Continuiamo a studiare il posizionamento dei nucleosomi in una certa misura nel lievito, con un interesse attivo nella decomposizione a singola molecola delle misure d’insieme.

Dinamica degli istoni

I test epigenomici catturano istantanee di stati cellulari complessi. A differenza della sequenza del DNA, che è altamente stabile, la cromatina può essere altamente dinamica, sollevando la questione delle scale temporali rilevanti che governano le strutture della cromatina. Questa domanda è collegata, ma distinta, da quella dell’eterogeneità all’interno di una popolazione cellulare. Quando osserviamo un nucleosoma “sfocato” in una misurazione d’insieme, la posizione del nucleosoma cambia solo alla divisione cellulare (stabile) o ogni pochi secondi (dinamico) – un’ampia gamma di scale temporali è coerente sia con l’osservazione d’insieme che con la distribuzione degli stati delle singole cellule. Questa domanda si applica a tutta la gamma di strutture trovate in vivo, dalle interazioni cromosomiche a lungo raggio alle modifiche chimiche del nucleosoma. Comprendere la funzione delle strutture osservate richiederà in definitiva di conoscere le scale temporali rilevanti per le strutture in questione.

Per caratterizzare le dinamiche della cromatina a livello genomico, abbiamo adattato i metodi di pule-chase codificati geneticamente per caratterizzare i tassi di turnover dei nucleosomi indipendenti dalla replicazione a livello genomico (Dion et al, Scienza 2007). Questi studi rivelano un turnover indipendente dalla replicazione nei geni trascritti, con una sostituzione particolarmente rapida degli istoni nelle regioni di regolazione (promotori ed esaltatori). Gli studi sui mutanti condotti da molti laboratori, tra cui il nostro, hanno permesso di comprendere il meccanismo cellulare responsabile della sostituzione degli istoni.

Su scale temporali più lunghe, la questione della dinamica degli istoni è fondamentale per qualsiasi comprensione meccanica di come gli stati della cromatina vengono copiati da una generazione all’altra. Per capire il meccanismo con cui gli stati della cromatina potrebbero essere ereditati, è necessario comprendere le sfide uniche poste dalla dinamica delle proteine istone durante la replicazione. In primo luogo, durante la replicazione genomica il passaggio della forcella di replicazione interrompe i contatti istone-DNA, e i vecchi istoni devono riassociarsi con i cromosomi figli in una posizione vicina alla loro posizione originale sul cromosoma madre. Altrimenti, le informazioni epigenetiche specifiche del locus verrebbero rimescolate casualmente ad ogni generazione. In secondo luogo, i vecchi istoni rappresentano solo la metà degli istoni su ogni nuovo genoma, e gli istoni rimanenti sono sintetizzati di nuovo durante ogni fase S. Questo implica un certo passaggio di informazioni dai vecchi ai nuovi istoni, poiché altrimenti i vecchi stati della cromatina sarebbero rapidamente diluiti dai nuovi istoni.

Per tentare di misurare l’entità del movimento dei nucleosomi durante la replicazione genomica, abbiamo fatto uso di un sistema genetico pulse-chase sviluppato dal laboratorio van Leeuwen in cui l’induzione della ricombinazione Cre-Lox provoca un passaggio da un istone H3 epitopo-taggato a un nuovo epitopo tag. Questo sistema ci ha permesso di spegnere un tag H3 ancestrale e successivamente seguire la disposizione genomica dell’H3 ancestrale per diverse divisioni cellulari (Radman-Livaja et al, PLoS Bio 2011). Con nostra grande sorpresa, abbiamo scoperto che le vecchie proteine istone non si accumulano a loci regolati epigeneticamente come i subtelomeri, ma invece si accumulano alle estremità 5′ di geni lunghi e poco trascritti. Come previsto, i vecchi istoni non si accumulano nei loci che presentano un rapido turnover degli istoni, ma abbiamo anche scoperto che il movimento da 3′ a 5′ dei vecchi istoni lungo le regioni codificanti e il movimento degli istoni durante la replicazione sono necessari per spiegare i modelli di ritenzione degli istoni ancestrali che osserviamo. Soprattutto, troviamo che i vecchi istoni non si riassociano con i genomi delle figlie esattamente nel luogo da cui si sono dissociati, ma invece che gli istoni materni rimangono entro ~ 400 bp della loro posizione originale durante la replicazione, fornendo la prima misura di questo parametro cruciale. Quindi, qualsiasi eredità degli stati della cromatina deve verificarsi sulla scala di ~ 5-10 domini nucleosomici piuttosto che alla risoluzione del singolo nucleosoma. Questi risultati limitano quindi la quantità massima di informazioni teoricamente trasportate dalla cromatina tra le generazioni.

Modifiche degli istoni

La struttura della fibra cromatinica non è composta da perline uniformi, poiché la composizione chimica dei singoli nucleosomi può in linea di principio essere estremamente variabile da nucleosoma a nucleosoma, con importanti conseguenze sulla funzione del genoma. Più drammaticamente, le proteine istone possono essere modificate chimicamente, con una prodigiosa varietà di modifiche post-traslazionali che si verificano (acetilazione, metilazione, fosforilazione, ubiquitylation, e molti altri) a più residui in tutti gli istoni. Queste modifiche chimiche possono alterare le proprietà chimiche e fisiche del nucleosoma, ma servono anche a modulare il legame da parte delle proteine che riconoscono lo stato modificato (ad esempio, si legano solo a H3K4 tri-metilato).

Questa incredibile diversità di modifiche degli istoni porta naturalmente alla domanda sul significato di tutto ciò – perché si verificano così tante modifiche degli istoni nella cellula? Siamo stati a lungo interessati alla questione di come la complessità combinatoria contribuisca alla regolazione della cromatina. Quante combinazioni distinte di modifiche si verificano (Figura 2), e possono combinazioni specifiche di modifiche essere abbinate a risultati specifici in modo che il codice possa essere decifrato? Abbiamo adottato due approcci a queste domande, basati su 1) mappatura a livello genomico delle modifiche degli istoni a risoluzione mononucleosomica (Liu et al, PLoS Bio 2005, Weiner et al, Mol Cell 2015), e 2) analisi dei cambiamenti trascrizionali in lievito in erba con istoni mutanti o delezioni di enzimi che modificano gli istoni (Dion et al, PNAS 2005, Weiner et al, PLoS Bio 2012).

Focalizzandosi prima sulla mappatura genomica, gli sforzi su larga scala nella mappatura dello stato degli istoni in più sistemi modello rivelano una serie di aspetti conservati della struttura della cromatina. In primo luogo, il processo di trascrizione lascia un’impronta massiccia sulla cromatina, con diverse modifiche istoniche depositate dalle forme di iniziazione (estremità 5′ dei geni) e di elongazione (estremità centrale e 3′) della RNA polimerasi. Le marcature alle 5′ estremità dei geni includono la di/tri-metilazione H3K4 (H3K4me3), l’iperacetilazione della coda H3 e H4 (H3K4/9/14/18/27ac e H4K5/8/12ac), le varianti H3.3 e H2A.Z e l’acetilazione H3K56. I nucleosomi del corpo genico sono tipicamente marcati con H3K36me3 e H3K79me3, e sono generalmente un po’ privi di acetiliazioni della coda dell’istone. In secondo luogo, gli elementi regolatori distali, come gli enhancer, sono marcati con H3K4me1/2 ma non H3K4me3. Altri segni istonici distinguono gli enhancer repressi, in bilico e attivi, con la metilazione e l’acetilazione di H3K27 che marcano gli enhancer repressi e attivi, rispettivamente. In terzo luogo, due forme principali di cromatina repressiva sono associate a modifiche istoniche specifiche. L’eterocromatina classica (compresi i telomeri e molte sequenze ripetitive) è contrassegnata dalla metilazione H3K9, mentre i geni repressi dai fattori del gruppo polycomb sono contrassegnati da H3K27me3. I nucleosomi H3K27-metilati possono essere in uno stato represso e privi di altri segni, o in uno stato “bivalente” in bilico in combinazione con il segno attivo H3K4me3. Infine, i nucleosomi associati ai centromeri contengono spesso la proteina H3-like CENP-A, e durante la fase M un ampio dominio pericentrico di nucleosomi è marcato con H3S10ph. Nel complesso, c’è una sorprendente corrispondenza tra lo stato degli istoni e la funzione delle regioni genomiche, e per questo motivo la mappatura delle modifiche degli istoni è un metodo efficace per scoprire geni ed elementi regolatori.

Passando alle funzioni delle modifiche degli istoni, un approccio sistematico per capire le funzioni delle modifiche combinatorie degli istoni è stata l’analisi dell’intero genoma dei cambiamenti di espressione genica osservati nei mutanti istonici. Tali studi trovano tipicamente che i mutanti istonici mostrano relativamente poca complessità fenotipica derivante da diverse combinazioni di mutanti istonici. Questo si vede sia negli studi che si concentrano su specifici mutanti istonici puntiformi e sulle loro combinazioni, sia negli studi che si concentrano su mutanti di delezione di enzimi che modificano gli istoni. Per esempio, abbiamo esaminato sistematicamente tutte le 16 possibili mutazioni combinatorie tra le 4 lisine nella coda dell’istone H4, trovando che la mutazione di tre dei residui (lisine 5, 8 e 12) aveva effetti indistinguibili sull’espressione genica, mentre la lisina 16 ha confermato di avere effetti unici sull’espressione genica (Dion et al, PNAS 2005). Inoltre, i difetti di espressione genica nei mutanti combinatori erano poco diversi dalle combinazioni lineari delle mutazioni componenti – in altre parole, l’effetto del doppio mutante H4K5,16R sull’espressione genica potrebbe essere previsto sommando i set di dati K5R e K16R.

In contrasto con gli effetti modesti di molte delezioni che modificano gli istoni osservati allo steady-state, gli studi sui singoli geni suggeriscono che i regolatori della cromatina hanno ruoli importanti nei processi dinamici che sono mascherati allo steady-state. Questo ci ha motivato a studiare i regolatori della cromatina nel contesto della riprogrammazione trascrizionale, utilizzando lo stress da diamido in lievito come un paradigma conveniente per indurre massicci cambiamenti trascrizionali (Weiner et al, PLoS Bio 2012). Troviamo che la maggior parte dei regolatori della cromatina hanno maggiori effetti sulla cinetica di induzione/repressione dei geni rispetto ai livelli di mRNA allo stato stazionario, confermando che gli studi dinamici possono identificare funzioni non previste per i regolatori della cromatina. Raggruppando i mutanti di delezione con simili difetti di espressione genica si identificano complessi noti, e che l’analisi congiunta dei mutanti istone e dei mutanti di delezione associa molti enzimi modificatori istone con i loro siti bersaglio. Combinando i dati funzionali con i dati di mappatura del genoma, abbiamo identificato un ruolo sorprendente per la metilazione H3K4 dipendente da Set1 (un marchio “attivante”) nella repressione dei geni della biogenesi ribosomiale. Insieme, questi dati forniscono una ricca visione multimodale sul ruolo dei regolatori della cromatina nelle dinamiche di induzione e repressione dei geni e suggeriscono che la comprensione della miriade di ruoli della struttura della cromatina nella regolazione dei geni su scala genomica richiederà l’estensione delle analisi dei mutanti agli studi cinetici.

Piegamento del cromosoma

Mentre la struttura unidimensionale della cromatina è sempre più ben compresa, la nostra comprensione del piegamento tridimensionale del genoma nel nucleo è rimasta tradizionalmente indietro. Detto questo, nell’ultimo decennio questo gap è stato drasticamente ridotto grazie allo sviluppo da parte di Dekker e colleghi della famiglia di tecniche 3C (Chromosome Conformation Capture). In questi metodi, la cromatina è soggetta a reticolazione in vivo per catturare le interazioni tra i loci cromosomici. Il genoma viene poi frammentato, tipicamente con enzimi di restrizione, e la legatura del DNA viene utilizzata per catturare le interazioni tra i loci cromosomici che erano in contatto tra loro in vivo. L’abbondanza di prodotti di legatura tra due regioni cromosomiche è spesso interpretata come una misura della frequenza/probabilità di contatto, o prossimità, tra la coppia di loci, fornendo una visione della struttura cromosomica che è in qualche modo analoga alla visione della struttura proteica generata dalle tecniche NMR. Le varianti genome-wide di 3C, come Hi-C, hanno rivelato una serie di caratteristiche organizzative dei genomi eucariotici a risoluzioni sempre più fini, dalla scala dei territori cromosomici completi, ai compartimenti attivi e inattivi multi-Mb, ai domini di contatto (TADs) da centinaia di kb, ai loop di enhancer-promoter.

Mentre molti fattori hanno un impatto sulla risoluzione effettiva di un set di dati 3C/Hi-C, compresa la profondità di sequenziamento e la complessità della libreria, un limite cruciale per la risoluzione genomica è la dimensione dei frammenti generati prima che le interazioni fisiche siano catturate tramite legatura. Poiché la maggior parte degli esperimenti basati su 3C si basano su enzimi di restrizione per la frammentazione del genoma, sono limitati a ~ 1 kb risoluzione al meglio. Per migliorare la risoluzione di 3C tecniche basate, abbiamo quindi sviluppato una tecnica ad alta risoluzione 3C-based, soprannominato “Micro-C”, in cui la frammentazione del genoma è realizzato con nucleasi micrococcale (MNase) per consentire mononucleosoma-risoluzione analisi del ripiegamento dei cromosomi. La migliore risoluzione offerta da Micro-C ha permesso l’identificazione di domini cromosomicamente interagenti – “CIDs” – in lievito in erba che non era stato precedentemente apprezzato utilizzando un enzima di restrizione basato su tecnica 3C (Hsieh et al, Cell 2015). Un protocollo Micro-C rivisto che incorpora reticolanti lunghi, che abbiamo chiamato “Micro-C XL”, non solo ha ricapitolato le strutture cromatiniche locali precedentemente rivelate da Micro-C, ma anche robustamente recuperato caratteristiche di ordine superiore come le interazioni centromero-centromero (Hsieh et al, Nature Methods 2016).

Il nostro metodo fornisce una visione del piegamento del genoma di lievito a tutte le scale di lunghezza di interesse. A scale più grandi, la configurazione Rabl dei cromosomi è visto come raggruppamento di centromeri, e le interazioni tra i telomeri dei bracci cromosomici di lunghezza simile. La cromatina centromerica mostra anche una caratteristica forma a “X” risultante dai due bracci del cromosoma che statisticamente si allontanano dal centromero insieme in una struttura a forcina per circa ~ 20 kb, mentre i centromeri sono relativamente isolati dai bracci del cromosoma. Ad una risoluzione più alta (Figura 3), i geni sia nel lievito in erba che nel lievito da fissione sono organizzati in domini di interazione cromosomica (CID), che in genere abbracciano 1-5 geni, che sono in qualche modo simili ai “domini topologicamente associati” descritti in una moltitudine di altri organismi modello. I confini tra i CID si verificano a promotori attivi, geni altamente espressi e geni tRNA. La concordanza di più approcci indipendenti all’analisi del ripiegamento dei cromosomi fa sperare che ci stiamo avvicinando a una vera comprensione delle strutture adottate dai cromosomi nella cellula.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.