Struktura a funkce chromatinu

Umístění nukleozomů

Eukaryotický genom je zabalen do opakující se podjednotky zvané nukleozom, která se skládá ze 146 bp DNA téměř dvakrát omotané kolem oktameru základních histonových proteinů. Všechny operace s eukaryotickou DNA, od transkripce přes opravy DNA až po rekombinaci, probíhají v kontextu balení tohoto nukleozomálního obalu. Vzhledem k tomu, že DNA zabalená kolem nukleozomu a DNA umístěná mezi nukleozomy se liší svou přístupností a strukturními vlastnostmi, ukázalo se, že přesné umístění nukleozomů podél genomu má velký význam pro pochopení funkce genomu. V jistém smyslu si lze chromatinový obal genomu představit jako „sadu filtrů“, která ovlivňuje výstup genomu tím, že střídavě skrývá nebo odhaluje klíčové regulační prvky DNA, což umožňuje stejné molekule DNA exprimovat více různých funkčních programů v závislosti na jejím přesném stavu obalu. Naše laboratoř se dlouhodobě zajímá o strukturní biologii genomu – jaká pravidla jsou základem genomového balení a jaké jsou funkční důsledky různých stavů balení?

Soustředili jsme se na pučící kvasinky S. cerevisiae jako na vhodný modelový organismus pro studium struktury chromatinu v celém genomu, kde jsme vyvinuli metody analýzy architektury chromatinu v celém genomu. Například pro tvorbu genomových map rozmístění nukleosomů využíváme skutečnosti, že mikrokoková nukleáza (MNáza) upřednostňuje linkerovou DNA před nukleosomální DNA – výsledkem separace velikosti fragmentů DNA zbylých po štěpení MNázou je pravidelný „žebřík“ s opakující se velikostí jednotek. Celogenomová analýza vzniklých fragmentů o velikosti mononukleozomů pomocí tiling array nebo hlubokého sekvenování (MNase-seq) pak poskytuje katalog oblastí chráněných nukleozomy (Yuan et al, Science 2005), který odhaluje jak místa „dobře umístěných“ nukleozomů, které jsou přítomny na stejném místě ve většině buněčné populace, tak místa „rozmazaných“ oblastí, kde se umístění nukleozomů v jednotlivých buňkách liší. Mezi největší překvapení těchto prvních nukleosomových map patřila skutečnost, že většina nukleosomů (~ 70 %) v poupatech kvasinek je relativně dobře umístěna, a to navzdory dlouho chápané skutečnosti, že naprostá většina genomové DNA má jen malou nebo žádnou vnitřní termodynamickou preferenci pro začlenění do nukleosomů. Pokračovali jsme ve zkoumání aspektů polohování nukleozomů u poupat kvasinek, a to jak pomocí tradičních genetických přístupů (Weiner et al, Genome Res 2010), tak pomocí srovnávacích genomických studií (Tsankov et al, PLoS Bio 2010, Hughes et al, Mol Cell 2012), abychom osvětlili síly zodpovědné za polohování nukleozomů in vivo.

Zkušenosti získané z kvasinkových nukleosomových map se do značné míry ukázaly jako obecné u mnoha druhů, které jsou předmětem celogenomového mapování nukleosomů, přičemž se objevila řada klíčových konceptů (obr. 1). Za prvé, aktivní a připravené promotory jsou ochuzeny o nukleosomy, stejně jako aktivní enhancery. Za druhé, nukleosomy ohraničující regulační elementy jsou dobře rozmístěné. Nukleosomy jsou umístěny s klesající přesností ve větších vzdálenostech, což vede k rozmělnění nukleosomové šablony ve větší vzdálenosti (~1000-2000bp) od hraničních nukleosomů. Za třetí, vysoce transkribované geny mají tendenci mít nižší obsazenost nukleosomů a méně přesné umístění, pravděpodobně v důsledku působení RNA polymerázy II a s ní spojených faktorů. A konečně, hustota nukleozomového templátu (průměrná vzdálenost mezi dvěma sousedními nukleozomy) se může lišit, většinou v důsledku trans faktorů. Pokračujeme ve studiu polohování nukleosomů v určitém rozsahu u kvasinek, přičemž se aktivně zajímáme o rozklad měření souboru jednotlivých molekul.

Dynamika histonů

Epigenomické testy zachycují snímky komplexních buněčných stavů. Na rozdíl od sekvence DNA, která je vysoce stabilní, může být chromatin vysoce dynamický, což vyvolává otázku příslušných časových škál, které řídí chromatinové struktury. Tato otázka souvisí s otázkou heterogenity v rámci buněčné populace, ale liší se od ní. Když pozorujeme „rozmazaný“ nukleosom při ansámblovém měření, mění se umístění nukleosomu pouze při dělení buňky (stabilní) nebo každých několik sekund (dynamický) – široký rozsah časových škál je v souladu jak s ansámblovým pozorováním, tak s distribucí stavů jednotlivých buněk. Tato otázka se týká celé škály struktur nalezených in vivo, od chromozomálních interakcí na dlouhé vzdálenosti až po chemické modifikace nukleozomů. Pochopení funkce pozorovaných struktur bude nakonec vyžadovat znalost příslušných časových škál pro dané struktury.

Pro charakterizaci dynamiky chromatinu v celém genomu jsme přizpůsobili geneticky kódované metody pule-chase k charakterizaci rychlosti obratu nukleozomů nezávislé na replikaci v celém genomu (Dion et al, Science 2007). Tyto studie odhalily na replikaci nezávislý obrat u přepisovaných genů, přičemž k obzvláště rychlé výměně histonů dochází v regulačních oblastech (promotory a enhancery). Mutantní studie mnoha laboratoří včetně naší umožnily mechanistický vhled do buněčných mechanismů odpovědných za výměnu histonů.

V delším časovém měřítku je otázka dynamiky histonů klíčová pro jakékoli mechanistické pochopení toho, jak se stavy chromatinu kopírují z jedné generace na druhou. Pro pochopení mechanismu, jakým by se mohly dědit stavy chromatinu, je nutné porozumět jedinečným výzvám, které představuje dynamika histonových proteinů během replikace. Za prvé, během replikace genomu dochází při průchodu replikační vidličkou k narušení kontaktů histon-DNA a staré histony se musí znovu spojit s dceřinými chromozomy v místě blízkém jejich původnímu umístění na mateřském chromozomu. Jinak by se epigenetická informace specifická pro lokus každou generaci náhodně promíchala. Za druhé, staré histony tvoří pouze polovinu histonů na každém novém genomu a zbývající histony jsou nově syntetizovány během každé S fáze. To předpokládá určitý přechod informace ze starých histonů na nové, protože jinak by staré stavy chromatinu byly rychle zředěny novými histony.

Pro pokus o měření rozsahu pohybu nukleozomů během replikace genomu jsme využili genetický systém pulzní honičky vyvinutý laboratoří van Leeuwena, v němž indukce rekombinace Cre-Lox vede k přepnutí z jednoho epitopově značeného histonu H3 na nový epitopový tag. Tento systém nám umožnil vypnout rodovou značku H3 a následně sledovat genomickou dispozici rodové značky H3 po dobu několika buněčných dělení (Radman-Livaja et al, PLoS Bio 2011). K našemu velkému překvapení jsme zjistili, že staré histonové proteiny se nehromadí v epigeneticky regulovaných lokusech, jako jsou subtelomery, ale naopak se hromadí na 5′ koncích dlouhých, málo přepisovaných genů. Jak jsme očekávali, staré histony se nehromadí v lokusech, které vykazují rychlý obrat histonů, ale také jsme zjistili, že k vysvětlení námi pozorovaných vzorců uchovávání histonů předků je nutný pohyb starých histonů z 3′ na 5′ podél kódujících oblastí a pohyb histonů během replikace. A co je nejdůležitější, zjistili jsme, že staré histony se znovu neasociují s dceřinými genomy přesně v místě, odkud se oddělily, ale že mateřské histony zůstávají během replikace v rozmezí ~400 bp od svého původního umístění, což poskytuje první měření tohoto klíčového parametru. Jakákoli dědičnost stavů chromatinu tedy musí probíhat v měřítku ~5-10 nukleozomových domén, nikoli v rozlišení jednoho nukleozomu. Tyto výsledky proto omezují maximální množství informace teoreticky přenášené chromatinem mezi generacemi.

Histonové modifikace

Struktura korálků na šňůrce chromatinového vlákna se neskládá z uniformních korálků, protože chemické složení jednotlivých nukleozomů může být v principu extrémně variabilní od nukleozomu k nukleozomu, což má důležité důsledky pro funkci genomu. Nejdramatičtější je, že histonové proteiny mohou být chemicky modifikovány, přičemž u všech histonů dochází k ohromnému množství posttranslačních modifikací (acetylace, metylace, fosforylace, ubikvitalizace a mnoho dalších) na mnoha zbytcích. Tyto chemické modifikace mohou měnit chemické a fyzikální vlastnosti nukleosomu, ale také slouží k modulaci vazby proteinů, které rozpoznávají modifikovaný stav (např. se vážou pouze na trimetylovaný H3K4).

Tato neuvěřitelná rozmanitost modifikací histonů přirozeně vede k otázce, co to všechno znamená – proč se v buňce vyskytuje tolik modifikací histonů? Již dlouho nás zajímá otázka, jak kombinatorická složitost přispívá k regulaci chromatinu. Kolik různých kombinací modifikací se vyskytuje (obr. 2) a lze specifickým kombinacím modifikací přiřadit specifické výsledky tak, aby bylo možné kód rozluštit? K těmto otázkám jsme zaujali dva přístupy založené na 1) celogenomovém mapování histonových modifikací v rozlišení mononukleozomů (Liu et al, PLoS Bio 2005, Weiner et al, Mol Cell 2015) a 2) analýze transkripčních změn u poupat kvasinek nesoucích buď mutantní histony, nebo delece enzymů modifikujících histony (Dion et al, PNAS 2005, Weiner et al, PLoS Bio 2012).

Zaměřeno nejprve na mapování genomu, rozsáhlé úsilí v oblasti mapování stavu histonů v mnoha modelových systémech odhalilo řadu konzervovaných aspektů struktury chromatinu. Zaprvé, proces transkripce zanechává na chromatinu masivní stopu, přičemž různé modifikace histonů ukládají iniciační (5′ konec genů) a elongační (střední a 3′ konec) formy RNA polymerázy. Značky na 5′ koncích genů zahrnují di/trimetylaci H3K4 (H3K4me3), hyperacetylaci ocasů H3 a H4 (H3K4/9/14/18/27ac a H4K5/8/12ac), varianty H3.3 a H2A.Z a acetylaci H3K56. Nukleosomy genových těl jsou typicky označeny H3K36me3 a H3K79me3 a jsou obecně poněkud ochuzeny o acetylace histonových chvostů. Za druhé, distální regulační elementy, jako jsou enhancery, jsou označeny H3K4me1/2, ale ne H3K4me3. Další histonové značky rozlišují potlačené, připravené a aktivní enhancery, přičemž metylace a acetylace H3K27 označují potlačené a aktivní enhancery. Za třetí, dvě hlavní formy represivního chromatinu jsou spojeny se specifickými modifikacemi histonů. Klasický heterochromatin (včetně telomer a mnoha repetitivních sekvencí) je označen metylací H3K9, zatímco geny potlačované faktory polycombové skupiny jsou označeny H3K27me3. Nukleosomy metylované H3K27 mohou být buď v potlačeném stavu a postrádat jiné značky, nebo v klidovém „bivalentním“ stavu v kombinaci s aktivní značkou H3K4me3. A konečně nukleosomy spojené s centromerami často obsahují protein CENP-A podobný H3 a během M fáze je široká pericentrická doména nukleosomů označena H3S10ph. Celkově existuje nápadná shoda stavu histonů s funkcí genomových oblastí a díky tomu je mapování histonových modifikací účinnou metodou pro objevování genů a regulačních prvků.

Přejdeme-li k funkcím histonových modifikací, jedním ze systematických přístupů k pochopení funkcí kombinatorických histonových modifikací byla analýza celého genomu na základě změn genové exprese pozorovaných u histonových mutantů. Takové studie obvykle zjišťují, že histonové mutanty vykazují relativně malou fenotypovou komplexnost vyplývající z různých kombinací histonových mutantů. To je patrné jak ve studiích zaměřených na specifické bodové mutanty histonů a jejich kombinace, tak ve studiích zaměřených na deleční mutanty enzymů modifikujících histony. Například jsme systematicky zkoumali všech 16 možných kombinatorických mutací mezi 4 lyziny v ocasu histonu H4 a zjistili jsme, že mutace tří ze zbytků (lyzinů 5, 8 a 12) mají nerozlišitelné účinky na genovou expresi, zatímco u lyzinu 16 byl potvrzen jedinečný účinek na genovou expresi (Dion et al, PNAS 2005). Kromě toho se defekty genové exprese u kombinovaných mutantů jen málo lišily od lineárních kombinací složkových mutací – jinými slovy, účinek dvojitého mutanta H4K5,16R na genovou expresi bylo možné předpovědět sečtením souborů dat K5R a K16R.

Na rozdíl od skromných účinků mnoha delecí modifikujících histony pozorovaných v ustáleném stavu studie jednotlivých genů naznačují, že chromatinové regulátory mají důležitou roli v dynamických procesech, které jsou v ustáleném stavu maskovány. To nás motivovalo ke studiu chromatinových regulátorů v kontextu transkripčního přeprogramování s využitím diamidového stresu u kvasinek jako vhodného paradigmatu pro vyvolání masivních transkripčních změn (Weiner et al, PLoS Bio 2012). Zjistili jsme, že většina chromatinových regulátorů má větší vliv na kinetiku indukce/represe genů než na hladiny mRNA v ustáleném stavu, což potvrzuje, že dynamické studie mohou identifikovat nepředpokládané funkce chromatinových regulátorů. Seskupení delečních mutantů s podobnými defekty genové exprese identifikuje známé komplexy a že společná analýza histonových mutantů a delečních mutantů spojuje mnoho enzymů modifikujících histony s jejich cílovými místy. Kombinací funkčních dat s daty z celogenomového mapování jsme identifikovali překvapivou roli metylace H3K4 („aktivační“ značky) závislé na Set1 v represi genů ribozomální biogeneze. Tato data společně poskytují bohatý multimodální pohled na roli chromatinových regulátorů v dynamice indukce a represe genů a naznačují, že pochopení nesčetných rolí chromatinové struktury v genové regulaci v celogenomovém měřítku bude vyžadovat rozšíření mutantních analýz o kinetické studie.

Skládání chromozomu

Zatímco jednorozměrná struktura chromatinu je stále lépe pochopena, naše porozumění trojrozměrnému skládání genomu v jádře tradičně zaostává. Přesto se v posledním desetiletí tato mezera dramaticky zmenšila díky tomu, že Dekker a jeho kolegové vyvinuli rodinu technik 3C (Chromosome Conformation Capture). Při těchto metodách se chromatin in vivo zesíťuje, aby se zachytily interakce mezi chromozomálními lokusy. Poté se genom fragmentuje, obvykle restrikčními enzymy, a k zachycení interakcí mezi chromozomálními lokusy, které byly in vivo ve vzájemném kontaktu, se použije ligace DNA. Množství produktů ligace mezi dvěma oblastmi chromozomů se často interpretuje jako míra četnosti/pravděpodobnosti kontaktu nebo blízkosti mezi dvojicí lokusů, což poskytuje pohled na strukturu chromozomů, který je do jisté míry analogický pohledu na strukturu proteinů vytvářenému technikami NMR. Celogenomové varianty 3C, jako je Hi-C, odhalily řadu organizačních rysů eukaryotických genomů ve stále jemnějším rozlišení, od měřítka celých chromozomálních teritorií, přes multi-Mb aktivní a neaktivní kompartmenty, až po stokilobytové kontaktní domény (TAD) a smyčky enhancerů a promotorů.

Ačkoli efektivní rozlišení souboru dat 3C/Hi-C ovlivňuje mnoho faktorů, včetně hloubky sekvenování a složitosti knihovny, zásadním limitem genomického rozlišení je velikost fragmentů generovaných před zachycením fyzických interakcí pomocí ligace. Vzhledem k tomu, že většina experimentů založených na 3C se při fragmentaci genomu spoléhá na restrikční enzymy, je jejich rozlišení v nejlepším případě omezeno na ~1 kb. Abychom zlepšili rozlišení technik založených na 3C, vyvinuli jsme proto techniku založenou na 3C s vysokým rozlišením, nazvanou „Micro-C“, při níž se fragmentace genomu provádí pomocí mikrokokové nukleázy (MNase), která umožňuje analýzu skládání chromozomů s mononukleozomálním rozlišením. Lepší rozlišení, které Micro-C umožňuje, umožnilo identifikovat chromozomálně interagující domény – „CID“ – u poupat kvasinek, které dříve nebyly pomocí techniky 3C založené na restrikčních enzymech doceněny (Hsieh et al, Cell 2015). Revidovaný protokol Micro-C zahrnující dlouhé crosslinky, který jsme pojmenovali „Micro-C XL“, nejenže rekapituloval lokální chromatinové struktury dříve odhalené pomocí Micro-C, ale také robustně obnovil prvky vyššího řádu, jako jsou interakce centromera-centromera (Hsieh et al, Nature Methods 2016).

Naše metoda poskytuje vhled do skládání kvasinkového genomu na všech délkových škálách zájmu. Na větších škálách je vidět rablová konfigurace chromozomů jako shlukování centromer a interakce mezi telomerami ramen chromozomů podobné délky. Centromerický chromatin také vykazuje charakteristický tvar „X“, který je výsledkem toho, že obě ramena chromozomu statisticky vedou od centromery společně ve vlásenkové struktuře po dobu asi ~20 kb, zatímco centromery jsou od ramen chromozomu relativně izolované. Při vyšším rozlišení (obr. 3) jsou geny u poupat i štěpných kvasinek uspořádány do chromozomálně interagujících domén (CID), které obvykle zahrnují 1-5 genů a které jsou v některých ohledech podobné „topologicky asociujícím doménám“ popsaným u mnoha dalších modelových organismů. Hranice mezi CID se vyskytují u aktivních promotorů, vysoce exprimovaných genů a genů tRNA. Shoda více nezávislých přístupů k analýze skládání chromozomů dává naději, že se blížíme ke skutečnému pochopení struktur, které chromozomy v buňce zaujímají.

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.