Estrutura e função cromatina

Posicionamento do nucleossoma

O genoma eucariótico é embalado em uma subunidade de repetição conhecida como o nucleossoma, que consiste em 146 bp de DNA enrolado quase duas vezes em torno de uma octâmera de proteínas histônicas básicas. Todas as transacções de ADN eucariotas, desde a transcrição à reparação do ADN até à recombinação, ocorrem no contexto do empacotamento deste empacotamento nucleossómico. Como o DNA envolvido ao redor do nucleossomo e o DNA localizado entre os nucleossomos diferem em sua acessibilidade e características estruturais, as localizações precisas dos nucleossomos ao longo do genoma provaram ser de grande importância para a compreensão da função do genoma. Em algum sentido, pode-se pensar na embalagem da cromatina do genoma como um “conjunto de filtros” que afeta a produção genômica ao esconder ou expor alternadamente elementos reguladores chave do DNA, permitindo que a mesma molécula de DNA expresse múltiplos programas funcionais distintos dependendo de seu estado preciso de embalagem. Nosso laboratório há muito se interessa pela biologia estrutural do genoma – quais são as regras subjacentes à embalagem do genoma, e quais são as implicações funcionais de diferentes estados de embalagem?

Concentramo-nos na levedura de brotação S. cerevisiae como um organismo modelo conveniente para estudar a estrutura da cromatina em todo o genoma, onde desenvolvemos métodos de análise da arquitetura da cromatina em todo o genoma. Por exemplo, para gerar mapas genômicos do posicionamento dos nucleossomos, fazemos uso do fato de que a micromolécula micrococal (MNase) tem preferência pelo DNA ligante em vez do DNA nucleossômico – a separação do tamanho dos fragmentos de DNA que restam após a digestão do MNase resulta em uma “escada” regular com tamanho de unidade repetitivo. A análise de todo o genoma dos fragmentos resultantes do mononucleosoma através de uma matriz de mosaicos ou por sequenciação profunda (MNase-seq) fornece então um catálogo de regiões protegidas por nucleossomas (Yuan et al, Science 2005), revelando ambas as localizações de nucleossomas “bem posicionados” que estão presentes no mesmo local na maioria da população celular, e localizações de regiões “difusas” onde a localização dos nucleossomas varia entre as células. Uma das maiores surpresas destes primeiros mapas de nucleossomas foi o facto de a maioria dos nucleossomas (~70%) da levedura em desenvolvimento estarem relativamente bem posicionados, apesar do facto de a grande maioria do DNA genómico ter pouca ou nenhuma preferência termodinâmica intrínseca pela incorporação nos nucleossomas. Temos continuado a investigar aspectos do posicionamento dos nucleossomas na levedura de brotação, utilizando tanto abordagens genéticas tradicionais (Weiner et al, Genome Res 2010) como estudos genómicos comparativos (Tsankov et al, PLoS Bio 2010, Hughes et al, Mol Cell 2012) para iluminar as forças responsáveis pelo posicionamento dos nucleossomas in vivo.

As lições aprendidas com os mapas de nucleosomas de levedura provaram ser em grande parte gerais numa multidão de espécies sujeitas ao mapeamento de nucleossomas em todo o genoma, com a emergência de uma série de conceitos chave (Figura 1). Primeiro, os promotores ativos e posicionados são os nucleossomos, assim como os potenciadores ativos. Em segundo lugar, os nucleossomas vizinhos a elementos reguladores são bem posicionados. Os nucleossomas são posicionados com precisão decadente a maiores distâncias, levando a um modelo de nucleossoma mais difuso mais distante (~1000-2000bp) dos nucleossomas limítrofes. Terceiro, genes altamente transcritos tendem a ter menor ocupação nucleosômica e posicionamento menos preciso, muito provavelmente devido à ação da RNA polimerase II e seus fatores associados. Finalmente, a densidade do modelo do nucleossoma (distância média entre dois nucleossomas adjacentes) pode variar, principalmente devido a factores trans. Continuamos a estudar o posicionamento dos nucleossomas até certo ponto em leveduras, com um interesse activo na decomposição de medidas de conjuntos de moléculas únicas.

>

Dinâmica dos fotões

Ensaios ergonómicos captam instantâneos de estados celulares complexos. Ao contrário da seqüência de DNA, que é altamente estável, a cromatina pode ser altamente dinâmica, levantando a questão das escalas de tempo relevantes que governam as estruturas cromatinosas. Esta questão está relacionada, mas distinta, da questão da heterogeneidade dentro de uma população celular. Quando observamos um nucleossoma “difuso” em uma medida de conjunto, a localização do nucleossoma muda apenas na divisão celular (estável) ou a cada poucos segundos (dinâmico) – uma ampla gama de escalas de tempo é consistente tanto com a observação do conjunto quanto com a distribuição dos estados de célula única. Esta questão aplica-se a toda a gama de estruturas encontradas in vivo, desde as interacções cromossómicas de longo alcance até às modificações químicas dos nucleossomas. Para compreender a função das estruturas observadas será necessário conhecer as escalas de tempo relevantes para as estruturas em questão.

Para caracterizar a dinâmica cromatínica em todo o genoma, adaptamos os métodos de pule-chase codificados geneticamente para caracterizar as taxas de rotação de nucleossomas independentes da replicação em todo o genoma (Dion et al, Science 2007). Estes estudos revelam uma rotatividade independente da replicação em genes transcritos, com uma substituição histórica particularmente rápida ocorrendo em regiões regulatórias (promotores e melhoradores). Estudos mutantes de muitos laboratórios, incluindo o nosso, têm permitido insights mecanicistas sobre a maquinaria celular responsável pela substituição do histone.

Em escalas de tempo mais longas, a questão da dinâmica do histone é fundamental para qualquer compreensão mecanicista de como os estados cromatínicos são copiados de uma geração para a próxima. Para compreender o mecanismo pelo qual os estados cromatínicos podem ser herdados, é necessário compreender os desafios únicos colocados pela dinâmica da proteína histone durante a replicação. Primeiro, durante a replicação genómica a passagem do garfo de replicação perturba os contactos histone-DNA, e as histonas antigas devem reassociar-se com os cromossomas filhas num local próximo da sua localização original no cromossoma mãe. Caso contrário, a informação epigenética específica do local seria embaralhada aleatoriamente a cada geração. Segundo, os histones antigos representam apenas metade dos histones de cada novo genoma, e os histones restantes são sintetizados recentemente durante cada fase S. Isto implica alguma passagem de informação dos histones antigos para os novos, pois de outra forma os estados cromatados antigos seriam rapidamente diluídos pelos novos histones.

Para tentar medir a extensão do movimento dos nucleossomas durante a replicação genómica, fizemos uso de um sistema de pulsação de impulsos genéticos desenvolvido pelo laboratório van Leeuwen no qual a indução de recombinação Cre-Lox resulta numa mudança de um histone H3 marcado com epitope para um novo epitope tag. Este sistema permitiu-nos desligar um tag H3 ancestral e subsequentemente seguir a disposição genómica do H3 ancestral para várias divisões celulares (Radman-Livaja et al, PLoS Bio 2011). Para nossa grande surpresa, descobrimos que as antigas proteínas histônicas não se acumulam em loci epigenicamente regulados como os subtelômeros, mas sim se acumulam nas extremidades de 5′ de genes longos e mal transcritos. Como esperado, as histonas antigas não se acumulam em loci exibindo rápida rotação histonal, mas também descobrimos que movimentos de 3′ a 5′ de histonas antigas ao longo das regiões codificadoras e movimento histonal durante a replicação são necessários para explicar os padrões de retenção de histonas ancestrais que observamos. Mais importante ainda, descobrimos que as histórias antigas não se associam novamente com genomas filhas precisamente no locus do qual se dissociaram, mas que as histórias maternas ficam a ~400 bp da sua localização original durante a replicação, fornecendo a primeira medida deste parâmetro crucial. Assim, qualquer herança de estados cromatinosos deve ocorrer na escala de ~5-10 domínios nucleossómicos em vez de na resolução de um único nucleossoma. Estes resultados restringem, portanto, a quantidade máxima de informação teoricamente transportada pela cromatina entre gerações.

Modificações de histofones

Os grânulos numa estrutura de cordas da fibra cromatina não são compostos de grânulos uniformes, uma vez que a composição química de cada nucleossoma pode, em princípio, ser extremamente variável de nucleossoma para nucleossoma, com importantes consequências para a função do genoma. Mais dramaticamente, as proteínas da histona podem ser modificadas quimicamente, com uma variedade prodigiosa de modificações pós-tradução ocorrendo (acetilação, metilação, fosforilação, ubiquilação, e muitas mais) em múltiplos resíduos em todas as histonas. Estas modificações químicas podem alterar as propriedades químicas e físicas do nucleossoma, mas também servem para modular a ligação por proteínas que reconhecem o estado modificado (por exemplo, ligam-se apenas ao trimetilado H3K4).

Esta incrível diversidade de modificações histônicas leva naturalmente à questão do que tudo isso significa – por que tantas modificações histônicas ocorrem na célula? Há muito tempo estamos interessados na questão de como a complexidade combinatória contribui para a regulação da cromatina. Quantas combinações de modificações distintas ocorrem (Figura 2), e podem combinações específicas de modificações ser combinadas com resultados específicos de modo que o código possa ser decifrado? Tomamos duas abordagens a estas questões, baseadas em 1) mapeamento genômico de modificações histônicas em resolução mononucleosômica (Liu et al, PLoS Bio 2005, Weiner et al, Mol Cell 2015), e 2) análise de mudanças transcripcionais em leveduras de brotação portadoras de histórias mutantes ou deleções de enzimas modificadoras de história (Dion et al, PNAS 2005, Weiner et al, PLoS Bio 2012).

Focando primeiro no mapeamento genômico, esforços em larga escala no mapeamento do estado histórico em sistemas de múltiplos modelos revelam uma série de aspectos conservados da estrutura cromatínica. Primeiro, o processo de transcrição deixa uma pegada massiva na cromatina, com diferentes modificações histônicas depositadas pela iniciação (5′ fim dos genes) e alongamento (meio e 3′ fim) das formas de RNA polimerase. As marcas nas extremidades dos 5′ dos genes incluem H3K4 di/tri-metilação (H3K4me3), H3 e H4 hiper acetilação da cauda (H3K4/9/14/18/27ac e H4K5/8/12ac), variantes H3.3 e H2A.Z, e acetilação H3K56. Os nucleossomas do corpo genético são tipicamente marcados com H3K36me3 e H3K79me3, e geralmente estão um pouco esgotados de acetilações da cauda do histone. Em segundo lugar, elementos reguladores distais, tais como melhoradores, são marcados com H3K4me1/2, mas não com H3K4me3. Outras marcas de histone distinguem melhoradores reprimidos, posicionados e ativos, com a metilação H3K27 e a marca de acetilação reprimida e melhoradores ativos, respectivamente. Terceiro, duas formas principais de cromatina repressiva estão associadas a modificações específicas do histone. A heterocromatina clássica (incluindo telómeros e muitas sequências repetitivas) é marcada com metilação H3K9, enquanto que os genes reprimidos por factores de grupo policarbonato são marcados com H3K27me3. Os nucleossomas metilados H3K27 podem estar num estado reprimido e sem outras marcas, ou num estado “bivalente” em combinação com a marca activa H3K4me3. Finalmente, os nucleossomas associados aos centrômeros frequentemente contêm a proteína H3 como a CENP-A, e durante a fase M um amplo domínio pericêntrico dos nucleossomas é marcado com H3S10ph. Em geral, há uma correspondência marcante do estado histonal com a função das regiões genômicas, e devido a este mapeamento das modificações histônicas é um método eficaz para descobrir genes e elementos reguladores.

Volvendo as funções das modificações histônicas, uma abordagem sistemática para entender as funções das modificações histônicas combinatórias tem sido a análise do genoma inteiro das modificações da expressão gênica observadas nos mutantes histônicos. Tais estudos tipicamente descobrem que os mutantes histonais apresentam relativamente pouca complexidade fenotípica resultante de diferentes combinações de mutantes histonais. Isto é observado tanto em estudos focando em mutantes de pontos histônicos específicos e suas combinações, quanto em estudos focando em mutantes de deleção de enzimas modificadoras histônicas. Por exemplo, examinamos sistematicamente todas as 16 possíveis mutações combinatórias entre as 4 lisinas na cauda da histona H4, constatando que a mutação de três dos resíduos (lisinas 5, 8 e 12) teve efeitos indistinguíveis na expressão gênica, enquanto a lisina 16 foi confirmada como tendo efeitos únicos na expressão gênica (Dion et al, PNAS 2005). Além disso, os defeitos de expressão gênica em mutantes combinatórios foram pouco diferentes das combinações lineares das mutações componentes – em outras palavras, o efeito do mutante duplo H4K5,16R sobre a expressão gênica poderia ser previsto pela adição dos conjuntos de dados K5R e K16R juntos.

Em contraste com os modestos efeitos de muitas deleções modificadoras de história observadas em estado estacionário, estudos com um único gene sugerem que os reguladores de cromatina têm papéis importantes em processos dinâmicos que são mascarados em estado estacionário. Isto nos motivou a estudar os reguladores de cromatina no contexto da reprogramação transcripcional, usando a tensão diamidal em levedura como um paradigma conveniente para induzir mudanças transcripcionais maciças (Weiner et al, PLoS Bio 2012). Verificamos que a maioria dos reguladores de cromatina tem maiores efeitos sobre a cinética de indução/repressão genética do que sobre os níveis de mRNA em estado estacionário, confirmando que os estudos dinâmicos podem identificar funções imprevistas para os reguladores de cromatina. O agrupamento de mutantes de deleção com defeitos de expressão gênica similares identifica complexos conhecidos, e que a análise conjunta de mutantes de histone e mutantes de deleção associa muitas enzimas modificadoras de histone com seus locais alvo. Ao combinar dados funcionais com dados de mapeamento de todo o genoma, identificamos um papel surpreendente para a metilação H3K4 dependente de Set1 (uma marca “ativadora”) na repressão de genes de biogênese ribossômica. Juntos, esses dados fornecem uma rica visão multimodal sobre o papel dos reguladores de cromatina na dinâmica de indução e repressão dos genes, e sugerem que a compreensão do miríade de papéis da estrutura da cromatina na regulação gênica em toda a escala do genoma exigirá análises mutantes extensas para estudos cinéticos.

Dobradura cromossômica

Embora a estrutura 1-dimensional da cromatina seja cada vez mais bem compreendida, nossa compreensão da dobradura tridimensional do genoma no núcleo tem ficado tradicionalmente para trás. Dito isto, durante a última década esta lacuna foi dramaticamente reduzida graças ao desenvolvimento por Dekker e colegas da família de técnicas 3C (Chromosome Conformation Capture). Nestes métodos, a cromatina está sujeita a reticulação in vivo para capturar as interações entre os loci cromossômicos. O genoma é então fragmentado, tipicamente com enzimas de restrição, e a ligação do DNA é usada para capturar interações entre os loci cromossômicos que estiveram em contato um com o outro in vivo. A abundância de produtos de ligação entre duas regiões cromossômicas é frequentemente interpretada como uma medida de freqüência/probabilidade de contato, ou proximidade, entre o par de loci, fornecendo uma visão da estrutura cromossômica que é um pouco análoga à visão da estrutura da proteína gerada pelas técnicas de RMN. As variantes de 3C para todo o genoma, como o Hi-C, têm revelado uma série de características organizacionais de genomas eucarióticos em resoluções cada vez mais finas, desde a escala de territórios cromossómicos completos, a compartimentos activos e inactivos multi-Mb, até aos domínios de contacto de cem kb (TADs), para melhorar os loops promotor-promotor.

Embora muitos factores tenham impacto na resolução efectiva de um conjunto de dados 3C/Hi-C, incluindo profundidade de sequenciação e complexidade de biblioteca, um limite crucial para a resolução genómica é o tamanho dos fragmentos gerados antes das interacções físicas serem capturadas através da ligação. Como a maioria dos experimentos baseados em 3C dependem de enzimas de restrição para a fragmentação do genoma, eles são limitados a ~1 kb de resolução, na melhor das hipóteses. Para melhorar a resolução das técnicas baseadas no 3C, desenvolvemos uma técnica de alta resolução baseada no 3C, chamada “Micro-C”, na qual a fragmentação do genoma é realizada usando a nuclease micrococal (MNase) para permitir a análise de mononucleosome-resolução do dobramento cromossômico. A resolução melhorada proporcionada pelo Micro-C permitiu a identificação de domínios de interação cromossômica – “CIDs” – em leveduras de brotação que não tinham sido previamente apreciadas usando uma técnica 3C baseada em enzimas de restrição (Hsieh et al, Cell 2015). Um protocolo Micro-C revisto incorporando reticuladores longos, que denominamos “Micro-C XL”, não só recapitulou as estruturas locais de cromatina previamente reveladas por Micro-C, mas também recuperou robustamente características de ordem superior, tais como interações centrômero-centrômero (Hsieh et al, Nature Methods 2016).

O nosso método fornece uma visão da dobra do genoma da levedura em todas as escalas de comprimento de interesse. Em escalas maiores, a configuração Rabl dos cromossomos é vista como agrupamento de centrômeros, e interações entre os telômeros dos braços cromossômicos de comprimento semelhante. A cromatina centrômica também mostra uma forma “X” característica resultante dos dois braços do cromossomo, ambos levando estatisticamente para longe do centrômero juntos em uma estrutura semelhante a um grampo de cabelo por cerca de ~20 kb, enquanto os centrômeros são relativamente isolados dos braços cromossômicos. Em resolução mais alta (Figura 3), os genes em ambos os domínios de gema e levedura de fissão estão organizados em domínios de interação cromossômica (CIDs), tipicamente abrangendo 1-5 genes, que são de alguma forma similares aos “domínios topologicamente-associantes” descritos em uma infinidade de outros organismos modelo. Os limites entre os CIDs ocorrem em promotores ativos, genes altamente expressos, e genes tRNA. A concordância de múltiplas abordagens independentes para análise de dobramento cromossômico fornece a esperança de que estamos nos aproximando de uma verdadeira compreensão das estruturas adotadas pelos cromossomos na célula.

Deixe uma resposta

O seu endereço de email não será publicado.