Estructura y función de la cromatina

Posicionamiento del nucleosoma

El genoma eucariota está empaquetado en una subunidad repetitiva conocida como nucleosoma, que consiste en 146 pb de ADN envuelto casi dos veces alrededor de un octámero de proteínas histónicas básicas. Todas las operaciones del ADN eucariótico, desde la transcripción hasta la reparación del ADN y la recombinación, se producen en el contexto del empaquetamiento de este nucleosoma. Como el ADN envuelto alrededor del nucleosoma y el ADN situado entre los nucleosomas difieren en su accesibilidad y características estructurales, la localización precisa de los nucleosomas a lo largo del genoma ha demostrado ser de gran importancia para entender la función del genoma. En cierto sentido, se puede pensar en el empaquetamiento de la cromatina del genoma como un «juego de filtros» que afecta a la producción genómica al ocultar o exponer alternativamente elementos reguladores clave del ADN, permitiendo que la misma molécula de ADN exprese múltiples programas funcionales distintos dependiendo de su estado de empaquetamiento preciso. Nuestro laboratorio lleva mucho tiempo interesado en la biología estructural del genoma: ¿cuáles son las reglas que subyacen al empaquetamiento genómico y cuáles son las implicaciones funcionales de los diferentes estados de empaquetamiento?

Nos hemos centrado en la levadura en ciernes S. cerevisiae como un organismo modelo conveniente para estudiar la estructura de la cromatina en todo el genoma, donde hemos desarrollado métodos para el análisis de la arquitectura de la cromatina en todo el genoma. Por ejemplo, para generar mapas genómicos del posicionamiento de los nucleosomas, utilizamos el hecho de que la nucleasa micrococal (MNasa) tiene preferencia por el ADN enlazador sobre el ADN nucleosómico – la separación por tamaño de los fragmentos de ADN que quedan después de la digestión con MNasa da como resultado una «escalera» regular con unidades de tamaño repetitivo. El análisis de todo el genoma de los fragmentos resultantes del tamaño del mononucleosoma por medio de una matriz de mosaico o por secuenciación profunda (MNase-seq) proporciona entonces un catálogo de regiones protegidas por nucleosomas (Yuan et al, Science 2005), revelando tanto las ubicaciones de los nucleosomas «bien posicionados» que están presentes en la misma ubicación en la mayor parte de la población celular, como las ubicaciones de las regiones «difusas» en las que la ubicación del nucleosoma varía entre las células. Una de las mayores sorpresas de estos primeros mapas de nucleosomas fue el hecho de que la mayoría de los nucleosomas (~70%) en la levadura en ciernes están relativamente bien posicionados, a pesar de que se sabe desde hace tiempo que la gran mayoría del ADN genómico tiene poca o ninguna preferencia termodinámica intrínseca para incorporarse a los nucleosomas. Hemos seguido investigando aspectos del posicionamiento de los nucleosomas en la levadura en ciernes, utilizando tanto enfoques genéticos tradicionales (Weiner et al, Genome Res 2010) como estudios genómicos comparativos (Tsankov et al, PLoS Bio 2010, Hughes et al, Mol Cell 2012) para iluminar las fuerzas responsables del posicionamiento de los nucleosomas in vivo.

Las lecciones aprendidas de los mapas de nucleosomas de la levadura han demostrado ser en gran medida generales en una multitud de especies sujetas al mapeo de nucleosomas en todo el genoma, con una serie de conceptos clave emergentes (Figura 1). En primer lugar, los promotores activos y preparados están desprovistos de nucleosomas, al igual que los potenciadores activos. En segundo lugar, los nucleosomas que bordean los elementos reguladores están bien posicionados. Los nucleosomas se posicionan con una precisión decreciente a mayores distancias, lo que lleva a una plantilla de nucleosomas más borrosa a mayor distancia (~1000-2000bp) de los nucleosomas limítrofes. En tercer lugar, los genes altamente transcritos tienden a tener una menor ocupación de nucleosomas y un posicionamiento menos preciso, muy probablemente debido a la acción de la ARN polimerasa II y sus factores asociados. Por último, la densidad de la plantilla de nucleosomas (distancia media entre dos nucleosomas adyacentes) puede variar, sobre todo debido a factores trans. Seguimos estudiando el posicionamiento de los nucleosomas en cierta medida en la levadura, con un interés activo en la descomposición de moléculas individuales de las mediciones del conjunto.

Dinámica de las histonas

Los ensayos epigenómicos capturan instantáneas de estados celulares complejos. A diferencia de la secuencia del ADN, que es muy estable, la cromatina puede ser muy dinámica, lo que plantea la cuestión de las escalas temporales relevantes que rigen las estructuras de la cromatina. Esta cuestión está relacionada con la de la heterogeneidad dentro de una población celular, pero es distinta. Cuando observamos un nucleosoma «difuso» en una medición de conjunto, ¿la ubicación del nucleosoma cambia sólo en la división celular (estable) o cada pocos segundos (dinámico) – una amplia gama de escalas de tiempo es consistente tanto con la observación de conjunto como con la distribución de los estados de una sola célula. Esta cuestión se aplica a toda la gama de estructuras encontradas in vivo, desde las interacciones cromosómicas de largo alcance hasta las modificaciones químicas del nucleosoma. La comprensión de la función de las estructuras observadas requerirá, en última instancia, conocer las escalas de tiempo relevantes para las estructuras en cuestión.

Para caracterizar la dinámica de la cromatina en todo el genoma, hemos adaptado métodos de persecución de pule codificados genéticamente para caracterizar las tasas de recambio de nucleosomas independientes de la replicación en todo el genoma (Dion et al, Science 2007). Estos estudios revelan un recambio independiente de la replicación en los genes transcritos, con una sustitución de histonas especialmente rápida en las regiones reguladoras (promotores y potenciadores). Los estudios de mutantes de muchos laboratorios, incluido el nuestro, han permitido comprender la maquinaria celular responsable de la sustitución de las histonas.

En escalas de tiempo más largas, la cuestión de la dinámica de las histonas es clave para cualquier comprensión mecánica de cómo se copian los estados de la cromatina de una generación a otra. Para entender el mecanismo por el que los estados de la cromatina podrían heredarse, es necesario comprender los desafíos únicos que plantea la dinámica de las proteínas histónicas durante la replicación. En primer lugar, durante la replicación genómica el paso de la horquilla de replicación interrumpe los contactos histona-ADN, y las histonas antiguas deben reasociarse con los cromosomas hijos en un lugar cercano a su ubicación original en el cromosoma madre. De lo contrario, la información epigenética específica del locus se barajaría al azar en cada generación. En segundo lugar, las histonas antiguas sólo representan la mitad de las histonas de cada nuevo genoma, y las restantes se sintetizan de nuevo durante cada fase S. Esto implica un cierto paso de información de las histonas viejas a las nuevas, ya que de otro modo los estados de la cromatina vieja se diluirían rápidamente con las nuevas histonas.

Para intentar medir el grado de movimiento de los nucleosomas durante la replicación genómica, utilizamos un sistema genético de persecución por pulsos desarrollado por el laboratorio van Leeuwen en el que la inducción de la recombinación Cre-Lox da lugar a un cambio de una histona H3 etiquetada con un epítopo a otra nueva. Este sistema nos permitió desconectar una etiqueta H3 ancestral y posteriormente seguir la disposición genómica de la H3 ancestral durante varias divisiones celulares (Radman-Livaja et al, PLoS Bio 2011). Para nuestra gran sorpresa, descubrimos que las proteínas histónicas antiguas no se acumulan en los loci regulados epigenéticamente, como los subtelómeros, sino que se acumulan en los extremos 5′ de los genes largos y poco transcritos. Como era de esperar, las histonas viejas no se acumulan en los loci que muestran un rápido recambio de histonas, pero también encontramos que el movimiento de 3′ a 5′ de las histonas viejas a lo largo de las regiones codificantes y el movimiento de las histonas durante la replicación son necesarios para explicar los patrones de retención de histonas ancestrales que observamos. Y lo que es más importante, descubrimos que las histonas antiguas no se reasocian con los genomas hijos precisamente en el locus del que se disociaron, sino que las histonas maternas se mantienen dentro de un rango de ~400 pb de su ubicación original durante la replicación, proporcionando la primera medida de este parámetro crucial. Por lo tanto, cualquier herencia de los estados de la cromatina debe producirse a la escala de ~5-10 dominios de nucleosomas y no a la resolución de un solo nucleosoma. Estos resultados, por tanto, limitan la cantidad máxima de información que teóricamente transporta la cromatina entre generaciones.

Modificaciones de las histonas

La estructura de cuentas en una cuerda de la fibra de la cromatina no está compuesta por cuentas uniformes, ya que la composición química de los nucleosomas individuales puede, en principio, ser extremadamente variable de nucleosoma a nucleosoma, con importantes consecuencias para la función del genoma. Lo más dramático es que las proteínas histónicas pueden modificarse químicamente, con una prodigiosa variedad de modificaciones postraduccionales (acetilación, metilación, fosforilación, ubiquitylación y muchas más) en múltiples residuos de todas las histonas. Estas modificaciones químicas pueden alterar las propiedades químicas y físicas del nucleosoma, pero también sirven para modular la unión por parte de las proteínas que reconocen el estado modificado (por ejemplo, se unen sólo a la H3K4 trimetilada).

Esta increíble diversidad de modificaciones de las histonas lleva naturalmente a la pregunta de qué significa todo esto: ¿por qué se producen tantas modificaciones de las histonas en la célula? Hace tiempo que nos interesa la cuestión de cómo la complejidad combinatoria contribuye a la regulación de la cromatina. ¿Cuántas combinaciones distintas de modificaciones se producen (Figura 2) y pueden emparejarse combinaciones específicas de modificaciones con resultados específicos de forma que pueda descifrarse el código? Hemos adoptado dos enfoques para estas preguntas, basados en 1) el mapeo de todo el genoma de las modificaciones de las histonas a resolución de mononucleosomas (Liu et al, PLoS Bio 2005, Weiner et al, Mol Cell 2015), y 2) el análisis de los cambios transcripcionales en la levadura en ciernes portadora de histonas mutantes o deleciones de enzimas modificadoras de las histonas (Dion et al, PNAS 2005, Weiner et al, PLoS Bio 2012).

Centrándonos primero en el mapeo genómico, los esfuerzos a gran escala en el mapeo del estado de las histonas en múltiples sistemas modelo revelan una serie de aspectos conservados de la estructura de la cromatina. En primer lugar, el proceso de transcripción deja una enorme huella en la cromatina, con diferentes modificaciones de las histonas depositadas por las formas de iniciación (extremo 5′ de los genes) y de elongación (extremos medio y 3′) de la ARN polimerasa. Las marcas en los extremos 5′ de los genes incluyen la di/trimetilación de H3K4 (H3K4me3), la hiperacetilación de las colas de H3 y H4 (H3K4/9/18/27ac y H4K5/8/12ac), las variantes de H3.3 y H2A.Z, y la acetilación de H3K56. Los nucleosomas del cuerpo génico suelen estar marcados con H3K36me3 y H3K79me3, y suelen estar algo desprovistos de acetilaciones en la cola de las histonas. En segundo lugar, los elementos reguladores distales, como los potenciadores, están marcados con H3K4me1/2 pero no con H3K4me3. Otras marcas de histonas distinguen los potenciadores reprimidos, preparados y activos, y la metilación y acetilación de H3K27 marca los potenciadores reprimidos y activos, respectivamente. En tercer lugar, hay dos formas principales de cromatina represiva asociadas a modificaciones específicas de las histonas. La heterocromatina clásica (que incluye los telómeros y muchas secuencias repetitivas) está marcada con metilación H3K9, mientras que los genes reprimidos por los factores del grupo polycomb están marcados con H3K27me3. Los nucleosomas metilados con H3K27 pueden estar en un estado reprimido y carecer de otras marcas, o en un estado «bivalente» en combinación con la marca activa H3K4me3. Por último, los nucleosomas asociados a los centrómeros suelen contener la proteína CENP-A, similar a H3, y durante la fase M un amplio dominio pericéntrico de nucleosomas está marcado con H3S10ph. En general, existe una sorprendente correspondencia del estado de las histonas con la función de las regiones genómicas, y debido a esto el mapeo de las modificaciones de las histonas es un método eficaz para descubrir genes y elementos reguladores.

Volviendo a las funciones de las modificaciones de las histonas, un enfoque sistemático para entender las funciones de las modificaciones combinatorias de las histonas ha sido el análisis de todo el genoma de los cambios de expresión génica observados en los mutantes de las histonas. Tales estudios suelen encontrar que los mutantes de histonas muestran una complejidad fenotípica relativamente escasa como resultado de diferentes combinaciones de mutantes de histonas. Esto se observa tanto en estudios centrados en mutantes puntuales de histonas específicos y sus combinaciones, como en estudios centrados en mutantes de deleción de enzimas modificadoras de histonas. Por ejemplo, examinamos sistemáticamente las 16 posibles mutaciones combinatorias entre las 4 lisinas de la cola de la histona H4, encontrando que la mutación de tres de los residuos (lisinas 5, 8 y 12) tenía efectos indistinguibles en la expresión génica, mientras que se confirmó que la lisina 16 tenía efectos únicos en la expresión génica (Dion et al, PNAS 2005). Además, los defectos de expresión génica en los mutantes combinados eran poco diferentes de las combinaciones lineales de las mutaciones componentes – en otras palabras, el efecto del doble mutante H4K5,16R sobre la expresión génica podía predecirse sumando los conjuntos de datos K5R y K16R.

En contraste con los efectos modestos de muchas deleciones modificadoras de histonas observadas en estado estacionario, los estudios de un solo gen sugieren que los reguladores de la cromatina tienen papeles importantes en los procesos dinámicos que quedan enmascarados en estado estacionario. Esto nos ha motivado a estudiar los reguladores de la cromatina en el contexto de la reprogramación transcripcional, utilizando el estrés de la diamida en la levadura como un paradigma conveniente para inducir cambios transcripcionales masivos (Weiner et al, PLoS Bio 2012). Encontramos que la mayoría de los reguladores de la cromatina tienen mayores efectos en la cinética de inducción/represión de genes que en los niveles de ARNm en estado estacionario, lo que confirma que los estudios dinámicos pueden identificar funciones no previstas para los reguladores de la cromatina. La agrupación de mutantes de deleción con defectos similares de expresión génica identifica complejos conocidos, y que el análisis conjunto de mutantes de histonas y mutantes de deleción asocia muchas enzimas modificadoras de histonas con sus sitios objetivo. Combinando datos funcionales con datos de mapeo de todo el genoma, identificamos un papel sorprendente para la metilación H3K4 dependiente de Set1 (una marca «activadora») en la represión de los genes de la biogénesis ribosomal. En conjunto, estos datos proporcionan una rica visión multimodal sobre el papel de los reguladores de la cromatina en la dinámica de inducción y represión de los genes, y sugieren que la comprensión de las múltiples funciones de la estructura de la cromatina en la regulación de los genes a escala de todo el genoma requerirá la ampliación de los análisis de los mutantes a los estudios cinéticos.

Plegado del cromosoma

Mientras que la estructura unidimensional de la cromatina se entiende cada vez mejor, nuestra comprensión del plegado tridimensional del genoma en el núcleo se ha quedado tradicionalmente atrás. Sin embargo, en la última década esta brecha se ha reducido drásticamente gracias al desarrollo por parte de Dekker y sus colegas de la familia de técnicas 3C (Chromosome Conformation Capture). En estos métodos, la cromatina se somete a reticulación in vivo para capturar las interacciones entre los loci cromosómicos. A continuación se fragmenta el genoma, normalmente con enzimas de restricción, y se utiliza la ligadura del ADN para capturar las interacciones entre los loci cromosómicos que estaban en contacto entre sí in vivo. La abundancia de productos de ligación entre dos regiones cromosómicas suele interpretarse como una medida de la frecuencia/probabilidad de contacto, o proximidad, entre el par de loci, proporcionando una visión de la estructura cromosómica que es algo análoga a la visión de la estructura de las proteínas generada por las técnicas de RMN. Las variantes de 3C que abarcan todo el genoma, como Hi-C, han revelado una serie de características organizativas de los genomas eucariotas a resoluciones cada vez más finas, desde la escala de territorios cromosómicos completos, hasta compartimentos activos e inactivos de varias Mb, pasando por dominios de contacto (TAD) de cientos de Kb, hasta bucles potenciadores-promotores.

Mientras que muchos factores impactan en la resolución efectiva de un conjunto de datos 3C/Hi-C, incluyendo la profundidad de la secuenciación y la complejidad de la biblioteca, un límite crucial para la resolución genómica es el tamaño de los fragmentos generados antes de que las interacciones físicas sean capturadas vía ligadura. Dado que la mayoría de los experimentos basados en 3C dependen de las enzimas de restricción para la fragmentación del genoma, están limitados a una resolución de ~1 kb en el mejor de los casos. Para mejorar la resolución de las técnicas basadas en la 3C, hemos desarrollado una técnica de alta resolución basada en la 3C, denominada «Micro-C», en la que la fragmentación del genoma se lleva a cabo utilizando nucleasas micrococales (MNasa) para permitir el análisis del plegamiento del cromosoma con resolución mononucleosomal. La resolución mejorada que ofrece Micro-C permitió la identificación de dominios de interacción cromosómica – «CIDs»- en la levadura en ciernes que no se habían apreciado previamente utilizando una técnica 3C basada en enzimas de restricción (Hsieh et al, Cell 2015). Un protocolo revisado de Micro-C que incorpora reticuladores largos, que denominamos «Micro-C XL», no solo recapituló las estructuras locales de la cromatina reveladas anteriormente por Micro-C, sino que también recuperó con solidez características de orden superior, como las interacciones centrómero-centrómero (Hsieh et al, Nature Methods 2016).

Nuestro método proporciona información sobre el plegamiento del genoma de la levadura en todas las escalas de longitud de interés. A escalas mayores, la configuración Rabl de los cromosomas se ve como agrupación de centrómeros, y las interacciones entre los telómeros de los brazos del cromosoma de longitud similar. La cromatina centromérica también muestra una característica forma de «X» resultante de que los dos brazos del cromosoma se alejan estadísticamente del centrómero juntos en una estructura en forma de horquilla durante unos ~20 kb, mientras que los centrómeros están relativamente aislados de los brazos del cromosoma. A mayor resolución (Figura 3), los genes tanto en la levadura en ciernes como en la de fisión se organizan en dominios de interacción cromosómica (CID), que suelen abarcar de 1 a 5 genes, y que son en cierto modo similares a los «dominios de asociación topológica» descritos en multitud de otros organismos modelo. Los límites entre los CIDs se dan en los promotores activos, en los genes de alta expresión y en los genes de ARNt. La concordancia de múltiples enfoques independientes para el análisis del plegamiento de los cromosomas proporciona la esperanza de que nos estamos acercando a una verdadera comprensión de las estructuras adoptadas por los cromosomas en la célula.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.