Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

El Genoma Humano PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 23

EL GENOMA HUMANO no es el único genoma para el que se encuentra disponible una

secuencia completa o borrador. En febrero de 2001, cuando se publicó el borrador de la


secuencia humana, también había borradores disponibles para la
levadura Saccharomyces cerevisiae , el gusano microscópico Caenorhabditis elegans ,
la mosca de la fruta Drosophila melanogaster , la planta Arabidopsis thaliana y uno de
los cromosomas del parásito de la malaria Plasmodium falciparum . Además, se
obtuvieron secuencias completas para más de 30 microorganismos, incluidas las
bacterias Escherichia coli y Mycobacterium tuberculosis ( Tabla 2.1) El trabajo avanza
rápidamente en los genomas de, entre otros, el arroz y el ratón, y se están haciendo
planes para comenzar el proyecto del genoma del chimpancé, cuyos resultados
permitirán una comparación directa entre el genoma humano y el de nuestro no humano
más cercano. relativo. Los proyectos terminados y en curso revelan mucho sobre cómo
se organizan los genomas, incluyendo una serie de descubrimientos inesperados que
han tomado por sorpresa a los biólogos moleculares. En este capítulo examinaremos la
información que ha surgido de los proyectos del genoma y fusionaremos esta
información con el conocimiento adquirido en la era pregenómica de la biología
molecular.

2.1. Una visión general de las anatomías del genoma


Los biólogos reconocen que el mundo vivo comprende dos tipos de organismos ( Figura
2.1 ):
1) Eucariotas , cuyas células contienen compartimentos unidos a la membrana, que
incluyen un núcleo y orgánulos como las mitocondrias y, en el caso de las células
vegetales, los cloroplastos. Los eucariotas incluyen animales, plantas, hongos y
protozoos.
2) Procariotas , cuyas células carecen de amplios compartimentos internos. Hay dos
grupos muy diferentes de procariotas, que se distinguen entre sí por características
genéticas y bioquímicas características:
a. las bacterias , que incluyen la mayoría de los procariotas comúnmente
encontradas tales como las gram-negativos (por ejemplo, E . coli), los gram-
positivos (por ejemplo, Bacillus subtilis ), las cianobacterias (por
ejemplo Anabaena ) y muchos más;
b. las arqueas , que están menos estudiadas, y se han encontrado
principalmente en ambientes extremos como aguas termales, piscinas de
salmuera y fondos anaeróbicos de lagos.
Los eucariotas y los procariotas tienen tipos de genoma bastante diferentes y, por lo
tanto, debemos considerarlos por separado.

2.1.1. Genomas de eucariotas


Los humanos son eucariotas bastante típicos y el genoma humano es, en muchos
aspectos, un buen modelo para los genomas eucariotas en general. Todos los genomas
nucleares eucariotas que se han estudiado están, como la versión humana, divididos en
dos o más moléculas de ADN lineales , cada una contenida en un cromosoma
diferente; todos los eucariotas también poseen genomas mitocondriales más pequeños,
generalmente circulares. La única característica eucariota general no ilustrada por el
genoma humano es la presencia en plantas y otros organismos fotosintéticos de un
tercer genoma, ubicado en los cloroplastos.
Aunque las estructuras físicas básicas de todos los genomas nucleares eucariotas son
similares, una característica importante es muy diferente en diferentes organismos. Este
es el tamaño del genoma, los genomas eucariotas más pequeños tienen menos de
10 Mb de longitud y el más grande de más de 100 000 Mb. Como se puede ver en
la Tabla 2.2, este rango de tamaño coincide en cierta medida con la complejidad del
organismo, los eucariotas más simples, como los hongos que tienen los genomas más
pequeños, y los eucariotas más altos, como los vertebrados y las plantas con flores que
tienen los más grandes. Esto podría tener sentido ya que uno esperaría que la
complejidad de un organismo esté relacionada con la cantidad de genes en su genoma:
los eucariotas superiores necesitan genomas más grandes para acomodar los genes
adicionales. Sin embargo, la correlación está lejos de ser precisa: si lo era, entonces el
genoma nuclear de la levadura S . cerevisiae , que a 12 Mb es 0.004 veces el tamaño
del genoma nuclear humano, se espera que contenga 0.004 × 35 000 genes, que es
solo 140. De hecho, el genoma de S. cerevisiae contiene aproximadamente 5800
genes.
Durante muchos años la falta de correlación precisa entre la complejidad de un
organismo y el tamaño de su genoma se miraba como un poco de un rompecabezas, el
denominado C -valor paradoja . De hecho, la respuesta es bastante simple: se ahorra
espacio en los genomas de organismos menos complejos porque los genes están más
juntos. El S . Elgenoma de cerevisiae , cuya secuencia se completó en 1996, ilustra este
punto, como podemos ver en las dos partes superiores de la Figura 2.2 , donde
el segmento de 50 kb del genoma humano que vimos en el Capítulo 1se compara con
un segmento de 50 kb del genoma de la levadura. El segmento del genoma de la
levadura, que proviene del cromosoma III (el primer cromosoma eucariota que se
secuencia; Oliver et al ., 1992 ), tiene las siguientes características distintivas:
 Contiene más genes que el segmento humano . Esta región del cromosoma
III de levadura contiene 26 genes que se cree que codifican proteínas y dos que
codifican ARN de transferencia ( ARNt ),moléculascortas deARN no
codificantesinvolucradas en la lectura del código genético durante la síntesis de
proteínas ( Sección 3.2.1 ).
 Relativamente pocos de los genes de levadura son discontinuos . En este
segmento del cromosoma III, ninguno de los genes es discontinuo. En todo el
genoma de la levadura solo hay 239 intrones, en comparación con más de 300
000 en el genoma humano.
 Hay menos repeticiones en todo el genoma . Esta parte del cromosoma III
contiene un únicoelemento derepetición terminal larga ( LTR ), llamado Ty2 , y
cuatro elementos LTR truncados llamados secuencias delta. Estas cinco
repeticiones de todo el genoma constituyen el 13.5% delsegmento de50 kb ,
pero esta cifra no es del todo típica del genoma de la levadura en su
conjunto. Cuando se consideran los 16 cromosomas de levadura, la cantidad
total de secuencia tomada por las repeticiones de todo el genoma es solo el 3.4%
del total. En los humanos, las repeticiones de todo el genoma constituyen el 44%
del genoma.
La imagen que emerge es que la organización genética del genoma de la levadura es
mucho más económica que la de la versión humana. Los genes mismos son más
compactos, tienen menos intrones, y los espacios entre los genes son relativamente
cortos, con mucho menos espacio ocupado por repeticiones de todo el genoma y otras
secuencias no codificantes.
La hipótesis de que los organismos más complejos tienen genomas menos compactos
se mantiene cuando se examinan otras especies. La tercera parte de la Figura
2.2 muestra un segmento de 50 kb del genoma de la mosca de la fruta ( Adams et al .,
2000 ). Si aceptamos que una mosca de la fruta es más compleja que una célula de
levadura pero menos compleja que un humano, entonces esperaríamos que la
organización del genoma de la mosca de la fruta sea intermedia entre la levadura y los
humanos. Esto es lo que vemos en la Figura 2.2C, este segmento de 50 kb del genoma
de la mosca de la fruta tiene 11 genes, más que en el segmento humano pero menos
que en la secuencia de la levadura. Todos estos genes son discontinuos, pero siete
tienen un solo intrón cada uno. La imagen es similar cuando se comparan las
secuencias completas del genoma de los tres organismos ( Tabla 2.3 ). La densidad
génica en el genoma de la mosca de la fruta es intermedia entre la de la levadura y la
de los humanos, y el gen promedio de la mosca de la fruta tiene muchos más intrones
que el gen promedio de la levadura, pero aún tres veces menos que el gen humano
promedio.
La comparación entre la levadura, la mosca de la fruta y los genomas humanos también
es cierta cuando consideramos las repeticiones de todo el genoma (ver Tabla
2.3 ). Estos representan el 3,4% del genoma de la levadura, aproximadamente el 12%
del genoma de la mosca de la fruta y el 44% del genoma humano. Está comenzando a
quedar claro que las repeticiones de todo el genoma juegan un papel intrigante en dictar
la compacidad o no de un genoma. Esto queda notablemente ilustrado por el genoma
del maíz, que a 5000 Mb es más grande que el genoma humano pero aún es
relativamente pequeño para una planta con flores. Solo se han secuenciado unas pocas
regiones limitadas del genoma del maíz, pero se han obtenido algunos resultados
notables que revelan un genoma dominado por elementos repetitivos. La figura
2.2D muestra un 50 kbsegmento de este genoma, a cada lado de un miembro de una
familia de genes que codifican las enzimas alcohol deshidrogenasa ( SanMiguel et al .,
1996 ). Este es el único gen en esta región de 50 kb, aunque hay un segundo, de función
desconocida, aproximadamente 100 kb más allá del extremo derecho de la secuencia
que se muestra aquí. En lugar de genes, la característica dominante de este segmento
del genoma son las repeticiones de todo el genoma. La mayoría de estos son
del elemento LTRtipo, que comprende prácticamente toda la parte no codificante del
segmento, y se estima que por sí mismos representan aproximadamente el 50% del
genoma del maíz. Cada vez es más claro que una o más familias de repeticiones de
todo el genoma han sufrido una proliferación masiva en los genomas de ciertas
especies. Esto puede proporcionar una explicación del aspecto más desconcertante de
la paradoja del valor C , que no es el aumento general en el tamaño del genoma que
se observa en organismos cada vez más complejos, sino el hecho de que organismos
similares pueden diferir mucho en el tamaño del genoma. Un buen ejemplo es el
de Amoeba dubia que, como protozoo, podría tener un genoma de 100 a 500 kb, similar
a otros protozoos como Tetrahymena pyriformis(ver Tabla 2.2 ). De hecho, el genoma
de la ameba tiene más de 200 000 Mb. Del mismo modo, podríamos adivinar que los
genomas de los grillos son similares en tamaño a los de otros insectos, pero estos
insectos tienen genomas de aproximadamente 2000 Mb, 11 veces más que la mosca
de la fruta.

2.1.2. Genomas de procariotas


Los genomas procariotas son muy diferentes de los eucariotas. Existe cierta
superposición de tamaño entre los genomas procariotas más grandes y eucariotas más
pequeños, pero en general los genomas procariotas son mucho más pequeños. Por
ejemplo, el E . El genoma de coli K12 tiene solo 4639 kb , dos quintos del tamaño del
genoma de la levadura y tiene solo 4405 genes. La organización física del genoma
también es diferente en eucariotas y procariotas. La visión tradicional ha sido que todo
un genoma procariota está contenido en una sola molécula de ADNcircular . Además de
este único 'cromosoma', los procariotas también pueden tener genes adicionales en
moléculas de ADN independientes más pequeñas, circulares o lineales
llamadas plásmidos ( Figura 2.3) Los genes transportados por los plásmidos son útiles,
ya que codifican propiedades como la resistencia a los antibióticos o la capacidad de
utilizar compuestos complejos como el tolueno como fuente de carbono, pero los
plásmidos parecen ser prescindibles: un procariota puede existir de manera bastante
efectiva sin ellos. Ahora sabemos que esta visión tradicional del genoma procariota ha
sido sesgada por la extensa investigación sobre E. coli , que ha sido acompañada por
la suposición errónea de que E. coli es un procariota típico. De hecho, los procariotas
muestran una diversidad considerable en la organización del genoma, algunos tienen
un genoma unipartito, como E. coli, pero otros son más complejos. Borrelia
burgdorferiB31, por ejemplo, tiene un cromosoma lineal de 911 kb, que transporta 853
genes, acompañado de 17 o 18 moléculas lineales y circulares, que juntas aportan otros
533 kb y al menos 430 genes ( Fraser et al ., 1997 ). Los genomas multipartitos ahora
se conocen en muchas otras bacterias y arqueas.
En un aspecto, E . coli es bastante típico de otros procariotas. Después de nuestra
discusión sobre la organización de genes eucariotas, probablemente no sea
sorprendente saber que los genomas procariotas son aún más compactos que los de la
levadura y otros eucariotas inferiores. Podemos ver este hecho ilustrado en la Figura
2.2E , que muestra un segmento de 50 kb del genoma de E. coli K12. Es obvio de
inmediato que hay más genes y menos espacio entre ellos, con 43 genes que ocupan
el 85.9% del segmento. Algunos genes prácticamente no tienen espacio entre
ellos: thrA y thrB , por ejemplo, están separados por un solo nucleótido, y thrCcomienza
en el nucleótido inmediatamente después del último nucleótido de thrB . Estos tres
genes son un ejemplo de un operón , un grupo de genes involucrados en una sola vía
bioquímica (en este caso, síntesis del aminoácido treonina) y expresados en conjunto
entre sí. Los operones se han utilizado como sistemas modelo para comprender cómo
se regula la expresión génica ( Sección 9.3.1 ). En general, los genes procariotas son
más cortos que sus contrapartes eucariotas, la longitud promedio de un gen bacteriano
es aproximadamente dos tercios de la de un gen eucariota, incluso después de que los
intrones se hayan eliminado de este último ( Zhang, 2000 ). Los genes bacterianos
parecen ser un poco más largos que los arcaicos.
Otras dos características de los genomas procariotas se pueden deducir de la figura
2.2E . En primer lugar, no hay intrones en los genes presentes en este segmento de
la E . genoma de coli . De hecho, E. coli no tiene genes discontinuos en absoluto, y
generalmente se cree que este tipo de estructura génica está prácticamente ausente en
los procariotas, las pocas excepciones ocurren principalmente entre las arqueas. La
segunda característica es la poca frecuencia de secuencias repetitivas. La mayoría de
los genomas procariotas no tienen nada equivalente a las familias de repetición de todo
el genoma de alto número de copias que se encuentran en los genomas eucariotas. Sin
embargo, poseen ciertas secuencias que podrían repetirse en otras partes del genoma,
por ejemplo, las secuencias de inserción.IS1 e IS186 que se pueden ver en el segmento
de 50 kb que se muestra en la Figura 2.2E . Estos son otros ejemplos de elementos
transponibles, secuencias que tienen la capacidad de moverse alrededor del genoma y,
en el caso de elementos de inserción, de transferir de un organismo a otro, incluso a
veces entre dos especies diferentes (ver página 64). Las posiciones de los elementos
IS1 e IS186 que se muestran en la Figura 2.2E se refieren solo al aislado particular de E.
coli del que se obtuvo esta secuencia: si se examina un aislamiento diferente, entonces
las secuencias IS bien podrían estar en posiciones diferentes o podrían estar
completamente ausentes del genoma La mayoría de los otros genomas procariotas
tienen muy pocas secuencias repetidas: prácticamente no hay ninguna en el
1.64Mbgenoma de Campylobacter jejuni NCTC11168 ( Parkhill et al ., 2000b ), pero hay
excepciones, en particular la bacteria meningitis Neisseria meningitidis Z2491, que tiene
más de 3700 copias de 15 tipos diferentes de secuencias repetidas, que en conjunto
representan casi el 11% de los 2.18 Mb genoma ( Parkhill et al. , 2000a ).

2.2. La anatomía del genoma eucariota


Ya hemos aprendido que el genoma humano se divide en dos componentes: el genoma
nuclear y el genoma mitocondrial (ver Figura 1.1 ). Este es el patrón típico para la
mayoría de los eucariotas, la mayor parte del genoma está contenido en los
cromosomas en el núcleo celular y una parte mucho más pequeña ubicada en las
mitocondrias y, en el caso de los organismos fotosintéticos, en los cloroplastos. Primero
veremos el genoma nuclear.

2.2.1. Genomas nucleares eucariotas


El genoma nuclear se divide en un conjunto de ADN lineal.moléculas, cada una
contenida en un cromosoma. No se conocen excepciones a este patrón: todos los
eucariotas que se han estudiado tienen al menos dos cromosomas y las moléculas de
ADN son siempre lineales. La única variabilidad a este nivel de la estructura del genoma
eucariota radica en el número de cromosomas, que parece no estar relacionado con las
características biológicas del organismo. Por ejemplo, la levadura tiene 16 cromosomas,
cuatro veces más que la mosca de la fruta. El número de cromosomas tampoco está
relacionado con el tamaño del genoma: algunas salamandras tienen genomas 30 veces
más grandes que la versión humana, pero se dividen en la mitad del número de
cromosomas. Estas comparaciones son interesantes, pero en la actualidad no nos dicen
nada útil sobre los genomas mismos; son más un reflejo de la no uniformidad de los
eventos evolutivos que han moldeado la arquitectura del genoma en diferentes
organismos.

Empaquetado de ADN en cromosomas


Los cromosomas son mucho más cortos que las moléculas de ADN que contienen: el
cromosoma humano promedio tiene poco menos de 5 cm de ADN. A lo tanto, se
necesita un sistema de embalaje altamente organizada para adaptarse a una molécula
de ADN en su cromosoma. Debemos comprender este sistema de empaquetamiento
antes de comenzar a pensar en cómo funcionan los genomas porque la naturaleza del
empaquetamiento influye en los procesos involucrados en la expresión de genes
individuales ( Sección 8.2 ).
Los avances importantes en la comprensión del empaquetamiento del ADN se
realizaron a principios de la década de 1970 mediante una combinación de análisis
bioquímicos y microscopía electrónica. Ya se sabía que el ADN nuclear está asociado
con proteínas de unión al ADN llamadas histonas, pero la naturaleza exacta de la
asociación no se había delineado. En 1973-74, varios grupos llevaron a
cabo experimentos de protección de nucleasas con cromatina.(Complejos de ADN-
histona) que se habían extraído suavemente de los núcleos mediante métodos
diseñados para retener la mayor cantidad posible de la estructura de la cromatina. En
un experimento de protección de nucleasas, el complejo se trata con una enzima que
corta el ADN en posiciones que no están 'protegidas' mediante la unión a una
proteína. Los tamaños de los fragmentos de ADN resultantes indican el posicionamiento
de los complejos de proteínas en la molécula de ADN original ( Figura 2.4 ). Después
del tratamiento de nucleasa limitado de la cromatina purificada, la mayor parte de los
fragmentos de ADN tienen longitudes de aproximadamente 200 pb y múltiplos de los
mismos, lo que sugiere un espaciado regular de proteínas histonas a lo largo del ADN.
En 1974, estos resultados bioquímicos se complementaron con micrografías
electrónicas de cromatina purificada, que permitieron visualizar el espacio regular
inferido por los experimentos de protección como perlas de proteína en la cadena
de ADN ( Figura 2.5A ). Un análisis bioquímico adicional indicó que cada cuenta,
o nucleosoma , contiene ocho moléculas de proteína histona, siendo estas dos de las
histonas H2A, H2B, H3 y H4. Los estudios estructurales han demostrado que estas ocho
proteínas forman un octamero núcleo en forma de barril con el ADN enrollado dos veces
alrededor del exterior ( Figura 2.5B ). Entre 140 y 150 pb de ADN (dependiendo de la
especie) están asociados con la partícula de nucleosoma, y cada nucleosoma está
separado por 50–70 pb de ADN conector, lo que da la longitud de repetición de 190–
220 pb mostrada previamente por los experimentos de protección de nucleasa.
Además de las proteínas del octamero central, hay un grupo de histonas adicionales,
todas estrechamente relacionadas entre sí y denominadas colectivamente histonas
enlazadoras . En los vertebrados, estos incluyen histonas H1a-e, H1 °, H1t y
H5. Se une una única histona enlazadora a cada nucleosoma, para formar
el cromatosoma , pero se desconoce el posicionamiento preciso de esta histona
enlazadora. Los estudios estructurales apoyan el modelo tradicional en el que la histona
de enlace actúa como una pinza, evitando que el ADN enrollado se desprenda del
nucleosoma ( Figura 2.5C; Zhou et al ., 1998 ; Travers, 1999) Sin embargo, otros
resultados sugieren que, al menos en algunos organismos, la histona enlazadora no se
encuentra en la superficie extrema del ensamblaje de nucleosoma-ADN, como se
esperaría si realmente fuera una pinza, sino que se inserta entre el octamero central y
el ADN ( Pruss et al ., 1995 ; Pennisi, 1996).
Se cree que la estructura de "cuentas en una cuerda" que se muestra en la Figura
2.5A representa una forma desempaquetada de cromatina que ocurre con poca
frecuencia en los núcleos vivos. Las técnicas de ruptura celular muy suaves
desarrolladas a mediados de la década de 1970 dieron como resultado una versión más
condensada del complejo, llamada fibra de 30 nm (tiene aproximadamente 30 nm de
ancho). La forma exacta en que los nucleosomas se asocian para formar la fibra de 30
nm no se conoce, pero se han propuesto varios modelos, el más popular de los cuales
es la estructura de solenoide que se muestra en la Figura 2.6 . Los nucleosomas
individuales dentro de la fibra de 30 nm pueden mantenerse unidos mediante
interacciones entre las histonas enlazadoras, o los archivos adjuntos pueden involucrar
a las histonas centrales, cuyas 'colas' de proteínas se extienden fuera del nucleosoma
(verFigura 8.9 ). La última hipótesis es atractiva porque la modificación química de estas
colas da como resultado la apertura de la fibra de 30 nm, permitiendo que los genes
contenidos dentro de ella se activen ( Sección 8.2.1 ).

Las características especiales de los cromosomas metafásicos

La fibra de 30 nm es probablemente el tipo principal de cromatina en el núcleo durante


la interfase, el período entre divisiones nucleares. Cuando el núcleo se divide,
el ADN adopta una forma más compacta de empaquetamiento, lo que da como
resultado los cromosomas de metafase altamente condensados que se pueden ver con
el microscopio óptico y que tienen la apariencia generalmente asociada con la palabra
'cromosoma' ( Figura 2.7 ). Los cromosomas de la metafase se forman en una etapa
del ciclo celular después de la replicación del ADN y, por lo tanto, cada uno contiene
dos copias de su molécula de ADN cromosómico. Las dos copias se mantienen juntas
en el centrómero., que tiene una posición específica dentro de cada cromosoma. Por lo
tanto, los cromosomas individuales pueden reconocerse debido a su tamaño y la
ubicación del centrómero en relación con los dos extremos. Otras características
distintivas se revelan cuando los cromosomas se tiñen. Existen varias técnicas de
tinción diferentes ( Tabla 2.4 ), cada una de las cuales produce un patrón de bandas
característico de un cromosoma particular. Esto significa que el conjunto de
cromosomas que posee un organismo puede representarse como un cariograma , en el
que se representa la apariencia en bandas de cada uno. El cariograma humano se
muestra en la Figura 2.8 .
Tanto el ADN en las regiones de centrómero, como las proteínas unidas a él, tienen
características especiales. La secuencia de nucleótidos del ADN centromérico se
entiende mejor en la planta Arabidopsis thaliana , cuya comodidad para el análisis
genético ha permitido ubicar las posiciones de los centrómeros en la secuencia de ADN
con cierta precisión. Además, se hizo un esfuerzo especial para secuenciar estas
regiones centroméricas, que con frecuencia se excluyen de las secuencias del genoma
borrador debido a problemas para obtener una lectura precisa a través de la estructura
altamente repetitiva que caracteriza a estas regiones. Los centrómeros
de Arabidopsis abarcan 0.9–1.2 Mb de ADN y cada uno está compuesto en gran parte
por 180 bprepetir secuencias. En humanos, las secuencias equivalentes son de 171 pb
y se denominan ADN alfoide . Antes de obtener las secuencias de Arabidopsis, se
pensaba que estas secuencias repetidas eran, con mucho, el componente principal del
ADN centromérico. Sin embargo, los centrómeros de Arabidopsis también contienen
múltiples copias de repeticiones de todo el genoma, junto con algunos genes, este último
con una densidad de 7–9 por 100 kb en comparación con 25 genes por 100 kb para las
regiones no centroméricas de los cromosomas de Arabidopsis ( Copenhaver et al .,
1999 ). El descubrimiento de que el ADN del centrómero contiene genes fue una gran
sorpresa porque se pensaba que estas regiones estaban genéticamente inactivas.
Las proteínas centroméricas especiales en humanos incluyen al menos siete que no se
encuentran en otras partes del cromosoma ( Warburton, 2001 ). Una de estas proteínas,
CENP- A , es muy similar a la histona H3 y se cree que reemplaza esta histona en los
nucleosomas centroméricos. Se supone que las pequeñas distinciones entre CENP-A y
H3 confieren propiedades especiales a los nucleosomas centroméricos, pero aún no se
sabe exactamente cuáles podrían ser estas propiedades y cómo se relacionan con la
función del centrómero. Parte de la función del centrómero en sí es revelada por el
microscopio electrónico, que muestra que en una célula en división un par
de cinetocoros en forma de placaestán presentes en la superficie del cromosoma en la
región centromérica. Estas estructuras actúan como puntos de unión para los
microtúbulos que irradian desde los cuerpos del polo del huso ubicados en la superficie
nuclear y que atraen los cromosomas divididos hacia los núcleos hijos ( Figura
2.9 ). Parte del cinetocoro está formado por ADN alfoide más CENP-A y otras proteínas,
pero su estructura no se ha descrito en detalle ( Vafa y Sullivan, 1997 ).
Una segunda parte importante del cromosoma es la región terminal o telómero . Los
telómeros son importantes porque marcan los extremos de los cromosomas y, por lo
tanto, permiten que la célula distinga un extremo real de un extremo no natural causado
por la ruptura cromosómica, un requisito esencial porque la célula debe reparar el último
pero no el primero. El ADN telomérico está formado por cientos de copias de un motivo
repetido, 5′-TTAGGG-3 'en humanos, con una extensión corta del término 3' de la
molécula de ADN bicatenario ( Figura 2.10) Dos proteínas especiales se unen a las
secuencias repetidas en los telómeros humanos. Estos se llaman TRF1, que ayuda a
regular la longitud del telómero, y TRF2, que mantiene la extensión de un solo
filamento. Si se inactiva TRF2, esta extensión se pierde y los dos polinucleótidos se
fusionan en un enlace covalente ( van Steensel et al ., 1998 ). Se cree que otras
proteínas teloméricas forman un enlace entre el telómero y la periferia del núcleo, el
área en la que se localizan los extremos cromosómicos ( Tham y Zakian, 2000 ). Aún
otros median la actividad enzimática que mantiene la longitud de cada telómero
durante la replicación del ADN . Volveremos a esta última actividad en la Sección
13.2.4.: es fundamental para la supervivencia del cromosoma y puede ser clave para
comprender la senescencia y la muerte celular.
¿Dónde están los genes en un genoma eucariota?
En la sección anterior aprendimos que los centrómeros de Arabidopsis contienen genes
pero a una densidad menor que la del resto de los cromosomas. Esto nos alerta sobre
el hecho de que los genes no están dispuestos de manera uniforme a lo largo de un
cromosoma. En la mayoría de los organismos, los genes parecen estar distribuidos más
o menos al azar, con variaciones sustanciales en la densidad génica en diferentes
posiciones dentro de un cromosoma. La densidad génica promedio en Arabidopsis es
de 25 genes por 100 kb , pero incluso fuera de los centrómeros y telómeros, la densidad
varía de 1 a 38 genes por 100 kb, como se ilustra en la Figura 2.11para el más grande
de los cinco cromosomas de la planta. Lo mismo es cierto para los cromosomas
humanos, donde la densidad varía de 0 a 64 genes por 100 kb.
La distribución desigual del gen dentro de los cromosomas humanos se sospechó
durante varios años antes de que se completara el borrador de la secuencia. Había dos
líneas de evidencia, una de las cuales estaba relacionada con los patrones de bandas
que se producen cuando se tiñen los cromosomas. Los colorantes utilizados en estos
procedimientos (ver Tabla 2.4 ) se unen a las moléculas de ADN , pero en la mayoría
de los casos con preferencias por ciertos pares de bases. Giemsa, por ejemplo, tiene
una mayor afinidad por las regiones de ADN que son ricas
en nucleótidos A y T. Las bandas G oscuras en el cariograma humano (ver Figura 2.8),
por lo tanto, se cree que son regiones ricas en AT del genoma. La composición base del
genoma en su conjunto es 59.7% A + T, por lo que las bandas G oscuras deben tener
contenidos AT sustancialmente mayores al 60%. Por lo tanto, los citogenéticos
predijeron que habría menos genes en las bandas G oscuras porque los genes
generalmente tienen contenidos de AT del 45 al 50%. Esta predicción se confirmó
cuando el borrador de la secuencia del genoma se comparó con el cariograma humano
( IHGSC, 2001 ).
La segunda línea de evidencia apunta a una distribución de genes desigual derivada
del modelo isócrono de organización del genoma ( Gardiner, 1996 ). Según este
modelo, los genomas de vertebrados y plantas (y posiblemente de otros eucariotas) son
mosaicos de segmentos de ADN , cada uno de al menos 300 kb de longitud, con cada
segmento con una composición base uniforme que difiere de la de los segmentos
adyacentes. El soporte para el modelo isócrono proviene de experimentos en los que el
ADN genómico se divide en fragmentos de aproximadamente 100 kb, tratados con
colorantes que se unen específicamente a regiones ricas en AT o GC, y las piezas se
separan por centrifugación en gradiente de densidad ( Nota técnica 2.2) Cuando este
experimento se lleva a cabo con ADN humano, se observan cinco fracciones, cada una
de las cuales representa un tipo de isóforo diferente con una composición base
distintiva: dos isocoros ricos en AT, llamados L1 y L2, y tres clases ricas en GC: H1, H2
y H3 . El último de estos, H3, es el menos abundante en el genoma humano,
representando solo el 3% del total, pero contiene más del 25% de los genes. Esta es
una clara indicación de que los genes no se distribuyen uniformemente a través del
genoma humano. El borrador de la secuencia del genoma sugiere que la teoría de la
isócrona simplifica en exceso lo que es, en realidad, un patrón mucho más complejo de
variaciones en la composición de la base a lo largo de cada cromosoma humano
( IHGSC, 2001) Pero incluso si resulta ser un concepto erróneo, la teoría de las
isócronas ha jugado un papel importante en ayudar a los biólogos moleculares de la era
previa a la secuencia a comprender la estructura del genoma.

¿Qué genes están presentes en un genoma eucariota?


Hay varias formas de clasificar los genes en un genoma eucariota. Una posibilidad es
clasificar los genes de acuerdo con su función, como se muestra en la Figura
1.18 (página 21) para el genoma humano. Este sistema tiene la ventaja de que las
categorías funcionales bastante amplias utilizadas en la Figura 1.18 pueden
subdividirse aún más para producir una jerarquía de descripciones funcionales cada vez
más específicas para conjuntos de genes cada vez más pequeños. La debilidad de este
enfoque es que las funciones aún no se han asignado a muchos genes eucariotas, por
lo que este tipo de clasificación excluye una proporción del conjunto total de
genes. UNAEl método más poderoso es basar la clasificación no en las funciones de los
genes sino en las estructuras de las proteínas que especifican. Una molécula de
proteína se construye a partir de una serie de dominios , cada uno de los cuales tiene
una función bioquímica particular. Ejemplos son el dedo de zinc , que es uno de varios
dominios que permiten que una proteína se una a una molécula de ADN ( Sección
9.1.4 ), y el 'dominio de muerte', que está presente en muchas proteínas involucradas
en la apoptosis., el proceso de muerte celular programada. Cada dominio tiene una
secuencia de aminoácidos característica, quizás no exactamente la misma secuencia
en cada ejemplo de ese dominio, pero lo suficientemente cerca para que la presencia
de un dominio particular sea reconocible al examinar la secuencia de aminoácidos de la
proteína. La secuencia de aminoácidos de una proteína está especificada por la
secuencia de nucleótidos de su gen, por lo que los dominios presentes en una proteína
pueden determinarse a partir de la secuencia de nucleótidos del gen que codifica esa
proteína. Por lo tanto, los genes en un genoma se pueden clasificar de acuerdo con los
dominios de proteínas que especifican. Este método tiene la ventaja de que puede
aplicarse a genes cuyas funciones no se conocen y, por lo tanto, puede abarcar una
mayor proporción del conjunto de genes en un genoma.
Los esquemas de clasificación basados en la función del gen sugieren que todos los
eucariotas poseen el mismo conjunto básico de genes, pero que las especies más
complejas tienen un mayor número de genes en cada categoría. Por ejemplo, los
humanos tienen el mayor número de genes en todas las categorías, excepto en una,
que se usan en la Figura 2.12 , con la excepción del 'metabolismo' donde Arabidopsis se
destaca por su capacidad fotosintética, que requiere un gran conjunto de genes no
presente en los otros cuatro genomas incluidos en esta comparación. Esta clasificación
funcional revela otras características interesantes, en particular la C . eleganstiene un
número relativamente alto de genes cuyas funciones están involucradas en la
señalización célula-célula, lo cual es sorprendente dado que este organismo tiene solo
959 células. Los humanos, que tienen 10 13 células, tienen solo 250 genes más para la
señalización de células. En general, este tipo de análisis enfatiza las similitudes entre
los genomas, pero no revela la base genética de los tipos muy diferentes de información
biológica contenida en los genomas de, por ejemplo, moscas de la fruta y humanos. El
enfoque de dominio es más prometedor a este respecto porque muestra que el genoma
humano especifica una serie de dominios de proteínas que están ausentes de los
genomas de otros organismos, incluidos estos dominios involucrados en actividades
como la adhesión celular, los acoplamientos eléctricos y el crecimiento de células
nerviosas ( tabla 2.5) Estas funciones son interesantes porque consideramos que
confieren las características distintivas de los vertebrados en comparación con otros
tipos de eucariotas.

Familias de genes
Desde los primeros días de la secuenciación del ADN, se sabe que las familias
multigénicas (grupos de genes de secuencia idéntica o similar) son características
comunes de muchos genomas. Por ejemplo, cada eucariota que se ha estudiado (así
como todas las bacterias excepto las más simples) tiene múltiples copias de los genes
para los ARN ribosómicos no codificantes ( ARNr ; Sección 3.2.1 ). Esto está ilustrado
por el genoma humano, que contiene aproximadamente 2000 genes para el
5S rRNA (llamado así porque tiene un coeficiente de sedimentación de 5S; ver Nota
técnica 2.2), todos ubicados en un solo grupo en el cromosoma 1. También hay
alrededor de 280 copias de una unidad de repetición que contiene los genes de ARNr
28S, 5.8S y 18S, agrupados en cinco grupos de 50–70 repeticiones, uno en cada uno
de los cromosomas 13, 14, 15, 21 y 22 (ver Figura 2.8 ). Los ARN ribosómicos son
componentes de las partículas sintetizadoras de proteínas llamadas ribosomas , y se
presume que sus genes están presentes en múltiples copias porque existe una gran
demanda de síntesis de ARNr durante la división celular, cuando se deben ensamblar
varias decenas de miles de nuevos ribosomas.
Los genes de ARNr son ejemplos de familias multigénicas "simples" o "clásicas", en las
que todos los miembros tienen secuencias idénticas o casi idénticas. Se cree que estas
familias surgieron por duplicación de genes, con las secuencias de los miembros
individuales mantenidas idénticas por un proceso evolutivo que, hasta el momento, no
se ha descrito completamente ( Sección 15.2.1) Otras familias multigénicas, más
comunes en eucariotas superiores que en eucariotas inferiores, se denominan
"complejas" porque los miembros individuales, aunque son similares en secuencia, son
lo suficientemente diferentes para que los productos génicos tengan propiedades
distintivas. Uno de los mejores ejemplos de este tipo de familia multigénica son los
genes de globina de mamíferos. Las globinas son las proteínas de la sangre que se
combinan para producir hemoglobina, y cada molécula de hemoglobina está compuesta
por dos globinas de tipo α y dos de tipo β. En humanos, las globinas de tipo α están
codificadas por una pequeña familia multigénica en el cromosoma 16 y las globinas de
tipo β por una segunda familia en el cromosoma 11 ( Figura 2.14 ). Estos genes
estuvieron entre los primeros en ser secuenciados, a fines de la década de 1970
( Fritsch et al ., 1980) Los datos de la secuencia mostraron que los genes en cada
familia son similares entre sí, pero de ninguna manera idénticos. De hecho, las
secuencias de nucleótidos de los dos genes más diferentes en el grupo de tipo β, que
codifican las globinas β y ε, muestran solo el 79,1% de identidad. Aunque esto es lo
suficientemente similar para que ambas proteínas sean globinas de tipo β, es lo
suficientemente diferente para que tengan propiedades bioquímicas distintivas. Se
observan variaciones similares en el grupo α.
¿Por qué los miembros de las familias de genes de globina son tan diferentes entre
sí? La respuesta se reveló cuando se estudiaron los patrones de expresión de los genes
individuales. Se descubrió que los genes se expresan en diferentes etapas del
desarrollo humano: por ejemplo, en el grupo de tipo β ε se expresa en el embrión
temprano, G γ y A γ (cuyos productos proteicos difieren en solo un aminoácido) en el feto
y δ y β en el adulto ( Figura 2.14 ). Se cree que las diferentes propiedades bioquímicas
de las proteínas de globina resultantes reflejan ligeros cambios en el papel fisiológico
que juega la hemoglobina durante el curso del desarrollo humano.
En algunas familias multigénicas, los miembros individuales están agrupados, como con
los genes de la globina, pero en otras los genes están dispersos por el genoma. Un
ejemplo de una familia dispersa son los cinco genes humanos para la aldolasa, una
enzima involucrada en la generación de energía, que se encuentran en los cromosomas
3, 9, 10, 16 y 17. El punto importante es que, aunque estén dispersos, los miembros de
La familia multigene tiene similitudes de secuencia que apuntan a un origen evolutivo
común. Cuando se hacen estas comparaciones de secuencias, a veces es posible ver
relaciones no solo dentro de una sola familia de genes, sino también entre diferentes
familias. Todos los genes de las familias de globina α y β, por ejemplo, tienen cierta
similitud de secuencia y se cree que evolucionaron a partir de un único gen de globina
ancestral.superfamilia de genes , y de las similitudes entre los genes individuales
podemos trazar los eventos de duplicación que han dado lugar a la serie de genes que
vemos hoy ( Sección 15.2.1 ).

2.2.2. Genomas de orgánulos eucariotas


Ahora salimos del núcleo para examinar los genomas presentes en las mitocondrias y
los cloroplastos de las células eucariotas. La posibilidad de que algunos genes pueden
estar situados fuera del núcleo - genes extracromosómicoscomo se les llamó
inicialmente - se elevó por primera vez en la década de 1950 como un medio de explicar
los patrones de herencia inusuales de ciertos genes en el hongo Neurospora crassa , la
levadura S . cerevisiae y el alga fotosintética Chlamydomonas reinhardtii . La
microscopía electrónica y los estudios bioquímicos casi al mismo tiempo proporcionaron
indicios de que el ADNLas moléculas pueden estar presentes en las mitocondrias y
cloroplastos. Finalmente, a principios de la década de 1960, se reunieron estas diversas
líneas de evidencia y se aceptó la existencia de genomas mitocondriales y de
cloroplastos, independientes y distintos del genoma nuclear.

Características físicas de los genomas de orgánulos.


Casi todos los eucariotas tienen genomas mitocondriales, y todos los eucariotas
fotosintéticos tienen genomas de cloroplasto. Inicialmente, se pensó que prácticamente
todos los genomas de orgánulos eran ADN circularmoléculas. Los estudios de
microscopía electrónica habían mostrado ADN tanto circular como lineal en algunos
orgánulos, pero se suponía que las moléculas lineales eran simplemente fragmentos de
genomas circulares que se habían roto durante la preparación para la microscopía
electrónica. Todavía creemos que la mayoría de los genomas mitocondriales y
cloroplásticos son circulares, pero ahora reconocemos que existe una gran variabilidad
en los diferentes organismos. En muchos eucariotas, los genomas circulares coexisten
en los orgánulos con versiones lineales y, en el caso de los cloroplastos, con círculos
más pequeños que contienen subcomponentes del genoma en su conjunto. El último
patrón alcanza su extremo en las algas marinas llamadas dinoflagelados, cuyos
genomas de cloroplastos se dividen en muchos círculos pequeños, cada uno de los
cuales contiene un solo gen ( Zhang et al.., 1999 ). Ahora también nos damos cuenta de
que los genomas mitocondriales de algunos eucariotas microbianos (por
ejemplo , Paramecium , Chlamydomonas y varias levaduras) son siempre lineales
( Nosek et al. , 1998 ).
Los números de copias para genomas de orgánulos no se comprenden particularmente
bien. Cada mitocondria humana contiene alrededor de 10 moléculas idénticas, lo que
significa que hay alrededor de 8.000 por célula, pero en S . cerevisiae el número total
es probablemente más pequeño (menos de 6500) a pesar de que puede haber más de
100 genomas por mitocondria. Microorganismos fotosintéticos
como Chlamydomonastienen aproximadamente 1000 genomas de cloroplastos por
célula, aproximadamente un quinto del número presente en una célula vegetal
superior. Un misterio, que se remonta a la década de 1950 y que nunca se ha resuelto
satisfactoriamente, es que cuando los genes de orgánulos se estudian en cruces
genéticos, los resultados sugieren que solo hay una copia de un genoma mitocondrial o
cloroplasto por célula. Claramente, este no es el caso, pero indica que nuestra
comprensión de la transmisión de genomas de orgánulos de padres a hijos no es
perfecta.
Los tamaños del genoma mitocondrial son variables ( tabla 2.6 ) y no están relacionados
con la complejidad del organismo. La mayoría de los animales multicelulares tienen
genomas mitocondriales pequeños con una organización genética compacta, los genes
están juntos y tienen poco espacio entre ellos. El genoma mitocondrial humano
(ver Figura 1.22 ), a 16 569 pb , es típico de este tipo. La mayoría de los eucariotas
inferiores, tales como S . cerevisiae ( Figura 2.15 ), así como las plantas con flores,
tienen genomas mitocondriales más grandes y menos compactos, con varios genes que
contienen intrones. Los genomas de cloroplasto tienen tamaños menos variables
( Tabla 2.6) y la mayoría tiene una estructura similar a la que se muestra en la Figura
2.16 para el genoma del cloroplasto de arroz.

El contenido genético de los genomas de orgánulos.


Los genomas de los orgánulos son mucho más pequeños que sus contrapartes
nucleares y, por lo tanto, anticipamos que sus contenidos genéticos son mucho más
limitados, que es el caso. Una vez más, los genomas mitocondriales muestran la mayor
variabilidad, contenidos de genes que van desde cinco para el parásito de la
malaria P . falciparuma 92 para el protozoo Reclinomonas americana ( Tabla
2.7 ; Lang et al ., 1997 ; Palmer, 1997a) Todos los genomas mitocondriales contienen
genes para los rRNA no codificantes y al menos algunos de los componentes proteicos
de la cadena respiratoria, siendo este último la principal característica bioquímica de la
mitocondria. Los genomas más ricos en genes también codifican tRNAs, proteínas
ribosómicas y proteínas involucradas en la transcripción, traducción y transporte de
otras proteínas a la mitocondria desde el citoplasma circundante ( Tabla 2.7 ). La
mayoría de los genomas de cloroplastos parecen poseer el mismo conjunto de
aproximadamente 200 genes, codificando nuevamente los rRNA y tRNA, así como las
proteínas ribosomales y las proteínas involucradas en la fotosíntesis (ver Figura 2.16 ).
Una característica general de los genomas de orgánulos surge de la Tabla 2.7 . Estos
genomas especifican algunas de las proteínas que se encuentran en el orgánulo, pero
no todas. Las otras proteínas están codificadas por genes nucleares, sintetizadas en el
citoplasma y transportadas al orgánulo. Si la célula tiene mecanismos para transportar
proteínas a las mitocondrias y cloroplastos, ¿por qué no tener todas las proteínas
orgánulos especificadas por el genoma nuclear? Todavía no tenemos una respuesta
convincente a esta pregunta, aunque se ha sugerido que al menos algunas de las
proteínas codificadas por los genomas de orgánulos son extremadamente hidrófobas y
no pueden transportarse a través de las membranas que rodean las mitocondrias y los
cloroplastos, por lo que simplemente no se pueden mover. en el organelo desde el
citoplasma ( Palmer, 1997b) La única forma en que la célula puede llevarlos al orgánulo
es hacerlos allí en primer lugar.

Los orígenes de los genomas de orgánulos


El descubrimiento de los genomas de orgánulos llevó a muchas especulaciones sobre
sus orígenes. Hoy la mayoría de los biólogos aceptan que la teoría del endosimbiontees
correcto, al menos en resumen, a pesar de que se consideró poco ortodoxo cuando se
propuso por primera vez en la década de 1960. La teoría del endosimbionte se basa en
la observación de que los procesos de expresión génica que ocurren en los orgánulos
son similares en muchos aspectos a procesos equivalentes en bacterias. Además,
cuando se comparan las secuencias de nucleótidos, se descubre que los genes de
orgánulos son más similares a los genes equivalentes de las bacterias que a los genes
nucleares eucariotas. Por lo tanto, la teoría del endosimbionte sostiene que las
mitocondrias y los cloroplastos son las reliquias de las bacterias de vida libre que
formaron una asociación simbiótica con el precursor de la célula eucariota, desde las
primeras etapas de la evolución.
El apoyo a la teoría de los endosimbiontes proviene del descubrimiento de organismos
que parecen exhibir etapas de endosimbiosis que son menos avanzadas que las
observadas con las mitocondrias y los cloroplastos. Por ejemplo, el
protozoo Cyanophora paradoxa muestra una etapa temprana de la endosimbiosis ,
cuyas estructuras fotosintéticas, llamadas cianelas , son diferentes de los cloroplastos
y, en cambio, se parecen a las cianobacterias ingeridas. Del mismo modo, la Rickettsia ,
que vive dentro de las células eucariotas, podría ser una versión moderna de la bacteria
que dio lugar a la mitocondria ( Andersson et al ., 1998) También se ha sugerido que los
hidrogenosomas de las tricomonadas (microbios unicelulares, muchos de los cuales son
parásitos), algunos de los cuales tienen un genoma pero la mayoría no, representan un
tipo avanzado de endosimbiosis mitocondrial ( Palmer, 1997b ; Akhmanova et al. ,
1998 ).
Si las mitocondrias y los cloroplastos alguna vez fueron bacterias de vida libre, entonces
desde que se estableció la endosimbiosis debe haber habido una transferencia de genes
desde el orgánulo hacia el núcleo. No entendemos cómo ocurrió esto, o de hecho si
hubo una transferencia masiva de muchos genes a la vez, o un goteo gradual de un sitio
a otro. Pero sí sabemos que la transferencia de ADN de los orgánulos al núcleo, y de
hecho entre los orgánulos, todavía ocurre. Esto se descubrió a principios de la década
de 1980, cuando se obtuvieron las primeras secuencias parciales de genomas de
cloroplastos. Se descubrió que en algunas plantas el genoma del cloroplasto contiene
segmentos de ADN, que a menudo incluyen genes completos, que son copias de partes
del genoma mitocondrial. La implicación es que este llamado ADN promiscuoha sido
transferido de un orgánulo a otro. Ahora sabemos que este no es el único tipo de
transferencia que puede ocurrir. El genoma mitocondrial de Arabidopsis contiene varios
segmentos de ADN nuclear, así como 16 fragmentos del genoma del cloroplasto,
incluidos seis genes de ARNt que han conservado su actividad después de la
transferencia a la mitocondria. El genoma nuclear de esta planta incluye varios
segmentos cortos del cloroplasto y los genomas mitocondriales, así como un fragmento
de ADN mitocondrial de 270 kb ubicado dentro de la región centromérica del
cromosoma 2 ( Copenhaver et al ., 1999 ; AGI, 2000 ). También se ha documentado la
transferencia de ADN mitocondrial a genomas nucleares de vertebrados.

2.3. La anatomía del genoma procariota


Debido a los tamaños relativamente pequeños de los genomas procariotas, en los
últimos años se han publicado muchas secuencias completas del genoma para diversas
bacterias y arqueas. Como resultado, estamos comenzando a comprender mucho sobre
las anatomías de los genomas procariotas, y en muchos aspectos sabemos más sobre
estos organismos que sobre los eucariotas.

2.3.1. La estructura física del genoma procariota.


La mayoría de los genomas procariotas tienen menos de 5 Mb de tamaño, aunque
algunos son sustancialmente más grandes que esto: B. megaterium, por ejemplo, tiene
un enorme genoma de 30 Mb. La visión tradicional ha sido que en un procariota típico
el genoma está contenido en una sola molécula de ADN circular , localizada dentro
del nucleoide , la región ligeramente teñida de la célula procariota, que de otro modo
carecería de características (ver Figura 2.1 ). Esto es especialmente cierto para
los E . coliy muchas de las otras bacterias comúnmente estudiadas. Sin embargo, como
veremos, nuestro creciente conocimiento de los genomas procariotas nos está llevando
a cuestionar varias de las ideas preconcebidas que se establecieron durante la era pre-
genómica de la microbiología. Estas ideas preconcebidas se relacionan tanto con la
estructura física del genoma procariota como con su organización genética.

La visión tradicional del 'cromosoma' bacteriano


Al igual que con los cromosomas eucariotas, un genoma procariota tiene que exprimirse
en un espacio relativamente pequeño (el cromosoma circular E. coli tiene una
circunferencia de 1.6 mm, mientras que una célula de E. coli mide solo 1.0 × 2.0 μm) y,
como con los eucariotas, esto es logrado con la ayuda de proteínas de unión al ADN que
empaquetan el genoma de manera organizada. La estructura resultante no tiene
similitudes sustanciales con un cromosoma eucariota, pero todavía usamos 'cromosoma
bacteriano' como un término conveniente para describirlo.
La mayor parte de lo que sabemos acerca de la organización del ADN en el nucleoide
proviene de estudios de E . coli. La primera característica que se reconoció fue que
el genoma circular de E. coli está superenrollado . El superenrollamiento ocurre
cuando se introducen giros adicionales en la doble hélice de ADN (superenrollamiento
positivo) o si se eliminan los giros (superenrollamiento negativo). Con una molécula
lineal, la tensión de torsión introducida por el devanado excesivo o insuficiente se libera
inmediatamente mediante la rotación de los extremos de la molécula de ADN, pero una
molécula circular, que no tiene extremos, no puede reducir la tensión de esta
manera. En cambio, la molécula circular responde enrollando alrededor de sí misma
para formar una estructura más compacta ( Figura 2.17) Por lo tanto, el
superenrollamiento es una forma ideal de empaquetar una molécula circular en un
espacio pequeño. La evidencia de que el superenrollamiento está involucrado en el
empaquetado del genoma circular de E. coli se obtuvo por primera vez en la década de
1970 a partir del examen de nucleoides aislados, y posteriormente se confirmó como
una característica del ADN en las células vivas en 1981. En E. coli, se cree que el
superenrollamiento es generado y controlado por dos enzimas, la ADN girasa y la ADN
topoisomerasa I , que veremos con más detalle en la Sección 13.1.2 cuando
examinemos los roles de estas enzimas en la replicación del ADN .
Los estudios de Nucleoides aisladas y de células vivas han demostrado que
la E . La molécula de ADN coli no tiene libertad ilimitada para rotar una vez que se
introduce una ruptura. La explicación más probable es que el ADN bacteriano está unido
a proteínas que restringen su capacidad de relajación, por lo que la rotación en un sitio
de ruptura da como resultado la pérdida de superenrollamiento de solo un pequeño
segmento de la molécula ( Figura 2.18 ). El modelo actual tiene el ADN de E. coli unido
a un núcleo de proteína desde el cual se irradian de 40 a 50 bucles superenrollados
hacia la célula. Cada bucle contiene aproximadamente 100 kb de ADN superenrollado,
la cantidad de ADN que se desenrolla después de una sola ruptura.
El componente proteico del nucleoide incluye ADN girasa y ADN topoisomerasa I , las
dos enzimas que son las principales responsables de mantener el estado
superenrollado, así como un conjunto de al menos cuatro proteínas que se cree que
tienen un papel más específico en el empaquetamiento del ADN bacteriano. La más
abundante de estas proteínas de empaquetamiento es HU, que es estructuralmente muy
diferente a las histonas eucariotas, pero actúa de manera similar, formando un tetrámero
alrededor del cual se enrollan aproximadamente 60 pb de ADN. Hay unos 60 000 HU
proteínas por correo . coli celular, suficiente para cubrir aproximadamente una quinta
parte de la molécula de ADN, pero no se sabe si los tetrámeros están espaciados
uniformemente a lo largo del ADN o restringidos a la región central del nucleoide.

Complicaciones sobre el tema de E. coli


En los últimos años se ha hecho evidente que la visión directa de la anatomía del
genoma procariótico desarrollado a partir de los estudios de E . Coli es una
simplificación excesiva. Aunque la mayoría de los cromosomas bacterianos y
arqueológicos son circulares, se está encontrando un número creciente de lineales. El
primero de ellos, para Borrelia burgdorferi , el organismo que causa la enfermedad de
Lyme, se describió en 1989 ( Ferdows y Barbour, 1989 ) y durante los años siguientes
se hicieron descubrimientos similares para Streptomyces y otras bacterias ( Chen,
1996 ).
Una segunda complicación se refiere al estado preciso de los plásmidos con respecto
al genoma procariota. Un plásmido es un pequeño fragmento de ADN , a menudo, pero
no siempre circular, que coexiste con el cromosoma principal en una célula bacteriana
(ver Figura 2.3 ). Algunos tipos de plásmidos pueden integrarse en el genoma principal,
pero se cree que otros son independientes de forma permanente. Los plásmidos
transportan genes que generalmente no están presentes en el cromosoma principal,
pero en muchos casos estos genes no son esenciales para la bacteria, codificando
características como la resistencia a los antibióticos, que la bacteria no necesita si las
condiciones ambientales son favorables ( Tabla 2.8) Además de esta aparente
dispensabilidad, muchos plásmidos pueden transferirse de una célula a otra, y los
mismos plásmidos a veces se encuentran en bacterias que pertenecen a especies
diferentes. Estas diversas características de los plásmidos sugieren que son entidades
independientes y que en la mayoría de los casos el contenido de plásmido de una célula
procariota no debe incluirse en la definición de su genoma.
Con una bacteria tal como E . coli K12, que tiene un cromosoma de 4.6 Mb y puede
albergar varias combinaciones de plásmidos, ninguno de los cuales tiene más de unos
pocos kb de tamaño y todos son prescindibles, es aceptable definir el cromosoma
principal como el 'genoma'. Con otros procariotas no es tan fácil ( Tabla 2.9 ). Vibrio
cholerae , la bacteria patógena que causa el cólera, tiene dos moléculas
de ADN circulares , una de 2.96 Mb y la otra de 1.07 Mb, con el 71% de los 3885 genes
del organismo en la mayor de ellas ( Heidelberg et al. , 2000 ). Parece obvio que estas
dos moléculas de ADN juntas constituyen elVibrio genoma, pero un examen más
detallado revela que la mayoría de los genes para las actividades celulares centrales,
como la expresión del genoma y la generación de energía, así como los genes que
confieren patogenicidad, se encuentran en la molécula más grande. La molécula más
pequeña contiene muchos genes esenciales, pero también tiene ciertas características
que se consideran características de los plásmidos, en particular un integrón , un
conjunto de genes y otras secuencias de ADN que permiten a los plásmidos capturar
genes de bacteriófagos y otros plásmidos. Por lo tanto, parece posible que el genoma
más pequeño sea un 'megaplasmido' que fue adquirido por el antepasado de Vibrio en
algún momento del pasado evolutivo de la bacteria. Deinococcus radioduransR1, cuyo
genoma es de particular interés porque contiene muchos genes que ayudan a esta
bacteria a resistir los efectos nocivos de la radiación, se construye en líneas similares,
con genes esenciales distribuidos entre dos cromosomas circulares y dos plásmidos
( White et al. , 1999 ). Sin embargo, los genomas Vibrio y Deinococcus son
relativamente poco complejos en comparación con Borrelia burgdorferi B31, cuyo
cromosoma lineal de 911 kb, que transporta 853 genes, está acompañado por 17 o 18
plásmidos lineales y circulares que juntos contribuyen con otros 533 kb y al menos 430
genes. ( Fraser et al. , 1997) Aunque se desconocen las funciones de la mayoría de
estos genes, los que se han identificado incluyen varios que normalmente no se
considerarían prescindibles, como los genes para las proteínas de membrana y la
biosíntesis de purinas. La implicación es que al menos algunos de los plásmidos
de Borrelia son componentes esenciales del genoma, lo que lleva a la posibilidad de
que algunos procariotas tengan genomas altamente multipartitos, que comprenden
varias moléculas de ADN separadas, más parecidas a lo que vemos en el núcleo
eucariota en lugar de el arreglo procariota "típico". Esta interpretación del genoma
de Borrelia sigue siendo controvertida y se complica por el hecho de que la bacteria
relacionada Treponema pallidum, cuyo genoma es una molécula de ADN circular única
de 1138 kb que contiene 1041 genes ( Fraser et al. , 1998 ), no contiene ninguno de los
genes presentes en los plásmidos Borrelia .
La complicación final con respecto a las estructuras físicas de los genomas procariotas
se refiere a las diferencias entre los sistemas de empaquetamiento de las moléculas
de ADN bacteriano y arqueal . Una razón por la cual las arqueas son consideradas
como un grupo distinto de organismos, diferentes de las bacterias, es que las arqueas
no poseen proteínas de empaquetado como HU, sino que tienen proteínas que son
mucho más similares a las histonas. Actualmente no tenemos información sobre la
estructura del nucleoide arqueal, pero se supone que estas proteínas similares a las
histonas juegan un papel central en el empaquetamiento del ADN.

2.3.2. La organización genética del genoma procariota.


Ya hemos aprendido que los genomas bacterianos tienen organizaciones genéticas
compactas con muy poco espacio entre los genes (ver Figura 2.2 ). Para volver a insistir
en este punto, el mapa genético completo de la circular E . Elgenoma de coli K12 se
muestra en la figura 2.19 . No es no codificante de ADN en el E. coli genoma, pero
representa sólo el 11% del total y se distribuye en todo el genoma en pequeños
segmentos que no se presentan cuando el mapa se dibuja a esta escala. En este
sentido, E. colies típico de todos los procariotas cuyos genomas han sido secuenciados
hasta ahora: los genomas procariotas tienen muy poco espacio desperdiciado. Existen
teorías de que esta organización compacta es beneficiosa para los procariotas, por
ejemplo, al permitir que el genoma se replique relativamente rápido, pero estas ideas
nunca han sido respaldadas por evidencia experimental sólida.

Figura 2.19
El genoma de Escherichia coli K12. El mapa se muestra con el origen de replicación
(Sección 13.2.1) colocado en la parte superior. Los genes en el exterior del círculo se
transcriben en sentido horario y los del interior se transcriben en sentido antihorario (más
...)

Los operones son rasgos característicos de los genomas procariotas.


Un rasgo característico de los genomas procariotas ilustrados por E . coli es la
presencia de operones. En los años anteriores a las secuencias del genoma, se
pensaba que entendíamos muy bien a los operones; ahora no estamos tan seguros.
Un operón es un grupo de genes que se encuentran adyacentes entre sí en el genoma,
con tal vez solo uno o dos nucleótidos entre el final de un gen y el comienzo del
siguiente. Todos los genes en un operón se expresan como una sola unidad. Este tipo
de disposición es común en los genomas procariotas. Una típica E . El ejemplo
de coli es el operón lactosa , el primer operón descubierto ( Jacob y Monod, 1961 ), que
contiene tres genes involucrados en la conversión del azúcar disacárido lactosa en sus
unidades de monosacárido: glucosa y galactosa ( Figura 2.20A) Los monosacáridos son
sustratos para la vía glicolítica generadora de energía, por lo que la función de los genes
en el operón de lactosa es convertir la lactosa en una forma que E. coli pueda
utilizar como fuente de energía. La lactosa no es un componente común del entorno
natural de E. coli , por lo que la mayoría de las veces el operón no se expresa y la
bacteria no produce las enzimas para la utilización de la lactosa. Cuando la lactosa está
disponible, enciende el operón; los tres genes se expresan juntos, lo que resulta en una
síntesis coordinada de las enzimas que utilizan lactosa. Este es el ejemplo clásico de
regulación génica en bacterias, y se examina en detalle en la Sección 9.3.1 .
En total, hay cerca de 600 operones en el correo . El genoma de coli K12, cada uno con
dos o más genes, y un número similar están presentes en Bacillus subtilis . En la
mayoría de los casos, los genes en un operón están funcionalmente relacionados,
codificando un conjunto de proteínas que están involucradas en una sola actividad
bioquímica, como la utilización de un azúcar como fuente de energía o la síntesis de un
aminoácido. Un ejemplo de esto último es el operón triptófano de E. coli ( Figura
2.20B) Los genetistas microbianos se sienten atraídos por la simplicidad de este sistema
por el cual una bacteria es capaz de controlar sus diversas actividades bioquímicas
mediante la regulación de la expresión de grupos de genes relacionados unidos en
operones. Esta puede ser una interpretación correcta de la función de los operones
en E. coli , Bacillus subtilis y muchos otros procariotas, pero en al menos algunas
especies la imagen es menos directa. Tanto el arqueón Methanococcus
jannaschii como la bacteria Aquifex aeolicus tienen operones, pero los genes en un
operón individual rara vez tienen una relación bioquímica. Por ejemplo, uno de los
operones de la A . AeolicusEl genoma contiene seis genes unidos, estos genes
codifican dos proteínas involucradas en la recombinación del ADN ( Sección 14.3 ), una
enzima utilizada en la síntesis de proteínas, una proteína necesaria para la motilidad,
una enzima involucrada en la síntesis de nucleótidos y una enzima para la síntesis de
lípidos ( Figura 2.21 ; Deckert et al. , 1998 ). Esto es típico de la estructura de operón en
el A. aeolicus y M . jannaschiigenomas. En otras palabras, la noción de que la expresión
de un operón conduce a la síntesis coordinada de enzimas requeridas para una única
vía bioquímica no es válida para estas especies.
Por lo tanto, los proyectos genómicos han confundido nuestra comprensión de los
operones. Sin duda, es demasiado pronto para abandonar la creencia de que operones
juegan un papel central en la regulación bioquímica en muchas bacterias, pero hay que
explicar las características inesperadas de los operones en una . aeolicus
y M . jannaschii . Se ha señalado que tanto A. aeolicus como M. jannaschii son
autótrofos, lo que significa que, a diferencia de muchos procariotas, pueden sintetizar
compuestos orgánicos a partir de dióxido de carbono ( Deckert et al. , 1998 ), pero cómo
esta similitud entre Las especies que podrían usarse para explicar sus estructuras de
operón no están claras.

Genomas procariotas y el concepto de especie.


GenomaLos proyectos también han confundido nuestra comprensión de lo que
constituye una 'especie' en el mundo procariota. Esto siempre ha sido un problema en
microbiología porque las definiciones biológicas estándar de especies han sido difíciles
de aplicar a los microorganismos. Los primeros taxonomistas como Linneaus
describieron especies en términos morfológicos, todos los miembros de una especie
tienen las mismas características estructurales o muy similares. Esta forma de
clasificación estuvo de moda hasta principios del siglo XX y fue aplicada por primera vez
a los microorganismos en la década de 1880 por Robert Koch y otros, que utilizaron
pruebas de tinción y bioquímicas para distinguir entre especies bacterianas. Sin
embargo, se reconoció que este tipo de clasificación era imprecisa porque muchas de
las especies resultantes estaban formadas por una variedad de tipos con propiedades
bastante diferentes. Un ejemplo es proporcionado porE . coli que, como muchas
especies bacterianas, incluye cepas con características patógenas distintivas, que van
desde inofensivas hasta letales. Durante el siglo XX, los biólogos redefinieron el
concepto de especie en términos evolutivos y ahora consideramos a una especie como
un grupo de organismos que pueden cruzarse entre sí. En todo caso, esto es más
problemático con los microorganismos porque hay una variedad de métodos por los
cuales los genes pueden intercambiarse entre procariotas que, de acuerdo con sus
propiedades bioquímicas y fisiológicas, son especies diferentes ( Cuadro 2.3 ). La
barrera al flujo de genes que es central para el concepto de especie, por lo tanto, no se
mantiene con los procariotas.
La secuenciación del genoma ha enfatizado las dificultades para aplicar el concepto de
especie a los procariotas. Ha quedado claro que diferentes cepas de una sola especie
pueden tener secuencias genómicas muy diferentes, e incluso pueden tener conjuntos
individuales de genes específicos de cepa. Esto se demostró por primera vez mediante
una comparación entre dos cepas de Helicobacter pylori , que causa úlceras gástricas
y otras enfermedades del tracto digestivo humano. Las dos cepas se aislaron en el
Reino Unido y EE. UU. Y tienen genomas de 1,67 Mb y 1,64 Mb, respectivamente. El
genoma más grande contiene 1552 genes y el más pequeño 1495 genes, 1406 de estos
genes están presentes en ambas cepas. En otras palabras, entre el 6 y el 7% del
contenido genético de cada cepa es exclusivo de esa cepa ( Alm et al.,
1999 ). Una distinción mucho más extremo entre las cepas fue revelado cuando la
secuencia de la cepa de laboratorio común de E . coli , K12, se comparó con la de una
de las cepas más patógenas, O157: H7 ( Perna et al. , 2001 ). Las longitudes de los dos
genomas son significativamente diferentes (4.64 Mb para K12 y 5.53 Mb para O157: H7)
con el ADN extra en la cepa patógena dispersa alrededor del genoma en casi 200
posiciones separadas. Estas 'islas O' contienen 1387 genes no presentes en E. coliK12,
muchos de estos genes codifican toxinas y otras proteínas que están claramente
involucradas en las propiedades patogénicas de O157: H7. Pero no se trata
simplemente de un caso de O157: H7 que contiene genes adicionales que lo hacen
patógeno. K12 también tiene 234 segmentos de su propio ADN único, y aunque estas
' islas K ' son, en promedio, más pequeñas que las islas O, todavía contienen 528 genes
que están ausentes de O157: H7. Por lo tanto, la situación es que E. coli O157: H7 y E.
coliK12 tiene cada uno un conjunto de genes específicos de la cepa, que constituyen el
26% y el 12% de los catálogos de genes, respectivamente. Esto es sustancialmente
más variación de lo que puede ser tolerado por el concepto de especie aplicado a
organismos superiores, y es difícil de conciliar con cualquier definición de especie aún
desarrollada para microorganismos.
Las dificultades se vuelven aún más agudas cuando se examinan otros genomas
bacterianos y arqueológicos. Debido a la facilidad con que los genes pueden fluir entre
las diferentes especies procariotas ( Cuadro 2.3 ), se anticipó que ocasionalmente se
encontrarían los mismos genes en diferentes especies, pero la extensión de la
transferencia lateral de genes revelada por la secuencia ha tomado a todos por sorpresa
( Ochman et al. , 2000 ). La mayoría de los genomas contienen unos pocos cientos
de kb de ADN adquiridos directamente de una especie diferente, y en algunos casos la
cifra es mayor: 12,8% de la E . El genoma de coli K12, correspondiente a 0,59 Mb , se
ha obtenido de esta manera (Figura 2.22 ). Una segunda sorpresa es que se ha
producido una transferencia entre especies muy diferentes, incluso entre bacterias y
arqueas. Por ejemplo, la bacteria termofílica Thermatoga maritima tiene 1877 genes,
451 de los cuales parecen haber sido obtenidos de arqueones ( Nelson et al. , 1999 ). La
transferencia en la otra dirección, de bacterias a arqueas, es igualmente frecuente. La
imagen que está surgiendo es una en la que los procariotas que viven en nichos
ecológicos similares intercambian genes entre sí para aumentar su aptitud individual
para la supervivencia en su entorno particular. Muchos de los Thermatoga Los genes
que se han obtenido de los arqueones probablemente han ayudado a esta bacteria a
adquirir su capacidad de tolerar altas temperaturas.
La transferencia lateral de genes ha desempeñado claramente un papel importante en
la evolución de los procariotas. A diferencia de los organismos superiores, las historias
evolutivas de bacterias y arqueas no pueden describirse como un patrón de ramificación
simple, sino que tienen que incorporar el flujo horizontal de genes entre especies
( Figura 2.23 ). Además de su impacto en nuestra comprensión de la evolución, la
transferencia lateral de genes también tiene implicaciones para la forma en que las
relaciones evolutivas son inferidas por la filogenética molecular ( Capítulo 16) Con
organismos superiores, las comparaciones entre las secuencias de genes equivalentes
en diferentes especies pueden usarse para reconstruir las relaciones evolutivas entre
esas especies. Este tipo de análisis asume que la evolución ha seguido el patrón de
ramificación simple ilustrado en la Figura 2.23A y, por lo tanto, no puede usarse para
inferir relaciones entre procariotas si existe la posibilidad de que los genes que se
analizan se hayan transferido lateralmente entre cualquiera de las especies siendo
estudiado. Pero el análisis se utilizó durante muchos años antes de que se reconociera
el alcance de la transferencia lateral de genes y los microbiólogos ahora se enfrentan a
la necesidad de reevaluar la validez de los esquemas evolutivos que se establecieron
en la era previa al genoma ( Doolittle, 1999 ).
Especulación sobre el contenido mínimo del genoma y la identidad de genes
distintivos
Aunque ahora se han publicado varias secuencias del genoma procariotas, todavía no
es posible describir un catálogo completo del contenido de genes de ninguna especie,
por la sencilla razón de que se desconocen las funciones de muchos de los genes. Más
de 1500 de la E . Los genes coli K12, por ejemplo, aún no tienen asignada una
función. A pesar de lo incompleto de la información, aún es interesante examinar el
papel de los genes cuyas funciones se conocen y apreciar la cantidad de genes
diferentes involucrados en cada una de las diversas actividades bioquímicas que una
bacteria como E. coli es capaz de realizar ( Tabla 2.10 ).
Los catálogos de genes son aún más interesantes cuando se hacen comparaciones
entre diferentes especies. Vemos, por ejemplo, que mientras que 243 de los genes
identificados en la E . el genoma de coli está involucrado en el metabolismo
energético, Haemophilus influenzae tiene solo 112 genes en esta categoría
y Mycoplasma genitaliumsolo 31. Estas comparaciones han llevado a especular sobre
el menor número de genes necesarios para especificar una célula de vida libre. Las
consideraciones teóricas inicialmente llevaron a sugerir que 256 genes son los mínimos
requeridos ( Mushegian y Koonin, 1996 ), pero los experimentos en los que se ha
mutado un número creciente de genes de Mycoplasma sugieren que se necesitan 265-
350 ( Hutchisonet al. , 1999 ). Ha habido un interés similar en la búsqueda de genes
'distintivos', que distinguen una especie de otra. De los 470 genes en el M . El genoma
del genital350 también está presente en la bacteria Bacillus subtilis relacionada de
forma distante( Doolittle, 1997 ), lo que sugiere que las características bioquímicas y
estructurales que distinguen a un Mycoplasma de un Bacillus están codificadas en los
120 genes que son exclusivos del primero. Desafortunadamente, las identidades de
estos supuestos genes distintivos no proporcionan pistas obvias sobre lo que hace que
una bacteria sea un micoplasma en lugar de otra cosa.

2.4. El contenido repetitivo de ADN de los genomas


El ADN repetitivo es el único aspecto de la estructura del genoma que no hemos
examinado en detalle. La Figura 2.2(página 34) nos mostró que el ADN repetitivo se
encuentra en todos los organismos y que en algunos, incluidos los humanos, constituye
una fracción sustancial de todo el genoma. Existen varios tipos de ADN repetitivo, y se
han diseñado varios sistemas de clasificación. El esquema que usaremos comienza
dividiendo las repeticiones en aquellas que se agrupan en matrices en tándem y las que
están dispersas alrededor del genoma.

2.4.1 ADN repetido en tándem


El ADN repetido en tándem es una característica común de los genomas eucariotas,
pero se encuentra con mucha menos frecuencia en los procariotas. Este tipo de
repetición también se denomina ADN satélite porque los fragmentos de ADN que
contienen secuencias repetidas en tándem forman bandas 'satélite' cuando el ADN
genómico se fracciona por centrifugación en gradiente de densidad (véase la Nota
técnica 2.2 ). Por ejemplo, cuando se divide en fragmentos de 50–100 kb de longitud, el
ADN humano forma una banda principal (densidad de flotabilidad 1.701 g cm -3 ) y tres
bandas satélite (1.687, 1.693 y 1.697 g cm -3) La banda principal contiene fragmentos
de ADN compuestos principalmente por secuencias de copia única con composiciones
de GC cercanas al 40,3%, el valor promedio para el genoma humano. Las bandas
satélite contienen fragmentos de ADN repetitivo y, por lo tanto, tienen contenidos de GC
y densidades flotantes que son atípicas del genoma en su conjunto ( Figura 2.24 ).
El ADN satélite se encuentra en los centrómeros y en otras partes de los
cromosomas eucariotas.
Las bandas de satélite en gradientes de densidad de ADN eucariota están formadas por
fragmentos compuestos de largas series de repeticiones en tándem, posiblemente de
cientos de kb de longitud. Un genoma único puede contener varios tipos diferentes de
ADN satélite, cada uno con una unidad de repetición diferente, siendo estas unidades
desde <5 hasta> 200 pb . Las tres bandas satélite en el ADN humano incluyen al menos
cuatro tipos de repetición diferentes.
Ya hemos encontrado un tipo de ADN satélite humano , las repeticiones de ADN alfoide
que se encuentran en las regiones centroméricas de los cromosomas (ver página
38). Aunque parte del ADN satélite está disperso alrededor del genoma, la mayoría se
encuentra en los centrómeros, donde puede desempeñar un papel estructural,
posiblemente como sitios de unión para una o más de las proteínas centroméricas
especiales (ver página 39). Alternativamente, el contenido repetitivo de ADN del
centrómero podría ser un reflejo del hecho de que esta es la última región del
cromosoma que se replica. Para retrasar su replicación hasta el final del ciclo celular, el
ADN del centrómero debe carecer de secuencias que puedan actuar como orígenes de
la replicación. La naturaleza repetitiva del ADN centromérico puede ser un medio para
garantizar que tales orígenes estén ausentes ( Csink y Henikoff, 1998)

Minisatélites y microsatélites
Aunque no aparece en bandas de satélite en gradientes de densidad, otros dos tipos
de ADN repetido en tándem también se clasifican como ADN 'satélite'. Estos
son minisatélites y microsatélites . Los minisatélites forman grupos de hasta 20 kb de
longitud, con unidades repetidas de hasta 25 pb ; Los grupos de microsatélites son más
cortos, generalmente <150 pb, y la unidad de repetición suele ser de 13 pb o menos.
El ADN minisatélite es un segundo tipo de ADN repetitivo con el que ya estamos
familiarizados debido a su asociación con las características estructurales de los
cromosomas. El ADN telomérico, que en humanos comprende cientos de copias del
motivo 5′-TTAGGG-3 '(ver Figura 2.10 ), es un ejemplo de un minisatélite. Sabemos una
cierta cantidad sobre cómo se forma el ADN telomérico, y sabemos que tiene una
función importante en la replicación del ADN ( Sección 13.2.4 ). Además de los
minisatélites teloméricos, algunos genomas eucariotas contienen varios otros grupos de
ADN minisatélite, muchos, aunque no todos, cerca de los extremos de los
cromosomas. No se han identificado las funciones de estas otras secuencias de
minisatélites.
La función de los microsatélites es igualmente misteriosa. El microsatélite típico consiste
en una unidad de 1, 2, 3 o 4 pb repetida 10-20 veces, como lo ilustran los microsatélites
en el locus del receptor de células T β humanas ( Sección 1.2.1 ). Aunque cada
microsatélite es relativamente corto, hay muchos de ellos en el genoma (ver Tabla
1.3 ). En humanos, por ejemplo, los microsatélites con una repetición CA, como:

constituyen el 0.25% del genoma, 8 Mb en total. Las repeticiones de un solo par de


bases, como:

constituyen otro 0.15%.


Aunque su función, si la hay, es desconocida, los microsatélites han demostrado ser
muy útiles para los genetistas. Muchos microsatélites son variables, lo que significa que
el número de unidades repetidas en la matriz es diferente en los diferentes miembros
de una especie. Esto se debe a que el "deslizamiento" a veces ocurre cuando se copia
un microsatélite durante la replicación del ADN , lo que lleva a la inserción o, con menos
frecuencia, a la eliminación de una o más de las unidades repetidas (ver Figura
14.5 ). No hay dos humanos vivos hoy que tengan exactamente la misma combinación
de variantes de longitud de microsatélites: si se examinan suficientes microsatélites,
entonces se puede establecer un perfil genético único para cada persona. Las únicas
excepciones son gemelos genéticamente idénticos. El perfil genético es bien conocido
como una herramienta en la ciencia forense (Figura 2.25 ), pero la identificación de
delincuentes es una aplicación bastante trivial de la variabilidad de microsatélites. Una
metodología más sofisticada hace uso del hecho de que el perfil genético de una
persona se hereda en parte de la madre y en parte del padre. Esto significa que los
microsatélites se pueden utilizar para establecer relaciones de parentesco y afinidades
de población, no solo para los humanos sino también para otros animales y para las
plantas.

2.4.2 Repeticiones intercaladas de todo el genoma


Se cree que las secuencias de ADN repetidas en tándem han surgido por la expansión
de una secuencia progenitora, ya sea por deslizamiento de replicación, como se
describe para microsatélites, o por procesos de recombinación de ADN ( Sección
14.3 ). Es probable que ambos eventos den como resultado una serie de repeticiones
vinculadas, en lugar de unidades de repetición individuales dispersas por el
genoma. Por lo tanto, las repeticiones intercaladas deben haber surgido por un
mecanismo diferente, uno que puede dar como resultado una copia de una unidad de
repetición que aparece en el genoma en una posición distante de la ubicación de la
secuencia original. La forma más frecuente en que esto ocurre es por transposición , y
la mayoría de las repeticiones intercaladas tienen actividad de transposición inherente.

Transposición a través de un intermedio de ARN


La mecánica precisa de la transposición no debe preocuparnos hasta que abordemos
la recombinación y los reordenamientos relacionados con el genoma en la Sección
14.3 . Todo lo que necesitamos saber en este momento es que hay dos modos
alternativos de transposición, uno que involucra un intermediario de ARN y otro que
no. La versión que involucra un ARN intermedio se llama retrotransposición . El
mecanismo básico implica tres pasos ( Figura 2.26 ):
1) Una copia de ARN del transposón se sintetiza mediante el proceso normal de
transcripción.
2) La transcripción del ARN se copia en el ADN , que inicialmente existe como una
molécula independiente fuera del genoma. Esta conversión de ARN a ADN, el reverso
del proceso de transcripción normal, requiere una enzima especial
llamada transcriptasa inversa . A menudo, la transcriptasa inversa está codificada por
un gen dentro del transposón y se traduce de la copia de ARN sintetizada en el paso
1.
3) La copia de ADN del transposón se integra en el genoma, posiblemente
nuevamente en el mismo cromosoma ocupado por la unidad original, o posiblemente
en un cromosoma diferente. El resultado final es que ahora hay dos copias del
transposón, en diferentes puntos del genoma.
Los transposones o retroelementos de ARN son características de los genomas
eucariotas, pero hasta ahora no se han descubierto en procariotas. Han llamado mucho
la atención porque existen claras similitudes entre algunos tipos de retroelementos y los
virus de vida libre llamados retrovirus , que incluyen formas benignas y también tipos
virulentos, como los virus de inmunodeficiencia humana que causan el SIDA . Estas
relaciones estructurales se ilustran en la figura 2.27 y se pueden resumir de la siguiente
manera:
 Los retrovirus son virus cuyos genomas están hechos de ARN y tienen la
organización genética que se muestra en la Figura 2.27A . Infectan muchos tipos
de vertebrados. Una vez dentro de una célula, el genoma de ARN se copia en
el ADN mediante la transcriptasa inversa especificada por el gen pol viral , y la
copia de ADN se integra en el genoma del huésped. Se pueden producir nuevos
virus copiando el ADN integrado en el ARN y empaquetándolo en proteínas de
la cubierta del virus, este último codificado por los genes env en el genoma del
virus.
 Los retrovirus endógenos (ERV) son genomas retrovirales integrados en los
cromosomas de vertebrados. Algunos todavía están activos y podrían, en algún
momento de la vida de una célula, la síntesis directa de virus exógenos, pero la
mayoría son reliquias en descomposición que ya no tienen la capacidad de
formar virus ( Patience et al. , 1997 ). Estas secuencias inactivas son
repeticiones de todo el genoma pero no son capaces de proliferación adicional.
 Los retrotransposones tienen secuencias similares a los ERV pero son
características de genomas eucariotas no vertebrados (es decir, plantas,
hongos, invertebrados y eucariotas microbianos) en lugar de vertebrados. Los
retrotransposones tienen números de copias muy altos en algunos genomas,
con muchos tipos diferentes presentes. La mayoría de las repeticiones de todo
el genoma en el maíz son retrotransposones y en esta planta estos elementos
probablemente constituyen casi la mitad del genoma (ver Figura 2.2 ). Hay dos
tipos de retrotransposones: la familia Ty3 / gypsy ( Ty3 y gypsy son ejemplos de
esta clase en levadura y mosca de la fruta, respectivamente), cuyos miembros
poseen el mismo conjunto de genes que un ERV , y Ty1 / copiafamilia, cuyos
miembros carecen del gen env ( Figura 2.27B ). Ambos tipos pueden
transponerse (mediante el mecanismo representado en la Figura 2.26 ) pero la
ausencia del gen env significa que el grupo Ty1 / copia no puede formar
partículas de virus infecciosos. De hecho, a pesar de la presencia de env en
el genoma Ty3 / gypsy, solo recientemente se ha reconocido que algunos de
estos elementos pueden formar virus y, por lo tanto, deben considerarse como
retrovirus no vertebrados ( Song et al. , 1994 ; Peterson- Burch et al. ,
2000) Aunque técnicamente son elementos intercalados, los retrotransposones
a veces se encuentran en grupos en una secuencia del genoma como resultado
de la presencia de sitios de integración preferidos para elementos de
transposición.
Los tres tipos de retroelemento descritos hasta ahora son elementos LTR , ya que tienen
repeticiones terminales largas en cada extremo que juegan un papel en el proceso de
transposición (ver Figura 2.27 ). Otros retroelementos no tienen LTR. Estos se
llaman retroposones y en los mamíferos se incluyen los siguientes:
 Los LINE ( elementos nucleares largos intercalados ) contienen un gen
similar a la transcriptasa inversa probablemente involucrado en el proceso de
retrotransposición ( Figura 2.27C ). Un ejemplo es el elemento humano LINE-1 ,
que tiene 6,1 kb y tiene un número de copias de 516 000 en el genoma humano
(ver Tabla 1.2).
 Los SINE ( elementos nucleares cortos intercalados ) no tienen un gen de
transcriptasa inversa, pero aún pueden transponerse, probablemente 'tomando
prestadas' enzimas de transcriptasa inversa que han sido sintetizadas por otros
retroelementos ( Figura 2.27D ). El SINE más común en el genoma humano
es Alu , que tiene un número de copias de más de 1 millón ( Tabla
1.2 ). Alu parece derivarse del gen para el ARN 7SL , un ARN no codificante
involucrado en el movimiento de proteínas alrededor de la célula. El primer
elemento Alu puede haber surgido por la transcripción inversa accidental de una
molécula de ARN 7SL y la integración del ADNcopiar en el genoma
humano. Algunos elementos Alu se copian activamente en el ARN, lo que brinda
la oportunidad de proliferar el elemento.

Transposones de ADN
No todos los transposones requieren un ARN intermedio. Muchos pueden transponer
de una manera más directa de ADN a ADN. Con estos elementos, conocemos dos
mecanismos de transposición distintos ( Figura 2.28 ), uno que involucra la interacción
directa entre el transposón donante y el sitio objetivo, lo que resulta en la copia del
elemento donante ( transposición replicativa ), y el segundo involucra la escisión del
elemento y reintegración en un nuevo sitio ( transposición conservadora ). Ambos
mecanismos requieren enzimas que generalmente están codificadas por genes dentro
del transposón. Los eventos moleculares que ocurren durante estos dos tipos de
transposición se describen en la Sección 14.3.3 .
En los eucariotas, los transposones de ADN son menos comunes que los
retrotransposones (ver Tabla 1.2 ), pero tienen un lugar especial en la genética porque
una familia de transposones de ADN de plantas, los elementos Ac / Dsdel maíz, fueron
los primeros elementos transponibles en ser descubiertos por Barbara McClintock en la
década de 1950. Sus conclusiones, que algunos genes son móviles y pueden moverse
de una posición a otra en un cromosoma, se basaron en experimentos genéticos
exquisitos, la base molecular de la transposición no se entendió hasta finales de los
años setenta.
Los transposones de ADN son un componente mucho más importante de las anatomías
del genoma procariota que los transposones de ARN . Las secuencias de inserción, IS1
y IS186, presentes en el 50- kb segmento de E . El ADN de coli que examinamos en
la Sección 2.1.2 (ver Figura 2.2 ), son ejemplos de transposones de ADN, y un
solo genoma de E. coli puede contener hasta 20 de estos de varios tipos. La mayor
parte de la secuencia de un IS está ocupada por uno o dos genes que especifican
la enzima transposasa que cataliza su transposición ( Figura 2.29A) Los elementos IS
pueden transponerse de forma replicativa o conservadora. Otros tipos
de transposones de ADN conocidos en E. coli , y bastante típicos de los procariotas en
general, son los siguientes:
 Los transposones compuestos son básicamente un par de elementos IS que
flanquean un segmento de ADN , que generalmente contiene uno o más genes,
a menudo los que codifican la resistencia a los antibióticos ( Figura 2.29B ). La
transposición de un transposón compuesto es catalizada por la transposasa
codificada por uno o ambos elementos IS. Los transposones compuestos usan
el mecanismo conservador de transposición.
 Los transposones de tipo Tn3 tienen su propio gen de transposasa y, por lo tanto,
no requieren elementos ISflanqueantes para transponer ( Figura 2.29C ). Los
elementos Tn3 se transponen replicativamente.
 Los fagos transponibles son virus bacterianos que se transponen
replicativamente como parte de su ciclo normal de infección ( Figura 2.29D ).

También podría gustarte