++
Determinar la secuencia nucleotídica de todo el DNA de un genoma es una tarea colosal. Durante las décadas de 1980 y 1990, la tecnología que acompañó este esfuerzo mejoró de forma gradual conforme los investigadores desarrollaron nuevos vectores para clonar grandes segmentos de DNA y procedimientos cada vez más automatizados para determinar las secuencias de nucleótidos de estos grandes fragmentos (sección 18.14). La primera secuencia completa de un organismo procariota se notificó en 1995 y un año después la de un organismo eucariota, la levadura S. cerevisiae. Unos pocos años después (mientras la comunidad científica aguardaba los resultados del proyecto del genoma humano), se publicaron las secuencias genómicas de numerosos organismos procariotas y eucariotas (incluidos la mosca de la fruta, un nematodo y un angiosperma). Los investigadores pudieron determinar la secuencia de estos genomas con relativa rapidez porque son mucho más pequeños que el del humano, el cual contiene alrededor de 3 200 millones de pares de bases. Para poner este número en perspectiva, considérese que si cada par de bases del DNA fuera equivalente a una sola letra de esta página, la información contenida en el genoma humano se extendería en un libro de alrededor de un millón de páginas.
++
En el año 2001 se había publicado ya un primer informe provisional de la secuencia nucleotídica de todo el genoma humano. La secuencia se describió como una “aproximación” porque cada segmento se secuenció un promedio de cuatro veces, lo cual no es suficiente para lograr una precisión absoluta y muchas regiones que resultaron difíciles de secuenciar se excluyeron. Los primeros intentos para describir la secuencia genómica, es decir, interpretar la secuencia en términos de la cantidad y el tipo de genes que codificaba, llevó a una sorprendente observación en relación con el número de genes. Los investigadores concluyeron que el genoma humano contenía tal vez unos 30 000 genes codificadores de proteínas. Hasta que se determinó su secuencia completa, se supuso que el genoma humano contenía quizá entre 50 000 y 150 000 genes diferentes.
++
La versión “terminada” de la secuencia del genoma humano se publicó en 2004, lo cual significó que (1) cada sitio se había secuenciado de siete a diez veces para asegurar un alto grado de exactitud (de al menos 99.99%) y (2) que la secuencia contenía un número mínimo de huecos. Los espacios no secuenciados que persistieron contienen regiones de los cromosomas (a menudo referidas como “materia oscura”) formadas en primera instancia por largos fragmentos de DNA muy repetitivo, localizados sobre todo alrededor de los centrómeros de cada cromosoma. A pesar de los exhaustivos esfuerzos, estas regiones han sido imposibles de clonar o sus secuencias no se han podido ordenar de manera correcta con la tecnología actual.
++
Pese a este notable logro en la secuenciación de nucleótidos, todavía se desconoce el número real de genes codificadores de proteínas en el genoma humano. La identificación de genes mediante diversos programas computacionales (algoritmos) está plagada de dificultades y, en realidad, la estimación previa de 30 000 genes humanos codificadores de proteínas sigue disminuyendo de manera continua, conforme siguen las investigaciones. ¡Aunque para la mayoría de los biólogos ha resultado una sorpresa, las estimaciones actuales colocan la cifra en alrededor de 21 000! Esto significa que en los humanos existe un número igual (aproximado) de genes codificadores de proteínas que en un gusano microscópico, cuyo cuerpo en su totalidad (incluyendo el sistema nervioso y el resto de las estructuras) está formado por unas 1 000 células (fig. 10.27).4
++
++
Es evidente a partir de estos datos que es imposible, como alguna vez se pensó, comprender la naturaleza de un organismo disponiendo sólo de una lista de los genes que componen su genoma. Si las diferencias en la complejidad de los organismos no pueden justificarse por el número de genes codificadores de proteínas en su genoma, ¿cómo pueden explicarse? En realidad no existe una respuesta adecuada a esa pregunta, pero pueden listarse algunas posibilidades a considerar.
++
Como se describe en el capítulo 12, un solo gen puede codificar varias proteínas relacionadas como resultado de un proceso llamado corte y empalme alternativos (alternative splicing) (sección 12.5). Varios estudios recientes sugieren que más de 90% de los genes humanos podría experimentar corte y empalme alternativos, de manera que el número real de proteínas codificadas por el genoma humano es al menos varias veces mayor que el número de genes que contiene. Es probable que surjan mayores diferencias entre los organismos cuando se exploren mejor estos y otros mecanismos “intensificadores de genes”. Esta expectativa es consistente con las observaciones de que los genes de los vertebrados tienden a ser más complejos (o sea, tienen más exones) que los de moscas y gusanos, y tienen mayor incidencia de corte y empalme alternativos.
Los biólogos moleculares dedicaron un esfuerzo enorme a estudiar los mecanismos que regulan la expresión génica. A pesar de ello, la comprensión de estos procesos es muy limitada. Por ejemplo, se aprendió que una gran parte del genoma se transcribe a un conjunto desconcertante de moléculas de RNA, de las cuales se sabe muy poco sobre su actividad. Cada vez se fortalece más la idea de que muchos de estos RNA tienen una función de regulación génica. También hay evidencia creciente de que el número y la diversidad de estos RNA no codificadores pueden relacionarse con el nivel de complejidad de diferentes organismos. Por ejemplo, en un estudio reciente los investigadores buscaron identificar el número de microRNA producidos por varios organismos. Como se explica en el siguiente capítulo, los microRNA son unos de los ácidos ribonucleicos reguladores mejor estudiados. Se encontró que las esponjas expresan casi 10 microRNA distintos y las anémonas marinas alrededor de 40. Esto se compara con los casi 150 identificados en gusanos y moscas de la fruta y con los al menos 1 000 descubiertos en los seres humanos. Esto no implica que la cantidad de microRNA sea el principal determinante de la complejidad morfológica, sino que sugiere que falta mucho por aprender sobre la regulación génica antes de comprender las bases de la diversidad biológica.
En los últimos 10 años ha surgido una nueva área de estudio biológico (llamada biología de sistemas) que se enfoca en la manera en que las proteínas trabajan juntas como redes complejas, en lugar de como actores individuales. En la figura 2.41 se presenta un ejemplo muy sencillo de una red proteínica. Como las células producen miles de proteínas distintas, con grados variables de interacción, estas redes pueden volverse muy complejas y dinámicas. Un aumento relativamente pequeño en el número de elementos que conforman una red, o un incremento en el tamaño y la diversidad de dichas moléculas, podría aumentar mucho la complejidad de la red y por lo tanto, del organismo entero.
++
Podrían agregarse muchos otros factores a esta discusión, pero el punto general está claro: la diferencia aparente entre la complejidad de distintos grupos de organismos multicelulares depende menos de la información genética que contiene el genoma que de la forma en que ésta se usa.
+++
Genómica comparativa: “si se conserva, debe ser importante”
++
Considérense los hechos siguientes: (1) la mayor parte del genoma consiste en DNA que reside entre los genes y por lo tanto, representa al DNA intergénico y (2) cada uno de los cerca de 21 000 genes humanos codificadores de proteínas consiste sobre todo en porciones no codificadoras (el DNA de los intrones). Tomados en conjunto, estos hechos indican que la porción del genoma que codifica proteínas representa un pequeño porcentaje (alrededor de 1.5%) del DNA total. La mayor parte del DNA intergénico y del intrónico del genoma no contribuye a las capacidades de supervivencia y reproductivas de un individuo, de modo que no hay una presión selectiva que restrinja cambios en su secuencia. Como resultado, la mayoría de las secuencias intergénicas y de los intrones tienden a cambiar con rapidez a medida que los organismos evolucionan. En otras palabras, estas secuencias no tienden a conservarse. Sin embargo, aquellos segmentos del genoma que codifican secuencias proteínicas o que contienen secuencias reguladoras que controlan la expresión génica (fig. 12.45) están sometidos a la selección natural. Ésta tiende a eliminar a los individuos cuyo genoma contiene mutaciones en estos elementos funcionales.5 Como resultado, tales secuencias tienden a conservarse. Con base en estas aseveraciones puede concluirse que la mejor manera de identificar secuencias funcionales consiste en comparar los genomas de diferentes tipos de organismos.
++
A pesar del hecho de que los seres humanos y los ratones no comparten un ancestro común desde hace casi 75 millones de años, las dos especies tienen genes similares, los cuales tienden a agruparse con un patrón muy parecido. Por ejemplo, el número y el orden de los genes de la globina humana que se muestran en la figura 10.23 son en esencia similares a los del genoma del ratón. Como resultado, es una tarea muy simple alinear las regiones correspondientes de los genomas de estos dos organismos. Por ejemplo, el cromosoma humano número 12 tiene una serie de segmentos en los cuales cada porción corresponde, de manera regular, a un bloque de DNA de un cromosoma de ratón. El número del cromosoma de ratón que contiene cada bloque se indica como sigue.
++
++
Incluso una revisión rápida de este dibujo revela los cambios drásticos en la estructura cromosómica que ocurren conforme la evolución genera nuevas especies con el tiempo. Los bloques de genes que están presentes en el mismo cromosoma de una especie pueden separarse en una especie subsiguiente. Con el tiempo, el número de cromosomas puede aumentar o disminuir conforme éstos se separan o se fusionan. Una estimación sugiere que en las líneas murina y humana se han producido unos 180 fenómenos de separación y de fusión desde la época en que estos dos mamíferos (actuales) compartían un antepasado común. Tales cambios en las posiciones de los genes tienen, por sí mismos, un efecto muy pequeño en los fenotipos de los organismos, pero dejan huellas visuales claras del proceso evolutivo.
++
Cuando segmentos homólogos de los genomas humano y de ratón se alinean con base en sus secuencias de nucleótidos, se observa que cerca de 5% de las secuencias de DNA está muy conservado entre ambas especies. Este es un porcentaje mucho más alto del que se esperaría al combinar las regiones codificadoras de proteínas y las regiones reguladoras de genes (juntas representan cerca de 2% del genoma). Si se acepta uno de los principios más importantes de la evolución molecular, que dice que “si algo se conserva, debe ser importante”, entonces puede interpretarse que estos estudios indican que partes del genoma que se presumía eran secuencias no codificantes ni reguladoras “inútiles”, tienen en realidad una función importante, pero no definida aún. Es indudable que algunas de estas regiones codifican moléculas de RNA con diversas funciones reguladoras (que se revisan en la sección 11.5). Es probable que otras tengan “funciones cromosómicas” en vez de “actividades genéticas”. Por ejemplo, dichas secuencias conservadas podrían ser importantes para la formación de pares de cromosomas previa a la división celular. Cualquiera que sea su función, estos elementos genómicos a menudo se localizan a gran distancia del gen más cercano e incluyen algunas de las secuencias más conservadas que se hayan descubierto, lo que muestra la identidad virtual entre los genomas de los humanos, las ratas y los ratones.
++
Al comparar segmentos de los genomas de dos especies relacionadas de manera distante, como el humano y el ratón, es posible identificar regiones muy conservadas durante decenas de millones de años. Sin embargo, este método no es capaz de reconocer las secuencias funcionales del genoma humano que tienen un origen evolutivo más cercano. Por ejemplo, lo anterior puede incluir a genes presentes en el hombre y ausentes en el ratón o a regiones reguladoras que han variado su secuencia durante el curso evolutivo de los primates para permitir que se unan a nuevas proteínas reguladoras. Se ha iniciado un esfuerzo concertado (llamado Proyecto ENCODE) para identificar todos los elementos funcionales presentes en el genoma humano. Por desgracia, se carece del conocimiento necesario para reconocer muchos de estos componentes, lo que dificulta la tarea. Un punto se ha esclarecido a partir de estudios recientes: un porcentaje significativo de las secuencias de DNA funcionales está en evolución constante, por lo que no se conserva mucho. En otras palabras, si se limita la búsqueda a las secuencias muy conservadas, se corre el riesgo de pasar por alto muchos de los elementos más importantes del genoma.
+++
Bases genéticas del “ser humano”
++
Al enfocarse en las secuencias conservadas, se tiende a aprender sobre las características que el hombre comparte con otros organismos. Si se desea comprender mejor la evolución biológica única del ser humano, es necesario ver más de cerca aquellas partes del genoma que lo distinguen de otras especies. El chimpancé es el pariente vivo más cercano del hombre, pues compartimos un ancestro común que vivió en una época tan reciente como hace apenas cinco a siete millones de años. Se pensó que un análisis detallado de las diferencias que existen entre las secuencias de DNA y la organización génica de ambas especies podría proporcionar gran información acerca de las bases genéticas de características surgidas en forma reciente que hacen único al ser humano, como la marcha erguida, el uso avanzado de herramientas y el lenguaje. Estos últimos rasgos se han rastreado hasta el cerebro humano, que tiene un volumen aproximado de 1 300 cm3 (unas cuatro veces el del cerebro del chimpancé).
++
En 2005 se publicó una versión preliminar del genoma del chimpancé. En términos generales, los genomas de ambos difieren en casi 4% (lo cual significa decenas de millones de cambios), un nivel de divergencia mucho mayor que el esperado con base en estudios no definitivos. Si bien parte de esta divergencia se debe a cambios de nucleótidos individuales entre los dos genomas, la mayor parte se atribuye a diferencias mayores, como deleciones y duplicaciones de segmentos (véase la nota a pie de la página 407).
++
Los investigadores han podido identificar cientos de genes en el linaje humano que evolucionan a un ritmo más rápido que la tasa neutra, al parecer en respuesta a la selección natural. Sin embargo, no está claro si alguno de éstos, en caso de que exista, contribuye a “hacernos humanos”. Algunos de los genes de evolución más rápida codifican proteínas implicadas en la regulación de la expresión génica (factores de transcripción). Estos son precisamente los tipos de genes que se esperaría que generaran mayores diferencias fenotípicas, porque pueden afectar la expresión de muchos otros genes. De hecho, se supone que las diferencias entre los factores de transcripción del chimpancé y el ser humano son la causa de las diferencias de expresión de las proteínas cerebrales que se presentan en la figura 2.48. Lo anterior puede ilustrarse mediante la exploración minuciosa del factor de transcripción FOXP2, que es específico del cerebro.
++
Una comparación de dicha proteína entre el hombre y el chimpancé señala dos diferencias de aminoácidos que han aparecido en la línea humana desde la separación a partir de su último antepasado común. Para valorar los efectos de las sustituciones mencionadas en la función de FOXP2 se hicieron modificaciones en neuronas humanas que no poseían su propio gen FOXP2 para que expresaran la proteína del chimpancé o del humano. Después se estudiaron las dos poblaciones neuronales en cultivo para valorar los efectos de las versiones alternas del factor de transcripción y se observó que hubo un incremento o un decremento significativo en la regulación de más de 100 genes “efectores” en neuronas que expresaban el gen humano FOXP2, en comparación con las que expresaban el factor de transcripción del chimpancé. Un aspecto interesante de este gen es que las personas con mutaciones en su secuencia presentan graves trastornos del habla y lenguaje, además de incapacidad para realizar los movimientos musculares finos de los labios y de la lengua que se necesitan para entablar la comunicación vocal. Ciertos cálculos sugieren que los cambios del “gen del habla” que lo diferencian de la versión propia del chimpancé quedaron “fijos” en el genoma humano en los últimos 120 000 a 200 000 años, fecha en que al parecer surgieron los seres humanos actuales (se dice que es fija una alteración de la secuencia de DNA si persiste en casi todos los miembros de la especie). Los datos anteriores sugieren que es posible que los cambios del gen FOXP2 hayan intervenido en gran medida en la evolución y el desarrollo del habla en humanos.
++
También se han descrito muchas otras diferencias entre las especies mencionadas, incluidas alteraciones en ciertos genes codificadores de RNA que parecen influir en el desarrollo cerebral. Uno de los genes de esta última categoría, llamado HAR1, tiene sólo 118 pares de nucleótidos, pero contiene 18 sustituciones de bases que lo distinguen de la región correspondiente en el genoma del chimpancé. Esta misma región está muy conservada entre otros vertebrados, por lo que es sólo durante la evolución de los seres humanos que ha experimentado efectos marcados de la selección natural (HAR significa en inglés Human Accelerated Region, región acelerada humana). Aunque se desconoce la función de dicho gen, el hecho de que se exprese sobre todo en el cerebro fetal en desarrollo lo convierte en un elemento de interés para los investigadores que intentan desentrañar la base genómica de la expansión cerebral humana.
++
Otro gen importante codifica la amilasa salival, una enzima que sirve para digerir el almidón. Los chimpancés tienen una dieta relativamente baja en almidón y tienen en su genoma una sola copia del gen que codifica la amilasa 1 (AMY1) (fig. 10.28a). Durante la evolución de los seres humanos, ha ocurrido una aparente selección para aumentar el número de copias del gen AMY1, lo que ha dado lugar a una mayor concentración de la enzima en la saliva humana. Podría predecirse que dicha acentuación en la concentración de amilasa se habría alcanzado durante la evolución por un incremento en la expresión del único gen AMY1 existente en el genoma, pero en este caso particular se debió a la duplicación génica. Como se observa en la figura 10.28b, y se explica en la sección siguiente, el número de copias del gen en cuestión es variable y tiende a ser mayor en las poblaciones humanas que ingieren más almidón en su dieta.
++
++
Uno de los planteamientos más interesantes en el área de la evolución humana es el de las posibles relaciones que existieron entre el hombre “moderno” (p. ej., Homo sapiens), y otras especies “humanas” (p. ej., miembros arcaicos del género Homo, extintos en la actualidad). Se piensa que los primeros humanos de la especie actual (anatómicamente modernos) evolucionaron al inicio en África hace unos 200 000 años. Sin embargo, el Homo sapiens no constituye el único miembro del género Homo que habitó la tierra en dicho periodo. Los neandertales (Homo neanderthalensis) vivieron en Europa hace unos 35 000 años, miles de años después de que llegaran los humanos modernos a dicho continente. Según se piensa, las dos especies compartieron algunas regiones del Oriente medio en el mismo periodo temprano. Dichos seres habitaron áreas similares y guardaban gran semejanza anatómica, razón por la cual los paleontólogos se han preguntado si: (1) las dos especies se aparearon entre sí o (2) los humanos modernos sustituyeron a los neandertales sin mezclarse de forma sexual. Para esclarecer tal duda se necesita información detallada sobre las diferencias en las secuencias de DNA entre los humanos modernos y los neandertales.
++
Algunos investigadores, desde finales del decenio de 1990, han creado técnicas cada vez más modernas para aislar y establecer secuencias de fragmentos de DNA mitocondrial (mtDNA, mitochondrial DNA) de fósiles de neandertales. En los fósiles es más fácil el análisis del mtDNA que del DNA nuclear, porque cada célula contiene muchas copias del primero y su tamaño es mucho menor. Los resultados de los estudios en cuestión sugirieron que la secuencia del mtDNA de neandertales era lo suficientemente diferente de la del humano moderno como para concluir que tal especie se extinguió sin contribuir con material genético al genoma mitocondrial del hombre actual. En otras palabras, las dos especies no se entrecruzaron y, además, no compartieron un antepasado común en al menos 300 000 años.
++
En 2010, Svante Pääbo y colaboradores, del Max Planck Institute de Alemania, ensamblaron una secuencia completa, en términos relativos, del genoma nuclear del neandertal. Concluyeron que el genoma de éste y el del humano moderno son 99.84% idénticos. Por ejemplo, los neandertales tuvieron el mismo alelo FOXP2 (que se expuso en párrafos anteriores) que los humanos modernos, lo que permitió deducir que también tenían capacidad de lenguaje verbal. Además, los datos de la comparación detallada de los genomas nucleares de dichas especies sugieren que, en promedio, de 1 a 4% del DNA de individuos europeos y asiáticos modernos proviene de los neandertales. Muchos de los genes derivados de esta última subespecie contribuyen al reconocimiento de patógenos por parte del sistema inmunitario. Poseer dichos genes quizá sirvió como un mecanismo de protección de los primeros humanos contra enfermedades a las que habían estado expuestos los Homo neanderthalensis. En cambio, los genomas de personas africanas no muestran signos de alguna contribución por parte de los neandertales, por lo cual se infiere que éstos y los humanos modernos se entrecruzaron en algún punto cronológico y topográfico después de que el Homo sapiens había salido de África y antes de que éste se dispersara en Europa y Asia. Otros señalamientos sugieren que algunos grupos de humanos modernos tuvieron antepasados antiguos que quizá se entrecruzaron con otras especies arcaicas además de los neandertales. Los datos en cuestión han preparado el terreno para especulaciones muy interesantes en cuanto al árbol filogenético del hombre. Según datos de algunos investigadores que conciben que un número de especies humanas compartieron el planeta en los últimos 100 000 años o más, la población actual podría describirse como la de los “últimos humanos que sobrevivieron”.
++
Esta sección se ha enfocado en las diferencias genómicas existentes entre los seres humanos y otros mamíferos, puesto que éste es el tema del presente capítulo. Tal vez resulte evidente, por la naturaleza limitada de esta explicación, que los investigadores todavía no progresan mucho en la identificación de las bases genéticas de lo que hace al humano serlo. Muchos investigadores piensan que gran parte de la atención en este campo se ha orientado a modificaciones en las secuencias que codifican proteínas. En cambio, ellos plantean que los cambios en la regulación de la expresión génica han intervenido de manera decisiva en la evolución humana, pero es difícil precisar cuáles de ellos tuvo una importancia real.
+++
Variación genética dentro de la población humana
++
No hay en el mundo dos personas exactamente iguales, porque no existen dos individuos, aparte los gemelos idénticos, que tengan la misma información genética. El genoma humano que se secuenció en el “Proyecto Genoma Humano” original, provenía en su mayor parte de un solo varón. Desde que se completó la secuencia, se ha puesto mucha atención al modo en que ésta varía en la población humana. Los polimorfismos genéticos son sitios en el genoma que cambian de un individuo a otro. Dicho término suele referirse a una variante génica que se presenta en cuando menos 1% de la población de una especie. El concepto de polimorfismo genético comenzó con el descubrimiento, hecho en 1900 por el médico austriaco Karl Landsteiner, de que las personas podrían tener cuando menos tres tipos sanguíneos alternos, A, B u O. Como se expone en la página 130, el tipo de sangre es determinado por diferentes alelos de un gen que codifica una enzima que transfiere azúcar. Ahora que se conoce la secuencia genómica humana, es posible buscar nuevos tipos de variación genética que en la “era pregenómica” nunca hubieran podido revelarse.
+++
Variación de la secuencia de DNA
++
El tipo más común de variabilidad genética en seres humanos se presenta en sitios del genoma en los que ocurren conmutaciones de nucleótidos individuales entre los miembros de la población. Estos sitios se denominan polimorfismos de nucleótidos individuales (SNP, single nucleotide polymorphisms). La vasta mayoría de los SNP (conocidos como “snips”) existen como dos alelos alternos, por ejemplo, A o G. Se piensa que la mayor parte de estos polimorfismos surgió por una sola mutación durante el transcurso de la evolución humana y que éstos son compartidos por individuos con un ancestro común. Se han identificado los SNP que ocurren con mayor frecuencia mediante la comparación de secuencias de DNA de los genomas de cientos de individuos diferentes de diversas poblaciones étnicas. En promedio, dos genomas humanos elegidos al azar tienen cerca de tres millones de diferencias en nucleótidos individuales, o un SNP cada mil pares de bases. Aunque esto podría parecer un número grande, significa que los seres humanos son 99.9% similares entre sí, en promedio, con respecto a la secuencia de nucleótidos, lo que tal vez sea mucho mayor que en gran parte de las especies de mamíferos. Esta similitud en las secuencias refleja el hecho de que al parecer la humana es una especie joven en términos evolutivos, y su tamaño de población prehistórica fue relativamente pequeño. De los casi 15 millones de SNP identificados en el genoma, se calcula que alrededor de 20 000 se encuentran dentro de las secuencias codificadoras y producen reemplazos de aminoácidos en la proteína producida. Esto corresponde a una sustitución por gen. Se considera que es esta magnitud de variación genética la principal causa de la variabilidad fenotípica observada en los seres humanos. En la sección “Perspectiva humana” de este capítulo, se trata el impacto de las variaciones de la secuencia del genoma en la práctica de la medicina.
+++
Variación estructural
++
Como se ilustra en la figura 10.29a, algunos segmentos de genoma pueden cambiar como resultado de duplicaciones, deleciones, inserciones, inversiones (cuando un fragmento de DNA se encuentra con orientación invertida) y otros fenómenos. Estos cambios casi siempre afectan segmentos de DNA cuya longitud oscila entre miles y millones de pares de bases. Por su gran tamaño, estos tipos de polimorfismos se denominan variantes estructurales, y apenas comienzan a comprenderse la magnitud y la importancia de su presencia.
++
++
Desde los primeros días del análisis microscópico de los cromosomas se sabe que aun entre las personas saludables, la estructura cromosómica varía. En la figura 10.29b se muestra un ejemplo de una inversión cromosómica común cuya existencia se conoce desde hace más de 30 años. Estudios recientes revelan que las variantes estructurales de tamaño intermedio (demasiado pequeñas para verse al microscopio y muy grandes para detectarse con facilidad mediante análisis de secuenciación ordinarios) son mucho más comunes de lo que se pensaba. Según una estimación, el típico genoma humano tiene cerca de 1 000 variantes estructurales cuya longitud oscila entre 500 y 1.3 millones de bases (Mb). Aunque estas cifras muestran diferencias extraordinarias, no hay duda de que la fracción del genoma (es decir, el número total de pares de bases) afectada por variación estructural es mayor que la alterada por SNP. Como consecuencia, la variación estructural posee un efecto notable en la diversidad fenotípica que se observa entre los humanos.
++
Variación en el número de copias Como se explica en la página 402, la técnica de identificación mediante perfiles de DNA depende de diferencias en la longitud de secuencias minisatélite, lo que a su vez depende del número de copias de la secuencia presente en sitios particulares de los cromosomas. Este es un ejemplo de una variación en el número de copias (CNV, copy number variation). Hallazgos recientes revelaron que CNV mucho más grandes (>1 000 bases) también son frecuentes en la población humana y que afectan a miles de regiones distintas del genoma, incluyendo una gran cantidad de genes que codifican proteínas. Estas CNV de gran tamaño son un tipo de variación estructural que se produce por una duplicación o una deleción de un segmento del DNA. Gracias a estas variaciones, muchas personas portan copias adicionales de uno o más genes que codifican proteínas fisiológicas importantes. Por lo general, las copias adicionales de genes se relacionan con la producción excesiva de una proteína, lo cual puede alterar el delicado equilibrio bioquímico que existe dentro de una célula. Por ejemplo, una cantidad considerable de personas que desarrollan enfermedad de Alzheimer de inicio temprano tienen copias adicionales del gen APP, que codifica la proteína que se considera causante de la enfermedad (pág. 68). El tema ha generado controversias, pero hay un consenso cada vez mayor entre los investigadores de que las personas con autismo o esquizofrenia tienen un número mayor de lo normal de CNV raros en su genoma. Algunos de los genes afectados por dichas variaciones participan en la formación de sinapsis y otros fenómenos neurológicos. En algunos casos, las copias adicionales de un gen pueden ser provechosas, como ocurre con la duplicación repetida del gen de la amilasa (AMY1), que se ha encontrado en ciertas poblaciones humanas que consumen abundante almidón en su dieta (fig. 10.28b). La figura 10.28b también muestra un excelente ejemplo de una CNV, debido a que indica el número de genes AMY1 en ambas copias de los cromosomas homólogos de una persona. Puede verse que un cromosoma contiene sólo cuatro réplicas del gen AMY1, mientras su homólogo posee 10.
++
PERSPECTIVA HUMANA Aplicación de los análisis genómicos a la medicina
En las décadas pasadas, cientos de genes se han identificado como causa de enfermedades hereditarias poco comunes. En casi todos los casos, el gen que provoca la enfermedad en estudio se identificó mediante ensayos genéticos de vinculación tradicionales. Tales análisis comienzan con la localización de varias familias cuyos integrantes presentan una gran frecuencia desproporcionada de alguna enfermedad particular. La dificultad inicial es determinar cuál es la región alterada del genoma que comparten todos los integrantes de la familia. Cuando se reconocen la región vinculada con el trastorno y el gen afectado, el DNA de este segmento se aísla y se obtiene el gen mutante. Este tipo de procedimiento genético es accesible para genes con una alta penetrancia, es decir, genes cuya forma mutante virtualmente garantiza que todos los individuos portadores desarrollarán la patología. Por ejemplo, el gen mutado en la enfermedad de Huntington (pág. 404) posee una penetrancia muy alta. Además, ningún otro defecto del genoma causa esta enfermedad. Se dice que los genes con gran penetrancia cumplen las leyes de herencia mendeliana, y se han identificado más de 3 000 de ellos.
La mayor parte de los padecimientos comunes que afectan a la especie humana (como el cáncer, las cardiopatías, la enfermedad de Alzheimer, la diabetes, el asma y la depresión) tiene un componente genético, el cual se dice que tiende a presentarse en las familias. Empero, a diferencia de las anomalías hereditarias (como la enfermedad de Huntington), no existe un solo gen ligado al padecimiento. En cambio, se sabe que numerosos genes se relacionan con el riesgo de padecer la enfermedad y cada uno de ellos realiza una pequeña contribución a la probabilidad general de desarrollar el trastorno. Además, factores no genéticos (p. ej., causas ambientales) modifican el desarrollo del trastorno. Así, la posibilidad de desarrollar diabetes se incrementa de manera notoria en sujetos que tienen aumento considerable de peso, o bien, el riesgo de desarrollar cáncer de pulmón se eleva con el tabaquismo. Uno de los objetivos de la comunidad médica dedicada a la investigación es identificar los genes que contribuyen al desarrollo de estas enfermedades comunes, pero complejas en términos genéticos.
Debido a su baja penetrancia, la mayor parte de los genes que incrementan el riesgo de desarrollar afecciones comunes no puede identificarse a través de estudios de vinculación familar.a En cambio, se encuentran mejor analizando la ocurrencia de enfermedad en grandes poblaciones. Para efectuar este tipo de investigación, los científicos comparan los genotipos de individuos que tienen la enfermedad específica con los de individuos de antecedentes étnicos similares no afectados. El objetivo es descubrir un nexo (o correlación) entre un trastorno particular, como la diabetes, y polimorfismos genéticos comunes. La utilidad potencial de este método se ilustra por el descubrimiento a principios del decenio de 1990 de un fuerte nexo entre un alelo común del gen que codifica la lipoproteína ApoE y la probabilidad de desarrollar la enfermedad de Alzheimer. En estos estudios se observó que individuos con cuando menos una copia del alelo APOE4, tienen mayor probabilidad de desarrollar esta enfermedad neurodegenerativa incapacitante que las personas que carecen de él. Tales descubrimientos abrieron una rama importante de investigación sobre los vínculos que existen entre el metabolismo del colesterol, la salud cardiovascular y la enfermedad de Alzheimer.
Como lo sugiere su nombre, los estudios de asociación del genoma completo (GWAS, genome-wide association studies) buscan relaciones entre una enfermedad y polimorfismos que podrían localizarse en cualquier parte del genoma. Para esto es necesario determinar la secuencia de nucleótidos de grandes partes del genoma de todos los sujetos que participan en el estudio. Los GWAS se realizan bajo la premisa de que las enfermedades comunes son causadas por variantes comunes, es decir, que están presentes en 1% o más de la población. Si una variante “patógena” aparece con menor frecuencia, no la detectarán análisis de este tipo. Como se mencionó antes, los tipos más comunes de variabilidad genética en seres humanos son los SNP, que están distribuidos casi de manera uniforme en todo el genoma. Es probable que muchos de los polimorfismos mencionados que modifican la especificidad codificadora de un gen, o la regulación de su expresión, tengan un cometido importante en la susceptibilidad del hombre a enfermedades complejas. Como el costo de determinar el genotipo de muestras de DNA humano ha disminuido en grado notable, los investigadores comenzaron a analizar los genomas de grandes cantidades de personas para identificar los SNP que se presentan más a menudo en sujetos afectados por una enfermedad específica que en individuos sanos. Incluso si los SNP identificados no son la causa directa de la enfermedad, sirven como marcadores genéticos de un locus cercano que pudiera serlo. Estos principios están bien ilustrados por un GWAS, publicado en 2005, sobre la degeneración macular relacionada con la edad (AMD, age-related macular degeneration), que es la principal causa de ceguera en los ancianos. Al inicio, los investigadores compararon 96 casos de AMD con 50 testigos, en busca de un nexo entre la enfermedad y más de 100 000 SNP que se habían identificado en el genotipo de los sujetos. Encontraron una fuerte relación entre la enfermedad y un SNP común presente dentro del intrón (región no codificadora) de un gen llamado CFH, que interviene en procesos inmunitarios e inflamatorios. Los homocigotos para este SNP tuvieron 7.4 veces mayor riesgo de sufrir la enfermedad. Una vez que identificaron un vínculo entre esta región del genoma y la AMD, determinaron la secuencia del gen CFH completo en 96 individuos. Encontraron que el SNP que habían identificado tenía un vínculo estrecho con un polimorfismo dentro de la región codificadora del gen CFH que coloca una histidina en un sitio particular de la proteína. Otros alelos de la proteína CFH que no se relacionaban con riesgo de sufrir AMD tenían una tirosina en esta posición. Tales observaciones constituyen pruebas adicionales de que la inflamación es un factor subyacente en el desarrollo de la patología en cuestión y señalan un objetivo bien definido en la búsqueda de tratamientos.
En los últimos años se han realizado numerosos GWAS. En muchos de estos estudios se exploró el genoma de miles de individuos y los resultados se confirmaron en análisis independientes de poblaciones separadas de casos y testigos. Estos ensayos se volvieron prácticos con la comercialización de microarreglos (o micromatrices) génicos que incluyen cientos de miles de fragmentos de DNA que contienen los SNP más frecuentes en la población humana. Los investigadores pueden incubar la matriz con el DNA de un individuo y determinar en poco tiempo cuáles de los posibles SNP se encuentran en cada localización genómica de la muestra. Una vez que se identifica que un SNP particular se vincula con una enfermedad en especial, los investigadores pueden buscar un gen probable en la región del genoma que explique tal asociación o vínculo (consúltense los comentarios sobre haplotipos en los párrafos siguientes). Además, es posible recolectar los datos generados por diferentes estudios sobre una enfermedad particular, lo cual amplía el tamaño de las muestras y confiere mayor poder estadístico para identificar las variantes “patógenas”. Como resultado de los GWAS, ahora se cuenta con listas de genes y de sitios no codificadores que regulan la expresión génica, para los cuales algunos alelos o variantes incrementan la posibilidad de que una persona desarrolle varias enfermedades, incluidas cardiopatías, enfermedad de Crohn, diabetes de tipos 1 y 2 y algunas clases de cáncer.
Cuando los investigadores comenzaron a realizar dichos estudios de relación, se esperaba que éstos revelaran información nueva sobre las bases de enfermedades frecuentes al descubrir genes de los que antes no se hubiera sospechado su participación en trastornos particulares. Los productos de tales genes podrían convertirse en objetivos de nuevos tratamientos farmacológicos, tal como la identificación de la importancia de los genes de la HMG CoA reductasa y del receptor para LDL en la hipercolesterolemia familiar condujo al desarrollo de las estatinas reductoras del colesterol (pág. 319). Aunque los GWAS todavía no conducen a la creación de nuevos fármacos, han descubierto mecanismos y vías importantes implicados en el desarrollo de muchas enfermedades frecuentes. Para citar sólo un ejemplo, varios de los alelos de susceptibilidad que contribuyen a la diabetes tipo 2 codifican proteínas que funcionan en las células secretoras de insulina en el páncreas, lo que ha enfocado mayor atención en la disfunción de estas células durante el desarrollo de dicha enfermedad. (Los lectores interesados en explorar los resultados de tales estudios pueden consultar la página de internet www.snpedia.com, un sitio de fácil acceso.)
A pesar de que gracias a los GWAS se han podido identificar cientos de variantes genéticas comunes que contribuyen a docenas de enfermedades frecuentes, también han decepcionado a muchos genetistas clínicos. Desde hace muchos años se conoce el grado en que la herencia contribuye a la susceptibilidad general para desarrollar las enfermedades más frecuentes. Esta medida se ha obtenido sobre todo de la comparación de la incidencia de una enfermedad determinada en miembros de la misma familia con la frecuencia en la población general. Cuando se examinan los resultados de GWAS recientes, casi todos los “alelos de susceptibilidad” que se han identificado causan sólo un pequeño aumento en el riesgo de desarrollar una enfermedad particular, casi siempre menos de 1.5 veces la probabilidad sin el alelo. Si se agrega el riesgo elevado que tendría una persona si portara todos los alelos de susceptibilidad identificados para una enfermedad particular, como la enfermedad de Crohn o la diabetes de tipo 2, la probabilidad obtenida no justifica la contribución conocida de la genética en el desarrollo de dicho padecimiento. En otras palabras, hay una gran “heredabilidad faltante” que todavía no se descubre. En el comienzo se pensó que gran parte de los factores heredados por descubrir consistían en variaciones estructurales (pág. 416), las cuales no son detectables en estudios de asociación que dependen de SNP. Sin embargo, conforme han surgido técnicas para mapear las variantes estructurales del genoma humano, la noción anterior ahora parece poco probable.
Muchos factores podrían ser responsables del hecho de que todavía no se descubra la mayor parte de los elementos genéticos de riesgo para enfermedades frecuentes. Por ejemplo, es posible que muchos alelos comunes contribuyan con un riesgo tan pequeño (p. ej., que tienen una penetrancia muy baja) que no se han detectado en los GWAS. Si esto resulta ser cierto, la identificación de tales variables de penetrancia baja podría tener poco valor práctico. En el otro extremo de la escala, es posible que haya una gran cantidad de alelos muy raros que eleven en gran medida el riesgo de desarrollar una enfermedad (o sea, con una penetrancia moderada). Sin embargo, como son poco comunes (p. ej., con una frecuencia de 0.1 a 1%), dichos alelos también podrían haber pasado desapercibido en los GWAS actuales. Otra explicación de que haya factores hereditarios no identificados es un fenómeno llamado epistasis, el cual implica que la presencia de un alelo particular en un locus puede modificar la expresión de otro alelo en un locus distinto. En otras palabras, los genes interactúan entre sí y por ello los investigadores tal vez tengan que considerar la participación de combinaciones específicas de alelos como elementos determinantes de fenotipos específicos. Es demasiado difícil determinar los efectos que tienen variantes individuales sobre el desarrollo de una enfermedad particular, sin intentar cuantificar los efectos de combinaciones de éstas.
A pesar de las dificultades actuales, es posible que un día se pueda determinar si una persona tiene predisposición genética para desarrollar una enfermedad particular tan sólo con la identificación de los nucleótidos que existen en posiciones clave de su genoma. La información sobre la variación genética también podría indicar la forma en la que las personas reaccionarán a un fármaco particular; es decir, si es probable que se beneficien con él, que experimenten efectos colaterales graves, o ambos. Por citar un ejemplo, los individuos que portan un alelo con dos SNP específicos que codifica la enzima TPMT son incapaces de metabolizar una clase de tiopurinas, que se usan con frecuencia para tratar algún tipo de leucemia infantil. Los homocigotos para este alelo tienen un riesgo muy alto de desarrollar una supresión potencialmente letal de la médula ósea cuando reciben dosis normales de dichos fármacos. La mayoría de las enfermedades pueden tratarse con varios medicamentos alternos, así que la elección apropiada de éstos es un aspecto importante de la práctica de la medicina. La industria farmacéutica espera que, al final, los datos sobre los SNP conduzcan a una era de “tratamiento farmacológico a la medida”, que permita a los médicos prescribir medicamentos específicos en dosis particulares ajustadas a cada paciente individual, según su perfil genético. Es posible que esta época haya comenzado con la reciente aprobación por la FDA del uso de un chip con DNA integrado, que permite a los médicos inspeccionar el material genético de un paciente a fin de determinar cuáles variantes de dos genes de citocromo P-450 distintos posee. Estos genes ayudan a determinar la eficiencia con que una persona metaboliza diversos fármacos, que van desde antipiréticos de venta sin prescripción médica hasta analgésicos y antidepresivos.
El uso de los datos de los SNP en estudios de asociación supone un reto formidable, debido al impresionante número de estos polimorfismos en el genoma. Al estudiar la distribución de los SNP en diferentes poblaciones humanas, los investigadores hicieron un descubrimiento que puede simplificar en gran medida estos estudios de relación: grandes bloques de SNP se han heredado como una unidad en el curso de la evolución humana reciente. Para ilustrar lo anterior, considérese lo siguiente: si se conocieran las bases particulares de unos cuantos sitios polimórficos en una región específica de un cromosoma, entonces las bases de todos los sitios polimórficos restantes ubicados en la región podrían predecirse con un alto porcentaje de precisión (p. ej., 90%). De acuerdo con la visión actual, los segmentos de SNP se han retenido juntos en el genoma en muchas generaciones debido a la recombinación genética (p. ej., entrecruzamiento) que no ocurre de manera aleatoria a lo largo del DNA, como se explicó en la discusión del mapeo de genes en la página 391. En cambio, hay segmentos cortos de DNA (1-2 kb) en los que es probable que ocurra recombinación y también existen bloques de DNA entre estos “puntos activos” que tienen baja frecuencia de recombinación. Como resultado, ciertos bloques de DNA (casi siempre de unos 20 kb de longitud) tienden a permanecer intactos porque se heredan de una generación a otra. Estos bloques se conocen como haplotipos. Los haplotipos se asemejan a “alelos gigantes multigénicos”; si se selecciona un sitio específico en un cromosoma particular, existe sólo un limitado número de haplotipos alternativos que pueden hallarse en esta región (fig. 1). Cada uno de éstos está definido por un pequeño número de SNP (llamados “SNP marcadores”) en dicha región del genoma. Una vez que se ha determinado la identidad de un puñado de SNP marcados dentro de un haplotipo, se conoce la identidad completa de éste.
El promedio de la longitud de los haplotipos y el número de versiones alternativas de cada uno de ellos varían entre diferentes etnias. Las poblaciones africanas muestran la máxima variedad de haplotipos, en concordancia con otros estudios que sugieren que la especie humana moderna nació en África (pág. 415). Las personas con antepasados del norte de Europa tienen haplotipos más largos con menos versiones alternativas que personas de ascendencia africana. El dato anterior sugiere que los europeos actuales han provenido de una población relativamente pequeña en la cual se han perdido muchos de los haplotipos de sus antepasados africanos. Según una “estimación conjetural”, un grupo fundador de menos de 500 personas emigró de África hace unos 60 000 años para dar origen a todas las poblaciones humanas que residen en el resto de los continentes.
En 2002, unos 25 grupos de investigadores comenzaron un trabajo en colaboración, llamado “Proyecto internacional HapMap”, encaminado a identificar y localizar (“mapear”) los diversos haplotipos que existen en la población humana. El HapMap contendría todos los haplotipos comunes (es decir, localizados en cuando menos 5% de la población) presentes a lo largo de cada uno de los 24 cromosomas humanos en 270 miembros de cuatro poblaciones distintas en términos étnicos. Las comunidades por examinar fueron: Yoruba (de África), Han (de China), japonesa y europea occidental (descendientes establecidos en Utah). El proyecto finalizó en 2006 y dio por resultado la publicación de un HapMap constituido con base en más de cuatro millones de SNP marcadores, distribuidos de manera uniforme en todo el genoma.
Ahora que el HapMap está disponible, los investigadores deben poder identificar nexos entre una enfermedad específica y un haplotipo dado. Una vez que se establece tal vínculo, la región del genoma que contiene el haplotipo puede analizarse en cuanto al gen o los genes particulares que contribuyen a la susceptibilidad de alguna enfermedad. El análisis de los HapMaps también ha suministrado datos sobre los orígenes y las migraciones de las poblaciones humanas y aportó información valiosa de los factores que han moldeado al genoma humano. Esto lo ilustra el siguiente ejemplo. El que un adulto pueda beber leche o no sin síntomas gastrointestinales (es decir, que sea tolerante a la lactosa) depende de cuáles alelos del gen de la lactasa porte en su genoma. La tolerancia a dicha azúcar se vincula con un haplotipo de longitud inusual que contiene un alelo del gen de la lactasa, el cual se expresa de manera persistente en la edad adulta. Este haplotipo en particular está presente con alta frecuencia en comunidades europeas, que han tenido una larga historia de crianza de animales lecheros, y es raro encontrarlo en la mayor parte de las poblaciones subsaharianas y del sudeste asiático, que históricamente no han criado dichos animales. Su alta frecuencia entre europeos sugiere que este haplotipo particular estuvo bajo intensa presión selectiva positiva en poblaciones que dependían de productos lácteos para su nutrición. Este haplotipo individual tiene más de un millón de bases de longitud, lo cual indica que no ha estado junto como bloque el tiempo suficiente para que el entrecruzamiento haya tenido oportunidad de romperlo en fragmentos más pequeños. De hecho, se estima que estuvo sujeto a fuerte presión selectiva hace unos 5 000 a 10 000 años, la época en la que se cree que apareció la cría de hatos lecheros. Es interesante señalar que varias poblaciones del este de África que participan en la producción de lácteos también tienen expresión persistente de lactasa. Las mutaciones causantes del fenotipo tolerante a la lactosa de estos individuos son distintas a las encontradas en los europeos, lo que indica que el rasgo evolucionó de manera independiente en ambos grupos y representa un buen ejemplo de evolución convergente en el linaje humano.
Si se mira hacia el futuro, es probable que los mayores avances en la “medicina genómica” surjan del progreso actual de la tecnología que permite la secuenciación de DNA. Se calcula que el “Proyecto del Genoma Humano”, que incluyó los esfuerzos de más de mil investigadores que trabajaron durante varios años y dio lugar a la primera secuencia del genoma del hombre, tiene un costo cercano a mil millones de dólares. En 2011, el costo de la secuenciación total de un genoma humano había disminuido a menos de 10 000 dólares. Esta drástica reducción de precio y esfuerzo ha sido posible por el desarrollo de una nueva generación de métodos para determinar las secuencias de DNA. Se espera que estos esfuerzos continúen en los próximos años y culminen en el desarrollo de procedimientos sistemáticos de laboratorio para conocer la secuencia del genoma de un individuo por unos cuantos miles de dólares o menos. Si se alcanza el objetivo, será posible que una persona porte un disco compacto que contenga una lista de las letras que conforman su genotipo completo. Incluso si nadie está interesado en aprender sobre su identidad genética única, los investigadores deben ser capaces de usar la información obtenida para identificar todos los sitios del genoma que contribuyen al desarrollo de las enfermedades humanas. De hecho, en 2008 se inició una tarea de colaboración internacional para comparar los genomas completos de al menos mil individuos. Al finalizar la fase piloto en 2010, el grupo había secuenciado los genomas completos de 179 personas y los segmentos codificadores de proteínas (en conjunto llamados exoma) de 697 individuos. Con base en estos datos se ha estimado que cada persona tiene, en promedio, unos 250 alelos que se han tornado no funcionales a causa de mutaciones. Este esfuerzo, llamado “Proyecto Genoma 1 000”, debe permitir a los investigadores establecer relaciones directas entre una variante genómica y un rasgo particulares, en lugar de tener que depender de GWAS indirectos que sólo identifican los SNP marcadores del HapMap (que no son el defecto causal real). Los lectores pueden conocer los progresos de este proyecto en la página de internet www.1000genomes.org.
++
++
VÍAS EXPERIMENTALES Naturaleza química de los genes
Tres años después de que Gregor Mendel presentara los resultados de su trabajo acerca de la herencia en guisantes, Friedrich Miescher se graduó en una escuela de medicina en Suiza y viajó a Tübingen, Alemania; su objetivo era hacer una estancia de un año y estudiar bajo la dirección de Ernst Hoppe-Seyler, uno de los químicos más notables de ese periodo y tal vez el primer bioquímico de la historia. Miescher se interesó en las sustancias químicas contenidas en el núcleo de la célula. Para aislar material de los núcleos celulares con un mínimo de contaminación por los componentes citoplásmicos, dicho investigador necesitaba células fáciles de obtener en gran cantidad y que tuvieran núcleos grandes. Eligió a los leucocitos, que obtuvo del pus de vendajes quirúrgicos desechados por una clínica local. Miescher trató las células con ácido clorhídrico diluido, al cual añadió un extracto de estómago de cerdo que eliminaba proteínas (dicho material contenía pepsina, una enzima proteolítica). El residuo conseguido después de este tratamiento se componía sobre todo de núcleos celulares aislados que se asentaron en el fondo del tubo, los cuales extrajo con un álcali diluido. El material soluble en esta última sustancia se purificó de manera adicional mediante precipitación con ácido diluido y una nueva extracción con álcali diluido. Miescher observó que el extracto alcalino contenía una sustancia con propiedades diferentes a las descubiertas con anterioridad: era una molécula muy grande, de carácter ácido y rica en fósforo. Denominó a este material “nucleína”. El año de residencia de Miescher concluyó y retornó a su hogar en Suiza, en tanto que Hoppe-Seyler, cauteloso acerca de los resultados, repitió el trabajo y una vez confirmados los hallazgos, los publicó en 1871.1
De vuelta en Suiza, Miescher continuó sus estudios sobre la química del núcleo celular. Como vivía cerca del Rhin, podía obtener con facilidad salmones que nadaban contra la corriente y arribaban llenos de huevecillos o espermatozoides maduros. Los últimos eran células ideales para estudiar los núcleos. Al igual que los leucocitos, se podían obtener en gran cantidad y 90% de su volumen correspondía al núcleo. Las preparaciones de Miescher con nucleína obtenida de espermatozoides tenían un porcentaje más elevado de fósforo (casi 10% de su peso) que los leucocitos, lo que indicaba que había menos proteínas contaminantes. De hecho, éstas fueron las primeras preparaciones de DNA relativamente puro. El término “ácido nucleico” lo acuñó en 1889 Richard Altmann, discípulo de Miescher, quien desarrolló los métodos para purificar DNA libre de proteínas de varios tejidos animales y levaduras.2
En los últimos dos decenios del siglo xix, numerosos biólogos se dedicaron al estudio de los cromosomas y describieron su evolución durante la división celular y la interfase (pág. 388). Una forma de observar cromosomas consistió en teñir estas estructuras celulares con pigmentos. Un botánico de nombre E. Zacharias descubrió que el mismo colorante que revelaba los cromosomas también teñía una preparación de nucleína extraída con el procedimiento de Miescher. Además, cuando las células tratadas con pepsina y HCl se extrajeron de modo subsecuente con álcali diluido, un procedimiento ya conocido para extraer nucleína, el residuo celular (incluidos los cromosomas) ya no contenía material teñible. Estos y otros resultados apoyaron de forma consistente la idea de que la nucleína era un componente de los cromosomas. Otto Hertwig, quien estudió la evolución de los cromosomas durante la fecundación, afirmó en 1884 en una disertación profética: “creo que es muy probable que la nucleína sea la sustancia encargada no sólo de la fecundación, sino también de la transmisión de las características hereditarias”.3 De manera irónica, cuanto más se aprendía acerca de las propiedades de dicho material, menos se le consideraba elegible para ser el material genético.
Durante los 50 años que siguieron al descubrimiento del DNA gracias a Miescher, se describió la química de dicha molécula y la naturaleza de sus componentes. Algunas de las contribuciones más importantes en esta tarea fueron obra de Phoebus Aaron Levene, quien emigró de Rusia a Estados Unidos en 1891 y con el tiempo obtuvo un puesto en el Rockefeller Institute de Nueva York. Dicho investigador fue quien por fin resolvió uno de los problemas más resistentes de la química del DNA, cuando en 1929 determinó que el azúcar de los nucleótidos era la 2-desoxirribosa.4 Para aislar el azúcar, Levene y E.S. London colocaron el DNA en el estómago de un perro a través una abertura quirúrgica y luego recolectaron muestras del intestino del animal. A medida que el DNA pasaba por el estómago y el intestino, varias enzimas del tubo digestivo actuaron sobre la molécula y fragmentaron los nucleótidos en sus componentes, las cuales se pudieron aislar y analizar. Levene resumió sus conocimientos de los ácidos nucleicos en una monografía publicada en 1931.5
Aunque a Levene se le acredita la determinación de la estructura de los bloques de construcción del DNA, también se le imputa el mayor obstáculo en la búsqueda de la estructura química de los genes. En este periodo, cada vez fue más evidente que las proteínas eran muy complejas y mostraban gran especificidad como catalizadores en una notable variedad de reacciones químicas. Por otra parte, se pensó que el DNA se integraba con bloques formados por los cuatro nucleótidos repetidos de forma monótona. El principal defensor de esta concepción del DNA, que se llamó “Teoría de los tetranucleótidos”, fue Phoebus Levene. Puesto que los cromosomas sólo contenían dos elementos, DNA y proteínas, pocos dudaban que las últimas fueran el material genético.
Mientras tanto, conforme se analizaba la estructura del DNA, se creó una nueva línea de investigación al parecer sin relación con el campo de la bacteriología. A principios del decenio de 1920 se observó que algunas especies de bacterias patógenas eran capaces de crecer en el laboratorio en dos formas diferentes. Las bacterias con capacidad virulenta (p. ej., causantes de enfermedades) formaron colonias lisas, regulares y en forma de domo. Por el contrario, las células bacterianas no virulentas crecieron en colonias de morfología rugosa, plana e irregular (fig. 1).6 El microbiólogo británico J. A. Arkwright introdujo los términos liso (S, smooth) y rugoso (R, rough) para describir estos dos tipos de organismos. Al observarlas al microscopio, las células que formaban las colonias S estaban rodeadas por una capa de consistencia gelatinosa, ausente en las de las colonias R. La cápsula bacteriana protegía a las bacterias de las defensas del hospedador, lo que explica por qué las células R, sin cápsula, no provocaban infecciones en animales de laboratorio.
Por su gran efecto sobre la salud humana, las bacterias causantes de neumonía (Streptococcus pneumoniae o neumococos) son desde hace mucho tiempo foco de atención entre los microbiólogos. En 1923, Frederick Griffith, médico del British Ministry of Health, demostró que estos organismos también crecen como colonias S o R y, además, que las dos formas eran interconvertibles, es decir, en ocasiones una bacteria R podía transformarse en S, o viceversa.7 Por ejemplo, Griffith observó que si inyectaba un número considerable de bacterias R a un ratón, el animal casi siempre desarrollaba neumonía y producía bacterias que formaban colonias de morfología S.
Con anterioridad se había demostrado que el neumococo se presentaba en varios tipos diferentes (I, II y III), que podían distinguirse unos de otros por medios inmunológicos. En otras palabras, se podían obtener anticuerpos de animales infectados que sólo reaccionaban con uno de los tres tipos. Más aún, una bacteria de un tipo nunca originaba a células de otra clase. Cada uno de los tres tipos de neumococos podía ocurrir en las formas S o R.
En 1928, Griffith hizo un descubrimiento sorprendente cuando inyectó varias preparaciones bacterianas en un ratón.8 La inyección de numerosas bacterias S eliminadas con calor, o de un pequeño número de bacterias R vivas, no causó por sí misma ningún daño al sujeto experimental. Sin embargo, cuando se inyectaron juntas las preparaciones al mismo organismo, éste desarrolló neumonía y murió. Se pudieron aislar y cultivar bacterias virulentas del ratón. Para ampliar sus datos, inyectó combinaciones de bacterias de diferentes tipos (fig. 2). De manera inicial administró a ocho ratones bacterias S de tipo I muertas junto con un pequeño inóculo de la cepa R de tipo II de bacterias vivas. Dos de los ocho animales contrajeron neumonía y Griffith pudo aislar y cultivar células bacterianas S de tipo I virulentas de los ratones infectados. Puesto que era imposible que las bacterias sin vida resucitaran, el investigador concluyó que las células muertas de tipo I habían suministrado algo a las células vivas no encapsuladas de tipo II, que las transformó en la forma encapsulada de tipo I. Cuando crecieron en cultivo, las bacterias transformadas continuaron produciendo células de tipo I y en consecuencia el cambio era estable y permanente.
Los datos de Griffith acerca de la transformación los confirmaron pronto varios laboratorios de todo el mundo, incluido el de Oswald Avery, un inmunólogo del Rockefeller Institute, la misma institución donde trabajaba Levene. Al principio, Avery dudó que una sustancia liberada por una célula muerta pudiera alterar el aspecto de una célula viva, pero se convenció cuando Martin Dawson, un joven ayudante, confirmó los mismos resultados en su laboratorio.9 Después, Dawson intentó demostrar que la transformación no ocurre siempre en un animal vivo. Un extracto crudo de bacterias S muertas, mezclado con un pequeño número de células no virulentas (R) cultivadas en presencia de antisuero R, podía convertir a las últimas en la forma S virulenta. Las células transformadas siempre fueron del tipo característico (I, II o III) de las células S muertas.10
El siguiente paso importante lo dio J. Lionel Alloway, otro miembro del laboratorio de Avery, quien logró solubilizar el agente transformante. Esto se logró tras (1) congelar y después descongelar con rapidez las células muertas donadoras, (2) calentar en seguida las células fragmentadas, (3) centrifugar la suspensión y (4) hacer pasar el sobrenadante a través de un filtro de porcelana cuyos poros impedían el paso de las bacterias. El extracto soluble así filtrado mostró la misma capacidad transformadora que las células muertas por calor originales.11
En la siguiente década, Avery y colaboradores enfocaron su atención en purificar la sustancia causante de la transformación y determinar su identidad. Tan sorprendente como puede parecer ahora, en aquel tiempo ningún otro laboratorio del mundo se dedicó a identificar el “principio transformador”, como lo llamó Avery. Los avances en este punto fueron lentos.12 Con el tiempo, Avery y col., Colin MacLeod y Maclyn McCarty, lograron aislar una sustancia activa del extracto soluble, capaz de causar la transformación en una concentración de apenas una parte en 600 millones. Todas las pruebas sugerían que la sustancia activa era DNA, puesto que: (1) poseía muchas de las propiedades químicas características de dicha molécula, (2) ningún otro tipo de material pudo detectarse en la preparación y (3) análisis con diferentes enzimas mostraron que sólo aquellas capaces de digerir el DNA podían inactivar el principio transformador.
El trabajo publicado en 1944 se escribió con cautela, sin conclusiones espectaculares, y afirmaba que los genes estaban constituidos por DNA y no por proteínas.13 Es digno de mencionar que dichos hallazgos atrajeron escasa atención. Maclyn McCarty, uno de los tres autores, narró un incidente en 1949 cuando se le invitó a disertar en la Johns Hopkins University junto con Leslie Gay, quien analizaba los efectos del nuevo fármaco dimenhidrinato para tratar la cinetosis. El auditorio estaba lleno y “luego de un breve periodo de preguntas y respuestas y después de la presentación del trabajo [de Gay], el presidente de la Sociedad se levantó para presentarme como el segundo orador. Muy poco de lo que él dijo se pudo escuchar a causa del bullicio de la gente que permanecía fuera de la sala. Cuando el éxodo terminó, después de los primeros minutos de mi discurso, conté aproximadamente 35 personas que permanecieron en el auditorio, quizá para escuchar algo acerca de la transformación del neumococo o porque sintieron que debían quedarse por cortesía”. Pero el verdadero potencial del descubrimiento de Avery se reveló en una carta que escribió en 1943 a su hermano Roy, también bacteriólogo:
Si estamos en lo correcto, y por supuesto que esto todavía no se ha demostrado, entonces los ácidos nucleicos no sólo son importantes desde el punto de vista estructural, sino que también son sustancias funcionales activas para definir la actividad bioquímica y las características específicas de una célula, además de que por medio de una sustancia química conocida es posible inducir cambios predecibles hereditarios en las células. Esto es algo que durante mucho tiempo fue el sueño de los genetistas (…) Suena como un virus, pudiera ser un gen. Pero con mecanismos que ahora no me preocupan, un paso a la vez (…) Por supuesto, el asunto está colmado de implicaciones (…) Se relaciona con genética, química enzimática, metabolismo celular y síntesis de carbohidratos, etc. Sin embargo, en la actualidad se requieren suficientes pruebas para convencer a todos de que la sal sódica del ácido desoxirribonucleico, libre de proteínas, podría poseer dicha actividad biológica y tales propiedades específicas y esta es la prueba que ahora tratamos de obtener. Es muy divertido hacer burbujas, pero es más sensato reventarlas uno mismo antes que alguien lo intente.
Se han escrito muchos artículos y pasajes en libros para averiguar la falta de entusiasmo por los datos de Avery. Parte de ello quizá sea el estilo discreto del artículo y el hecho de que el investigador era bacteriólogo, no genetista. Algunos biólogos estaban convencidos de que las preparaciones de Avery debían estar contaminadas con cantidades mínimas de proteínas y que éstas, no el DNA, constituían el agente transformador activo. Otros se preguntaban si los estudios acerca de la transformación en las bacterias podían tener relevancia alguna en el campo de la genética.
En los años siguientes a la publicación del trabajo de Avery, tuvieron lugar cambios importantes en la genética. Se reconoció la existencia de cromosomas de bacterias y algunos prominentes genetistas volvieron su atención a dichos procariotas. Estos científicos estaban convencidos de que el conocimiento logrado por el estudio de los organismos celulares más simples ayudaría a esclarecer los mecanismos que operan en la mayor parte de las plantas y los animales más complejos. Además, los trabajos de Erwin Chargaff y sus colegas acerca de la composición de las bases del DNA acabaron con la idea de que esta molécula era sólo una simple serie de nucleótidos repetidos (pág. 394).14 Este dato reveló la posibilidad de que el DNA tuviera las propiedades necesarias para desempeñar un papel importante en el almacenamiento de información.
Siete años después de la publicación del trabajo de Avery sobre la transformación bacteriana, Alfred Hershey y Martha Chase (de los Cold Spring Harbor Laboratories de Nueva York) se enfocaron en un sistema todavía más simple, los bacteriófagos (o virus que infectan células bacterianas). Alrededor de 1950, los investigadores reconocieron que aun los virus tenían información genética. Éstos inyectaban su material genético en una célula hospedadora, en la que éste podía dirigir la formación de nuevas partículas víricas. En cuestión de minutos, la célula infectada estallaba y liberaba nuevas partículas de bacteriófagos que infectaban a células hospedadoras vecinas.
Era claro que el material genético capaz de dirigir la formación de la progenie vírica debía ser DNA o proteínas, puesto que eran las únicas dos moléculas del virus. Observaciones con microscopia electrónica mostraron que durante la infección, la masa del bacteriófago permanecía fuera de la célula, fijada a la superficie celular por apéndices fibrosos (fig. 3).
Hershey y Chase razonaron que el material genético del virus debía poseer dos propiedades. Primero, si éste dirige el desarrollo de nuevos bacteriófagos durante la infección, entonces debía pasar al interior de la célula infectada. Segundo, si el material porta información, ésta debe transmitirse a la segunda generación de bacteriófagos. Hershey y Chase prepararon dos grupos de bacteriófagos para utilizar como material infectante (fig. 4). Un grupo contenía DNA marcado con fósforo radiactivo (DNA[32P]); el otro poseía proteínas marcadas con azufre radiactivo (proteína[35S]). Puesto que el DNA carece de átomos de azufre (S) y las proteínas no tienen átomos de fósforo (P), estos dos radioisótopos suministraron marcas distinguibles en los dos tipos de macromoléculas. El plan experimental consistió en infectar a una población de células bacterianas con uno u otro tipo de bacteriófago, esperar unos pocos minutos y luego desprender los virus vacíos de la superficie celular. Luego de diferentes intentos y métodos para separar las cubiertas de los fagos unidas a las bacterias, los investigadores observaron que la mejor manera de lograrlo era someter la suspensión de bacterias infectadas a la acción de las hojas giratorias de una licuadora. Una vez desprendidas, las partículas se pudieron aislar mediante centrifugación; las bacterias se sedimentaban en el fondo del tubo y los virus vacíos permanecían en el sobrenadante.
Con base en este procedimiento, Hershey y Chase compararon la cantidad de radiactividad que había entrado a las células con la de las cubiertas vacías de fago. Observaron que en células infectadas con un bacteriófago marcado con proteína radiactiva, la radiactividad permanecía en las cubiertas vacías. Por el contrario, en las células infectadas con un bacteriófago marcado con DNA radiactivo, la radiactividad pasaba al interior de la célula hospedadora. Respecto de la radiactividad transmitida a la siguiente generación, encontraron que menos de 1% de la proteína marcada en la progenie, y casi 30% del DNA marcado, pasaron a la siguiente generación.
La publicación de los experimentos de Hershey y Chase en 1952,15 junto con el abandono de la teoría de los tetranucleótidos, eliminó todos los obstáculos restantes para aceptar que el DNA era el material genético. Entonces surgió un nuevo y enorme interés por una molécula hasta entonces ignorada. El escenario estaba listo para el descubrimiento de la doble hélice.
Referencias Miescher, J. F. 1871. Hoppe-Seyler’s Med. Chem. Untersuchungen. 4:441.
Altmann, R. 1889. Anat. u. Physiol., Physiol. Abt. 524.
Tomado de Mirsky, A. E. 1968. The discovery of DNA. Sci. Am. 218:78–88. (June).
Levene, P. A. & London, E. S. 1929. The structure of thymonucleic acid. J. Biol. Chem. 83:793–802.
Levene, P. A. & Bass, L. W. 1931. Nucleic Acids. The Chemical Catalog Co.
Arkwright, J. A. 1921. Variation in bacteria in relation to agglutination both by salts and by specific serum. J. Path. Bact. 24:36–60.
Griffith, F. 1923. The influence of immune serum on the biological properties of pneumococci. Rep. Public Health Med. Subj. 18:1–13.
Griffith, F. 1928. The significance of pneumococcal types. J. Hygiene 27:113–159.
Dawson, M. H. 1930. The transformation of pneumoccal types. J. Exp. Med. 51:123–147.
Dawson, M. H. & Sia, R.H.P. 1931. In vitro transformation of pneumococcal types. J. Exp. Med. 54:701–710.
Alloway, J. L. 1932. The transformation in vitro of R pneumococci into S forms of different specific types by use of filtered pneumococcus extracts. J. Exp. Med. 55:91–99.
McCarty, M. 1985. The Transforming Principle: Discovering That Genes Are Made of DNA. Norton.
Avery, O. T., MacLeod, C. M., & McCarty, M. 1944. Studies on the chemical nature of the substance inducing transformation of pneumococcal types: Induction of transformation by a deoxyribonucleic acid fraction isolated from pneumococcus type III. J. Exp. Med. 79:137–158.
Chargaff, E. 1950. Chemical specificity of nucleic acids and mechanism of their enzymic degradation. Experentia 6:201–209.
Hershey, A. D. & Chase, M. 1952. Independent functions of viral protein and nucleic acid in growth of bacteriophage. J. Gen. Physiol. 36:39–56.
++
++
++
++
+
++
++