+++
Método químico o de degradación de Maxam y Gilbert
++
Es un método de secuenciación que depende de la degradación química específica del ADN que describieron Maxam y Gilbert, en 1977. Este método tiene la ventaja de que puede emplear ADN de doble hebra, pero requiere una separación de hebras o fraccionamiento equivalente por cada fragmento de restricción estudiado, lo cual lo hace laborioso.
++
La fragmentación específica del ADN es la base de este método, desarrollado en cinco pasos, que a grandes rasgos implican el marcaje radiactivo del extremo 5’ con 32P, la modificación de una base, la eliminación de la base modificada, rotura de la cadena de ADN en la desoxirribosa modificada y el análisis de la secuencia fragmentada por electroforesis en gel de poliacrilamida. El método está limitado por el poder de resolución del gel de poliacrilamida que, en el contexto histórico de la época, permitía secuenciar aproximadamente 100 bases a partir del punto de marcaje.
++
La electroforesis es una técnica para la separación de moléculas según su movilidad en un campo eléctrico a través de una matriz porosa, la cual finalmente las separa por tamaños moleculares y carga eléctrica, según la técnica que se use. La electroforesis en gel en general se utiliza con propósitos analíticos, pero puede ser una técnica preparativa para purificar parcialmente moléculas antes de aplicar espectrometría de masas, reacción en cadena de la polimerasa (PCR), clonación o secuenciación de ADN (para mayores detalles, consultar el capítulo relacionado).
++
Antes del tratamiento químico que genera el corte, se marca un fragmento de doble hebra producido por digestión con una enzima de restricción (fragmento de restricción) de una determinada longitud en sus dos extremos; primero, se trata con fosfatasa alcalina para eliminar el fosfato terminal en su extremo 5’, y después, se añade un fosfato marcado con 32P para producir una hebra marcada de forma terminal. La fragmentación selectiva de una cadena de ADN marcada se consigue con el uso de cuatro tratamientos químicos independientes, cada uno de los cuales está diseñado para producir patrones específicos de rotura y observación mediante autorradiografía. El procedimiento consiste en “atacar” químicamente al ADN con reactivos que primero dañan y después eliminan una base del nucleótido. La desoxirribosa expuesta es, entonces, un punto débil en el esqueleto de la cadena y es susceptible de roturas. Posteriormente, se llevan a cabo reacciones químicas para desprender completamente la desoxirribosa de los enlaces 5’ y 3’ de sus fosfatos, y la reacción es tan específica que permite dañar sólo uno de los residuos a lo largo de pocos pares de bases del ADN. El reactivo específico para purinas es el dimetilsulfato, mientras que el reactivo para pirimidinas es la hidracina.
++
Debido a que el enlace glucosídico de una purina metilada es inestable y se rompe fácilmente, las bases pueden eliminarse calentando las hebras a pH neutro, dejando la desoxirribosa libre. El tratamiento que de preferencia rompe residuos guanílicos se basa en un álcali suave a 90°C (NaOH 0.1 M), que libera completamente los restos de desoxirribosa despurinados de los grupos fosfato adyacentes en sus enlaces 3’ y 5’, o ácido fórmico para corte en bases púricas indiferenciado (A + G), mientras que para los residuos adenílicos el tratamiento es a 0°C en condiciones ligeramente ácidas (HCl 0.1 M). Cuando los fragmentos marcados en su extremo se resuelven en gel de poliacrilamida, la autorradiografía contiene un patrón de bandas oscuras y claras. Las bandas oscuras se generan del rompimiento de guaninas, que se metilan cinco veces más rápido que las adeninas. Este patrón de guanina/fuerte y adenina/débil contiene, al menos, la mitad de la información necesaria para la secuenciación; sin embargo, en la interpretación de estos patrones puede haber ambigüedad, ya que la evaluación de la intensidad de las bandas aisladas no es sencilla. Para determinar las bases de forma diferencial se compara la información que contiene esta columna del gel con una en paralelo en la cual se suprime el rompimiento de guaninas, lo que permite que las adeninas se evidencien.
++
La evidencia de corte de adeninas se basa en que los enlaces glucosúricos de las adenosinas metiladas son menos estables que las de las guanosinas, de manera tal que de preferencia las adeninas se liberan con un tratamiento suave con ácido diluido. Subsecuentemente, el rompimiento con álcali producirá un patrón de bandas oscuras correspondiente a las adeninas y con bandas claras para las guaninas.
++
Para el caso de detección de pirimidinas, la reacción con hidracina producirá roturas en posiciones ocupadas tanto por citosina como por timina. La reacción se repite en presencia de NaCl 2 M, la sal suprime la reacción de la hidracina con la timina, tal que en la autorradiografía sólo se detectan fragmentos cortados mediante tratamiento con piperidina en posiciones ocupadas por citosinas. Cuando se comparan los patrones autorradiográficos de C y C + T, la banda oscura (correspondiente a la marca del radioisótopo) que aparezca en ambas radiografías indicará rotura en la C, mientras que un enlace sólo presente en C + T representará la rotura en una T.
++
Para lograr el corte en citosinas y timinas, la hidracina reacciona con timina y citosina, cortando la base y dejando ribosilurea. La hidracina puede reaccionar para producir hidrazona. Después de una lisis de hidracina parcial en solución acuosa de hidracina 15 a 18 M a 20°C, el ADN se corta con piperidina 0.5 M. La amina cíclica secundaria, así como la base libre, desplaza todo el producto de la reacción con hidracina de la desoxirribosa y cataliza la eliminación de β-fostatos. El patrón final contiene bandas de intensidad similar para los cortes en citosinas y timinas.
++
Cuando se analiza el patrón autorradiográfico de un gel de secuenciación obtenido de los cuatro tratamientos químicos, si se considera una secuencia de carriles con A, G, C y C + T, una banda fuerte en la primera columna con una banda débil en la segunda genera una A; una banda fuerte en la segunda columna con una banda débil en la primera columna es una G; una banda que aparezca en la tercera y cuarta columnas es una C, y una banda solamente en la cuarta columna es una T (figura 17-2). Para obtener la secuencia de una hebra sencilla se comienza en la parte baja izquierda y se lee hacia arriba; así, la secuencia que se lee de abajo hacia arriba es la correspondiente a 5’ → 3’ de la hebra original de ADN analizada. La sencillez de este método radica en que sólo se necesitan cuatro radiografías para establecer la secuencia de ADN.
++
++
La secuenciación química tiene ventajas específicas. En primer lugar, los tratamientos químicos son sencillos de controlar; el ataque químico ideal, una base eliminada por hebra, produce una buena distribución de materiales marcados a través de la secuencia. En segundo lugar, cada base es atacada, tal que en un corrimiento se desplegará cada base individual. La distinción química entre cada base es clara y la secuencia de ambas hebras permite un chequeo más adecuado. Estas reacciones específicas fueron elegidas para proveer información más que suficiente para la secuenciación. En principio, podría secuenciarse ADN con tres reacciones químicas específicas para cada base, utilizando la ausencia de banda para identificar la posición de la cuarta base; sin embargo, las aproximaciones tienden a error o a malinterpretarse por otra base, por esa razón se describen las reacciones para diferenciar que son redundantes.
++
El método de Maxam y Gilbert es óptimo para ADN que no puede secuenciarse de forma adecuada mediante otros métodos (por ejemplo, oligonucleótidos pequeños y secuencias de ADN que producen terminación prematura debida a estructuras secundarias fuertes). Además, la secuenciación de Maxam y Gilbert puede usarse para mapear modificaciones de ADN, como alquilaciones y roturas producidas por carcinógenos, antineoplásicos y otros agentes que tienen como blanco el ADN. En ensayos de huella digital química o enzimática, la técnica permite la identificación precisa de secuencias específicas de ADN que se unen a moléculas pequeñas y proteínas. Por ello, las mejoras al método son benéficas para gran variedad de aplicaciones en biología molecular y bioquímica.
+++
El método “didesoxi” de Sanger
++
Sanger también desarrolló otro método, el cual emplea análogos de dNTP específicos de terminación de cadena. Los análogos más utilizados son los didesoxinucleótidos trifosfatados (ddNTP), iguales que los dNTP pero sin el grupo hidroxilo en el carbono 3’ de la desoxirribosa. Estos pueden incorporarse a una cadena de ADN en crecimiento por medio de la ADN polimerasa, pero actúan como terminadores porque, una vez incorporados a la cadena, y al no contar con el OH en el extremo 3’, no permiten que se una otro nucleótido. Este método es más rápido y acertado que el método químico de Maxam y Gilbert, por lo que es el utilizado en la actualidad de manera rutinaria en los laboratorios. El proceso consiste en encontrar diferentes cadenas, tantas como número de bases tenga el fragmento que son copias de la cadena de ADN que se va a secuenciar, cada uno de un tamaño diferente y terminado con la incorporación de un 2’ 3’ didesoxinucleótido (figura 17-3).
++
++
El principio del método “didesoxi” es el siguiente: se aísla y se clona el ADN que se desea secuenciar; este ADN se desnaturaliza y se emplea una sola hebra en la secuenciación. En la secuenciación se utiliza un iniciador o primer marcado radiactivamente, el cual usualmente es un fragmento de restricción, que suministra el extremo 3’ OH que necesita la ADN polimerasa para continuar la adición de nucleótidos. El iniciador y el molde de ADN se alinean para formar un complejo iniciador-molde y la mezcla resultante se divide en cuatro partes. Con estas mezclas se preparan cuatro tubos de reacción, cada uno con el ADN molde de hebra sencilla que se desea secuenciar, la ADN polimerasa, el iniciador marcado radiactivamente y los cuatro dNTP. A cada tubo se le añade uno de los ddNTP en exceso, es decir, en mayor proporción respecto a su dNTP convencional (10:1). En cada uno de estos tubos se producirán cadenas de ADN de distintas longitudes, terminando todas en el lugar en el que se incorporó el “didesoxi” correspondiente (ddATP, ddTTP, ddGTP, ddCTP) añadido al tubo.
++
Por ejemplo, una muestra de ADN se incuba con ADN polimerasa en presencia de una mezcla de ddTTP (didesoxitimidina fosfato) y con bajas concentraciones de TTP junto con concentraciones normales de los otros tres dNTP (uno de los cuales puede marcarse con 32P, 35S o con marcadores quimioluminiscentes o fluorocromos). Conforme la cadena de ADN se forma en el extremo 3’ del iniciador, la posición de T se estará agregando en algunos casos con el sustrato normal y, por ende, la cadena seguirá extendiéndose. En ocasiones se agregará un ddTTP, lo que hará que acabe la síntesis, tal que al término de la incubación seguirá habiendo una mezcla de cadenas de longitud variable con terminación T en su extremo 3’, pero todas con el mismo extremo 5’ (el extremo 5’ original del iniciador). Incubaciones similares se llevan a cabo en presencia de cada uno de los otros 3 ddNTP, lo que da mezclas de terminación en la posición de cada uno de los nucleótidos restantes C, A o G, respectivamente.
++
Las cuatro mezclas son separadas en paralelo (cada mezcla de reacción en un carril) por electroforesis vertical en gel de poliacrilamida-urea en condiciones desnaturalizantes (acrilamida 12% con urea 8 M), con resolución de un solo nucleótido. Este sistema separa las cadenas de ADN de acuerdo con su longitud; así, las más pequeñas migrarán más rápido y las más grandes, más lento.
++
En teoría, cada una de las fracciones de las mezclas tendrá suficientes fragmentos terminados en cada una de las posiciones del nucleótido y podrán visualizarse mediante autorradiografía cuando se utiliza marcaje radiactivo, ya sea en el iniciador o en alguno de los dNTP. El tiempo de exposición de la placa de rayos X sobre el gel varía de 20 a 30 horas y se expone a temperatura ambiente. En la actualidad, se emplean marcas quimioluminiscentes (fluorescentes) para evitar el manejo de radiactividad. En este caso el marcaje es con fluorocromos en el extremo 5’ del iniciador y la identificación se hace separando los diferentes fragmentos por medio de electroforesis en gel de poliacrilamida, para que, de esta manera, la secuencia pueda leerse directamente sobre el gel, de acuerdo con el patrón de bandas.
++
En general, secuencias de entre 15 a 200 nucleótidos desde el sitio del iniciador pueden determinarse con precisión mediante un solo iniciador e inclusive es posible leer hasta 300 nucleótidos. El problema más grave es el apilamiento de bandas, causado por las asas de apareamiento de bases que se forman en el ADN en las condiciones de la electroforesis del gel de acrilamida y que se observan como un número de bandas en la misma posición o inusualmente muy cercanas unas a otras en la electroforesis.
++
Uno de los mayores avances en la tecnología de secuenciación del ADN fue el desarrollo de la secuenciación automatizada, ya que aunque los procedimientos propuestos tanto por Sanger como por Maxam y Gilbert son relativamente sencillos y su interpretación es fácil, su capacidad de resolución de los procedimientos utilizados es limitada.
++
El método de Maxam y Gilbert fue muy popular en sus inicios; sin embargo, con la descripción del método enzimático didesoxi, o de terminación de cadena, esta técnica quedó en desuso, ya que involucra el uso de sustancias químicas peligrosas y cantidades elevadas de ADN marcado radiactivamente, además de ser técnicamente más complejo. Por ello, en la actualidad los procedimientos de secuenciación automatizada están basados en el método enzimático de Sanger, que suple el marcaje radiactivo con métodos quimioluminiscentes con el uso de fluorocromos. De esta manera, para la lectura de la secuencia se utilizan sistemas ópticos que detectan los diversos fluorocromos empleados, con lo que se logra un método más directo, fácil, rápido y seguro. Esta variante es conocida como dye-primer sequencing (secuenciación mediante colorantes acoplados al iniciador).
++
Para evitar el error debido a lo repetitivo y a los pasos de pipeteo, en la actualidad un robot industrial puede automatizar las reacciones de secuenciación del método didesoxi. Este sistema utiliza microrreacciones a temperatura controlada; en un ciclo de reacción (alrededor de 50 minutos) se procesan arriba de 48 moldes. Con este robot se resuelven más de 450 bases en secuenciación automática de ADN, protocolo que es aplicable tanto a marcaje radiactivo como fluorescente.
++
En estos sistemas automatizados el fragmento de ADN fluorescente pasa por el punto de tensión del secuenciador automático, y estas señales se envían a una computadora con un programa especial. Así, un golpe de láser excita la tinción fluorescente, la señal de fluorescencia emitida se digitaliza y es captada por detectores que una computadora analiza y descifra, y pueden observarse los resultados obtenidos en tiempo real. En minutos, este programa procesa la imagen del gel capilar. Para cada muestra secuenciada se crean curvas de cuatro colores, uno por cada nucleótido, y debajo de cada pico de la secuencia se identifica la secuencia de nucleótidos correspondientes al fragmento analizado. Puede analizarse la secuencia de 10 muestras simultáneamente o bien estudiar 40 fragmentos de ADN.
++
La secuenciación por terminación fluorescente es un método para el análisis de la secuencia del ADN mediante automatización parcial. Es una variante modificada en la cual el marcaje se realiza con un fluoróforo unido de forma covalente en el oligonucleótido iniciador utilizado. En esta opción se utiliza un color diferente para cada fluoróforo de cada reacción específica para nucleótidos A, C, G o T, marcándolos como terminadores reversibles mediante la unión del fluoróforo a la base en el grupo 3’-OH, de tal forma que la ADN polimerasa aún la puede reconocer como sustrato. Después, las mezclas de reacción se combinan en una coelectroforesis en un mismo gel, y la información de la secuencia se lee directamente mediante una computadora. Cuando el fluoróforo se agrega en la terminación de la cadena, se tiene la ventaja de que este último método puede llevarse a cabo en una sola reacción en lugar de en cuatro, como en el método en que se marca el iniciador. En esta reacción los ddNTP se marcan con fluorocromos de diferente color para cada base, con lo cual la terminación de cada cadena determinará el color y, por ende, el NTP respectivo. Esto hará que al fluorescer a diferentes longitudes de onda, el sistema óptico del equipo identifique directamente en un gráfico las señales de fluorescencia de cada una de las bases (figura 17-4). El gráfico generado es acorde con el color del fluorocromo, en el cual se representa cada base con picos de intensidad de luz.
++
++
Las investigaciones siguen progresando de tal forma que se ha planteado la utilización de la tecnología de espectrofotometría de masas para secuenciar ADN. Otras propuestas adaptan la técnica de Maxam y Gilbert en una tecnología innovadora denominada secuenciación multiplex, que permite aumentar la velocidad de secuenciación y faculta al investigador para analizar un gran grupo de fragmentos de ADN como una mezcla a través de los pasos de secuenciación de ADN, lo cual incrementa la eficiencia de los procedimientos estándares por un factor de 10.
++
La pirosecuenciación es un sistema basado en el método enzimático, que aprovecha la liberación de pirofosfato cuando un nucleótido se incorpora en la hebra de ADN en crecimiento, mediante bioluminiscencia; es un sistema útil para analizar tanto secuencias cortas de ADN como polimorfismos de nucleótido simple (SNP) y genotipificación. La longitud de lectura tendrá que seguir mejorando para dar aplicaciones más precisas y más amplias a esta alternativa. Este método tiene la dificultad de que descifra de forma adecuada las regiones homopoliméricas del molde de ADN; sin embargo, existen abordajes metodológicos que permiten modificar nucleótidos en posición 3’-OH mediante enlaces químicos reversibles para terminación de cadena usando un grupo alil o un grupo 2-nitrobencilo.
++
Se han propuesto métodos de secuenciación del ADN que no involucran ni electroforesis en gel o reacciones químicas o enzimáticas. Entre ellos se encuentran métodos con fluorescencia para detección mediante citometría de flujo como alternativa a la técnica de secuenciación en geles, la posibilidad del marcaje de la ADN polimerasa o la secuenciación por nanoporos; otros enfoques están dirigidos a la utilización de microscopia electrónica de túnel para leer las bases directamente en la hebra de ADN mediante el marcaje de las bases con halógenos para la detección visual.
++
La dificultad para secuenciar fragmentos de ADN de longitudes grandes (> 300 nucleótidos) se debe a la capacidad limitada para resolver fragmentos grandes de ADN que difieran en un solo nucleótido. Una de las soluciones es la secuenciación sobrelapada, en la cual el ADN genómico se fragmenta y se clona en un vector de ADN, se amplifica, se purifica y se analiza para ensamblarse en una secuencia larga y continua, donde se identifican las regiones sobrelapadas (secuenciación shotgun, de fuerza bruta o de un tiro). Para llevar a cabo esta técnica no se requiere contar con antecedentes de la secuencia de ADN, por lo que se le conoce como secuenciación de novo.
++
Técnicas desarrolladas recientemente permiten secuenciar ADN genómico de células microbiales individuales (secuenciación de célula única). Ésta es una estrategia útil para determinar secuencias naturales de microorganismos que suelen cambiar cuando se cultivan en laboratorio. Además, las reacciones de amplificación pueden producir rearreglos en el ADN, de tal forma que, al no requerir ni el cultivo ni la reacción, se puede llevar a cabo la determinación de la secuencia de la célula original tomada directamente del ambiente. En la actualidad, en los centros de secuenciación más de 70% de los genomas se recuperan de célula única.
+++
Secuenciación de alto rendimiento: la secuenciación de la próxima generación
++
A partir del Proyecto Genoma Humano, en 2008 se secuenció un genoma humano completo en cinco meses con 1.5 millones de dólares; en 2009 el proceso se realizó en horas y con sólo 10 000 dólares, y actualmente, con un menor tiempo y costo, en una sola reacción se puede conocer la secuencia completa de un individuo, lo cual demuestra la gran capacidad y la rapidez con que ha evolucionado la secuenciación, sobre todo en los últimos cinco años.
++
Las plataformas actuales comparten características tecnológicas comunes, como secuenciación masiva en paralelo de moléculas únicas de ADN separadas en un flujo de células o clonadas in vitro, para lograr muchas copias de la molécula original y después ser amplificadas, con ciclos repetidos de extensión de nucleótidos mediados por polimerasas o por ligación de oligonucleótidos. Como se trata de un proceso masivo en paralelo, estos sistemas pueden generar centenares de megabases (Mb) y gigabases (Gb) de secuencias nucleotídicas en un solo corrimiento de un aparato.
++
Por ejemplo, la tecnología 454 (Roche; http://www.454.com) se deriva de la pirosecuenciación y la PCR de emulsión, en la cual se detecta la quimioluminiscencia generada por la liberación de pirofosfatos cuando se incorpora un dNTP en una reacción de polimerización. Según estas bases, en 2005 se presentó el GS20 como el primer secuenciador de nueva generación, mediante el cual se pudo secuenciar el genoma de Mycoplasma genitalia (580 069 pb secuenciadas a 96% con 99.96% de precisión) en una sola corrida. Posteriormente, en 2007, Roche Applied Science adquirió la 454 Life Sciences y presentó una nueva versión, GS-FLX, el cual mediante el mismo principio permite hacer microtitulaciones (a nivel de picolitros, es decir, la millonésima parte de un mililitro) mediante un haz de fibra óptica.
++
El método para secuenciar con este tipo de tecnología requiere preparar una genoteca de ADN molde mediante fragmentación por nebulización o sonicación, los fragmentos se reparan en sus extremos y ligados a oligonucleótidos; después, la genoteca de ADN se diluye hasta la concentración de molécula única; luego se desnaturaliza e hibridada a una microesfera que contiene oligonucleótidos adaptadores con secuencias complementarias, con las cuales se lleva a cabo la PCR de emulsión; posteriormente, se liberan los fragmentos y se someten a enzimas de secuenciación mediante un flujo sucesivo de los 4 dNTP. Cada evento de incorporación de un dNTP produce la liberación de un pirofosfato, y el sistema reconoce la luminiscencia producida, que se transmite por la fibra óptica que dirige y traduce la señal. Una ventaja reconocida de la tecnología 454 es la amplia longitud de lectura de secuencias, ya que puede leer fragmentos de más de 400 bases de longitud mediante el principio de pirosecuenciación y en el tiempo de una sola corrida (10 horas) se pueden secuenciar 500 Mb.
++
Además, la secuenciación de la nueva era permite llevar a cabo la secuenciación de transcriptomas, un enfoque muy poderoso denominado ARN-Sec, para mapear y cuantificar tránscritos a partir de muestras biológicas. El rango dinámico del ARN-Sec para determinar niveles de expresión es de 3-4 órdenes de magnitud, comparado con dos órdenes de magnitud de expresión por microarreglos. De esta manera, esta alternativa permite la detección cuantitativa tanto de tránscritos producidos a bajo y alto nivel, además de poder deducir la diversidad de la información cualitativa y cuantitativa del corte y empalme. La ARN-Sec se ha aplicado a gran variedad de organismos, incluidos Saccharomyces cerevisiae, Arabidopsis thaliana, ratón y células humanas.
++
La secuencia de nucleótidos de los genes humanos ha sido y continúa siendo de gran importancia como herramienta de investigación para el entendimiento de las bases de los procesos celulares que definen la fisiología y el desarrollo. La organización de los genes en los genomas existe en un cromosoma concreto en un orden particular. La comparación de mapas cromosómicos de animales superiores proporciona información acerca de cuál organización génica está asociada con qué expresión génica y qué función génica. Sin embargo, conocer la secuencia de ADN de los genes y cómo se traducen en proteínas no es suficiente para establecer cómo están controlados o cómo la función del producto génico en una célula particular en el organismo es un todo. Entender la relación entre la estructura de la proteína y su función es el siguiente paso crucial.