MÉTODO PARA LA OBTENCIÓN DEL PERFIL GENETICO DE UN INDIVIDUO
CAMPO DE LA INVENCIÓN
La invención se relaciona con un método para obtener el perfil genético de un individuo, para determinar relaciones de parentesco entre individuos o para identificar restos humanos que comprende el análisis de loci STRs en un extracto de ADN de dicho individuo mediante, al menos, una reacción de amplificación multiplex. Dicho método es de aplicación en la identificación de individuos en el área de la genética forense, así como en genética de poblaciones, antropología y biomedicina.
ANTECEDENTES DE LA INVENCIÓN
Salvo los gemelos monocigóticos, no existen dos personas cuyo material genético (ADN) nuclear sea idéntico. Determinadas regiones del ADN conocidas como STRs (Short Tandem Repeats) se caracterizan por su alta variabilidad entre individuos y a lo largo de las dos últimas décadas, han constituido el material de elección para la obtención de perfiles genéticos, los cuales pueden emplearse tanto en la identificación de personas como en la determinación de relaciones de parentesco entre individuos. De la misma manera, los STRs se utilizan en la elaboración de bases de datos de perfiles genéticos en países de todo el mundo, como por ejemplo, la base de datos CODIS (Combined DNA Index System) , que incluye los loci STRs CSF1PO, FGA, TH01, TPOX, VWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51 y D21S11, también incluidos en la base de datos nacional de los Estados Unidos para la búsqueda de perfiles de ADN durante la investigación de delitos criminales. Por otro lado, la base de datos Europea y la base del datos del Reino Unido incluyen algunos de los loci STRs del CODIS, como son FGA, TH01, VWA, D3S1358, D8S1179, D16S539, D18S51, D21S11 y el locus de sexo amelogenina (AMEL) , además del locus STRs D2S1338.
En la actualidad existen numerosas empresas que comercializan kits para la elaboración de perfiles genéticos. Applied Biosystems® comercializa AmpFlSTR® Identifiler® PCR amplification kit (2004, Applied Biosystems®, Foster City, CA) y Promega fabrica PowerPlexTM 16 (2004, Promega® Corporation, USA) . Mediante estos kits puede alcanzarse una probabilidad de coincidencia entre los perfiles genéticos de dos individuos de alrededor de uno entre un trillón, tras el análisis de 15 regiones STRs. Ambos kits incluyen los 13 loci del CODIS; en el caso de Identifiler® incluye además los loci autosómicos D2S1338 y D19433, y PowerplexTM 16 incluye los loci autosomicos Penta E y Penta D.
Recientemente se han desarrollado los kits comerciales AmpFlSTR® NGM TM Amplification Kit (Applied Biosystems, Foster City, CA) , PowerPlex® ES X y PowerPlex® ES Y (Promega® Corporation, USA) que permiten analizar algunos de los loci recomendados para ser incluidos en las bases de datos nacionales.
Uno de los principales inconvenientes de estos y otros kits de análisis actuales es su falta de capacidad para proporcionar perfiles genéticos que incluyan la totalidad de los loci recogidos actualmente en el CODIS a partir de de extractos de ADN altamente degradados, lo que disminuye su rendimiento en cuanto a comparación de los resultados obtenidos con los millones de perfiles genéticos disponibles en esta base de datos. La degradación del ADN se caracteriza por una fragmentación general del material genético, donde los fragmentos de ADN pueden rondar las 240 pb mientras que estos kits necesitan al menos de fragmentos de unas 450 pb para el análisis de todos los loci STRs que incluyen. El ADN altamente degradado es una característica de la mayoría de las muestras que se analizan en los laboratorios de genética criminalística. En estos casos se produce la ausencia de resultados o incluso la obtención de resultados erróneos, con las graves repercusiones judiciales y/o personales que ello puede conllevar.
Con la finalidad de conseguir perfiles genéticos de muestras cuyo ADN está muy degradado, se han realizado numerosos esfuerzos para desarrollar reacciones que posibiliten la obtención de perfiles genéticos suficientemente discriminativos en extractos de ADN altamente degradados, (Lygo et al., 1994 Int. J. Legal Med. 107:77-89; Whitaker et al., 1995, BioTechniques 18 (4) :670-677) .
Schilz, F. et al. 2004 (Anthrop. Anz., 4: 369-378) describieron una reacción PCR multiplex capaz de amplificar simultáneamente fragmentos de corta longitud de 16 loci STRs y el locus amelogenina (de 84pb a 275pb) . Sin embargo en esta reacción multiplex solo se consideraron alelos presentes al menos en el 1% de los caucasoides, por lo que su utilización puede derivar en un perfil genético erróneo en el 16 % de los casos en que la muestra biológica analizada provenga de un individuo de origen caucasoide, error que puede incluso incrementarse en el análisis de individuos de otros orígenes étnicos.
Okamoto, O. et al. 2003 (Acta Medica Okayama, 57 (2) : 59-71) describe el empleo del kit comercial PowerPlex™ 16 System para estimar las frecuencias genotípicas y fenotípicas de 15 STRs loci en la población japonesa.
En 2003, John Butler et al., publicaron el desarrollo de reacciones multiplex que analizan entre 3 y 6 loci STRs mediante la amplificación de fragmentos de pequeño tamaño, para su aplicación en extractos de ADN degradado (Butler et al., J. Forensic Sci 48 (5) :1054-1064) . En 2006 Applied Biosystems comenzó a comercializar AmpFlSTR® MiniFiler™ (Mulero et al., J Forensic Sci. 2008 Jul;53 (4) :838-52, Luce et al., 2009. J Forensic Sci.Sep;54 (5) :1046-54) , mediante el cual pueden obtenerse resultados con fragmentos de ADN de tamaño reducido. Por contra, el perfil genético proporcionado por AmpFlSTR®MiniFiler™ se compone de solamente 8 loci STRs más amelogenina, por lo que aunque tiene la ventaja de posibilitar la obtención de resultados en muestras de ADN degradadas que otros kits no permiten, sus resultados resultan insuficientes para la determinación de la mayoría de relaciones de parentesco que son habituales en la identificación de restos de personas desaparecidas o en casos de graves accidentes o catástrofes.
En este contexto han surgido numerosas solicitudes de patentes, relacionadas con la obtención de perfiles genéticos mediante el análisis simultáneo de varios loci STRs, que describen nuevos métodos de obtención de perfiles genéticos cada vez más discriminativos basados en el análisis de nuevos STRs además de incluir algunos de los loci STRs analizados hoy día, o bien metodologías capaces de reportar resultados en el análisis de extractos de ADN altamente degradados.
La solicitud de patente US6090558 describe el uso de la espectrometría de masas para detectar la variación de longitud en repeticiones de secuencias de nucleótidos, tales como microsatélites y repeticiones cortas en tándem, y cebadores de ADN para el análisis de polimorfismos en repeticiones de nucleótidos en tándem en loci específicos.
Tanto la solicitud de patente US6479235 como la patente ES2273367 describen la detección de loci genéticos, más específicamente, la amplificación simultánea de múltiples loci genéticos polimórficos diferentes utilizando la reacción en cadena de la polimerasa u otros sistemas de amplificación para determinar en una reacción los alelos de cada locus contenido dentro del sistema multiplex. Los loci genéticos amplificados comprenden HUMvWFA31, HUMLIPOL, HUMBFXIII, HUMF13A01, HUMFESFPS, HUMTH01, HUMTPOX, HUMCSF1PO, D22S683, D20S481, D19S253, D17S1299, D17S1298, D16S753, D16S539, D16S490, D14S562, D14S548, D14S118, D13S317, D10S1239, D9S930, D7S820, D5S818, D4S2368, D3S1539. Aunque analiza un alto número de loci STRs, incluye únicamente 8 de los 13 loci objeto del CODIS, y 3 de los 10 loci incluidos en la base de datos europea, lo que disminuye su rendimiento en cuanto a comparación de los resultados obtenidos con los millones de perfiles genéticos disponibles en las bases de datos existentes.
La solicitud de patente US6479235 describe métodos y materiales para la amplificación simultánea de, al menos, 13 STRs del CODIS en una reacción multiplex sencilla cuyos tamaños de amplificado exceden las 360pb.
La solicitud de patente US2003/0186272 describe un método rápido para determinar la longitud de los fragmentos de los alelos presentes en una pluralidad de loci en una muestra que contiene ADN que comprende (a) obtener una muestra que contiene ADN, b) amplificar mediante PCR multiplex una pluralidad de loci que comprenden FGA, vWA, TH01, TPOX, CSF1PO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51 y D21S11, donde dicha reacción PCR multiplex se lleva a cabo empleando una pluralidad de parejas de cebadores, donde al menos, un cebador de cada pareja de cebadores está marcado con una etiqueta detectable, y la amplificación produce una mezcla de amplicones marcados, y (c) analizar por electroforesis dicha mezcla de amplicones loci, donde dicha etapa de análisis permite la determinación de la longitud de los fragmentos de los alelos en dicha pluralidad de loci de la muestra que contiene ADN.
Actualmente la obtención de perfiles genéticos mediante el análisis de loci STRs plantea el problema técnico del escaso éxito que presentan la mayoría de las reacciones en el análisis del ADN degradado y el limitado poder de discriminación de las reacciones expresamente diseñadas para este tipo de muestras, en especial en la consecución de perfiles genéticos que incluyan la totalidad de los loci recogidos en el CODIS. Asimismo, la limitada cantidad de ADN presente en las muestras altamente degradadas, dificulta la realización de diferentes reacciones multiplex sobre la misma muestra o la realización de réplicas que ofrezcan una mayor fiabilidad de los resultados obtenidos, por lo cual es de vital importancia utilizar reacciones o combinaciones de reacciones que permitan la obtención de perfiles genéticos compuestos por un gran número de loci STRs, como los contenidos en las principales bases de datos y mediante métodos que garanticen una elevada fiabilidad de los perfiles genéticos obtenidos a partir de extractos de ADN altamente degradados.
Por lo tanto, existe en el estado de la técnica la necesidad de desarrollar métodos para obtener perfiles genéticos, alternativos a los ya existentes, que superen los inconvenientes antes citados y que permitan obtener perfiles genéticos fiables incluso a partir de extractos de ADN altamente degradados.
COMPENDIO DE LA INVENCIÓN
La obtención de perfiles genéticos fiables a partir de extractos de ADN altamente degradados es difícil de conseguir mediante el empleo de los métodos existentes actualmente en el estado de la técnica. Sin embargo, los autores de la presente invención han diseñado un conjunto de parejas de cebadores gracias al cual han desarrollado una reacción de amplificación multiplex que permite, sorprendentemente, obtener perfiles genéticos fiables, e incluso a partir de extractos de ADN altamente degradados, superando así los inconvenientes que presentan el resto de métodos del estado de la técnica a la hora de obtener dichos perfiles genéticos.
Tal como se muestra en el Ejemplo 1 de la presente descripción, el diseño del conjunto de parejas de cebadores de la invención se realizó mediante una búsqueda de las secuencias flanqueantes a cada locus STR y posteriormente empleando el programa Perlprimer (http://perlprimer.sourceforge.net/) . Una vez obtenidas las parejas de cebadores, se procedió a realizar una reacción de amplificación sobre un extracto de ADN empleando dichas parejas de cebadores tras lo cual, se obtuvo el perfil genético del individuo al que pertenecía el extracto de ADN con una fiabilidad, precisión y capacidad de discriminación superior a los perfiles genéticos obtenidos por otros métodos.
Así, en un primer aspecto, la invención se relaciona con un método para obtener el perfil genético de un individuo, para determinar relaciones de parentesco entre individuos o para identificar restos humanos que comprende el análisis de loci STRs en un extracto de ADN procedente de dicho individuo o dichos restos humanos mediante, al menos, una reacción de amplificación multiplex, en donde las parejas de cebadores de dicha reacción de amplificación multiplex comprenden las parejas de oligonucleótidos SEQ ID NO: 1 y SEQ ID NO: 2 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 4 (FGA) , SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 7 y SEQ ID NO: 8 (D18S51) , SEQ ID NO: 9 y SEQ ID NO: 10 (VWA) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 13 y SEQ ID NO: 14 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 16 (D7S820) , SEQ ID NO: 17 y SEQ ID NO: 18 (D2S1338) , SEQ ID NO: 19 y SEQ ID NO: 20 (D13S317) , SEQ ID NO: 21 y SEQ ID NO: 22 (Amelogenina) , y SEQ ID NO: 23 y SEQ ID NO: 24 (D5S818) .
En otro aspecto, la invención se relaciona con un kit que comprende las parejas de cebadores que comprenden las parejas de oligonucleótidos SEQ ID NO: 1 y SEQ ID NO: 2 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 4 (FGA) , SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 7 y SEQ ID NO: 8 (D18S51) , SEQ ID NO: 9 y SEQ ID NO: 10 (VWA) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 13 y SEQ ID NO: 14 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 16 (D7S820) , SEQ ID NO: 17 y SEQ ID NO: 18 (D2S1338) , SEQ ID NO: 19 y SEQ ID NO: 20 (D13S317) , SEQ ID NO: 21 y SEQ ID NO: 22 (Amelogenina) , y SEQ ID NO: 23 y SEQ ID NO: 24 (D5S818) .
En otro aspecto, la invención se relaciona con el uso de un kit según la presente invención para obtener el perfil genético de un individuo, para determinar relaciones de parentesco entre individuos o para identificar restos humanos.
En otro aspecto, la invención se relaciona con un conjunto de parejas de cebadores que comprende las siguientes parejas de oligonucléotidos SEQ ID NO: 1 y SEQ ID NO: 2 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 4 (FGA) , SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 7 y SEQ ID NO: 8 (D18S51) , SEQ ID NO: 9 y SEQ ID NO: 10 (VWA) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 13 y SEQ ID NO: 14 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 16 (D7S820) , SEQ ID NO: 17 y SEQ ID NO: 18 (D2S1338) , SEQ ID NO: 19 y SEQ ID NO: 20 (D13S317) , SEQ ID NO: 21 y SEQ ID NO: 22 (Amelogenina) , y SEQ ID NO: 23 y SEQ ID NO: 24 (D5S818) .
En otro aspecto, la invención se relaciona con una pareja de cebadores seleccionada de entre las parejas de oligonucleótidos que consisten en SEQ ID NO: 1 y SEQ ID NO: 2 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 4 (FGA) , SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 7 y SEQ ID NO: 8 (D18S51) , SEQ ID NO: 9 y SEQ ID NO: 10 (VWA) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 13 y SEQ ID NO: 14 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 16 (D7S820) , SEQ ID NO: 17 y SEQ ID NO: 18 (D2S1338) , SEQ ID NO: 19 y SEQ ID NO: 20 (D13S317) , SEQ ID NO: 21 y SEQ ID NO: 22 (Amelogenina) , SEQ ID NO: 23 y SEQ ID NO: 24 (D5S818) , SEQ ID NO: 25 y SEQ ID NO: 26 (CSF1PO) , SEQ ID NO: 27 y SEQ ID NO: 28 (D5S818) , SEQ ID NO: 15 y SEQ ID NO: 29 (D7S820) , SEQ ID NO: 30 y SEQ ID NO: 31 (D21S11) , SEQ ID NO: 32 y SEQ ID NO: 33 (VWA) , SEQ ID NO: 34 y SEQ ID NO: 35 (D8S1179) , SEQ ID NO: 36 y SEQ ID NO: 37 (D19S433) , SEQ ID NO: 38 y SEQ ID NO: 39 (D16S539) , SEQ ID NO: 40 y SEQ ID NO: 41 (D3S1358) , SEQ ID NO: 42 y SEQ ID NO: 43 (D18S51) , SEQ ID NO: 44 y SEQ ID NO: 45 (D13S317) , SEQ ID NO: 46 y SEQ ID NO: 22 (Amelogenina) , y SEQ ID NO: 3 y SEQ ID NO: 47 (FGA) .
El uso, tanto del conjunto de cebadores como de los cebadores de la invención para obtener el perfil genético de un individuo, para determinar relaciones de parentesco entre individuos o para identificar restos humanos, constituyen aspectos adicionales de la presente invención.
DESCRIPCIÓN DE LAS FIGURAS
La Figura 1 corresponde a un gráfico llamado electroferograma que muestra el perfil genético de un individuo para los STRs analizados mediante el primer conjunto de parejas de cebadores de la invención empleando un analizador automático de secuencias AB3130 Genetic Analyzer (Applied Biosystems®) . En la Figura se pueden observar 4 paneles, cada uno correspondiente a aquellas parejas de cebadores marcadas con el mismo locus fluorescente. En cada panel se muestra la intensidad de la señal detectada en Relative Fluorescence Units (RFU, unidad relativa de fluorescencia) en el eje Y; el eje X corresponde al tamaño en pares de bases. Así, el primer panel corresponde a los resultados obtenidos para los productos de STRs amplificados con cebadores marcados con 6-FAMTM (dirigidos a los loci CSF1PO y FGA) , el segundo panel a los marcados con VICTM (loci TH01, D21S11 y D7S820) , el tercero a NEDTM (loci TPOX, D18S51 y VWA) y en el cuarto panel se muestran los resultados para los loci STRs marcados con el fluorocromo PET® (D2S1338, D13S317, amelogenina, y D5S818) . Las barras situadas en la parte superior de cada panel corresponden al nombre de los loci. Los rectángulos situados bajos los picos del electroferograma muestran el nombre del alelo, indicado por un número, su tamaño en pares de bases y la intensidad de la señal en RFUs.
La Figura 2 corresponde a un gráfico llamado electroferograma que muestra el perfil genético de un individuo para los STRs analizados mediante el segundo conjunto de cebadores de la invención empleando un analizador automático de secuencias AB3130 Genetic Analyzer (Applied Biosystems®) . En la Figura se pueden observar 4 paneles, cada uno correspondiente a aquellas parejas de cebadores marcadas con el mismo locus fluorescente. En cada panel se muestra la intensidad de la señal detectada en Relative Fluorescence Units (RFU, unidad relativa de fluorescencia.) en el eje Y; el eje X corresponde al tamaño en pares de bases. Así, el primer panel corresponde a los resultados obtenidos para los productos de STRs amplificados con cebadores marcados con 6-FAMTM (dirigidos a los loci CSF1PO, D5S818, D7S820 y D21S11) , el segundo panel a los marcados con VICTM (loci TH01, D16S539, D3S1358 y D18S51) , el tercero a NEDTM (loci TPOX, VWA, D8S1179 y D19S433) y en el cuarto panel se muestran los resultados para los loci STRs marcados con el fluorocromo PET® (D13S317, amelogenina y FGA) . Las barras situadas en la parte superior de cada panel corresponden al nombre de los loci. Los rectángulos situados bajos los picos del electroferograma muestran el nombre del alelo, indicado por un número, su tamaño en pares de bases y la intensidad de la señal en RFUs.
La Figura 3 es una representación gráfica que muestra la comparación del diseño del primer conjunto de parejas de cebadores (denominado I-DNA2) [Panel A] y el diseño del segundo conjunto de parejas de cebadores (denominado I-DNA-1) [Panel B]. Las cajas representan los tamaños de amplificado para cada locus. Los loci marcados con diferente color se presentan en diferentes escalas de grises. Los respectivos marcajes se señalan en la parte derecha de la Figura.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
Los autores de la presente invención han diseñado un conjunto de parejas de cebadores gracias al cual han desarrollado una reacción de amplificación multiplex que permite obtener perfiles genéticos con un alto poder de discriminación a partir de extractos de ADN altamente degradados, superando así los inconvenientes que presentan el resto de métodos del estado de la técnica a la hora de obtener dichos perfiles genéticos Las parejas de cebadores de la invención han sido diseñadas de tal manera que es posible obtener el análisis simultáneo de 11 loci STRs (Short Tandem Repeats) más el locus amelogenina para la determinación del sexo, cuando un extracto de ADN es sometido a una reacción de amplificación multiplex empleando dichas parejas de cebadores, e incluso a partir de extractos de ADN altamente degradados, en donde el tamaño de los fragmentos extraídos no supera las 230 pb. Adicionalmente, los inventores han diseñado un segundo conjunto de parejas de cebadores que empleado en otra reacción de amplificación sobre el mismo extracto de ADN, proporcionan por un lado la confirmación del perfil genético obtenido con el primer conjunto de parejas de cebadores, pues comprende cebadores dirigidos a los mismos loci STRs del primer conjunto de cebadores, y por otro ampliar el perfil genético a 15 loci STRs más el locus amelogenina. Estas dos características permiten obtener un perfil genético con un alto poder de discriminación. Además, mediante la combinación de ambos conjuntos de parejas de cebadores se analizan 10 loci por duplicado: (i) 8 de los cuales se genotipan con parejas de cebadores diferentes por lo que se reducen las pérdidas alélicas causadas cuando un cebador concreto no se une a la secuencia de ADN diana debido a algún polimorfismo; (ii) y los dos restantes con idénticos cebadores, lo que proporciona un control interno adicional, ya que los genotipos de ambos loci deben ser idénticos en cada una de las reacciones. Cabe mencionar que ambos conjuntos de parejas de cebadores presentan además, cebadores dirigidos a identificar el locus amelogenina para la determinación del sexo.
Así, en base a estos conjuntos de parejas de cebadores, se han desarrollado los distintos aspectos inventivos que forman parte de la presente invención y que serán descritos en detalle a continuación. Previamente a la descripción de dichos aspectos inventivos, se incluye un listado de definiciones donde se explica el significado de los términos empleados en el contexto de la presente invención para ayudar en la comprensión de la misma.
Definiciones “un”/”una”
El uso de la palabra “un” o “una” cuando se usa junto con el término “comprender” o “comprende” en las reivindicaciones y/o la descripción puede significar “uno”, pero también es consistente con el significado de “uno o más”, “al menos uno” y “uno o más de uno”.
Perfil Genético En el contexto de la presente invención, los términos “perfil genético” y “huella genética” tienen el mismo significado por lo que pueden emplearse indistintamente a lo largo de la descripción. El “perfil genético” es un conjunto de secuencias de bases características del material genético que permiten diferenciar a un individuo de otro.
Loci STRs En la presente invención, el perfil genético se obtiene a partir del análisis de secuencias de bases cortas repetidas en tandem o STRs (del inglés Short Tandem Repeats) que se caracterizan por su alta variabilidad entre individuos. Así, en la presente invención se entiende por “secuencias STRs” o “loci STRs” aquellas secuencias del ADN, también llamadas microsatélites, que contienen repeticiones de 4 pb (Butler JM, Biotechniques. 2007 Oct;43 (4) :ii-v.) .
El análisis de los loci STRs en el genoma presenta múltiples aplicaciones que incluyen, aunque no se limitan a, obtención de perfiles genéticos, diagnósticos de parentesco, determinación del origen de una muestra o tejido, identificación de cadáveres, estudios de genética de poblaciones, pruebas de zigosidad en mellizos, seguimiento de transplantes de médula ósea, evaluación de la trazabilidad de muestras biológicas de origen humano, identificación de mezclas presentes en una muestra y determinación del número de contribuyentes de origen humano a una mezcla y su aportación relativa a la mezcla.
PCR
PCR corresponde a las siglas de reacción en cadena de la polimerasa mediante la cual se pueden obtener millones de copias de las regiones de ADN deseadas. Se caracteriza por el empleo de parejas de cebadores que acotan la región de la que se realizarán millones de copias, lo que también se conoce como “amplificar ADN” durante la PCR. La PCR está compuesta por un número determinado de ciclos, compuestos a su vez por tres fases en las que las hebras de ADN se separan, se unen los cebadores y se elongan las nuevas hebras de ADN. En cada ciclo, si la eficiencia de la reacción es del 100% se produce un crecimiento exponencial de los fragmentos de ADN objeto de la amplificación.
Reacción de amplificación multiplex
En la presente invención se entiende por “Reacción de amplificación multiplex” a la reacción PCR en la cual se amplifica más de una secuencia de ADN en una misma reacción, mediante el empleo de dos o más parejas de cebadores en único tubo junto con el resto de los reactivos de la reacción con el fin de amplificar simultáneamente múltiples secuencias de ADN.
Oligonucleótido El término “oligonucleótido” hace referencia a la secuencia de bases de nucleótidos unidos por enlaces fosfo-diéster, habitualmente no mayor de 50 nucleótidos.
Cebador
En la presente invención se entiende por “cebador” o “primer” u “oligonucleótido” (“oligo”) a la secuencia de nucleótidos a partir de la cual la ADN polimerasa inicia la síntesis de una molécula nueva de ADN. Los cebadores son secuencias nucleotídicas cortas, aproximadamente de 15-24 nucleótidos de longitud que se pueden alinear con una hebra de ADN diana gracias a la complementariedad de bases para formar un híbrido entre el cebador y la hebra diana de ADN. Después, el enzima ADN polimerasa puede extender el cebador a lo largo de la hebra diana de ADN. Los métodos para preparar y usar cebadores se describen, por ejemplo en Sambrook et al. (2001) y Ausubel et al. (1999) .
Pareja de cebadores En el contexto de la presente invención se entiende por “pareja de cebadores” o “primer pair”, al conjunto de dos cebadores que, empleados en una misma reacción de amplificación o PCR, permiten obtener múltiples copias de una secuencia diana de ADN. Cada uno de los cebadores hibrida con la secuencia diana, de manera que se amplifica la secuencia de nucleótidos acotada mediante cada pareja de cebadores. La extensión de los cebadores durante los ciclos de PCR determina la multiplicación exponencial 2N de la secuencia de nucleótidos acotada por los cebadores, siendo N el número de ciclos de la reacción PCR.
Muestra biológica En el contexto de la presente invención, se entiende por “muestra biológica” cualquier materia que contenga ADN.
Extracto de ADN
En el contexto de la presente invención se entiende “extracto de ADN”, cuando tras someter la muestra biológica a un procedimiento de extracción, separación, purificación o clonación de ADN, entre otros, se obtiene como resultado ya sea en seco, en solución, unido o no a otras moléculas, adherido o no a diversas sustancias o lechos, materia en la que el ADN se encuentra en mayor proporción relativa respecto al resto de moléculas presentes, en comparación con la muestra biológica de partida.
Así “extracto de ADN” se refiere al ADN extraído de cualquier muestra biológica que contenga ADN humano, ya sea procedente de un individuo vivo o muerto, feto, órganos, tejidos ó células.
En el contexto de la presente invención, se entiende por “ADN altamente degradado” al ADN cuyos fragmentos son de tamaño reducido, preferiblemente, tamaños menores de 300 pb, de 290 pb, de 280 pb, de 270 pb, de 260 pb, de 250 pb, de 240 pb, de 230 pb, de 220 pb, de 210 pb o de 200 pb.
Individuo El término “individuo” se refiere a ser humano de cualquier edad o raza, que en el contexto de la presente invención puede estar viva o muerta.
Cebadores de la invención Los inventores han diseñado un conjunto de parejas de cebadores, de aquí en adelante, “primer conjunto de parejas de cebadores de la invención” o “I-DNA2”, que permite obtener el perfil genético de un individuo a partir de extractos de ADN altamente degradados. Las parejas de cebadores han sido diseñadas de manera que empleadas conjuntamente en una reacción de amplificación multiplex es posible obtener el análisis simultáneo de 11 loci STRs más el locus amelogenina que determina el sexo. Los loci STRs analizados en la presente invención así como las parejas de cebadores diseñadas para su identificación se muestran en la Tabla 1 (página siguiente) . En el Ejemplo 1 se detalla el procedimiento seguido en el diseño del primer conjunto de parejas de cebadores de la invención.
Tabla 1. Resumen de las secuencias de los cebadores en dirección 5´a 3´ diseñados para la amplificación de cada locus STR. Asimismo, se detalla del alelo menor al mayor del STR que será considerado mediante este análisis (columna: alelos) así como el tamaño máximo y mínimo de amplificado posible para cada STR.
LOCUS ALELOS Tamaño amplificados (pb) SEQ ID NO: SECUENCIA (5-3´)
CSF1PO 5 88-132 1 GAAGATATTAACAGTAACTGCCTT
16 2 ACCCTGTTCTAAGTACTTCC
FGA 12 140-298 3 CTCACAGATTAAACTGTAACCA
51.2 4 GTGATTTGTCTGTAATTGCCA
TPOX 4 53-101 5 CTTAGGGAACCCTCACTG
16 6 GCAGCGTTTATTTGCCCAA
D18S51 7 109-196 7 CTTAGGGAACCCTCACTG
28.3 8 GTACAATAACAGTTGCTACTATTTCT
VWA 10 204-264 9 ACTCCTCAGACTGATCCTATA
25 10 AGATGATAAATACATAGGATGGATG
TH01 3 49-93 11 AACACAGACTCCATGGTG
14 12 GTTCCTCCCTTATTTCCCT
D21S11 12 94-212 13 CCCAAGTGAATTGCCTTC
41.2 14 ATAGGAGGTAGATAGACTGGA
D7S820 5 220-260 15 GAATTATAACGATTCCACATTTATCC
15 16 GTTGGTCAGGCTGACTATG
D2S1338 11 88-156 17 GGAAACAGAAATGGCTTGG
28 18 GTAAGTTAAAGGATTGCAGGAG
D13S317 5 164-212 19 GTTCATTTCTTTAGTGGGCA
17 20 GTCCTTCAACTTGGGTTGAG
Amelogenina X 220-226 21 AAAGCTACCACCTCATCCT
Y 22 GGCTTGAGGCCAACCAT
D5S818 6 234-282 23 TAGCAAGTATGTGACAAGGG
18 24 GTCAGATGCTAATAGGCTGTT
Así, en un aspecto, la invención se relaciona con un conjunto de parejas de cebadores que comprende las siguientes parejas de oligonucléotidos SEQ ID NO: 1 y SEQ ID NO: 2 10 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 4 (FGA) , SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 7 y SEQ ID NO: 8 (D18S51) , SEQ ID NO: 9 y SEQ ID NO: 10 (VWA) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 13 y SEQ ID NO: 14 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 16 (D7S820) , SEQ ID NO: 17 y SEQ ID NO: 18 (D2S1338) , SEQ ID NO: 19 y SEQ ID NO: 20 (D13S317) , SEQ ID NO: 21 y SEQ ID
NO: 22 (Amelogenina) , y SEQ ID NO: 23 y SEQ ID NO: 24 (D5S818) .
Por otro lado, los autores de la presente invención han diseñado un segundo conjunto de parejas de cebadores, de aquí en adelante, “segundo conjunto de parejas de cebadores de la invención” o “I-DNA1”, caracterizado porque comprende, al menos, una pareja de cebadores caracterizada porque:
- amplifica uno de los locus amplificados por el primer conjunto de parejas de cebadores de la invención y
- uno de los cebadores de la pareja presenta una secuencia de nucleótidos distinta de la secuencia de nucleótidos de la pareja de cebadores que en el primer conjunto de cebadores amplifica el mismo locus.
El segundo conjunto de parejas de cebadores de la invención permite obtener el perfil 10 genético de 14 loci STRs más el locus amelogenina. El segundo cebadores de cebadores, así como los loci STRs que amplifica, se recogen en la Tabla 2 (página siguiente) .
Un valor adicional de la presente invención consiste en que al realizar dos reacciones de amplificación sobre el mismo extracto de ADN, es decir, dividir un único extracto de ADN
en dos alícuotas y sobre cada alícuota llevar a cabo una reacción de amplificación empleando, respectivamente, I-DNA2 e I-DNA1 se consigue, en primer lugar la confirmación del perfil genético obtenido con el primer conjunto de parejas de cebadores (I-DNA2) y en segundo lugar, se amplía el perfil genético obtenido de 11 y 14 STRs respectivamente a 15 STRs más amelogenina.
Tabla 2: Resumen de las secuencia de los cebadores en dirección 5´a 3´ diseñados para la amplificación de cada STR en la combinación denominada como I-DNA1 (columna: secuencia 5´3´) . En esta misma tabla se detalla del alelo menor al mayor del STR que será considerado mediante este análisis (columna: alelos) así como el tamaño máximo y mínimo posible para cada STR.
LOCUS ALELOS Tamaño de los amplificados (pb) SEQ ID NO: SECUENCIA (5-3´)
CSF1PO 6 71-115 25 ACTGCCTTCATAGATAGAAGAT
15 26 GCCCTGTTCTAAGTACTTCCT
D5S818 7 123-171 27 TTAATAGCAAGTATGTGACAAGG
17 28 GACATTTGTATCTTTATCTGTATCCTT
D7S820 6 179-219 15 GAATTATAACGATTCCACATTTATCC
15 29 ATAAAGGGTATGATAGAACACTTG
D21S11 24 227-297 30 CCCTGATTCTTCAGCTTGTA
38 31 GCAGAGACAGACTAATAGGAGG
TPOX 6 53-101 5 CTTAGGGAACCCTCACTG
16 6 GCAGCGTTTATTTGCCCAA
VWA 11 109-169 32 TCAGTATGTGACTTGGATTGA
24 33 GTAGGTTAGATAGAGATAGGACAGA
D8S1179 8 177-229 34 TTGTATTTCATGTGTACATTCGT
20 35 TTGTGTTCATGAGTATAGTTTCAC
D19S433 5, 2 237-295 36 CATGTTGGCACATTCCTG
18.2 37 AGTTCTTTAGCAGTGATTTCTG
TH01 5 49-93 11 AACACAGACTCCATGGTG
14 12 GTTCCTCCCTTATTTCCCT
D16S539 5 101-149 38 CCTCTTCCCTAGATCAATACA
16 39 ATCTGTAAGCATGTATCTATCATC
D3S1358 9 157-205 40 TGTAGTGAGCTATGATTCCC
20 41 GTATTCCCTGTGCCTTTG
D18S51 7 213-300 42 GTCTCAGCTACTTGCAGG
27 43 GGAGATGTCTTACAATAACAGTTG
D13S317 5 72-120 44 CGCCTATCTGTATTTACAAATACAT
17 45 GGACAGAAAGATAGATAGATGATTGAT
Amelogenina X 121-127 46 CCCTGGGCTCTGTAAAGA
Y 22 GGGCTTGAGGCCAACCAT
FGA 16 135-293 3 CTCACAGATTAAACTGTAACCA
51.2 47 TTGTCTGTAATTGCCAGC
Uso de los cebadores de la invención Los diferentes usos que tienen los cebadores de la invención, constituyen aspectos inventivos adicionales de la presente invención.
Así, los usos del primer conjunto de parejas de cebadores de la invención incluyen, sin limitarse a, la obtención de perfiles genéticos, diagnósticos de parentesco, determinación del origen de una muestra o tejido, identificación de cadáveres, estudios de genética de poblaciones, pruebas de zigosidad en mellizos, seguimiento de transplantes de médula ósea, evaluación de la trazabilidad de muestras biológicas de origen humano, identificación de mezclas presentes en una muestra y determinación del número de contribuyentes de origen humano a una mezcla y su aportación relativa a la mezcla.
En otro aspecto, la invención se relaciona con el uso del primer conjunto de parejas de cebadores de la invención (Tabla 1) para obtener el perfil genético de un individuo, para determinar relaciones de parentesco entre individuos o para identificar restos humanos.
Método de la invención Tal como se ha explicado anteriormente, mediante una reacción de amplificación empleando el primer conjunto de parejas de cebadores de la invención (Tabla 1) es posible llevar a cabo el análisis simultáneo de 11 loci STRs más el locus amelogenina en un extracto de ADN altamente degradado para obtener un perfil genético de un individuo.
Así, en un primer aspecto, la invención se relaciona con un método, de aquí en adelante “método de la invención”, para obtener el perfil genético de un individuo, para determinar relaciones de parentesco entre individuos o para identificar restos humanos que comprende el análisis de loci STRs en un extracto de ADN procedente de dicho individuo o dichos restos humanos mediante, al menos, una reacción de amplificación multiplex, en donde las parejas de cebadores de dicha reacción de amplificación multiplex comprenden las parejas de oligonucleótidos SEQ ID NO: 1 y SEQ ID NO: 2 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 4 (FGA) , SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 7 y SEQ ID NO: 8 (D18S51) , SEQ ID NO: 9 y SEQ ID NO: 10 (VWA) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 13 y SEQ ID NO: 14 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 16 (D7S820) , SEQ ID NO: 17 y SEQ ID NO: 18 (D2S1338) , SEQ ID NO: 19 y SEQ ID NO: 20 (D13S317) , SEQ ID NO: 21 y SEQ ID NO: 22 (Amelogenina) , y SEQ ID NO: 23 y SEQ ID NO: 24 (D5S818) .
La puesta en práctica del método de la invención requiere la obtención de un extracto de ADN que procederá, en última instancia, de una muestra biológica que será tratada de forma adecuada para obtener dicho extracto de ADN.
Como entiende el experto en la materia, si el método de la invención está dirigido a obtener el perfil genético de un individuo o la relación de parentesco entre individuos, el extracto de ADN procederá del individuo cuyo perfil genético quiere obtenerse, o de los individuos cuya relación de parentesco quiere determinarse. Sin embargo, si el método de la invención está dirigido a la identificación de restos humanos, el extracto de ADN procederá de los restos humanos que se quieren identificar. En la presente invención, el término “restos humanos” incluye cualquier muestra biológica procedente de un ser humano muerto o vivo, pudiendo estar dicho resto humano conservado en formol, congelado, desecado, fijado en parafina, en estado de descomposición, degradación y/o putrefacción, entre otros.
Ejemplos de muestras biológicas de las que se puede obtener ADN incluyen, sin limitarse a, fluidos biológicos (sangre, saliva, orina, esperma, etc) ; epidermis, caspa, pelo, heces, una muestra vaginal, una muestra de tejido, tejidos quemados, etc. Las muestras biológicas más adecuadas para la obtención de extractos de ADN útiles en la identificación de restos humanos incluyen, entre otros, pelos con raíz, hueso compacto, diente, tejidos blandos y sangre.
En una realización particular, el extracto de ADN procede de una muestra de sangre, pelo, saliva, epidermis, esperma, caspa, una muestra vaginal y una muestra de tejido,
La obtención de la muestra biológica debe realizarse en las condiciones y con el material adecuado, tales como torundas, pinzas, etc. y cada muestra debe almacenarse independientemente en frascos o bolsas plásticas separadas y estériles, sin ningún tipo de conservante, en congelación y debidamente rotulados, evitando la contaminación por material biológico foráneo.
Una vez que se ha obtenido la muestra del individuo/s o del resto humano, ésta debe ser procesada para obtener el extracto de ADN. La fracción de ADN adecuada para la puesta en práctica del método de la invención es el ADN nuclear. La extracción del ADN puede ser llevado a cabo usando cualquier método conocido por los expertos en la materia (Sambrock et al., 2001. “Molecular cloning: a Laborator y Manual”, 3rd ed., Cold Spring Harbor Laborator y Press, N.Y., Vol. 1-3) que incluyen, sin limitarse a, centrifugaciones en gradientes de densidad, extracción en dos fases usando fenol acuoso o cloroformo con etanol, cromatografía en columna, métodos basados en la capacidad del ADN para unirse en superficies de cristal y/o silicatos, como preparaciones de tierra diatomeas o lechos de cristal, empleando kits comerciales, por ejemplo, los kits “Q-Biogene fast DNA kit” o el “QIAamp (R) DNA Blood Mini Kit” (Qiagen, Hilden, Alemania) el “G-Spin IIp” (Intron Biotechnology, Corea) o el “Fast Prep System Bio 101” (Qbiogene, Madrid, España) o los métodos descritos en las solicitudes de patente US5.057.426, US4.923.978 y la solicitud de patente europea EP0512767A1.
El extracto de ADN es cuantificado y normalizado para obtener cantidades iguales de ADN en cada muestra en el caso de que la cantidad de ADN sea suficiente para ello. En el caso de muestras altamente degradadas con ADN escaso y/o degradado es habitual añadir la mayor cantidad de ADN posible en la subsiguiente reacción de PCR multiplex.
Tras obtener el extracto de ADN de la muestra biológica, éste es sometido, al menos, a una reacción de amplificación multiplex empleando el primer conjunto de parejas de cebadores de la invención. La amplificación de los diferentes loci STRs requiere condiciones y procedimientos de reacción específicos para cada una de las parejas de cebadores empleadas, las cuales pueden conseguirse mediante variación sistemática de cada parámetro. El número de ciclos y la temperatura de alineamiento empleada en la reacción de PCR deben de ser adecuados para la obtención de resultados fiables mediante el empleo de cada una de las parejas de cebadores del primer conjunto de cebadores de la invención. Parámetros como la concentración de cebadores son específicos para cada cebador y se han ajustado en la validación del conjunto de cebadores. Los cebadores ofrecen resultados en un amplio rango de concentraciones, aunque las concentraciones óptimas para cada pareja de cebadores se recogen en la Tabla 3 (página siguiente) .
Tabla 3. Resumen de las concentraciones a las que se emplea cada uno de los cebadores y el fluorocromo con el que se ha marcado el extremo 5´del cebador directo o forward (números en negrita) de cada pareja de cebadores en el conjunto denominado I-DNA2.
LOCUS SEQ ID NO: Intervalo Concentración de cebadores (μM) Concentración óptima decebadores (μM) Marcaje fluorescente
CSF1PO 1 0, 12-0, 03 0, 06 6-FAM
2
FGA 3 0, 14-0, 03 0, 08
4
TPOX 5 0, 16-0, 04 0, 10 NED
6
D18S51 7 0, 36-0, 24 0, 30
8
VWA 9 2, 4-0, 12 0, 18
10
TH01 11 0, 11-0, 03 0, 05 VIC
12
D21S11 13 0, 17-0, 03 0, 11
14
D7S820 15 0, 20-0, 08 0, 14
16
D2S1338 17 0, 21-0, 09 0, 15 PET
18
D13S317 19 0, 21-0, 09 0, 15
20
Amelogenina 21 0, 17-0, 03 0, 11
22
D5S818 23 0, 14-0, 03 0, 08
24
Tal como se ha indicado al inicio de la presente descripción, el método de la invención comprende el análisis de loci STRs en un extracto de ADN mediante una reacción de amplificación multiplex que, adicionalmente, puede comprender una segunda reacción de amplificación de dicho extracto de ADN. Así, en una realización particular del método de la invención, el análisis de loci STRs comprende, además, una segunda reacción de 10 amplificación multiplex del extracto de ADN procedente de dicho individuo o dichos restos humanos, en donde las parejas de cebadores de dicha segunda reacción de amplificación multiplex comprenden, al menos, una pareja de cebadores caracterizada porque: -amplifica uno de los locus amplificados en la primera reacción de amplificación 15 multiplex y
-uno de los cebadores de la pareja presenta una secuencia de nucleótidos distinta
de la secuencia de nucleótidos de la pareja de cebadores que en la primera reacción de amplificación multiplex amplifica el mismo locus.
Como se ha indicado previamente, con dos reacciones de amplificación sobre el mismo extracto de ADN, es decir, dividir un único extracto de ADN en dos alícuotas y sobre cada alícuota llevar a cabo una reacción de amplificación empleando, respectivamente, I-DNA2 e I-DNA1, se consigue, por un lado, la confirmación del perfil genético obtenido con el primer conjunto de parejas de cebadores de la invención (I-DNA2) y por otro, si se desea, ampliar el número de loci STRs que forman parte del perfil genético.
En otra realización particular de la invención, las parejas de cebadores de la segunda reacción de amplificación multiplex comprenden 2, 3, 4, 5, 6, 7, 8 o 9 parejas de cebadores, cada pareja de cebadores caracterizada porque:
-amplifica uno de los locus amplificados en la primera reacción de amplificación
multiplex y
-uno de los cebadores de la pareja presenta una secuencia de nucleótidos distinta
de la secuencia de nucleótidos de la pareja de cebadores que en la primera reacción de amplificación amplifica el mismo locus.
En otra realización todavía más particular, las parejas de cebadores de la segunda reacción de amplificación multiplex se seleccionan de entre las parejas de oligonucleótidos SEQ ID NO: 25 y SEQ ID NO: 26 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 47 (FGA) , SEQ ID NO: 42 y SEQ ID NO: 43 (D18S51) , SEQ ID NO: 32 y SEQ ID NO: 33 (VWA) , SEQ ID NO: 30 y SEQ ID NO: 31 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 29 (D7S820) , SEQ ID NO: 44 y SEQ ID NO: 45 (D13S317) , SEQ ID NO: 46 y SEQ ID NO: 22 (Amelogenina) y SEQ ID NO: 27 y SEQ ID NO: 28 (D5S818) .
En otra realización aún más particular, la segunda reacción de amplificación multiplex adicionalmente comprende, al menos, 1, 2, 3, 4, 5 o 6 de las parejas de cebadores seleccionadas de las parejas de oligonucleótidos SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 34 y SEQ ID NO: 35 (D8S1179) , SEQ ID NO: 36 y SEQ ID NO: 37 (D19S433) , SEQ ID NO: 38 y SEQ ID NO: 39 (D16S539) y, SEQ ID NO:40 y SEQ ID NO:41 (D3S1358) .
Las parejas de cebadores empleadas en la segunda reacción de amplificación multiplex 5 de la realización particular del método de la invención, así como los loci que amplifican, se recogen en la Tabla 2, y la concentración óptima para cada cebador (ajustada en la validación del segundo conjunto de parejas de cebadores) se muestra en la Tabla 4.
Tabla 4. Resumen de las concentraciones a las que se emplea cada uno de los cebadores y el fluorocromo con el que se ha marcado el extremo 5´del cebador directo ó forward (números en 10 negrita) de cada pareja de cebadores en el conjunto denominado I-DNA1.
LOCUS SEQ ID NO Intervalo Concentración de cebadores (μM) Concentración óptima de cebadores (μM) Marcaje fluorescente
CSF1PO 25 0, 14-0, 03 0, 08 6-FAM
26
D5S818 27 0, 25-0, 13 0, 19
28
D7S820 15 0, 19-0, 07 0, 13
29
D21S11 30 0, 16-0, 04 0, 1
31
TPOX 5 0, 14-0, 03 0, 08 NED
6
VWA 32 0, 15-0, 03 0, 07
33
D8S1179 34 0, 15-0, 03 0, 09
35
D19S433 36 0, 25-0, 13 0, 19
37
TH01 11 0, 1-0, 03 0, 04 VIC
12
D16S539 38 0, 17-0, 05 0, 11
39
D3S1358 40 0, 15-0, 03 0, 09
41
D18S51 42 0, 44-0, 32 0, 38
43
D13S317 44 0, 12-0, 03 0, 06 PET
45
Amelogenina 46 0, 17-0, 05 0, 11
22
FGA 3 0, 37-0, 25 0, 31
47
Como entiende el experto en la materia, una reacción de amplificación multiplex requiere una serie de reactivos, entre los que se incluyen, sin limitar a, el ADN molde, la enzima ADN polimerasa, al menos, dos parejas de cebadores (siendo cada cebador de cada pareja complementario a una de las dos hebras del ADN) , desoxinucleótidos trifosfatos (dNTPs) , cloruro de magnesio (MgCl2) , buffer de reacción y aditivos opcionales, que pueden añadirse por separado mezclándose en el laboratorio o adquirir previamente mezclados, como es el caso de Qiagen Multiplex PCR Kit (Qiagen, Valencia, CA) , al que se le añaden las parejas de cebadores en las concentraciones adecuadas y el ADN molde.
La PCR se lleva a cabo en un termociclador que realiza los ciclos en los tiempos y temperaturas programadas de forma exacta, tales como la temperatura de hibridación, que depende de la temperatura de fusión de cada uno de los cebadores utilizados en la reacción o la temperatura de extensión.
La temperatura de fusión de los cebadores SEQ ID NO: 1 a SEQ ID NO: 24 (Tabla 1) está comprendida entre 58 y 60ºC, y la del conjunto de parejas de cebadores mostrados en la Tabla 2, está comprendida entre 57 y 63ºC, según lo calculado mediante el programa informático Perlprimer (http://perlprimer.sourceforge.net/) .
Así, en una realización particular del método de la invención, la temperatura de hibridación de la reacción de amplificación multiplex que comprende los oligonucleótidos SEQ ID NO: 1 a SEQ ID NO: 24 (Tabla 1) está comprendida entre 58 y 60ºC, y/o en caso de que la segunda reacción de amplificación multiplex se lleve a cabo con todo o parte del conjunto de parejas de oligonucleótidos mostrados en la Tabla 2, la temperatura de hibridación de la segunda reacción de amplificación multiplex está comprendida entre 57 y 63ºC.
La amplificación multiplex ya sea el primer conjunto de parejas de cebadores o I-DNA2 (Tabla 1) como el segundo conjunto de parejas de cebadores o I-DNA1 (Tabla 2) , ofrece resultados satisfactorios en un amplio rango de temperaturas de hibridación, entre 57-63ºC, aunque los mejores resultados en ambos casos, es de 60, 5ºC. De igual manera, los cebadores ofrecen resultados en un amplio rango de concentraciones, aunque las concentraciones óptimas para cada pareja de cebadores se recogen en las Tablas 3 y 4. Respecto al número de ciclos empleado en la reacción de PCR se obtienen resultados satisfactorios entre 28-32 ciclos, aunque el número de ciclos óptimo es de 30 en ambas reacciones de amplificación multiplex.
Opcionalmente, si se desea, previamente a la reacción de amplificación multiplex, puede llevarse a cabo el marcaje de los cebadores que participan en dicha reacción de amplificación multiplex con el fin de poder detectar posteriormente los fragmentos amplificados. El marcaje de los productos de amplificación puede realizarse por métodos convencionales. Dicho marcaje puede ser directo, para lo cual pueden utilizarse fluoróforos, por ejemplo, Cy3, Cy5, fluoresceína, alexa, etc., enzimas, por ejemplo, fosfatasa alcalina, peroxidasa, etc., isótopos radiactivos, por ejemplo, 33P, 125I, etc., o cualquier otro marcador conocido por el experto en la materia. Alternativamente, dicho marcaje puede ser indirecto mediante el empleo de métodos químicos, enzimáticos, etc.; a modo ilustrativo, el producto de amplificación puede incorporar un miembro de un par de unión específica, por ejemplo, avidina o estreptavidina conjugada con un fluorocromo (locus) , y la sonda se une al otro miembro del par de unión específica, por ejemplo, biotina (indicador) , efectuándose la lectura mediante fluorimetría, etc., o bien, el producto de amplificación puede incorporar un miembro de un par de unión específica, por ejemplo, un anticuerpo anti-digoxigenina conjugado con una enzima (locus) , y la sonda se une al otro miembro del par de unión específica, por ejemplo, digoxigenina (indicador) , etc., transformándose el sustrato de la enzima en un producto luminiscente o fluorescente y , efectuándose la lectura mediante quimio-luminiscencia, fluorimetría, etc.
Así, en una realización particular, el marcaje del producto de amplificación se lleva a cabo mediante el marcaje, en uno de sus extremos, de uno de los oligonucleótidos de cada pareja de cebadores que, en otra realización todavía más particular, el compuesto empleado en el marcaje de los oligonucleótidos se selecciona del grupo que consiste en un radioisótopo, un material fluorescente, digoxigenina y biotina. Ejemplos de materiales fluorescentes que se pueden emplear en el marcaje de oligonucleótidos incluyen, sin limitar a, 5-carboxifluoresceína (5-FAM) , 6-FAM, análogo tetraclorinado de t-FAM (TET) , análogo hexaclorinado de 6-FAM (HEX) , 6-carboxitetrametilrodamina (TAMRA) , 6-carboxi-X-rodamina (ROX) , 6-carboxi-4’, 5’-dicloro-2’, 7’-dimetoxifluoresceína (JOE) , NED, Cy-3, Cy-5, Cy-5.5, fluorescein-6-isotiocinato (FITC) y tetrametilrodamina-5isotiocinato (TRITC) .
Tras finalizar la reacción de amplificación multiplex, si se desea, se puede proceder a separar los productos de amplificación o amplicones. Prácticamente cualquier método convencional puede ser utilizado dentro del marco de la invención para separar los productos de amplificación. Las técnicas para separar los productos de amplificación están ampliamente descritas en el estado de la técnica, como por ejemplo, en Sambrook et al., 2001 (citado ad supra) . Técnicas para separar los productos de amplificación son, por ejemplo, electroforesis sumergida con geles de Methafor, electroforesis en geles de poliacrilamida, electroforesis capilar, etc.
Seguidamente a la separación de los productos de amplificación, se procede a identificar el tamaño de los fragmentos separados, para lo cual puede emplearse cualquiera de los procedimientos de identificación de fragmentos de amplificación conocidos del estado de la técnica, tales como hibridación con sondas marcadas (por ejemplo con un fluoróforo) que serán detectadas por un detector y procesadas mediante un sistema informático, tinción, por ejemplo, con bromuro de etidio, tinción de plata, etc. Tal como entiende el experto en la materia, si todo este proceso es integrado en un sistema informático, se puede generar una gráfica denominada electroferograma donde puede identificarse el tamaño de los fragmentos amplificados.
Kit de la invención Por otro lado, la invención se relaciona con un kit útil para la puesta en práctica del método de la invención, que comprende el primer conjunto de parejas de cebadores de la invención o I-DNA2.
Así, en otro aspecto, la invención se relaciona con un kit, de aquí en adelante “kit de la invención”, que comprende las parejas de cebadores SEQ ID NO: 1 y SEQ ID NO: 2 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 4 (FGA) , SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 7 y SEQ ID NO: 8 (D18S51) , SEQ ID NO: 9 y SEQ ID NO: 10 (VWA) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 13 y SEQ ID NO: 14 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 16 (D7S820) , SEQ ID NO: 17 y SEQ ID NO: 18 (D2S1338) , SEQ ID NO: 19 y SEQ ID NO: 20 (D13S317) , SEQ ID NO: 21 y SEQ ID NO: 22 (Amelogenina) , y SEQ ID NO: 23 y SEQ ID NO: 24 (D5S818) .
Como entiende el experto en la materia, el kit de la invención además de comprender el primer conjunto de parejas de cebadores de la invención, puede incluir, opcionalmente, los reactivos necesarios para llevar a cabo la reacción de amplificación multiplex, entre los que se incluyen, sin limitar a, desoxinucleótidos trifosfato (dNTPs) , iones divalentes y/o monovalentes, una solución tampón (buffer) que mantiene el pH adecuado para el funcionamiento de la ADN polimerasa, ADN polimerasa o mezcla de distintas polimerasas, etc. No obstante, si el kit de la invención no comprende los reactivos necesarios para poner en práctica el método de la invención, éstos están disponibles comercialmente y pueden encontrarse formando parte de un kit. Cualquier kit de los disponibles comercialmente que contenga los reactivos necesarios para llevar a cabo una reacción de amplificación, puede emplearse con éxito en la puesta en práctica del método de la invención. Tal como se muestra en los ejemplos, en el caso de la presente invención estos reactivos se encuentran previamente mezclados en el reactivo Qiagen Multiplex PCR Kit (Qiagen, Valencia, CA) , el cual se utiliza a una quinta parte del volumen recomendado por los fabricantes para reacciones de PCR en general en combinación con la primera o segunda combinación de cebadores en las concentraciones previamente descritas, en un volumen final de 10 microlitros.
Sin embargo, tal como se ha mencionado previamente, el método de la invención puede comprender, además, una segunda reacción de amplificación multiplex para amplificar otra alícuota del extracto de ADN, en donde dicha segunda reacción multiplex comprende un conjunto de parejas de cebadores en la que, al menos, una pareja de cebadores se caracteriza porque (i) amplifica uno de los locus amplificados en la primera reacción de amplificación y (ii) uno de los cebadores de la pareja presenta una secuencia de nucleótidos distinta de la secuencia de nucleótidos de la pareja de cebadores que en la primera reacción de amplificación amplifica el mismo locus.
Por lo tanto, en una realización particular, el kit de la invención comprende adicionalmente al primer conjunto de parejas de cebadores de la invención, al menos, una pareja de cebadores caracterizada porque:
-amplifica uno de los locus amplificados por el primer conjunto de parejas de cebadores de la invención y
-uno de los cebadores de la pareja presenta una secuencia de nucleótidos distinta de la secuencia de nucleótidos de la pareja de cebadores que en el primer conjunto de parejas de cebadores amplifica el mismo locus.
En otra realización más particular, el kit de la invención comprende, adicionalmente al primer conjunto de parejas de cebadores de la invención, 2, 3, 4, 5, 6, 7, 8 o 9 parejas de cebadores, cada pareja de cebadores caracterizada porque:
-amplifica uno de los locus amplificados por el primer conjunto de parejas de cebadores de la invención, y
-uno de los cebadores de la pareja presenta una secuencia de nucleótidos distinta de la secuencia de nucleótidos de la pareja de cebadores que en el primer conjunto de parejas de cebadores amplifica el mismo locus.
En otra realización todavía más particular, dicha pareja de cebadores caracterizada porque (i) amplifica uno de los locus amplificados por el primer conjunto de parejas de cebadores de la invención, y (ii) uno de los cebadores de la pareja presenta una secuencia de nucleótidos distinta de la secuencia de nucleótidos de la pareja de cebadores que en el primer conjunto de parejas de cebadores de la invención amplifica el mismo locus, se selecciona de entre las parejas de oligonucleótidos SEQ ID NO: 25 y SEQ ID NO: 26 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 47 (FGA) , SEQ ID NO: 42 y SEQ ID NO: 43 (D18S51) , SEQ ID NO: 32 y SEQ ID NO: 33 (VWA) , SEQ ID NO: 30 y SEQ ID NO: 31 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 29 (D7S820) , SEQ ID NO: 44 y SEQ ID NO: 45 (D13S317) , SEQ ID NO: 46 y SEQ ID NO: 22 (Amelogenina) y SEQ ID NO: 27 y SEQ ID NO: 28 (D5S818) .
En otra realización particular, el kit de la invención comprende, adicionalmente, al menos, 1, 2, 3, 4, 5 o 6 de las parejas de cebadores seleccionadas de las parejas de oligonucleótidos SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 34 y SEQ ID NO: 35 (D8S1179) , SEQ ID NO: 36 y SEQ ID NO: 37 (D19S433) , SEQ ID NO: 38 y SEQ ID NO: 39 (D16S539) y, SEQ ID NO:40 y SEQ ID NO:41 (D3S1358) .
Por otro lado, como entiende el experto en la materia, el kit de la invención puede comprender parejas de cebadores ya marcados o los reactivos necesarios para llevar a cabo el marcaje de los mismos. Los distintos métodos que existen en el estado de la técnica para realizar el marcaje de los cebadores, así como los tipos de compuestos que se pueden emplear en dicho marcaje han sido explicados previamente en la presente memoria.
Así, en una realización particular, el kit de la invención comprende parejas de cebadores en donde uno de los oligonucléotidos de cada pareja está marcado en uno de sus extremos,
o los reactivos necesarios para marcar las parejas de cebadores.
En una realización todavía más particular del kit de la invención, los compuestos empleados en el marcaje de los oligonucleótidos seleccionan del grupo que consiste en un radioisótopo, un material fluorescente, digoxigenina y biotina, que en otra realización aún más particular, el material fluorescente se selecciona del grupo que consiste en 5carboxifluoresceína (5-FAM) , 6-FAM, análogo tetraclorinado de t-FAM (TET) , análogo hexaclorinado de 6-FAM (HEX) , 6-carboxitetrametilrodamina (TAMRA) , 6-carboxi-Xrodamina (ROX) , 6-carboxi-4’, 5’-dicloro-2’, 7’-dimetoxifluoresceína (JOE) , NED (ABI) , Cy-3, Cy-5, Cy-5.5, fluorescein-6-isotiocinato (FITC) y tetrametilrodamina-5-isotiocinato (TRITC) .
Tal como se ha mencionado previamente, el kit de la invención es útil en la puesta en práctica del método de invención. Por lo tanto, en otro aspecto, la invención se relaciona con el uso del kit de la invención para obtener el perfil genético de un individuo, para determinar relaciones de parentesco entre individuos o para identificar restos humanos.
En otro aspecto, la invención se relaciona con una pareja de cebadores seleccionada de entre las parejas de oligonucleótidos que consisten en SEQ ID NO: 1 y SEQ ID NO: 2 (CSF1PO) , SEQ ID NO: 3 y SEQ ID NO: 4 (FGA) , SEQ ID NO: 5 y SEQ ID NO: 6 (TPOX) , SEQ ID NO: 7 y SEQ ID NO: 8 (D18S51) , SEQ ID NO: 9 y SEQ ID NO: 10 (VWA) , SEQ ID NO: 11 y SEQ ID NO: 12 (TH01) , SEQ ID NO: 13 y SEQ ID NO: 14 (D21S11) , SEQ ID NO: 15 y SEQ ID NO: 16 (D7S820) , SEQ ID NO: 17 y SEQ ID NO: 18 (D2S1338) , SEQ ID NO: 19 y SEQ ID NO: 20 (D13S317) , SEQ ID NO: 21 y SEQ ID NO: 22 (Amelogenina) , SEQ ID NO: 23 y SEQ ID NO: 24 (D5S818) , SEQ ID NO: 25 y SEQ ID NO: 26 (CSF1PO) , SEQ ID NO: 27 y SEQ ID NO: 28 (D5S818) , SEQ ID NO: 15 y SEQ ID NO: 29 (D7S820) , SEQ ID NO: 30 y SEQ ID NO: 31 (D21S11) , SEQ ID NO: 32 y SEQ ID NO: 33 (VWA) , SEQ ID NO: 34 y SEQ ID NO: 35 (D8S1179) , SEQ ID NO: 36 y SEQ ID NO: 37 (D19S433) , SEQ ID NO: 38 y SEQ ID NO: 39 (D16S539) , SEQ ID NO: 40 y SEQ ID NO: 41 (D3S1358) , SEQ ID NO: 42 y SEQ ID NO: 43 (D18S51) , SEQ ID NO: 44 y SEQ ID NO: 45 (D13S317) , SEQ ID NO: 46 y SEQ ID NO: 22 (Amelogenina) , y SEQ ID NO: 3 y SEQ ID NO: 47 (FGA) .
Los siguientes ejemplos son ilustrativos de la invención y no pretenden ser limitativos de la misma.
EJEMPLOS
En los ejemplos siguientes se realiza la validación de I-DNA1, I-DNA2 y la combinación de ambos sistemas de acuerdo con Scientific Working Group on DNA Analysis Methods (SGWDAM) [Ellegren, H., 2004. Nat Rev Genet., 5 (6) : 435-45], para su uso en identificación humana (Ejemplo 1) y en el análisis de muestras de ADN altamente degradadas (Ejemplo 2) . En el primer ejemplo se detallan la optimización de los conjuntos de cebadores y de los parámetros de las reacciones de PCR, estudios de concordancia, precisión y exactitud, con el objetivo de demostrar que la invención es adecuada para su uso en identificación humana. En el segundo ejemplo, se realiza la comparación de la invención y del resto de métodos del estado de la técnica, en cuanto a los parámetros principales en el análisis de muestras de ADN altamente degradadas tales como el análisis de mezclas, sensibilidad y estrategias de diseño. Así mismo, se realiza una comparación directa de rendimiento en el análisis de un conjunto de muestras de ADN altamente degradadas, entre el método de la invención y el método de mayor rendimiento del estado de la técnica. Los resultados obtenidos demuestran que, el método de la invención constituye una mejora respecto a los métodos del estado de la técnica, en el rendimiento y
la fiabilidad de análisis de loci STRs incluidos en el CODIS a partir de muestras de ADN altamente degradadas.
EJEMPLO 1 Validación del método de la invención que comprende dos reacciones de amplificación multiplex empleando los conjuntos de parejas de cebadores I-DNA1 e I-DNA2 para su uso en identificación humana
A continuación se describe la validación de I-DNA1, I-DNA2 y la combinación de ambos sistemas de acuerdo con Scientific Working Group on DNA Analysis Methods (SGWDAM) [Ellegren, H., 2004. Nat Rev Genet., 5 (6) : 435-45]. Dicha validación ha consistido en ensayos de optimización de los conjuntos de cebadores, optimización de los parámetros de la PCR, estudios de concordancia, precisión y exactitud. Los resultados obtenidos mostraron que tanto I-DNA1, I-DNA2 por separado como la combinación de ambas, son herramientas adecuadas para la obtención de perfiles genéticos humanos.
MATERIALES Y METODOS
Muestras control de ADN humano Se utilizaron los ADN controles 9947A del kit AmpFlSTR® YFiler (Applied Biosystems, Foster City, CA) , Control DNA 007 (Applied Biosystems, Foster City, CA) y K562 (Promega® Corporation, USA) para poner a punto las condiciones de PCR y realizar ensayos de sensibilidad. Estas tres muestras se cuantificaron mediante Quantifiler® Human DNA Quantification Kit (Applied Biosystems, Foster City, CA) en un ABI PRISM® 7000 Sequence Detection System (Applied Biosystems, Foster City, CA) , de acuerdo con las especificaciones del fabricante y fueron diluidas a 1 ng/μl.
Muestras de la población Se tomaron muestras de sangre periférica de 600 individuos sanos: 318 caucasoides europeos (País Vasco, Spain) y 282 individuos de Colombia (133 negroides y 149 hispanos) .
Extracción de ADN y cuantificación Los extractos de ADN de los individuos de origen caucasoide se obtuvieron mediante lisis proteolítica con proteinasa K y extracción orgánica. Los extractos de ADN procedentes de las muestras biológicas de los individuos de origen negroide e hispano se obtuvieron mediante extracción por QiAamp DNA Micro Kit (Qiagen, CA) . Todos los extractos de ADN se cuantificaron con PicoGreen® (Invitrogen) .
Optimización del conjunto de cebadores Se utilizó el programa Perlprimer (http://perlprimer.sourceforge.net/) para diseñar nuevos cebadores que amplifiquen en el caso de I-DNA1 14 loci STRs (D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D19S433, D21S11, CSF1PO, FGA, TH01, TPOX y vWA) más amelogenina, y en el caso de I-DNA2 11 STRs (CSF1PO, FGA, TPOX, D18S51, vWA, TH01, D21S11, D7S820, D2S1338, D13S317, D5S818) más amelogenina, en base a las secuencias de referencia cuyos números de acceso a Genbank se recogen en la Tabla 5 y en la Tabla 5A para el primer y segundo conjunto de parejas de cebadores, respectivamente.
Las regiones flanqueantes a los STR analizados se estudiaron mediante SNPblast (www.ncbi.nlm.nih.gov/SNP/snpblastByChr.html) con el fin de evitar posiciones variables en la región de unión de todos los cebadores diseñados. Los amplificados se extienden desde 49 hasta 297pb y 298 pb, en el caso de I-DNA1 y I-DNA2 respectivamente, para abarcar un amplio número de los alelos contenidos en STRBase website [Ruitberg, C.M.,
D.J. Reeder, y J.M. Butler, 2001. Nucleic Acids Res, 29 (1) : 320-2] (Tablas 5 y 5A, respectivamente) .
La intensidad de los amplicones y la ausencia de inespecíficos de cada locus se evaluó mediante el análisis de los productos de PCR por DHPLC con un DNAsep Cartridge (Transgenomic® WAVE® System 4500, Glasgow, UK) . 10 μl de amplificado fueron migrados a 40ºC en un gradiente lineal desde 38, 6 a 61, 1 % de buffer B (25 % de acetonitrilo y TEAA 0, 1 M) durante 10 minutos.
Para evitar la adenilación incompleta se utilizó la adición tanto de una guanina al extremo 5´ del cebador inverso como de “pig-tailing” [cola de nucleótidos (5’-GTTTCTT3’) que se añade al extremo 5’ de un cebador para evitar la adenilación incompleta], (Brownstein, M.J., J.D. Carpten, and J.R. Smith, 1996. Biotechniques, 20 (6) : 1004-6, 1008-10; Hill CR, B.J., Valone PM, 2009. J Forensic Sci, 54 (5) : 7; Butler, J.M., Y. Shen, and B.R. McCord, 2003. J Forensic Sci, 48 (5) : 1054-64) .
Amplificación de PCR, electroforesis y análisis de datos Se emplearon 5μl de Qiagen® Master Mix de Qiagen® Multiplex PCR Kit (Qiagen, Valencia, CA) , 4 μl del mix de cebadores y un 1 μl de ADN molde (1ng / μl) . Las concentraciones de cada pareja de cebadores se detallan en las Tablas 3 y 4. Se analizó el rendimiento de la amplificación en diferentes termocicladores: BioradTM ICycler, C1000TM y MycyclerTM (BioRad, Hercules, CA) y GeneAmp® 9700 PCR System (Applied Biosystems, Foster City, CA) , así como en diferentes condiciones de temperaturas de hibridación (“annealing temperature”) : 57 ºC, 58, 9 ºC, 60, 5 ºC, 61, 8 ºC y 63 ºC, a distintos números de ciclos: 28, 29, 30, 31 y 32 ciclos y a tiempos de extensión final de 30, 45, 60 y 90 minutos. Se analizaron 2 μl de cada producto de amplificado mezclados con 9 μl de Hi-Di™ Formamide (Applied Biosystems®, Foster City, CA) y 0, 5 μl de GeneScan™ 500 LIZ® Size Standard (Applied Biosystems®, Foster City, CA) . Tras la desnaturalización de los amplificados (6 minutos a 95 ºC) se enfriaron (4 minutos a 4 ºC) y se separaron en un ABI PRISM 3130 Genetic Analyzer (Applied Biosystems®, Foster City, CA) . Los resultados de la electroforesis fueron analizados mediante el software Genmapper versión 4.0 (Applied Biosystems®, Foster City, CA) .
Estudios de concordancia Se compararon perfiles genéticos analizados con I-DNA1, I-DNA2 e Identifiler® (Applied Biosystems, Foster City, CA) . Para su análisis mediante I-DNA1 y I-DNA2 se empleó 1 ng de ADN molde de cada individuo. El análisis mediante Identifiler® (Applied Biosystems, Foster City, CA) se realizó según las condiciones óptimas sugeridas por el fabricante.
Precisión y exactitud
La precision de las escaleras alélicas de I-DNA1 y I-DNA2 se calculó mediante el análisis de 48 réplicas de cada escalera alélica en un ABI PRISM 3130 Genetic Analyzer (Applied Biosystems®, Foster City, CA) . La exactitud del genotipado de I-DNA1 y I-DNA2 se evaluó mediante el análisis de 162 muestras de ADN amplificadas en condiciones estándar,
de las que se calculó la desviación estándar en pares de bases de cada uno de los alelos respecto al tamaño del alelo de la escalera alélica correspondiente, por el programa Genmapper (Applied Biosystems, Foster City, CA) .
RESULTADOS
Optimización de los conjuntos de cebadores Las Tablas 5 y 5A (páginas siguientes) recogen un amplio rango de alelos para cada locus incluido en I-DNA1 y I-DNA2, respectivamente. Se han considerado los alelos descritos en los principales grupos poblacionales según la información recogida en STRbase [Ruitberg, C.M., D.J. Reeder, y J.M. Butler, 2001. Nucleic Acids Res, 29 (1) : 3202].
ES 2 378 203 Al
Tabla 5
Locus Nº acceso Genbank Intervalo alelos Fragmento de PCR (pb) Concentración de cebadores (μM) Marcador fluorescente
CSF1PO X14720 AC008512 AC004848 M84567 M68651 M25858 AF216671 G08036 D00269 AC024591 NT_005997 AP001534 AL353628 Sullivan et al.* M64982 6 -15 7 -17 6 -15 24 -38 6 -16 11 -24 8 -20 5, 2 -18, 2 5 -14 5 -16 9 -20 7 -27 5 -17 X, Y 16 -51, 2 75 – 111 127 -167 183 – 219 240 – 296 61 – 89 121 – 173 181 – 229 245 – 297 57 – 93 105 – 149 161 – 205 213 – 293 72 – 120 121, 127 151 – 293 0, 08 0, 19 0, 13 0, 1 0, 08 0, 07 0, 09 0, 19 0, 04 0, 11 0, 09 0, 38 0, 06 0, 11 0, 31 6-FAMTM
D5S818
D7S820
D21S11
TPOX NEDTM
VWA
D8S1179
D19S433
TH01 VICTM
D16S539
D3S1358
D18S51
D13S317 PET®
amelogenina
FGA
* Sullivan KM, et.al. 1993. Biotechniques, 15 (4) :636-8, 640-1.
* Sullivan KM, et.al. 1993. Biotechniques, 15 (4) :636-8, 640-1.
Tabla 5A
Locus Nº acceso GenBank Intervalo alelos Tamaño fragment PCR (pb) Concentración de cebador μM Marcador fluorescente
CSF1PO X14720 M64982 M68651 AP001534 M25858 D00269 M84567 AC004848 AC010136 AL353628 Sullivan et al.* AC008512 5 – 16 12 – 51, 2 4 – 16 7 -28, 3 10 – 25 3 – 14 12 – 39 6 – 15 11 – 28 5 – 17 X, Y 6 – 18 88 -132 140 -298 53 -101 109 -196 212 -272 49 -93 107 -215 224 -260 88 -156 164 -212 220, 226 234 -282 0, 06 0, 08 0, 1 0, 3 0, 18 0, 05 0, 11 0, 14 0, 15 0, 15 0, 11 0, 08 6-FAMTM
FGA
TPOX NEDTM
D18S51
vWA
TH01 VICTM
D21S11
D7S820
D2S1338 PET©
D13S317
amelogenina
D5S818
En el caso de I-DNA1 se diseñaron 96 cebadores de entre los que se eligieron aquellos capaces de producir amplificados del menor tamaño posible, que en ningún caso excedieran de 300 pb, cuyas temperaturas de fusión (“melting temperature”) estuvieran comprendidas entre 57, 5 y 62, 5 ºC y que hibridaran en regiones carentes de SNPs (Single Nucleotide Polymorphism) e INDELS (Inserciones/deleciones) descrito hasta la fecha en NCBI (http://www.ncbi.nlm.nih.gov/snp/) . En la primera fase de optimización se efectuaron amplificaciones PCR singleplex de cada locus. Los productos PCR fueron analizados mediante DHPLC para evaluar la especificidad de los cebadores y la intensidad de amplificación. Todas las parejas de cebadores de esta invención son diferentes a las utilizadas en cualquiera de los kits actualmente validados. En la segunda fase de optimización, se ensayaron diversos conjuntos de cebadores en multiplex. Se espaciaron los rangos de alelos de los loci adyacentes en tamaño con el fin de evitar solapamientos entre alelos correspondientes a loci diferentes para asegurar así un correcto genotipado. El
análisis mediante DHPLC permitió evaluar la ausencia de inespecíficos y la eficacia de la amplificación para cada uno de los loci ensayados en formato multiplex. Finalmente, se seleccionaron 3 reacciones de PCR quadruplex (quadruplex A: CSF1PO, D5S818, D7S820 y D21S11; quadruplex B: TH01, D16S539, D3S1358 y D18S51; quaduplex C: TPOX, vWA, D8S1179 y D19S433) y una reacción de PCR triplex (triplex D: D13S317, amelogenina y FGA) . Los cebadores directos de las 3 reacciones quadruplex A, B y C se marcaron con 6-FAMTM, VICTM y NEDTM, respectivamente y los cebadores directos de la reacción triplex D, fueron marcados con PET® (Applied Biosystems, Foster City, CA) (Tabla 5) . Por último, se agruparon los distintos conjuntos de cebadores en una única reacción de PCR multiplex que permite la obtención de un perfil genético mediante la amplificación de 14 loci STRs y amelogenina. En la Figura 3 se representa el resultado final de la estrategia en el diseño de cebadores para I-DNA1.
En el caso de I-DNA2, se diseñaron 78 cebadores capaces de producir amplicones que en ningún caso excedieran las 300 pb y cuyas temperaturas de fusión estuvieran comprendidas entre 57, 5 y 62, 5 ºC. Adicionalmente, el diseño de los cebadores de I-DNA2 permite que mediante su combinación con I-DNA1 permitiera el análisis se analicen del mayor número de loci miniSTRs posible. Por ello, 9 de los 11 loci compartidos por I-DNA2 y I-DNA1 (CSF1PO, FGA, D18S51, VWA, D21S11, D7S820, D13S317, D5S818 y amelogenina) presentan amplicones de tamaños netamente diferentes en ambos sistemas (Tablas 5 y 5A) . Así mismo, se diseñaron cebadores capaces de producir amplificados del menor tamaño posible para D2S1138 al no estar este locus incluido en I-DNA1. Por otro lado, se utilizaron cebadores de idéntica secuencia a los utilizados en I-DNA1 para TH01 y TPOX debido a su reducido tamaño de 49 y 51 pb, respectivamente. En la primera fase de la optimización se efectuaron amplificaciones PCR singleplex de cada locus, a excepción de TH01 y TPOX, previamente testados. Los productos PCR fueron analizados mediante DHPLC para evaluar la especificidad de los cebadores y la intensidad de amplificación. Cabe destacar que, todas las parejas de cebadores seleccionadas en este trabajo, son diferentes a las empleadas en cualquiera de los métodos del estado de la técnica, excepto las parejas de cebadores utilizadas para la amplificación de TH01 y TPOX, también empleadas en I-DNA1. En la segunda fase de optimización se ensayaron diversos conjuntos de cebadores en multiplex, de tal forma que se espaciaron los rangos de alelos de los loci adyacentes en tamaño, con el fin de evitar solapamientos entre alelos correspondientes a diferentes loci. El análisis mediante DHPLC de los productos de PCR de cada uno de los loci ensayados en formato multiplex, permitió evaluar la eficacia de la amplificación y la ausencia de inespecíficos en cada caso.
Finalmente, se seleccionaron 2 reacciones de PCR triplex (Triplex A: TPOX, D18S51 y vWA; Triplex B: TH01, D21S11 y D7S820) , una reacción de PCR quadruplex (quadruplex
C: D2S1338, D13S317, amelogenina y D5S818) y una reacción de PCR duplex (duplex D: CSF1PO y FGA) . Los cebadores directos de las 2 reacciones triplex A y B se marcaron con NEDTM y VICTM, respectivamente, los cebadores directos de la reacción quadruplex C, fueron marcados con PET® (Applied Biosystems, Foster City, CA) y los cebadores directos de la reacción duplex D, fueron marcados con 6-FAMTM (Tabla 5A) . Por último, los distintos conjuntos de cebadores se agruparon en una única reacción de PCR multiplex que permite amplificar 11 loci STRs más amelogenina, mediante amplicones desde 49 hasta 298 pb, para así abarcar un amplio número de alelos (Tabla 5A) .
En conclusión, tanto I-DNA1 como I-DNA2 permiten la obtención de un perfil genético al analizar 14 y 11 STRs respectivamente. Por otro lado, el diseño de cebadores de I-DNA1 e I-DNA2 posibilita que mediante su combinación puedan ser analizados opcionalmente, un total de 15 loci STRs: (CSF1PO, FGA, TPOX, D18S51, vWA, TH01, D21S11, D7S820, D2S1338, D13S317, D5S818, D8S1179, D19S433, D16S539, D3S1358) más amelogenina. La primera reacción multiplex, que emplea el conjunto de cebadores denominado I-DNA1, permite obtener el perfil genético de 14 STRs (CSF1PO, D5S818, D7S820, D21S11, TPOX, VWA, D8S1179, D19S433, TH01, D16S539, D3S1358, D18S51, D13S317, FGA) más amelogenina. La segunda reacción multiplex, que emplea el conjunto de cebadores denominado I-DNA2, permite obtener el perfil genético de 11 STRs (CSF1PO, FGA, TPOX, D18S51, vWA, TH01, D21S11, D7S820, D2S1338, D13S317, D5S818) más amelogenina.
En la Figura 3 se representa el resultado final de la estrategia en el diseño de cebadores para I-DNA2 (A) y I-DNA1 (B) .
Optimización de los parámetros de PCR
La optimización de los parámetros de amplificación tales como la concentración óptima de cebadores, temperatura de hibridación, número de ciclos y tiempo de extensión, se realizó mediante el estudio de los electroferogramas en los que se evaluó la altura de los picos, el balance en heterocigosis de los mismos y la adenilación incompleta.
En primer lugar, la concentración de cada pareja de cebadores fue testada entre 0, 0375 μM y 0, 75 μM, de tal forma que en cada caso, por debajo de la concentración óptima se observó un aumento en la altura de los picos a medida que se aumentaba la concentración de cebadores. Mientras que a su vez, en concentraciones superiores a la considerada óptima se detectó un aumento tanto del desbalance en heterocigosis y de la adenilación incompleta, como de la intensidad de los artefactos en I-DNA1 (FAM87, FAM96, FAM158, VIC53, VIC105, VIC121 y VIC180) y en I-DNA2 (FAM91, FAM155, VIC51, VIC179, NED100, NED165, NED179, PET95 y PET97) .
En este sentido, las intensidades de los loci analizados mediante I-DNA1 y I-DNA2 se equilibraron alrededor de 2.500 RFUs en el análisis de 1 ng de ADN, para alcanzar un equilibrio entre la intensidad de la señal y la ausencia de solapamiento entre las señales correspondientes a diferentes fluorocromos.
A continuación se procedió a la optimización de la temperatura de hibridación de la reacción PCR multiplex. El aumento de temperatura de hibridación produjo una disminución gradual tanto de la adenilación incompleta, como de la altura de los picos. Los mejores resultados se obtuvieron a la temperatura de hibridación de 60, 5 ºC, en el caso de I-DNA1, y de 58, 9ºC y 60, 5ºC en el caso de I-DNA2. Se escogió la temperatura de 60, 5ºC por ser la más restrictiva para I-DNA2 y por coincidir para ambos sistemas.
Por otro lado, el aumento en el número de ciclos incrementó de forma generalizada la altura de los picos y la adenilación incompleta. En este sentido, los resultados más equilibrados correspondieron a 30 ciclos. Así mismo, el incremento del tiempo de extensión no produjo cambios significativos en la adenilación incompleta; sin embargo, la adición de una guanina al extremo 5´ del primer reverse eliminó el efecto de la adenilación incompleta, incluso mejor que la adición de pig-tailing. La adición de dicha guanina se representa como una G en las Tablas 1 y 2.
Cabe destacar también que, el empleo de los termocicladores BioradTM ICycler, C1000TM y MycyclerTM (BioRad, Hercules, CA) y GeneAmp® 9700 PCR System (Applied Biosystems, Foster City, CA) no reveló variaciones significativas en cuanto a la calidad de los resultados obtenidos.
Tras la evaluación de todos los parámetros anteriormente mencionados, se llegó a determinar la concentración óptima de cebadores, de tal forma que se obtuvieron las siguientes intensidades medias para cada color en el análisis de 1 ng de ADN de I-DNA1 [6-FAMTM (2243 ± 764 RFUs) , VICTM (2742 ± 748 RFUs) , NEDTM (2313 ± 426 RFUs) y PET® (2417 ± 247 RFUs) ] y I-DNA2 [6-FAMTM (1933 ± 424 RFUs) , VICTM (2659 ± 428 RFUs) , NEDTM (2276 ± 100 RFUs) y PET® (1869 ± 416 RFUs) ].
De esta manera, I-DNA1 y I-DNA2 han demostrado ser reacciones multiplexes balanceadas y específicas, capaces de obtener perfiles genéticos independientemente al amplificar 14 loci STRs y 11 loci STRs, respectivamente, además del locus amelogenina, a partir de 1 ng de ADN molde (Figuras 1 y 2) , mediante la siguientes condiciones de amplificación: un ciclo de desnaturalización inicial durante 15 minutos a 95 ºC, 30 ciclos de 30 s a 95 ºC, 90 s a 60, 5 ºC y 1 minuto a 72 ºC, seguidos de 1 ciclo de extensión final de 30 minutos a 60 ºC. Además, el hecho de que los cebadores utilizados en ambos sistemas posean características similares de temperatura de fusión (I-DNA1: 58, 8±0, 91ºC y I-DNA2: 58, 9±0, 87 ºC) y longitud (I-DNA1: 21, 3±2, 88 pb y I-DNA2: 20, 4±2, 3 pb) , posibilita que puedan ofrecer óptimos resultados en las mismas condiciones de PCR.
Estudios de concordancia Los estudios de concordancia se llevaron a cabo mediante la comparación de 2430 allele calls obtenidos por I-DNA1 e Identifiler® (Applied Biosystems, Foster City, CA) , de 1944 allele calls obtenidos por I-DNA2 e Identifiler® (Applied Biosystems, Foster City, CA) y la comparación de 6600 allele calls obtenidos por I-DNA2 y I-DNA1. Se eligió Identifiler® (Applied Biosystems, Foster City, CA) por ser éste un sistema ampliamente utilizado [Hill, C.R., et al., 2007. J Forensic Sci, 52 (4) : 870-3] y validado [Collins, P.J., et al., 2004. J Forensic Sci, 49 (6) : 1265-77]. Entre los resultados obtenidos por I-DNA1 e Identifiler® se encontró una única discordancia lo que supone una concordancia del 99, 9% entre estos sistemas. Dicha discordancia correspondió a un individuo genotipado como homocigoto (15/15) para D3S1358 mediante Identifiler® y como heterocigoto (12/15) mediante I-DNA1. La muestra fue analizada por triplicado por ambos sistemas con idénticos resultados. En la comparación de I-DNA2 e Identifiler® (Applied Biosystems, Foster City, CA) no se encontraron discordancias, lo que supone una concordancia del 100 % entre ambos sistemas. Mientras que, la comparación de los perfiles genéticos obtenidos por I-DNA1 y I-DNA2 reveló 6 discordancias, lo que supone una concordancia del 99, 9 % entre estos sistemas.
De estas discordancias 2 correspondieron a pérdidas alélicas registrada en el locus vWA de I-DNA2, mientras que 3 discordancias consistieron en diferencias entre ambos sistemas de 2 pb en el tamaño de 1 alelo del locus D18S51 y de 4 pb en 2 alelos del locus D13S317.
Precisión y exactitud
La precisión de las escaleras alélicas de I-DNA1 y I-DNA2 se calculó a partir del estudio de escaleras alélicas analizadas en inyecciones independientes. La desviación estándar del tamaño en pares de bases fue igual o menor a 0, 07 pb tanto para I-DNA1 como para I-DNA2. La exactitud fue medida mediante el análisis de 162 individuos caucasoides para calcular la desviación del tamaño de los alelos de cada una de las muestras respecto al tamaño de los alelos de las escaleras alélicas correspondientes. No se detectaron alelos fuera del rango de ±0.40 pb correspondiente a cada alelo de las escaleras alélicas.
DISCUSION
A continuación se discuten los resultados relativos a la validación de I-DNA1 en los ensayos de optimización del conjunto de cebadores, optimización de parámetros de PCR, y estudios de concordancia.
La optimización del conjunto de cebadores ha consistido en analizar los productos de amplificado tanto por separado, como en multiplex. El procedimiento habitual consiste en el análisis de amplicones marcados mediante un secuenciador de ADN [Tagliaro, F., et al., 2010. Electrophoresis, 31 (1) : 251-9]. Sin embargo, en esta invención se ha utilizado por primera vez la tecnología DHPLC (del inglés “Denaturing High-Performance Liquid Chromatography”) para evaluar la intensidad de los amplificados y determinar la ausencia de amplificaciones inespecíficas. La ventaja de la utilización del análisis mediante DHPLC es que evita la necesidad del marcaje previo de los cebadores. Esta metodología se ha empleado tanto en la primera fase de optimización de los productos de PCR por separado, como en la segunda fase de optimización con el fin adicional de evaluar la ausencia de solapamiento de los productos de PCR. Una vez determinado el mejor conjunto de cebadores para la amplificación multiplex de los 14 loci STRs y amelogenina los 11 loci STRs más amelogenina, según el caso, se marcaron los cebadores mediante fluorocromos. De esta manera, se han marcado únicamente aquellos cebadores que finalmente han sido incluidos en las reacciones denominadas I-DNA1 y I-DNA2. Por lo tanto, el empleo de la tecnología DHPLC en la optimización de la amplificación de las reacciones multiplex supone una alternativa rápida [Shinka, T., et al., 2001. J Hum Genet, 46 (5) : 263-6] y de reducido coste al análisis de amplicones mediante secuenciador de ADN, ya que evita la necesidad de utilizar cebadores marcados en las primeras fases de la optimización [Devaney, J.M., J.E. Girard, y M.A. Marino, 2000. Anal Chem, 72 (4) : 858-64].
I-DNA1 y I-DNA2 han demostrado ser reacciones multiplexes balanceadas y específicas, capaces de obtener perfiles genéticos independientemente al amplificar 14 loci STRs y 11 loci STRs , respectivamente, además del locus amelogenina. Además el hecho de que los cebadores utilizados en ambos sistemas posean características similares de temperatura de fusión y longitud, posibilita que puedan ofrecer óptimos resultados en las mismas condiciones de PCR.
La fiabilidad de I-DNA1 y I-DNA2 ha sido comprobada mediante estudios de concordancia entre los perfiles genéticos determinados por estos sistemas y los obtenidos mediante sistemas preexistentes ampliamente utilizados. En este sentido en primer lugar se constató una concordancia del 99, 9 % entre I-DNA1 e Identifiler® (Applied Biosystems, Foster City, CA) , donde la única excepción se detectó en un individuo, genotipado como homocigoto por Identifiler® (Applied Biosystems, Foster City, CA) y como heterocigoto por I-DNA1. Así mismo, se constató la concordancia del 100 % de I-DNA2 respecto a Identifiler (Applied Biosystems, Foster City, CA) y del 99, 9 % respecto a I-DNA1. Las discordancias detectadas entre I-DNA1 y I-DNA2 consisten en pérdidas alélicas y variaciones de 2-4 pb en el tamaño de los alelos detectados en ambos sistemas. Este tipo de discordancias son las habituales tras el análisis de idénticos STRs con sistemas que emplean diferentes parejas de cebadores (Hill, C.R. et al., 2007. J Forensic Sci, 2007. 52 (4) : 870-3) . Discordancias similares reportadas en otros estudios se debieron a la presencia de mutaciones que probablemente coincidían con la región de unión del extremo 3´ de uno de los cebadores mientras que las variaciones en el tamaño de alelos probablemente se debieron a la presencia de inserciones y/o deleciones en la región flanqueante a la repetición STR [Budowle, B., et al., 2008. Int J Legal Med, 122 (5) : 421-7; Zhai, X.D., et al., 2009. Oct 30, Int J Legal Med]. Dichas mutaciones impiden la amplificación de uno de los alelos y en consecuencia originan pérdidas alélicas. En este sentido, los perfiles genéticos obtenidos mediante I-DNA1 y I-DNA2 mostraron una alta fiabilidad, ya que el uso combinado de varias STR multiplex que utilicen diferentes parejas de cebadores para la amplificación de loci STR comunes como I-DNA1 y I-DNA2, ofrece considerables ventajas en identificación humana, al permitir tanto la detección de inserciones/deleciones que puedan afectar al perfil genético obtenido, como la disminución del efecto de estos alelos silentes.
En conclusión, la presente validación ha puesto de manifiesto que tanto I-DNA1 y I-DNA2 independientemente, así como la combinación de ambas reacciones, constituyen sistemas de elevada robustez y fiabilidad en la obtención de perfiles genéticos, lo que las convierte en herramientas útiles para su utilización en identificación humana. Así mismo, el reducido tamaño de sus amplificados, sumado al haber sido diseñadas para su óptima complementariedad, sugiere que la presente invención posee una elevada capacidad de análisis de loci incluidos en el CODIS a partir de fragmentos de ADN de reducido tamaño.
EJEMPLO 2 Validación del método de la invención que comprende dos reacciones de amplificación multiplex empleando los conjuntos de parejas de cebadores I-DNA1 e I- DNA2 para su uso en el análisis de muestras de ADN altamente degradadas
A continuación se describe la validación de I-DNA1, I-DNA2 y la combinación de ambas reacciones de acuerdo con Scientific Working Group on DNA Analysis Methods (SGWDAM) [Ellegren, H., 2004. Nat Rev Genet., 5 (6) : 435-45] en el análisis de muestras de ADN altamente degradadas. Dicha validación ha consistido en ensayos de determinación de porcentaje de alelos tartamudos, intensidad relativa entre picos, mezclas y sensibilidad. Así mismo, se realizan dos estudios comparativos de: 1) entre las estrategias de diseño del método objeto de invención y los de los métodos del estado de la técnica y 2) entre la capacidad de análisis de loci incluidos en CODIS a partir de muestras de ADN altamente degradadas del método de la invención y la de MinifilerTM Kit PCR, Identifiler® y la combinación de ambos (Applied Biosystems, Foster City, CA) , por ser los métodos del estado de la técnica que mayor rendimiento han demostrado en este aspecto.
Los resultados obtenidos indican que la presente invención que supera al resto de métodos de la técnica en capacidad de análisis de loci incluidos en el CODIS a partir de muestras de ADN altamente degradadas.
MATERIALES Y METODOS
Muestras control de ADN humano Se utilizaron los ADN controles 9947A del kit AmpFlSTR® YFiler (Applied Biosystems, Foster City, CA) , Control DNA 007 (Applied Biosystems, Foster City, CA) y K562 (Promega® Corporation, USA) para poner a punto las condiciones de PCR y realizar ensayos de sensibilidad. Estas tres muestras se cuantificaron mediante Quantifiler® Human DNA Quantification Kit (Applied Biosystems, Foster City, CA) en un ABI PRISM® 7000 Sequence Detection System (Applied Biosystems, Foster City, CA) , de acuerdo con las especificaciones del fabricante y fueron diluidas a 1 ng/μl. Muestras de la población Se tomaron muestras de sangre periférica de 600 individuos sanos: 318 caucasoides europeos (País Vasco, Spain) y 282 individuos de Colombia (133 negroides y 149 hispanos) .
Muestras de ADN altamente degradadas.
Se tomaron 10 muestras de ADN procedentes de tejidos incluidos en parafina del año 80, originarios de autopsias en las que el tejido permaneció 72-96 horas en formol antes de su inclusión en parafina.
Extracción de ADN y cuantificación Los extractos de ADN de los individuos de origen caucasoide y de las muestras de parafina, se obtuvieron mediante lisis proteolítica con proteinasa K y extracción orgánica. Los extractos de ADN procedentes de las muestras biológicas de los individuos de origen negroide e hispano se obtuvieron mediante extracción por QiAamp DNA Micro Kit (Qiagen, CA) . Se utilizaron las cantidades de ADN recomendadas por el fabricante para la amplificación PCR de cada tipo de muestras en cada caso. Para el análisis mediante el sistema objeto de la presente invención se utilizó 1 ng en la amplificación del ADN procedente de muestras poblacionales y 1, 6 ng del ADN de las muestras de parafina. Todos los extractos de ADN se cuantificaron con PicoGreen® (Invitrogen) .
Amplificación de PCR, electroforesis y análisis de datos Se emplearon 5 μl de Qiagen® Master Mix de Qiagen® Multiplex PCR Kit (Qiagen, Valencia, CA) , 4 μl del mix de cebadores y un 1 μl de ADN molde. Las concentraciones de cada pareja de cebadores se detallan en las Tablas 3 y 4. Las reacciones de amplificación PCR se realizaron en un termociclador MycyclerTM (BioRad, Hercules, CA) en las siguientes condiciones: un ciclo de desnaturalización inicial durante 15 minutos a 95 ºC, 30 ciclos de 30 s a 95 ºC, 90 s a 60, 5 ºC y 1 minuto a 72 ºC, seguidos de 1 ciclo de extensión final de 30 minutos a 60 ºC. Se analizaron 2 μl de cada producto de amplificado mezclados con 9 μl de Hi-Di™ Formamide (Applied Biosystems®, Foster City, CA) y 0, 5 μl de GeneScan™ 500 LIZ® Size Standard (Applied Biosystems®, Foster City, CA) . Tras la desnaturalización de los amplificados (6 minutos a 95 ºC) se enfriaron (4 minutos a 4 ºC) y se separaron en un ABI PRISM 3130 Genetic Analyzer (Applied Biosystems®, Foster City, CA) . Los resultados de la electroforesis fueron analizados mediante el software Genmapper versión 4.0 (Applied Biosystems®, Foster City, CA) .
Determination del porcentaje de alelos tartamudos, intensidad relativa de picos heterocigotos y mezclas La determinación de alelos tartamudos tanto en individuos homocigotos como heterocigotos que diferían en tamaño en más de 4 pb se efectuó calculando el porcentaje de la altura del pico del alelo tartamudo respecto a la altura del pico real. El cálculo de la intensidad relativa de picos heterocigotos (del inglés “Peak Height Ratio” ó PHR) se realizó dividiendo la altura del menor de los picos entre la altura del mayor de los heterocigotos de cada locus.
Los estudios de mezclas consistieron en establecer un umbral basado en el porcentaje de alelo tartamudo para la distinción entre el alelo tartamudo y “minor contributor” (en una mezcla compuesta por los ADNs de dos individuos, el “minor contributor” se refiere al perfil que en menor proporción contribuye a la mezcla) . Para comprobar la eficacia de dicho umbral, se mezclaron dos muestras de ADN a las siguientes proporciones (1:1, 1:3, 1:5, 1:7, 1:10, 1:15, 1:20, 3:1, 5:1, 7:1, 10:1, 15:1 y 20:1) , manteniendo la cantidad de ADN molde final en 1 ng.
Sensibilidad
Con el fin de determinar la sensibilidad de I-DNA1, I-DNA2 y la de ambos en combinación, se analizaron por triplicado los ADN controles 9947A del kit AmpFlSTR® YFiler (Applied Biosystems, Foster City, CA) , Control DNA 007 (Applied Biosystems, Foster City, CA) y K562 (Promega® Corporation, USA) . Se utilizaron concentraciones de ADN de 30 ng, 20 ng, 10 ng, 1, 6 ng, 1 ng, 400 pg, 200 pg, 100 pg, 50 pg y 25 pg.
RESULTADOS
Determinación del porcentaje de alelos tartamudos, intensidad relativa de picos heterocigotos y mezclas Los picos correspondientes a alelos tartamudos, resultado del deslizamiento de la polimerasa (en inglés, “strand slippage”) , habitualmente se traducen en un pico 4 pb menor que el alelo real. Los resultados para cada locus tras el análisis de 162 individuos de origen caucasoide correspondientes a I-DNA1 y I-DNA2, se recogen en las Tablas 6 y 7, respectivamente (página siguiente) . El menor valor medio se observó en TH01 en ambos casos (4, 0 ± 2, 1 y 4, 3 ± 1, 6, respectivamente) , mientras que el mayor también se observó en ambos casos en D21S11 (11, 4±2, 2 y 12, 9±2, 9, respectivamente) . En todos los loci se observa que cuanto mayor es el número de repeticiones de sus alelos mayor es el porcentaje de alelos tartamudos.
Tabla 6: Porcentaje de alelos tartamudos (%) de loci STRs analizados con I-DNA1
I-DNA1 Tamaño muestral Media Mediana Desviación estándar Mínimo Máximo
CSF1PO 209 6, 3 5, 4 2, 6 2, 7 13, 0
D13S317 276 6, 2 6, 1 2, 3 2, 0 13, 2
D16S539 202 9, 4 9, 3 1, 3 6, 6 12, 6
D18S59 270 8, 6 8, 5 2, 0 5, 2 12, 7
D19S433 272 8, 5 8, 4 1, 4 5, 9 12, 5
D21S11 240 11, 4 11, 2 2, 2 7, 7 16, 9
D3S1358 258 10, 1 10, 2 1, 9 6, 1 14, 1
D5S818 200 5, 7 6, 7 3, 4 5, 0 10, 9
D7S820 279 7, 2 7, 0 2, 1 2, 8 12, 4
D8S1179 233 9, 2 8, 9 2, 2 5, 2 15, 0
FGA 269 8, 4 8, 4 2, 0 3, 9 12, 9
TH01 254 4, 0 3, 8 2, 1 0, 8 11, 2
TPOX 228 4, 2 3, 9 1, 6 1, 0 9, 3
vWA 275 8, 7 9, 2 3, 1 1, 0 14, 6
Tabla 7. Porcentaje de alelos tartamudos de los STR analizados mediante I-DNA2.
I-DNA2 Tamaño muestral Media Mediana Desviación estándar Mínimo Máximo
CSF1PO 262 10, 6 10, 3 2, 2 6, 9 16, 6
D13S317 264 5, 6 5, 7 1, 8 2, 2 9, 4
D18S59 272 8, 5 8, 3 2, 1 4, 9 12, 7
D21S11 172 12, 9 12, 6 2, 9 7, 8 18, 2
D2S1338 270 10, 8 10, 7 2, 1 6, 6 14, 8
D5S818 247 6, 8 6, 9 1, 7 3, 4 10, 8
D7S820 255 7, 6 7, 6 2, 4 3, 2 13, 7
FGA 243 12, 1 12, 0 3, 0 6, 9 17, 8
TH01 264 4, 3 4, 5 1, 6 1, 3 7, 4
TPOX 263 5, 4 4, 9 1, 7 3, 2 10, 4
Vwa 240 9, 4 9, 7 2, 8 3, 0 14, 8
El cálculo de la Altura Relativa entre Picos (PHR) ofreció bajos valores de desviación estándar así como valores de mediana muy cercanos a la media en cada uno de los loci 15 analizados en 600 individuos, tanto en I-DNA1 como en I-DNA2 (Tablas 8 y 9, respectivamente) . En el caso concreto de I-DNA1, todas las medias superan el 80 % con desviaciones estándar comprendidas entre 7, 2 y 11, 4. En general, I-DNA1 presenta buen balance de los alelos en heterocigosis. La única excepción es el locus D13S317 se observa una media de 75, 8 % con una desviación estándar de 14, 8. I-DNA2 también presenta buen balance de los alelos en heterocigosis, ya que muestra bajos valores de desviación estándar (8, 6 – 11, 6) , así como valores de mediana muy cercanos a las correspondientes medias (82, 7 – 90, 5 %) .
Tabla 8: Intensidad relativa entre picos para cada locus STR analizado con I-DNA1
Tamaño
IDNA1 Media Mediana SD* Minimo Máximo muestral
CSF1PO D13S317 D16S539 D18S59 D19S433 D21S11 D3S1358 390 437 429 473 430 445 424 84, 2 75, 8 92, 1 84, 0 81, 7 85, 7 89, 1 86, 3 77, 2 94, 1 85, 6 83, 7 87, 4 90, 3 11, 4 14, 8 7, 2 8, 5 8, 9 9, 9 7, 5 49, 0 40, 7 63, 7 55, 9 51, 7 49, 1 58, 8 100, 0 99, 8 100, 0 100, 0 99, 6 99, 6 100, 0
D5S818 D7S820 D8S1179 FGA TH01 399 430 421 475 436 84, 2 89, 2 81, 9 88, 0 90, 9 85, 7 91, 0 84, 1 89, 7 94, 6 10, 4 9, 2 11, 2 8, 0 9, 7 52, 7 58, 0 50, 5 59, 8 57, 2 100, 0 100, 0 99, 7 99, 8 100, 0
TPOX 359 88, 2 90, 6 10, 1 54, 3 99, 9
vWA 457 SD: desviación estándar 87, 1 88, 1 8, 3 60, 2 99, 9
10
Tabla 9. Intensidad relativa de picos para cada locus STR analizado con I-DNA2.
I-DNA2 Tamaño muestral Media Mediana Desviación estándar Mínimo Máximo
CSF1PO 397 88, 9 90, 7 9, 2 57, 7 100, 0
D13S317 420 83, 9 86, 2 9, 9 54, 2 100, 0
D18S51 462 87, 1 88, 6 9, 0 52, 4 99, 8
D21S11 443 85, 8 88, 2 10, 9 52, 8 100, 0
D2S1338 473 84, 6 86, 7 10, 2 53, 2 99, 8
D5S818 389 85, 9 87, 8 8, 9 54, 8 100, 0
D7S820 409 88, 7 91, 0 8, 6 60, 1 99, 9
FGA 461 90, 0 94, 0 10, 0 59, 2 100, 0
THO1 424 90, 5 95, 3 10, 5 56, 7 100, 0
TPOX 348 88, 2 91, 8 11, 6 46, 0 100, 0
vWA 429 82, 7 83, 3 10, 8 51, 0 100, 0
Los ADNs seleccionados para el ensayo de mezclas fueron elegidos por su elevada 15 heterocigosidad, aunque algunos de los alelos del “minor contributor” residían en las posiciones de alelos tartamudos de los alelos del “mayor contributor” (en una mezcla compuesta por lo ADNs de dos individuos, el “mayor contributor” se refiere al perfil que en mayor proporción se encuentra en la mezcla) . El umbral para la distinción entre el “minor contributor” y el alelo tartamudo del “mayor contributor” de cada locus analizado se estableció en una intensidad igual a la media de porcentaje de alelo tartamudo más 3 veces su desviación estándar.
Teniendo en cuenta dicho umbral, en el caso de I-DNA1 se logró genotipar el “minor contributor” a una proporción 1:10 en la totalidad de los loci incluidos en esta reacción, con excepción de los loci D19S433 y D7S820 que se lograron genotipar a una proporción 1:7. El “minor contributor” se logró genotipar hasta proporciones de 1:15 en los loci CSF1PO, D5S818 y D8S1179, e incluso a proporciones de 1:20 en TH01 y TPOX.
En el caso de I-DNA2, se logró genotipar el minor contributor a una proporción 1:7 en la totalidad de los loci incluidos en esta reacción, con la excepción del locus D21S11, que se genotipó a una proporción de 1:5, debido a su elevado porcentaje de stutter y a la presencia del artefacto VIC179. El minor contributor se alcanzó a genotipar hasta una proporción 1:10 en D18S51 y D7S820, de 1:15 en CSF1PO, FGA y D13S317, e incluso a una proporción 1:20 en TPOX y TH01.
Sensibilidad
La menor cantidad de ADN que permitió amplificar la totalidad de los STRs incluidos tanto en el caso de I-DNA1 como de I-DNA2 fue 100 pg. Mediante I-DNA1 cantidades superiores a 25 pg de ADN permitieron el análisis de 11 loci STR y amelogenina, mientras que los 3 loci STR restantes (D5S818, D3S1358 y D18S51) presentaron pérdidas alélicas por efectos estocásticos.
Mediante I-DNA2 cantidades superiores a 50 pg de ADN posibilitaron el análisis de 8 loci STR y amelogenina, mientras que, los 3 loci STR restantes (FGA, D21S11 y D2S1338) presentaron pérdidas alélicas por efectos estocásticos. Así mismo, cantidades superiores a 25pg de ADN, permitieron el análisis de 5 loci STR (VWA, TH01, D7S820, D13S317 y D5S818) y amelogenina, mientras que el resto de loci STR presentaron pérdidas alélicas por efectos estocásticos, a excepción de FGA que no ofreció resultados a más de 50 RFUs.
Por otro lado, la combinación de I-DNA1 e I-DNA2 a partir de cantidades de 100 pg de ADN totales, mediante la utilización por igual de 50 pg en cada sistema, posibilitó el análisis de 14 loci STRs y amelogenina, 5 de ellos por duplicado (CSF1PO, vWA, D13S317, TPOX y D7S820) . A su vez, cantidades de 50 pg de ADN totales, mediante la utilización por igual de 25 pg en cada sistema, permitió el análisis de 13 loci STRs y amelogenina, 2 de ellos más amelogenina por duplicado (D13S317 y vWA) .
Estudio comparativo de las estrategias de diseño de los conjuntos de cebadores de la presente invención respecto a los métodos del estado de la técnica Como ya se ha explicado en el apartado dedicado a los antecedentes de la invención, el tamaño de los amplicones de un sistema STR multiplex, es crítico para la obtención de perfiles genéticos a partir de muestras biológicas altamente degradadas [Butler, J.M., Y. Shen, y B.R. McCord, 2003. J Forensic Sci, 48 (5) : 1054-64; Coble, M.D. y J.M. Butler, 2005. J Forensic Sci, 50 (1) : 43-53].
Las parejas de cebadores de la presente invención, se caracterizan por permitir analizar un alto número de loci STR mediante amplificados de reducido tamaño. En la Tabla 11 (página siguiente) , se detallan los loci analizados tanto en las STR multiplexes del estado de la técnica como en el método objeto de invención, mediante amplificados que no superen las 200 pb (miniSTRs) o las 300 pb (midiSTRs) , así como aquellos mayores de 300 pb (maxiSTRS) . Con el fin de evaluar las estrategias de diseño seguidas por las diferentes STRs multiplexes, en cuanto al análisis de loci incluidos en el CODIS a partir de muestras de ADN altamente degradadas, se detallan los loci STRs incluidos en las diferentes bases de datos.
Tabla 11. miniSTRs (< 200 pbs) , midiSTRs (< 300 pbs) y maxiSTRs (> 300 pbs) , en negro, gris y blanco respectivamente, analizados por las principales STRsmultiplexes del estado de la técnica así como por las combinaciones de reacciones y aquellas objeto de la presente invención. En este cálculo no se consideran los alelos de alto peso molecular de FGA, por ser altamente infrecuentes, como ha sido demostrado por su ausencia en los 600 individuos analizados en los ejemplos 1 y 2. Deizquierda a derecha: Identifiler®, MinifilerTM, Powerplex 16, Q8, Bioplex-11, NGMTM, Powerplex ESX-17, Powerplex ESI-17, I-DNA2, I-DNA1 y las combinaciones Powerplex ESX-17+Powerplex ESX-17, MinifilerTM +Identifiler®, MinifilerTM+NGMTM y I-DNA1+I-DNA2. Los tamaños de amplificado para MinifilerTM e Identifiler® son aproximados, debido a que los datos exactos no han sido publicados. Se detallan los loci STRs incluidos en el CODIS, ECL, en ambas o en otras bases de datos.
I-DNA1 ESX+ESI MINI + NGM I-DNA1 +I-DNA2 MIINI +IDENT IDENTI FILER* MINIFILER* PP 16 BIOPLEX-11 NGM PP ESX-17 I-DNA2PP ESI-17Q8LOCUS D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA TH01 vWA CSF1PO D13S317 D5S818 D7S820 TPOX D19S433 D2S1338
D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA TH01 vWA CSF1PO D13S317 D7S820 D19S433 D2S1338 D10S1248 D12S391 D1S1656 D22S1045 D2S441
D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA TH01 vWA CSF1PO D13S317 D5S818 D7S820 TPOX D19S433 D2S1338
D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA TH01 vWA D19S433 D2S1338 D10S1248 D12S391 D1S1656 D22S1045 D2S441 SE33
D16S539 D18S59 D21S11 D3S1358 D8S1179 FGA TH01 vWA CSF1PO D13S317 D5S818 D7S820 TPOX D19S433
D18S51 D21S11 FGA THO1 vWA CSF1PO D13S317 D5S818 D7S820 TPOX D2S1338
D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA TH01 vWA D19S433 D2S1338 D10S1248 D12S391 D1S1656 D22S1045 D2S441 SE33
D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA TH01 vWA D19S433 D2S1338 D10S1248 D12S391 D1S1656 D22S1045 D2S441 SE33
D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA TH01 vWA D19S433 D2S1338 D10S1248 D12S391 D1S1656 D22S1045 D2S441
D21S11 D3S1358 D8S1179 FGA THO1 vWA D5S818 TPOX D2S1338 D12S391
D18S51 D21S11 D3S1358 D8S1179 FGA THO1 vWA SE33
D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA TH01 vWA CSF1PO D13S317 D5S818 D7S820 TPOX Penta-D Penta-E
D16S539 D18S51 D21S11 FGA CSF1PO D13S317 D7S820 D2S1338
D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA THO1 vWA CSF1PO D13S317 D5S818 D7S820 TPOX D19S433 D2S1338
D16S539 D18S51 D21S11 D3S1358 D8S1179 FGA TH01 vWA CSF1PO D13S317 D5S818 D7S820 TPOX D19S433 D2S1338 D10S1248 D12S391 D1S1656 D22S1045 D2S441 Penta-D Penta-E SE33
CODIS + ECL CODIS ECL OTROS
I-DNA1 analiza la totalidad de los STRs incluidos en el CODIS y 9 de 10 de la ECL, así como amelogenina, a partir de fragmentos de ADN que no superen las 300 pb. I-DNA1 destaca por ser el único sistema disponible en la actualidad que permite analizar la totalidad de los loci incluidos en el CODIS mediante amplicones que no superen las 300 pb y al igual que Bioplex-11, analiza 10 loci incluidos en el CODIS mediante amplicones que no superen las 200 pbs. I-DNA2 analiza 10 y 7 de los STRs incluidos en el CODIS, así como amelogenina, a partir de fragmentos de ADN que no superen las 300 y las 200 pbs, respectivamente.
Las combinaciones de STRs multiplexes del estado de la técnica presentan el siguiente rendimiento a partir de fragmentos que no superen las 300 pb: MinifilerTM + Identifiler®, analiza la totalidad del CODIS [Luce, C., et al., 2009. J Forensic Sci, 54 (5) : 1046-54; Mulero, J.J., et al., 2008. J Forensic Sci, 53 (4) : 838-52]; MinifilerTM+NGM™, analiza 11 loci incluidos en la CODIS [AmpFlSTR® NGM™ PCR Amplification Kit User’s Guide. Applied Biosystems. 2009]; y PowerPlex® ESX+PowerPlex® ESY, analiza 8 loci incluidos en el CODIS [Hill, C.R., et al.2010. April 22, Forensic Sci Int Genet]. En este sentido, la combinación de I-DNA1 con I-DNA2, permite analizar 15 loci STR más amelogenina a partir de fragmentos que no superen las 300 pb, e incluye la totalidad de los marcadores/loci del CODIS. Esta combinación presenta un reducido tamaño de amplicones, de tal forma que ha sido específicamente diseñada para posibilitar la amplificación de 13 loci STRs, 12 de ellos incluidos en el CODIS en fragmentos de ADN que no superen las 200 pb. Cabe señalar que la combinación de I-DNA1 con I-DNA2, permite analizar la totalidad de los loci incluidos en el CODIS mediante amplicones que no superen las 229 pbs.
Así mismo, las combinaciones de reacciones han sido diseñadas de forma que puedan permitir el genotipado por duplicado de cierto número de loci. MinifilerTM combinado con NGMTM permite la amplificación por duplicado de 2 loci en formato midiSTR, mientras que combinado con Identifiler® amplía a 4 el número de loci analizados por duplicado en formato midiSTR. Ambas combinaciones permiten únicamente el genotipado por duplicado de amelogenina en fragmentos que no superen las 200 pb. Por otro lado, la combinación de PowerPlex® ESX y ESY, posibilita el análisis por duplicado de 9 loci, 6 incluidos en el CODIS, a partir de fragmentos que no superen las 300 pb y de 4 loci, incluidos en el CODIS y en la ECL, a partir de fragmentos que no superen las 200 pb [Hill, C.R., et al.2010. April 22, Forensic Sci Int Genet]. La combinación de I-DNA2 con I-DNA1, permite analizar 10 loci STRs más amelogenina por duplicado, todos ellos incluidos en el CODIS, mediante amplicones que no superen las 300 pb y 5 loci STRs en fragmentos que no superen las 200 pb.
Estudio comparativo de la capacidad de análisis de muestras de ADN altamente degradadas de los conjuntos de cebadores de la presente invención respecto a los métodos del estado de la técnica.
El análisis en conjunto de Identifiler® y Minifiler® constituye el sistema de identificación del estado de la técnica que mayor rendimiento presenta en el análisis de loci STRs incluidos en el CODIS, a partir de extractos altamente degradados; (Mulero, J. J., et.al. 2008. J Forensic Sci, 53 (4) : 838-852 y Luce et al., 2009. J Forensic Sci. 54 (5) :104654) , considerando los loci STRs incluidos en el CODIS. Identifiler®* corresponde al poder
de discriminación combinado de los loci STRs D3S1358, D5S818, D8S1179, D19S433, TH01, TPOX y VWA, aquellos de menor tamaño de amplificado en ese sistema de identificación y por tanto los que más probabilidad tendrán de ofrecer resultados en el análisis de extractos de ADN altamente degradados. Minifiler® comprende el análisis de los 8 loci STRs restantes presentes en Identifiler® más amelogenina.
En la Tabla 15 se representa tanto por separado como en combinación, la probabilidad de coincidencia combinada en distintos grupos poblaciones de Identifiler® y Minifiler®, así como de I-DNA1 e I-DNA2.
Tabla 15. Probabilidad de coincidencia combinada de Identifiler®* (sin incluir los loci analizados mediante Minifiler) , Minifiler®, I-DNA1, I-DNA2 e Identifiler® (Id) ó la combinación entre I-DNA1 + I-DNA2 (ya que incluyen idénticos loci STRs) .
Sistemas Identifiler®* Afroamericanos 2, 01E-08 Caucasoides 6, 10E-08 Nativos americanos 7, 32E-08 Hispanos 1, 75E-07
Minifiler® 6, 52E-11 8, 21E-11 1, 05E-10 2, 08E-10
I-DNA2 5, 64E-14 1, 22E-13 1, 74E-13 6, 11E-13
I-DNA1 5, 69E-17 1, 86E-16 2, 01E-16 8, 43E-16
Id /I-DNA1+2 1, 31E-18 5, 01E-18 7, 65E-18 3, 62E-17
Como se observa en la Tabla 15, los sistemas comparados ordenados en función de su probabilidad de coincidencia, de mayor a menor son: Identifiler®*, Minifiler®, I-DNA2, I-DNA1. La combinación de I-DNA1+I-DNA2 ofrece la misma probabilidad de coincidencia que Identifiler®, y que la combinación de éste con MinifilerTM debido a que en ambos casos se analizan idénticos loci STRs.
La comparación de la capacidad de análisis de muestras altamente degradadas del sistema objeto de la invención respecto al sistema de mayor rendimiento del estado de la técnica, se realizó mediante el análisis por las 4 reacciones multiplexes, de 10 muestras de ADN procedentes de tejidos incluidos en parafina de autopsias del año 80. Los resultados en cuanto a probabilidad de coincidencia y número de loci STRs de los perfiles obtenidos mediante cada sistema se detallan respectivamente en las Tablas 12 y 13. Se han considerado los alelos que superaban las 40RFUs (Relative Units of Fluorescence) . Al no disponer de muestras de referencia se ha tomado como análisis completo de un STR
aquellos casos en los que se ha logrado obtener dos alelos para una misma muestra o cuando en todos los resultados obtenidos se ha detectado un único alelo. En el caso de D19S433, debido a que no se han conseguido resultados más que mediante Identifiler®, se han tomado como resultados completos aquellos casos en los que se ha detectado un único alelo, por lo que puede que tanto los resultados para Identifiler®, como aquellos que combinan los resultados obtenidos mediante la combinación de Identifiler® y Minifiler® hayan sido ligeramente sobreestimados respecto al resto de sistemas comparados.
Tabla 12. Probabilidad de coincidencia promedio tras el análisis por diferentes sistemas de identificación de muestras de ADN procedentes de parafina del año 80. I-DNA1+I-DNA2 DC, se 25 refiere a la probabilidad de coincidencia de aquellos loci analizados por duplicado al combinar I-
DNA1 e I-DNA2.
Sistemas Afroamericanos Caucasoides Nativos americanos Hispanos
Identifiler® Minifiler® 0.018606312 3.50657E-09 0.025840157 3.19672E-09 0.021707915 4.04664E-09 0.025506154 5.8364E-09
I-DNA2 Identifiler®+Minifiler® I-DNA1 2.48349E-10 3.46271E-11 5.37458E-11 8.20714E-10 6, 55755E-11 9.90932E-11 1.30969E-09 8, 1612E-11 1.18376E-10 3.82184E-09 1, 4143E-10 1.71206E-10
I-DNA1+I-DNA2 1.11032E-15 3.11562E-15 4.73925E-15 1.93533E-14
I-DNA1+I-DNA2 DC 0.003101053 0.004306698 0.003617991 0.004251035
Como se observa en la Tabla 12, Identifiler® ofrece la mayor probabilidad de coincidencia de los sistemas comparados. Minifiler® a su vez, presenta resultados similares a I-DNA2. La combinación Identifiler® y Minifiler® ofrece una probabilidad de coincidencia similar a la obtenida mediante I-DNA1. Por su parte la combinación I-DNA1 e I-DNA2 ofrecen una probabilidad de coincidencia entre 4 y 7 órdenes de magnitud menor que la obtenida mediante la combinación Identifiler® y Minifiler®, y entre 4 y 5 órdenes de magnitud menor que la obtenida mediante I-DNA1.
Del mismo modo, en cuanto al número de loci STRs analizados (Tabla 13, página siguiente) Identifiler® ofrece los peores resultados entre los sistemas comparados, al permitir tan solo el análisis completo de un promedio de 2, 9 loci STRs más amelogenina. Tanto Minifiler®, mediante el cual se obtiene un promedio de 8, 4 loci (7, 4 loci STRs más amelogenina) , como I-DNA2, mediante el cual se obtiene un promedio de 8, 9 loci, (8 loci STRs más amelogenina, la que se ha podido genotipar completamente en 6 y parcialmente en 3 de las 10 muestras analizadas) ofrecen resultados similares en cuanto a número de loci analizados.
Mediante I-DNA1 se obtiene un promedio de 11 loci completos (10 loci STR más amelogenina) , lo que constituye un rendimiento superior al resto de sistemas comparados, similar al obtenido mediante la combinación de Identifiler® y Minifiler® sobre las mismas muestras. Por último la combinación I-DNA1 e I-DNA2 ofrece los perfiles genéticos más completos, ya que consigue genotipar un promedio de 14 loci (13 loci STR más amelogenina) . Además mientras que la combinación Identifiler® y Minifiler® permite genotipar por duplicado únicamente el locus de sexo amelogenina, mediante la combinación I-DNA1 e I-DNA2 se obtiene el genotipado por duplicado de 5, 8 loci completos (5, 4 loci STR más amelogenina en 6 casos de los 10 casos analizados) .
Tabla 13. Resumen de resultados obtenidos tras el análisis de 10 muestras de parafina del año 80, mediante I-DNA1, I-DNA2, I-DNA1+I-DNA2, Minifiler®, Identifiler® y Minifiler®+Identifiler®. Los cifras bajo cada sistema de identificación corresponden al nº de loci (entre STRsy amelogenina) C: analizados completamente, P:parcialmente, N:sin resultado, DC (doble chequeo, genotipado por ambos sistemas) .
Muestra I-DNA2 I-DNA1 I-DNA1+I-DNA2 Minifiler Identifiler Minifiler+Identifiler
C P N C P N C P N DC C P N C P N C P N DC
C P C P
71410 2314 1132 8 013013 10 1 5 10 2 91211 1314 1161 9 002113 10 1 5 10 3 90311 1314 1160 8 102113 9 2 5 10 4 72311 1314 1142 8 104012 11 1 4 10 5 91212 0315 0161 9 005011 13 0 3 10 6 10021203150170 9 005011 13 0 1210 7 10111203150171 7 203112 9 3 4 10 8 10111014131271 9 004210 12 2 2 10 9 91212 1215 0162 8 104012 11 1 4 1
92112 0315 0162 9 0070915 0 1 10 PROMEDIO 8.9 1 2.1 11 0.7 3 14 0.5 1.1 5.8 1.2 8.4 0.5 0 3.9 0.5 12 11 1.1 4.5 10
DISCUSION
A continuación se discuten los resultados relativos a la validación de I-DNA1, I-DNA2 y de la combinación de ambos, en los ensayos de determinación del porcentaje de alelos tartamudos, intensidad relativa de picos heterocigotos (PHR) , mezclas y sensibilidad. Así mismo se discuten los resultados obtenidos en los estudios comparativos del método de la invención y de los métodos del estado de la técnica, tanto respecto a la estrategia de diseño como respecto a la capacidad de análisis de loci incluidos en el CODIS a partir de muestras de ADN altamente degradadas.
La estimación de la capacidad analítica de un sistema multiplex requiere valorar su sensibilidad en el análisis de mezclas. Antes de proceder al ensayo de mezclas es necesario evaluar los resultados obtenidos para porcentaje de alelos tartamudos y PHR [Budowle, B., Onorato, A. J., Callaghan, T. F., Della Manna, A., Gross, A. M., Guerrieri, R. A., Luttman, J. C., & McClure, D. L. 2009b. J Forensic Sci, 54 (4) : 810-821]. Un porcentaje de alelos tartamudos elevado puede conducir a equívocos en la interpretación de mezclas al confundirse con el “minor contributor” [Walsh PS, F.N., Reynolds R., 1996. Nucleic Acids Res, 24 (14) : 2807-12]. De la misma forma, la variabilidad intermuestra en el porcentaje de alelos tartamudos puede afectar al rendimiento en la resolución de mezclas. Los valores porcentaje de alelos tartamudos de media, mediana, desviación estándar, valores mínimos y máximos del método de la invención, se ajustan a los obtenidos por otros grupos de investigación en la validación de sistemas de identificación como Minifiler® [Mulero, J.J., et al., 2008. J Forensic Sci, 53 (4) : 838-52] y genRESMPX-3 [Schlenk, J., et al., 2004. Int J Legal Med, 118 (1) : 55-61]. En conjunto, los bajos porcentajes de alelos tartamudos obtenidos para I-DNA1 y I-DNA2 ayudan al correcto genotipado de las muestras, así como en la interpretación de mezclas.
Por otro lado los valores de PHR definen el balance existente en la amplificación de heterocigotos. Para I-DNA1 y I-DNA2 se observa una PHR media similar a la reportada para MinifilerTM e Identifiler® (Applied Biosystems, Foster City, CA) (85, 86%, 87%, 87, 87% y 86, 87%, respectivamente) . En cuanto a la homogeneidad de PHR en los diferentes loci, I-DNA1 y I-DNA2 muestran valores similares y una menor desviación media estándar que la reportada para MinifilerTM Kit PCR (Applied Biosystems, Foster
City, CA) (9, 65 y 9, 95, frente a 33, 47, respectivamente) [Mulero, J.J., et al., 2008. J Forensic Sci, 53 (4) : 838-52]. No se ha comparado I-DNA1 y I-DNA2 con Identifiler® (Applied Biosystems, Foster City, CA) porque no se han reportado datos de desviación estándar.
En el análisis de mezclas, el umbral de detección depende del número de contribuyentes, del perfil genético de los mismos y de la cantidad de ADN total [Schlenk, J., et al., 2004. Int J Legal Med, 118 (1) : 55-61]. El bajo porcentaje de alelos tartamudos, alto valor de PHR y bajo valor de desviación estándar del mismo, determinan que en mezclas de dos contribuyentes, tanto I-DNA1 como I-DNA2 permitan la detección de un “minor contributor” a 1:20. I-DNA2 presenta en los loci FGA, D13S317 y D7S820, una mayor capacidad de análisis de mezclas que I-DNA1, mientras que ésta es inferior en los loci vWA, D21S11 y D5S818.
Por lo tanto, el uso de ambos sistemas sobre una misma mezcla de ADN de dos componentes, incrementa la capacidad de determinación de los perfiles individuales respecto a la obtenida mediante la utilización de un único sistema. Así pues cabe considerar que, tanto I-DNA1 como I-DNA2 y en especial la combinación de ambos, presentan características adecuadas tanto para la determinación de los genotipos que componen una mezcla, como para estimar la proporción en la que estos se encuentran.
La sensibilidad de una STR multiplex es determinante en la obtención de perfiles de STRs con la suficiente probabilidad de coincidencia [Budowle, B., A.J. Eisenberg, y A. van Daal, 2009. Croat Med J, 50 (3) : 207-17]. Por ello en la presente invención, se han perseguido aquellas condiciones experimentales en las que I-DNA1 y I-DNA2 ofrecen una alta sensibilidad. Ambas permiten la amplificación de la totalidad de los STRs que contienen a partir de cantidades de ADN de 100 pg, I-DNA1 de 14 loci STR más amelogenina y I-DNA2 11 loci STR más amelogenina. I-DNA1 incluso posibilita el análisis de 12 loci en muestras con cantidades de ADN en el rango de 25 a 100 pg.
Se ha comparado la sensibilidad de I-DNA1 y I-DNA2 con la de otros sistemas multiplex que incluyen al menos los 13 loci STRs del CODIS, tales como PowerPlex16 system (Promega® Corporation, USA) e Identifiler® (Applied Biosystems, Foster City,
CA) . Ambos sistemas requieren cantidades mayores de ADN molde que I-DNA1 (250 pg) [Collins, P.J., et al., 2004. J Forensic Sci, 49 (6) : 1265-77; Krenke, B.E., et al., 2002. J Forensic Sci, 47 (4) : 773-85]. PowerPlex® 16 HS system (Promega® Corporation, USA) , posee una sensibilidad superior a I-DNA1 y a I-DNA2 al ser capaz de amplificar la totalidad de los STRs que incluye a partir de cantidades de ADN superiores a 62, 5 pg, aunque por el contrario requiere de amplificados de mayor tamaño para ello, lo que reduce su rendimiento en el análisis de muestras altamente degradadas, como se detalla en el estudio comparativo de las estrategias de diseño (PowerPlex® 16 HS system y PowerPlex® 16 contienen idénticos conjuntos de cebadores) .
Otros sistemas multiplex de amplia utilización son genRESMPX-3 (Serac, Homburg, Germany) , AmpFISTR Profiler Plus y AmpFISTR Cofiler multiplex Systems (Applied Biosystems, Foster City, CA) , que también requieren de cantidades mayores de ADN molde que I-DNA1 (120 pg el primero [Schlenk, J., et al., 2004. Int J Legal Med, 118 (1) : 55-61] y 160 pg el segundo y el tercero [LaFountain MJ, S.M., Svete PA, Walkinshaw MA y Buel E, 2001. J Forensic Sci, 46: 9]) .
Los extractos de ADN analizados en laboratorios forenses se caracterizan frecuentemente por contener cantidades muy reducidas de ADN, lo que dificulta la obtención de perfiles genéticos de elevada probabilidad de coincidencia tras su análisis mediante un sistema STR multiplex. En este sentido, la combinación de I-DNA1 y I-DNA2 se ha mostrado más eficaz en el análisis de cantidades escasas de ADN, que la utilización de una única STR multiplex.
Así pues, el análisis combinado de I-DNA1 y I-DNA2 a partir de 50 pg de ADN repartidos en dos reacciones de 25 pg, permite la obtención de perfiles genéticos de 13 loci STRs y amelogenina, de los cuales D13S317, vWA y amelogenina se genotipan por duplicado. Mientras que el uso de una única reacción, bien I-DNA1 ó I-DNA2, a partir de cantidades de 50 pg de ADN, posibilita la amplificación de 11 u 8 loci STRs más amelogenina, respectivamente.
La progresiva mejora de la sensibilidad en el análisis de ADN extremadamente escaso se ha debido principalmente al elevado rendimiento del genotipado LCN (Low Copy
Number) . Es importante remarcar que el genotipado LCN no muestra la misma fiabilidad que el genotipado convencional y que su aplicación conlleva un mayor riesgo de error y de contaminación [Budowle, B., A.J. Eisenberg, y A. van Daal, 2009. Croat Med J, 50 (3) : 207-17], por lo que la fiabilidad del genotipado LCN se basa en la realización de varias réplicas de forma que el alelo que haya sido registrado al menos dos veces, sea incorporado a la tabla de resultados [Taberlet, P., et al., 1996. Nucleic Acids Res, 24 (16) : 3189-94].
En este sentido, el principal inconveniente de las combinaciones de reacciones del estado de la técnica es el reducido número de loci que comparten, tanto en formato midiSTR (< 300 pb) como miniSTR (< 200 pb) . Así, MinifilerTM combinado con NGMTM permite la amplificación por duplicado de 3 loci en formato midiSTR, mientras que combinado con Identifiler® amplia a 6 el número de loci analizados por duplicado en formato midiSTR. Ambas combinaciones permiten únicamente el genotipado por duplicado de amelogenina en fragmentos que no superen las 200 pb. La combinación de PowerPlex® ESX y ESY, posibilita el análisis por duplicado de 10 loci, 7 incluidos en el CODIS y en la ECL, en formato midiSTR, y de 3 loci, todos ellos incluidos en el CODIS y en la ECL, en formato miniSTR [Hill, C.R., et al.2010. April 22, Forensic Sci Int Genet].
La combinación de I-DNA1 con I-DNA2, permite analizar 10 loci STRs más amelogenina por duplicado, todos ellos incluidos en el CODIS, por lo que permite confirmar el perfil genético obtenido a partir de fragmentos de ADN que no superen las 300 pb. Esta cualidad es de especial interés en el análisis de muestras de ADN altamente degradadas y en el genotipado LCN, donde los perfiles pueden presentar una reducida fiabilidad debido a la escasa altura de los picos obtenidos. Así mismo, tanto I-DNA1 y I-DNA2, como la combinación de ambas reacciones, presentan un reducido tamaño de amplicones, de tal forma que combinadas posibilitan la amplificación por duplicado de 5 loci STRs, todos incluidos en el CODIS, a partir de fragmentos de ADN no mayores de 200 pb.
Por tanto, en base a la sensibilidad y a los loci midiSTRs y miniSTRs analizados tanto I-DNA1 como I-DNA2 y sobre todo su combinación constituyen una herramienta altamente eficaz para la confirmación de perfiles genéticos obtenidos mediante genotipado LCN, y en especial a partir de muestras altamente degradados cuyos fragmentos de ADN no superen las 300 pb e incluso las 200 pb, lo que sugiere en este apartado un mayor rendimiento global del método de la invención que el del resto de las combinaciones de reacciones del estado de la técnica.
El tamaño de los amplicones de un sistema STR multiplex es crítico para la obtención de perfiles genéticos a partir de muestras biológicas altamente degradadas [Budowle, B.,
A.J. Eisenberg, y A. van Daal, 2009. Croat Med J, 50 (3) : 207-17]. Tal y como se observa en el estudio comparativo de estrategias de diseño I-DNA1, I-DNA2 y la combinación de ambas, han sido específicamente diseñadas para la obtención de perfiles genómicos a partir de fragmentos de ADN de pequeño tamaño.
Las STR multiplexes del estado de la técnica se caracterizan por su incapacidad de analizar el conjunto de loci que constituyen el CODIS, a partir de fragmentos de ADN que no superen las 300 pb. I-DNA1 destaca por ser la única STR multiplex que permite analizar la totalidad de los loci incluidos en el CODIS mediante amplicones que no superen las 300 pb y 10 de ellos mediante amplicones que no superen las 200 pb.
Cabe señalar que Bioplex-11 analiza 8 loci del CODIS mediante amplificados inferiores a 200 pb, si bien para ello marca parte de sus cebadores con biotina lo que posibilita separar los amplificados en dos porciones que son analizadas en electroforesis independientes y por tanto permite incluir un mayor número de loci por reacción de PCR. Por lo tanto se puede afirmar que, I-DNA1 aumenta el número de loci totales y así como de aquellos incluidos en del CODIS analizados a partir de extractos de ADN que no superen las 300 pb e incluso las 200 pb, mediante una única reacción de PCR y una única electroforesis capilar.
MinifilerTM (Applied Biosystems, Foster City, CA) es el sistema de mayor rendimiento en el análisis de STRs del CODIS a partir de muestras de ADN altamente degradadas. En total amplifica 8 STRs más amelogenina, 7 de ellos incluidos en el CODIS, a partir de fragmentos de ADN que no superen las 283 pb y cantidades de ADN de 125 pg, mientras que por debajo de 100 pg suele ofrecer resultados parciales [Mulero, J.J., et al., 2008. J Forensic Sci, 53 (4) : 838-52]. En comparación, I-DNA1 amplifica 15 loci incluyendo la totalidad del CODIS y I-DNA2 12 loci incluyendo 10 STRs del CODIS, ambas reacciones con un requerimiento de ADN molde 25 pg inferior a MinifilerTM. Incluso a partir de fragmentos que no superen las 229pb, I-DNA2 es capaz de analizar tantos STRs como la totalidad de los incluidos en MinifilerTM y I-DNA1 analiza 5 STRs más que estas dos reacciones. En síntesis, el reducido tamaño de los amplicones de I-DNA1 y I-DNA2 sumado a su alta sensibilidad, sugieren que la utilidad de estos sistemas al analizar loci STRs incluidos en el CODIS, a partir de muestras de muestras de ADN altamente degradadas y/o escasas, es superior al de los métodos del estado de la técnica.
Así mismo, con la excepción de la combinación MinifilerTM e Identifiler®, las combinaciones de STRs multiplexes del estado de la técnica, no permiten el análisis de la totalidad de los loci incluidos en el CODIS mediante amplicones que no superen las 300 pb, por lo que los perfiles de STRs que proporcionan a partir de extractos de ADN altamente degradados no incluyen los 13 STRs del CODIS y por tanto, no permiten su comparación con la de la totalidad de los loci STRs genotipados en los millones de perfiles genéticos almacenados en dicha base de datos. De este modo, MinifilerTM e Identifiler® constituyen la combinación de reacciones más ampliamente utilizada actualmente en el análisis de muestras degradadas y la que presenta un mayor rendimiento entre las combinaciones del estado de la técnica en cuanto a capacidad de análisis de loci incluidos en el CODIS a partir de este tipo de muestras. Sin embargo, no es posible determinar con exactitud el tamaño mínimo requerido de fragmentos de ADN para analizar la totalidad de loci incluidos en el CODIS mediante el uso combinado de MinifilerTM e Identifiler®, debido a que no han sido publicados y a que los cebadores de estas reacciones utilizan conectores peptídicos que alteran la movilidad electroforética de los amplificados. Según la información gráfica publicada dicho tamaño mínimo es de aproximadamente 255 pb.
La combinación de I-DNA1 y I-DNA2 presenta un reducido tamaño de amplicones, de tal forma que ha sido específicamente diseñada para analizar la totalidad de loci incluidos en el CODIS en fragmentos que no superen las 229 pb, e incluso 13 loci STRs entre los que se incluyen 12 de los 13 del el CODIS (5 de ellos por duplicado) en fragmentos de ADN que no superen las 200 pb. En total, esta combinación analiza 15 loci STR más amelogenina, 10 de ellos más amelogenina por duplicado, a partir de fragmentos que no superen las 300 pb. Por lo tanto, la estrategia de diseño de la presente invención, a falta de poder compararse con el diseño de la combinación MinifilerTM e Identifiler®, supone una mejora respecto al resto de combinaciones de reacciones desarrolladas hasta la fecha, en rendimiento y fiabilidad, en el análisis de loci incluidos en el CODIS a partir de fragmentos de ADN de reducido tamaño.
El análisis comparativo de la capacidad de análisis de muestras de ADN altamente degradadas, consistió en el análisis de muestras de parafina caracterizadas por la elevada fragmentación de su ADN, mediante: I-DNA1, I-DNA2, la combinación de ambas, Identifiler® y MinifilerTM, así como de la combinación de estas dos últimas.
Identifiler®, debido al gran tamaño de sus amplificados, presenta los peores resultados de entre todos los sistemas comparados, al analizar 2, 9 loci STRs, con una probabilidad de coincidencia de aproximadamente 10-2, por lo que resulta una reacción insuficiente para su uso como herramienta identificativa a partir de ADN altamente degradado. I-DNA2 y Minifiler®, presentan un rendimiento similar, tanto en número de loci analizados (8 STRs y 7, 4 STRs, respectivamente) , como en cuanto a probabilidad de coincidencia, en ambos casos de aproximadamente 10-9.
I-DNA1, permite el análisis de 10 loci STR más amelogenina con una probabilidad de coincidencia de 10-10 y por lo tanto, mediante el uso de I-DNA1 y a partir de idénticas muestras, se obtienen los perfiles genéticos de menor probabilidad de coincidencia entre los sistemas comparados. I-DNA1 incluso proporciona perfiles genéticos de menor probabilidad de coincidencia (10-10-10-11) que los proporcionados por la combinación de Identifiler® y Minifiler® (10-8-10-11) en 3 de los 4 grupos poblacionales, por lo que se puede afirmar que I-DNA1 alcanza un mayor rendimiento que el resto de métodos comparados, en cuanto a capacidad de análisis de loci incluidos en el CODIS a partir de muestras de ADN altamente degradadas.
Así mismo, la combinación I-DNA1 e I-DNA2 ofrece perfiles genéticos de una mayor fiabilidad que la combinación de Identifiler® y Minifiler®, tanto en número de loci, al analizar 13 loci STR más amelogenina (12 incluidos en el CODIS) , respecto a los 10 STRs más amelogenina (8 incluidos en el CODIS) , como en probabilidad de coincidencia que alcanza valores de 10-14-10-15, respecto a los 10-8-10-11 de la combinación de Identifiler® y Minifiler®.
Del mismo modo, en cuanto al genotipado por duplicado de una serie de loci STRs a la combinación I-DNA1+I-DNA2, ofrece un mayor rendimiento que la combinación MinifilerTM+Identifiler®, pues mientras que ésta última permite genotipar por duplicado únicamente el locus de sexo amelogenina, la combinación I-DNA1 e I-DNA2 permite el genotipado por duplicado de 5, 4 loci STR que proporcionan en sí mismos una probabilidad de coincidencia de 10-3, menor que la obtenidas en el análisis de las muestras de parafina mediante Identifiler®.
En conclusión, los resultados obtenidos en la presente validación tanto en los ensayos de mezclas y sensibilidad, como en los estudios comparativos de estrategias de diseño y de análisis de muestras de ADN altamente degradadas, demuestran que la presente invención, constituye una mejora sustancial respecto al estado de la técnica en cuanto a rendimiento y a fiabilidad en análisis de loci STRs incluidos en el CODIS a partir de muestras de ADN
altamente degradadas.