MÉTODO PARA LA OBTENCiÓN DEL PERFIL GENÉTICO DE UN INDIVIDUO
CAMPO DE LA INVENCIÓN
La invención se relaciona con un método para obtener el perfil genético de un individuo o resto biológico que comprende el análisis de 4 Ó más loei STRs, hasta un total de 20 ¡oei STRs más e110cus amelogenina determinante del sexo (en total 21 loci) , en un extracto de ADN de dicho individuo o resto mediante una reacción de amplificación PCR multiplexo Asimismo, la presente invención también se dirige a la producción de un kit que comprende las parejas de cebadores para la puesta en práctica del método de la invención. Tanto el método como el kit aquí descritos son de aplicación en la identificación de individuos en el área de la genética forense, así como en genética de poblaciones, antropología y biomedicina.
ANTECEDENTES DE LA INVENCIÓN
El análisis de marcadores microsatélitcs denominados STRs (del inglés, Short Tandem Repeats) es hoy en día la técnica de rderencia para la obtención de perfiles genéticos destinados a identificación de individuos. restos biológicos, detenninación de parentesco o cnminalística.
Del mismo modo, a partir del análisis de dichos marcadores STRs se han ido creando bases de datos de perfiles genéticos en diferentes países del mundo. Dichas bases de datos permiten la utilización de los perfiles genéticos en investigación criminal así como la utilización del conocimiento acumulado sobre los distintos loei STRs en diferentes grupos poblacionales, a la hora de cotejar los datos djsponibles y estimar el poder de discriminación en cada caso cotejado.
Existe un amplio número de bases de datos de perfiles genéticos. entre ellas las más relevantes son Combined lndex syslem (CODIS) creada por el FBI, lnterpol Standard Set
Loei (ISSL) , El/ropean eore loei (ECL) , UK National Criminal lntelfigence DNA
Dalabase (NDNAD) , Extended European Standard Sel (ESS) y German Core loci (GeL) .
Todas las bases de datos incluyen un núcleo común de STRs (D18S5 1, 021 Sil, D3S 1358, D8S 11 79, FGA, TH01, vWA) aunque difieren en el número total yen al!:, runos de los loci STRs incluidos en cada una de ellas (Tabla 1) .
Tabla 1. Loc i STRs incluidos en las principales bases de datos.
CODlS ECLlNDNAD ESS GeL ISSL FBI Europcan & UK EI/rapean Er.icntled GenJ/1111 Core Loei [nterpol
Dl8SS1 D1NS51 01855\ 01 855 1 018551 021S11 D21S11 021S11 02IS1 1 D2ISII 0351358 D3S\3SX 0381358 O3S1358 03S1358 0851179 OS51179 O¡.;S1179 0851179 D8S1179 FGA FGA FGA FGA FUA TilO I THOl THOI THO! T HOl vWA v\VA vWA vWA v\VA
DlóS539 0165539 0135317 CSF II'O
TPOX
D7S820
DSSS18 0195433 0251338
01051248 0125391 01$1656
022SI045 025441 SED 5
CODIS es la base de datos que más loci STRs incluye, un total de 13, además del10cus amelogenina para la determinación del sexo. ECL y la base de datos del Reino Unido incluyen 10 loei STRs y amelogenina, el núcleo de 7 loci STRs junto con el 016S539 10 compartido con el CODIS y dos loci STRs adicionales DI9S433 y D2S1338, además de recomendar el análisis de TPOX, incluido en el CODlS. ISSL incluye el núcleo universal de 7 loei STRs y considera opcional el análisis de amelogenina. Por último, Gel incluye el núcleo universal de 7 loei STRs. amelogenina y el locus SE33. Recientemente se ha recomendado el uso de 5 nuevos loci STRs (DIS I656, D2S44I, DIOSI248, D12S391 ,
D22S 1045) además del núcleo de 7 loci STRs por la Extended European Standard Ser (ESS) .
En la acrualidad existen numerosas empresas que comercializan kits para la elaboración de perfiles genéticos. Applicd BiosystemsOO comercializa AmpFlSTR:!I Identifilcr') I) PCR amplification kit (2004. Applied Biosystems'!l, Foster City, CA) . Promega fabrica TM , ji;)
PowerPlex 16 (2004, Promega Corporation, USA) . Mediante estos kits puede alcanzarse una probabilidad de coincidencia entre los perfiles genéticos de dos individuos de alrededor de uno entre un trillón, tras el análisis de 15 regiones STRs. Ambos kits incluyen los 13 loci del CODlS~ en el caso de Identifiler® incluye además los loei autosómicos 02S1338 y 019433, Y Powerplex™ 16 incluye los locl autosomicos Penta E y Penta D.
Recientemente se han desarrollado otros nuevos kits comerciales AmpFlSTR® NGM ™ Amplification Kit (Applied Biosystems, Foster City, CA) , PowerPlex® ES X Y PowerPlex® ES Y (Promega® Corporation, USA) , lnvestigator ESSplex Kit (Qiagen, (Valencia, California, U.S.A.) dirigidos especialmente a analizar los 5 nuevos loci recomendados por la EDNAP (European DNA Profi/ing Group) and ENFS I (European Network o/Forensic Sciellce Instilutes) .
Uno de los principales inconvenientes de éstos y otros kits actualmente disponibles en el mercado es su falta de capacidad para amplificar la totalidad de los loci STRs que se incluyen en el conjunto de las principales bases de datos. Este problema dificulta la comparación de los pertiles obtenidos mediante estos kits comerciale::s y los registrados en las diferentes bases de datos haciendo en muchos casos ineficaz dicha comparación al no obtenerse una probabilidad de coincidencia suticiente (ver Tabla 9 de los Ejemplos) .
En este contexto han surgido numerosas solicitudes de patentes relacionadas con la obte::nción de perfiles genétlcos mediante el análisis simultáneo de varías loci STRs, que describen nuevos métodos de obtención de perfiles genéticos cada vez más discriminati vos basados en el análisis de nuevos STRs además de incluir algunos de los loei STRs utilizados hoy día, La solicitud de patente US6090558 describe el uso de la espectrometría de masas para detectar la variación de longitud en repeticiones de secuencias de nudeótidos, tales como microsatélites y repeticiones cortas en tándem, y cebadores de ADN para el análisis de polimorfismos en repeticiones de nucleótidos en tándem en loci específicos.
Tanto la solicitud de patente US6479235 como la patente ES2273367 describen la detección de loci genéticos, más específicamente, la amplificación simultánea de múltiples ¡oei genéticos polimórficos diferentes utilizando la reacción en cadena de la polimerasa u otros sistemas de amplificación para determinar los alelos de cada locu5. Los loei genéticos amplificados comprenden HUMvWFA3 1, HUMUPOL, HUMBFXlII, HUMFI3AOI , HUMFESFPS, HUMTHOI, HUMTPOX, HUMCSFIPO, D22S683, D20S481, D19S253, D17S1299, D17S1298, D16S753, D16S539, D16S490, D14S562, D14S548, D14S118, D13S317, DI OSJ 239, D9S930, D7S820, D5S818, D4S2368, D3S1539. Aunque integra un alto número de loei STRs, incluye únicamente 8 de los 13 ¡oei objeto del CODIS, y 3 de los 10 loei incluidos en la base de datos europea, lo que disminuye su rendimiento en cuanto a comparación de los resultados obtenidos con los millones de perfiles genéticos disponibles en las bases de datos existentes.
La solicitud de patente US6479235 describe métodos y materiales para la amplificación simultánea de, al menos, 13 STRs del coors en una reacción multiplex cuyos tamaños de amplificado exceden las 360 pb.
La solicitud de patente US2003/01 86272 describe un método rápido para determinar la longitud de los fragmentos de los alelos presentes en una pluralidad de loei en una muestra que contiene ADN que comprende: (a) obtener una muestra que contiene ADN, b) amplificar mediante PCR multiplex los loci FGA, vWA, THOI , TPOX, CSF IPO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, DI8S51 y D21SI1 (la reacción PCR multiplex se lleva a cabo empleando una pluralidad de parejas de cebadores, donde al menos un cebador de cada pareja de cebadores está marcado con una etiqueta detectable, y la amplificación produce una mezcla de amp licones marcados) , y (e) analizar por electroforesis dicha mezcla de amplicones, para determinar la longitud de los fragmentos de los alelos en dicha pluralidad de loei de la muestra que contiene ADN.
Actualmente la obtención de perfiles genéticos mediante el análisis de ¡oei STRs autosómicos plantea el problema técnico del escaso éxito de la mayoría de las reacciones para resolver casos de parentesco complejo en los que por falta de un progenitor, o por ser un parentesco lejano, el reducido número de STRs analizados en los diferentes kits hace que la probabilidad de parentesco obtenida resulte insuficiente para determinar con seguridad el grado de parentesco. En estos casos se hace necesario un nuevo análisis de los individuos con otros kits de STRs autosómicos y STRs sexuales (STRs del cromosoma X y del cromosoma Y) con el tin de aumentar el número de STRs analizados para alcanzar una probabilidad suficiente o para descartar el parentesco.
Por lo tanto. el estado de la técnica revela la necesidad de desarrollar un nuevo método para obtener perfiles genéticos de loci STRs, que supere los inconvenientes de los actualmente existentes,
COMPENDIO DE LA INVENCIÓN
El establecimiento de bases de datos de perfiles genéticos basados en loei STRs proporciona una herramienta de gran relevancia para la resolución de casos forenses en el ámbito criminal o la detenninación del parentesco entre individuos.
En la actualidad existen numerosas empresas que comercializan kits para la elaboración de perfiles genéticos, pero ninguno de ellos pennite analizar la totalidad de los loci STRs incluidos en las principales bases de datos usadas en la identificación de individuos como son CODlS, NDNAO, ECL, 153L, E5S y GCL. Para solventar este problema los inventores han diseñado nuevas parejas de cebadores dirigidas a amplificar cada uno de los loei incluidos en las mencionadas bases de datos, como son CSFIPO, 05S818, D7S820, 021SII, 02S441, 0131656, TPOX, VWA, 0831179, 0195433, 0123391, THOI, 0165539, 0351358, 01855 1, 0251338, 0135317, FGA, 02251045 Y 01051248, con la característica técnica adicional de que, si se desea, pueden emplearse simultáneamente en combinaciones de 4 o más parejas de cebadores en una reacción de amplificación JUuItiplex para obtener un perfil genético compuesto de hasta 20 loci STRs más el locos amelogenina de detenninación del sexo (lo que hacen un total de 21 ¡oci) , incluyendo entre ellos la totalidad de los loci de las bases de datos más comúnmente empleadas en la
identificación de individuos. Esta característica de las parejas de cebadores de la invención
permite su empleo en casos de determinación de parentesco complejo y evita el análi sis de
los individuos con varios kits comerciales con el fin de analizar todos los STRs incluidos
en las bases de datos de identificación de individuos, lo que disminuye el coste de la
5 identificación genética.
Tal como se muestra en el Ejemplo 1, el diseño de las parejas de cebadores de la presente
invención se realizó mediante una búsqueda de las secuencias flanqueantes a cada locus
STR y posteriormente se diseñaron los cebadores empleando el programa Perlprimer. Una
10 vez obtenidas las parejas de cebadores, se procedió a realizar una reacción de
amplificación de la polimerasa sobre un extracto de ADN empleando dichas parejas de
cebadores tras lo cual, se obtuvo el perfil genético del individuo al que pertenecía el
extracto de ADN con fiabilidad, precisión y con un poder de discriminación superior a los
perfi les genéticos obtenidos por otros métodos.
15
Así, en un primer aspecto, la invención se relaciona con un método para obtener el perfil
genético de un individuo que comprende el análisis, en un extracto de ADN procedente de
dicho individuo mediante una reacción de amplificación multiplex, de al menos 4 loci del
grupo formado por los loci CSF 1PO, D5S818, D7S820, D21 S 11 , D2S44 1 , DI S 1656,
20 TPOX, VWA, D8S1179, D19S433, D12S391 , THOI , D16S539, D3S1358, D18S51 ,
D2S1338, D13S317, Amelogenina, FGA, D22SI045 y Dl0S1248, en donde
a) Al menos uno de los 4 loci se selecciona del grupo formado por los loci STRs
CSFl PO, D5S818, D7S820, TPOX y D13S317, y
b) Al menos dos de los 4 loci se seleccionan del grupo fonnado por los loci STRs
25 D2S441 , DIS1656, D12S391 , D22SI045 y DIOS1248.
En otro aspecto, la invención se relaciona con el uso de un método según la presente
invención para identificar un individuo, determinar relaciones de parentesco entre
individuos o para identificar restos humanos.
JO
En otro aspecto, la invención se relaciona con un kit que comprende parejas de ceba.dores
específicas para amplificar al menos 4 locí seleccionados del grupo fonnado por los loei
CSFlPO, D5S818, D7S820, D2ISII , D2S441 , DIS1656, TPOX, VWA, D8S1179,
019S433, 012S391, THOI, 016S539, 03S1358, 018S51, 02S1338, 013S317, Amelogenina, FGA, 022S 1 045 Y O IOS 1248, en donde a) Al menos uno de los 4 ¡oei se selecciona del grupo formado por los ¡oei STRs CSFl PO, 05S818, 07S820, TPOX y 013S317; y
b) Al menos dos de lo s 4 ¡oei se seleccionan del grupo fonnado por los ¡oei STRs 02S441 , 01S1656, 012S391 , 022S1045 y 010S1248.
En otro aspecto, la invención se relaciona con el uso de un kit según la invención para obtener el perfil genético de un individuo, para identificar un individuo, para determinar relaciones de parentesco entre individuos O para identificar restos humanos.
En otro aspecto, la invención se relaciona con un conjunto de parejas de cebadores que comprende, al menos, 4 parejas de cebadores dirigidas a amplificar 4 ¡oei del grupo formado por los loei CSF IPO, 05S818, 07S820, 021SII , 02S441 , 01S1656, TPOX, VWA, 08S1179, 019S433, 012S391 , THOI , 016S539, O3S1358, D18S51 , 02S1338, 013S317, Amelogenina, FGA, 022S 1045 y OlOS 1248, en donde a) Al menos uno de los 4 ¡oei se selecciona del grupo formado por los loci STRs CSFl PO, 05S818, 07S820, TPOX y 013S317; y
b) Al menos dos de los 4 loci se seleccionan del grupo fOffimdo por los loei STRs 02S441 , 01S1656, 012S391 , 022S1045 y 010S1248.
El uso del conjunto de cebadores de la invención para obtener el perfil genético de un individuo, para detenninar relaciones de parentesco entre individuos, para identificar restos humanos, constituye un aspecto adicional de la presente invención.
Finalmente, en otro aspecto, la invención se relaciona con una pareja de cebadores seleccionada del grupo que consiste en las siguientes parejas de oligonucleótidos SEQ ID NO: I y SEQ ID NO: 2 para el loeus CSF 1 PO, SEQ ID NO: 3 y SEQ ID NO: 4 para el loeus 05S818, SEQ ID NO: 5 y SEQ ID NO: 6 para el loeus 07S820, SEQ ID NO: 7 y SEQ ID NO: 8 para el loeus 021 S 11 , SEQ ID NO: 9 y SEQ ID NO: 10 para el loeus 02S44 I , SEQ ID NO: I1 y SEQ ID NO: 12 para el loeus O I S 1656,
SEQ ID NO: 13 y SEQ ID NO: 14 para ellocus TPOX, SEQ ID NO: 15 Y SEQ ID NO: 16 para ellocus VWA, SEQ ID NO: 17 y SEQ ID NO: 18 para ellocus D8S1179, SEQ ID NO: 19 y SEQ ID NO: 20 para ell""us D19S433, SEQ ID NO: 21 y SEQ ID NO: 22 para ellocus D12S391 , SEQ ID NO: 23 y SEQ ID NO: 24 para ellocus THOI , SEQ ID NO: 25 y SEQ ID NO: 26 para ellocus D16S539, SEQ ID NO: 27 y SEQ ID NO: 28 para e1locus 03S1358, SEQ ID NO: 29 y SEQ ID NO: 30 para ellocus O18S5 1, SEQ ID NO: 31 y SEQ ID NO: 32 para ellocus D2S 1338, SEQ ID NO: 33 y SEQ ID NO: 34 paraellocus D13S3 17, SEQ ID NO: 35 y SEQ ID NO: 36 para ellocus Amelogenina, SEQ ID NO: 37 y SEQ ID NO: 38 para el locus FOA, SEQ ID NO: 39 y SEQ ID NO: 40 para e1locus D22S 1 045, Y SEQ ID NO: 41 y SEQ ID NO: 42 para ellocus DIOS1248.
BREVE DESCRIPCIÓN DE LAS FIGURAS
La Figura 1 corresponde a un gráfico llamado electroferograma que muestra el perfil genético de un individuo obtenido de los loci analizados mediante el conjunto de cebadores de la invención empleando un analizador automático de secuencias AB3J30 Genetie Analyzer (Applied Biosyslemsrr{;) . En la Figura se pueden observar 4 paneles, cada uno correspondiente a aquellas parejas de cebadores marcadas con el mismo locus fluorescente. En cada panel se muestra la intensidad de la señal detectada en Relarive Flltorescence Units (RFU, unidad relativa de tluorescencia.) en el eje Y; el eje X corresponde al tamaño en pares de bases. Así, el primer panel corresponde a los resultados obtenidos para los productos de STRs amplificados con cebadores marcados con 6_FAM™ (dirigidos a los loci CSFIPO, D5S818, D7S820, D2ISII. D2S441 y 0ISI656) , el segundo panel a los marcados con VIC™ (loci THOl , D16S539, D3S135S, D18351, D2SI338) , el tercero a NEDT~ (Ioci TPOX, VWA, D8S1179, DI9S433 y D12S391) yen el cuarto panel se muestran los resultados para los loei marcados con el fluorocromo PETi @.\ (D13S317.
amelogenina, FGA, D2251045 y 010SI248) . Las barras situadas en la parte superior de cada panel corresponden al nombre de los loci. Los rectángulos situados bajos los picos del electroferograma muestran el nombre del alelo, indicado por un número.
La Figura 2 es una representación gráfica que muestra el diseño del conjunto de parejas de cebadores (denominado I-ONAE21) . Las cajas representan los tamaños de amplificado para cada locus. Los loci marcados con diferente color se presentan en diferentes escalas de grises. Los respectivos marcajes se señalan en la parte derecha de la figura.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
En la actualidad existen varias empresas que comercializan kits para la elaboración de perfiles genéticos, pero ninguno de ellos pennite el análisis de la totalidad de los ¡oei STRs incluidos en las bases de datos internacionales más importantes como son COOIS, NONAO, ECL, ISSL, ESS y GCL. Para solventar esta carencia los inventores han diseñado unas parejas de cebadores dirigidas a amplificar cada uno de los loci STRs incluidos en las mencionadas bases de datos, como son CSF 1 PO, 05S818, 07S820, 021S II, 02S441, 01S1656, TPOX, VWA, 08S 1179, 019S433, 012S391, THOI, 016S539, 03S 1358, 018S51, 02S1338, 013S317, FGA, 022SI045 y 010S1248, con l. característica técnica adicional de que, si se desea, las parejas de cebadores pueden emplearse simultáneamente en una reacción de amplificación multiplex en combinaciones de 4 o más parejas de cebadores para obtener un perfil genético compuesto de hasta 20 loci STRs más el locus amelogenina de determinación del sexo (lo que hacen un total de 21 loci analizados) , estando todos los ¡oci amplificados incluidos en las bases de datos más comúnmente empleadas en la identificación de individuos. Esta característica de las parejas de cebadores de la invención pemlite su empleo en casos de determinación de identificación y parentesco complejo, evitando además el análisis de los individuos con varios kits comerciales con el fin de analizar todos los STRs incluidos en las bases de datos de identificación de individuos, lo que disminuye el coste analítico. Dicha característica permite a esta invención tener un poder de discriminación y por consiguiente una probabilidad de coincidencia al azar netamente superior a cualquier kit existente actualmente en el mercado, posibilitando el cotejo de los perfiles genéticos obtenidos mediante su análisis, con los contenidos en las principales bases de datos y la aplicación de la invención a casos de parentesco complejos.
Así, mediante las parejas de cebadores diseñadas por los inventores de la presente
invención, se han desarrollado los distintos aspectos inventivos que torman parte de la
presente invención y que serán descritos en detalle a continuación. Previamenle a la
5 descripción de dichos aspectos inventivos, se incluye un listado de definiciones donde se
explica el significado de los teoninos empleados en el contexto de la presente invención
para ayudar en la comprensión de la misma.
Definiciones
10
"lIn "j"llna"
El uso de la palabra "un" o "una" cuando se usa junto con el término "'comprender"o
"comprende" en las reivindicaciones y/o en la descripción puede significar "uno", pero
también es consistente con el significado de "uno o más", ~·al menos uno" y ''Uno o más de
15 uno".
Pet:/iI Genético
En el contexto de la presente invención. los ténninos "perfil genético" y "huella genética"
tienen el mismo significado por lo que pueden emplearse indistintamente a lo largo de la
20 descripción. El "perfil genético" es un conjunto de secuencias de bases en posiciones
características del material gem!tico que permiten diferenciar a un individuo de otro.
Loci STRs
En la presente invención, el perfil genético se obtiene a partir del análisis de loci
25 caracterizados por la repetición en tándem de una corta secuencia de bases STRs (del
inglés Short Tandem Repeats) cuyo número de repeticiones es altamente variable entre
individuos. Así, en la presente invención se entiende por "secuencias STRs" o "loci STRs"
aquellas secuencias del ADN, también llamadas microsatélites, que contienen repeticiones
de 4 pb (Buder JM, Biotechniqlles. 2007) .
JO
El análisis de los loei STRs en el genoma presenta múltiples aplicaciones que incluyen.
aunque no se limitan a, obtención de perfiles genéticos. diagnósticos de parentesco,
detenninación del origen de una muestra o tejido, identificación de cadáveres, estudios de
genética de poblaciones, pruebas de cigosidad en mellizos, seguimiento de transplantes de
médula ósea, evaluación de ta trazabilidad de muestras biológicas de origen humano,
identificación de mezclas presentes en una muestra y determinación del número de
contribuyentes de origen humano a una mezcla y su aportación relativa a la mezcla.
5
PCR
PCR corresponde a las siglas de reacción en cadena de la polimerasa mediante la cual se
pueden obtener millones de copias de las regiones de ADN deseadas. Se caracteriza por el
empleo de parejas de cebadores que acotan la región de la que se realizarán millones de
la copias, lo que también se conoce como "amplificar ADN" durante la peRo La PCR está
compuesta por un número detenninado de ciclos, compuestos a su vez por tres fases en las
que las hebras de ADN se separan, se unen los cebadores y se elongan las nuevas hebras de
ADN. En cada ciclo, si la eficiencia de la reacción es del 100% se produce un crecimiento
exponencial 2" del número de fragmentos de ADN objeto de la amplificación.
15
Reacción de amplificacióll multiplex
En la presente invención se entiende por "Reacción de amplificación multiplex" a la
reacción PCR en la cual se amplifica más de una secuencia de ADN en una misma
reacción, mediante el empleo de dos o más parejas de cebadores junto con el resto de los
20 reactivos de la reacción con el fin de amplificar simultáneamente múltiples secuencias de
ADN.
Oligol1l1cleótido
El ténnino "oligonucleótido" hace referencia a la secuencia de bases de nucleótidos
25 unidos por enlaces tosfo-diéster, habitualmente no mayor de 50 nuc1eótidos.
Cebador
En la presente invención se entiende por "ccbador" o "primer" u "ol1gonucJeótido"
("oligo") a la secuencia de nucleótidos a partir de la cual la ADN polimerasa inicia la
30 síntesis de una molécula nueva de ADN. Los cebadores son secuencias nucleotídicas
cortas, aproximadamente de 15-24 nucleótidos de longitud que se pueden alinear con una
hebra de ADN diana gracias a la complementariedad de bases para formar un híbrido entre
el cebador y la hebra diana de ADN. Después, el enzima ADN polimerasa puede extender
el cebador a lo largo de la hebra diana de ADN. Los métodos para preparar y usar cebadores se describen, por ejemplo en Sambrook el a/. (2001) Y Ausubel el al. (1999) .
Pareja de cebadores En el contexto de la presente invención se entiende por "pareja de cebadores" o "primer pair", al conjunto de dos cebadores que. empleados en una misma reacción de amplificación o peR, penniten obtener múltiples copias de una secuencia diana de ADN. Cada uno de los cebadores hibrida con la secuencia diana en el extremo 3' de cada hebra. de manera que se amplifica la secuencia de nuc1eótidos acotada mediante cada pareja de ccbadores. La extensión de los cebadores durante los ciclos de PCR determina la multiplicación exponencial 2n de la secuencia de nucleótidos acotada por los cebadores,
siendo "u" el número de ciclos de la reacción peRo Muestra biológica En el contexto de la presente invención, se entiende por "muestra biológica" cualquier materia que contenga ácido nucleico, por ejemplo, AD . En la presente invención se entiende por "AON" o "ADN genómico" al material genético de los organismos vivos que controla la herencia y se localiza en el núcleo de las células.
Extracto de ADN
En el contexto de la presente invención se entiende "extracto de ADN", cuando tras someter la muestra biológica a un procedimiento de extracción, separación, purificación o clonación de ADN, entre otros, se obtiene como resultado ya sea en seco, en solución, unido o no a otras moléculas, adherido o no a diversas sustancias o lechos, materia en la que el ADN se encuentra en mayor proporción relativa respecto al resto de moléculas presentes, en comparación con la muestra biológica de partida.
Asi "extracto de ADN" se refiere al ADN extraído de cualquier muestra biológica que contenga ADN humano, ya sea procedente de un individuo vivo o muerto, feto, órganos, tcj idos ó células.
Il/dividHO
El ténnino "individuo" se refiere a ser humano de cualquier edad o raza, que en el contexto de la presente invención puede estar vivo o muerto.
Cebadores de la invención Los inventores han diseñado unas parejas de cebadores, de aquí en adelante, "parejas de cebadores de la invención" o "1-DNAE21", que permiten obtener el perfil genético de un individuo con un alto poder de discriminación y son aplicables incluso al análisis de parentesco complejo.
Las parejas de cebadores han sido diseñadas de manera que su uso en una reacción de amplificación multiplex permite obtener el perfil genético de un individuo que comprende la combinación de 4 hasta 20 ¡oei STRs de la totalidad de los STRs (a excepción del marcador SE33) que forman parte de las principales bases de datos empleadas en la identificación de individuos como son CODIS, NDNAD, ECL, ISSL, ESS y GCL, más el locus amelogenina de determinación del sexo (en total 21 loci) ..
Los loei analizados en la presente invención así como las parejas de cebadores diseñadas para su identificación se muestran en la Tabla 2. En el Ejemplo 1 se detalla el 20 procedimiento seguido en el diseño del conjunto de parejas de cebadores de la invención.
Tabla 2. Resumen de las secuencias de los cebadores en dirección 5 ' a 3' diseñados para la amplificación de cada loci en la combinación denominada como l-DNAE21 (columna: secuencia 5'-3') . En esta misma tabla se detalla del alelo menor al
mayor de los STRs que serán considerados mediante este análisis (columna: alelos) así como el tamaño máximo y mín imo posible para cada STR.
LOCUS ALELOS Tamaño de los amplificados (ph) SEQID NO: SECUENCIA (5-3')
1 ACTGCCTTCATAGATAGAAGAT GCCCTGTTCTAAGTACTTCCT
CSFI PO 6 -1 5 75 -111 2
3 TTAATAGCAAGTATGTGACAAGG GACATTTGTATCTTTATCTGTATCCTT
0 5S818 7 -17 127 -167 4
5 GAATTATAACGATTCCACATTTATCC ATAAAGGGTATGATAGAACACTTG
07S820 6 -15 183 -2 19 6
02I S I1 24-38 240-296 7 CCCTGATTCTTCAGC TTGTA
8 GCAGAGACAGACTAATAGGAGG
D2S441 9 -16 305 -333 9 CTCTGAAGAGATTCTTAAGACCC GTTCACTC TCC TTCCCAAATG
10
DI S I656 9 -21 341 -389 1I ATCCCCATATAAGTTCAAGCC
12 GCTTTCAGGCATTTCAGAGATTATG
TPOX 6 -16 61-101 13 CTTAGGGAACCCTCACTG
14 GCAGCGTTTATTTGCCCAA
VWA 11 -24 121-173 15 TCAGTATGTGACTTGGATTGA
16 GTAGGTTAGATAGAGATAGGACAGA
D8S 11 79 8 -20 181-229 17 TTGTATTTCATGTGTACATTCGT GTTGTGTTCATGAGTATAGTTTCAC
18
DI9S433 5.2-18.2 245-297 19 CATGTTGGCACATTCCTG
20 AGTTCTTTAGCAGTGATTTCTG
DI 2S391 14 -27 305 -357 21 CAAATTGTGATAGTAGTTTCTTCTGG GTTAGACCTGGACTGAGCC
22
T HO I 5 -14 57-93 23 AACACAGACTCCATGGTG
24 GTT CCTCCCTTATTTCCCT
DI6S539 5 -16 105-149 25 CCTCTTCCCTAGATCAATACA
26 ATCTGTAAGCATGTATCTATCATC
D3S1358 9 -20 161-205 27 TGTAGTGAGCTATGATTCCC
28 GTATTCCCTGTGCCTTTG
DI8S51 7 -27 2 13-293 29 GTCTCAGCTACTTGCAGG
30 GGAGATGTCTTACAATAACAGTTG
D2S 1338 15 -28 3 13-365 31 GGAGGTGCCTAAAGACTTC
32 GCCTACCAGAATGCCAGTC
1) 13S317 5 -17 72-120 33 CGCCTATCTGTATTTACAAATACAT GGACAGAAAGATAGATAGATGATTGAT
34
A melogenina X, Y 121-127 35 CCCTGGGCTCTGTAAAGA
36 GGGCTTGAGGCCAACCAT
FGA 16-51.2 151-293 37 CTCACAGATTAAACTGTAACCA
38 TTGTCTGTAATTGCCAGC
022S 1045 8 -19 294 -327 39 TCTGCATAAGACCCACTATG
40 ATAGTGACAGTGCCTGTG
DI OS I 248 8 -18 339 -379 41 AGCTATTATTACCAAAGCATGAAC GTTCCAGTCCAACTAGATCCT
42
Así, en un aspecto, la invención se relaciona con un conjunto de parejas de cebadores, de aquí en adelante "conjunto de parejas de cebadores de la invención", que comprende, al menos, 4 parejas de cebadores dirigidas a amplificar 4 loei del grupo formado por los loci CSFIPO, D5S818, D7S820, D2IS11, D2S441, DIS1656, TPOX, VWA, D8S1179, 0 19S433, 012S391 , THOI , 0 16S539, 03S 1358, 018S5 1, 02S 1338, 0 13S3 17, Amelogenina, FGA, 022S 1 045 Y O I OS 1248, en donde a) Al menos uno de los 4 loei se selecciona del grupo formado por los loei STRs CSFl PO, 05S818, 07S820, TPOX y 0 13S317; y
b) Al menos dos de los 4 loei se selecciona del grupo formado por los ¡oei STRs 02S44 1, 0 1S1656, 0 12S39 1, 022S I045 y 01OS1248.
En una realización particular, el conjunto de parejas de cebadores de la invención
comprende, al menos 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20ó21 parejas de cebadores específicas para los ¡oei del grupo formado por los loei CSFI PO, 05S818,
07S820, 021S11, 02S441, DIS1656, TPOX, VWA, 08S1179, 019S433, 012S391,
THOI, 016S539, O3S1358, 018S51, 02S1338, 013S317, Arnelogenina, FGA,
022S I045 y 010S1248.
En otro aspecto, la invención se relaciona con una pareja de cebadores seleccionada del grupo que consiste en las siguientes parejas de oligonucleótidos SEQ ID NO: 1 y SEQ ID NO: 2 para elloens CSF 1 PO, SEQ ID NO: 3 y SEQ ID NO: 4 para el loens 05S818, SEQ ID NO: 5 y SEQ ID NO: 6 para el loens 07S820, SEQ ID NO: 7 y SEQ ID NO: 8 para elloens 021SII, SEQ ID NO: 9 y SEQ ID NO: 10 para elloens 02S441 , SEQ ID NO: 11 y SEQ ID NO: 12 para el loeus O 1 S 1656, SEQ ID NO: 13 y SEQ ID NO: 14 para elloeus TPOX, SEQ ID NO: 15 y SEQ ID NO: 16 para el loeus VW A, SEQ ID NO: 17 y SEQ ID NO: 18 para el loeus 08S 1179, SEQ ID NO: 19 y SEQ ID NO: 20 para el loeus O 19S433, SEQ ID NO: 21 y SEQ ID NO: 22 para el loeus O 12S391, SEQ ID NO: 23 y SEQ ID NO: 24 para elloeu, THOI , SEQ ID NO: 25 y SEQ ID NO: 26 para elloeus 016S539, SEQ ID NO: 27 y SEQ ID NO: 28 para el loeu, 03S 1358, SEQ ID NO: 29 y SEQ ID NO: 30 para el loeu, O18S5 1, SEQ ID NO: 31 y SEQ ID NO: 32 para elloeu, 02S 1338,
SEQ ID NO: 33 y SEQ ID NO: 34 para ellocus D13S317, SEQ ID NO: 35 y SEQ ID NO: 36 para el locus Amelogenina, SEQ ID NO: 37 y SEQ ID NO: 38 para ellocus FGA, SEQ ID NO: 39 y SEQ ID NO: 40 para ellocus D22S 1 045, Y SEQ ID NO: 41 y SEQ ID NO: 42 para el locus DIOS 1248.
Uso de los cebadores de la invención Los diferentes usos que tienen los cebadores de la invención, constituyen aspectos adicionales de la presente invención.
Así, los usos del conjunto de parejas de cebadores de la invención incluyen, sin limitarse a, la obtención de perfiles genéticos, diagnósticos de parentesco, determinación del origen de una muestra o tejido, identificación de cadáveres, estudios de genética de poblaciones, pruebas de cigosidad en gemelos o mellizos, seguimiento de transplantes de médula ósea, evaluación de la trazabilidad de muestras biológicas de origen humano, identificación de mezclas presentes en una muestra, determinación del número de contribuyentes de origen humano a una mezcla y su aportación relativa a la mezcla, la realización de estudios poblacionales mediante la elaboración de bases de datos de frecuencias alélicas, y la estimación de las tasas de pérdida alélica o tasas de mutación .
En otro aspecto, la invención se relaciona con el uso del conjunto de parejas de cebadores de la invención para obtener el perfil genético de un individuo, para determinar relaciones de parentesco entre individuos o para identificar restos humanos.
Método de la invención Tal como se ha explicado anteriormente, la presente invención está basada en el diseño de parejas de cebadores que permiten obtener el perfil genético de un individuo basado en una combinación de 4 o más loci que forman parte de las principales bases de datos usadas en la identificación de individuos como son CODlS, NDNAD, ECL, ISSL, ESS y GCL.
Así, en un primer aspecto, la invención se relaciona con un método, de aquí en adelante "método de la invención", para obtener el perfil genético de un individuo que comprende el análisis, en un extracto de ADN procedente de dicho individuo mediante una reacción de amplificación multiplex, de al menos 4 loei del grupo fonnado por los loei CSFI PO, D5S818, D7S820, D2ISII, D2S44I, DIS1656, TPOX, VWA, D8S1179, D19S433, D12S391, THOI, D16S539, D3S1358, D18551, D2S1338, D13S317, Amelogenina, FGA, D22S 1 045 Y DIOS 1248, en donde a) Al menos uno de los 4 ¡oei se selecciona del grupo formado por los ¡oei STRs CSFl PO, D5S818, D7S820, TPOX y D 13S317, y
b) Al menos dos de los 4 ¡oei se selecciona del grupo formado por los STRs loci D2S441, DIS 1656, D12S391, D22SI045 y DIOSI248.
Tal como se ha indicado anteriormente, las parejas de cebadores de la presente invención dirigidas a amplificar los STRs de las principales bases de datos empleadas en la identificación de un individuo. han sido diseñadas de tal manera que es posible emplearlas en el análisis de 4 o más, hasta un total de 20 loci STRs de los STR incluidos en dichas bases de datos, más el locus Amelogenina de determinación del sexo (dando lugar a un total de 21 loei analizados) . Así, mediante el empleo de las parejas de cebadores de la invención, es posible obtener el perfil genético de un individuo formado por 5, 6, 7. 8, 9, 10 11 , 12, 13, 14, 15, 16, 17, 18, 19 020 loci de los loci STRs incluidos en las bases de datos antes mencionadas más ellocus amelogenina de detenninación del sexo.
Por lo tanto, en una realización particular del método de la invención, el conjunto de parejas de cebadores dirigido a obtener el perfil genético de un individuo está dirigido al análisis de al menos 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 Ó 21 loei del gmpo formado por los loci CSF 1 PO, D5S818, D7S820, 021 S 11, 02S44 1 , DI S 1656, TPOX, VWA, 08S 1179, D19S433, D12S391, THOI, D16S539, 03S1358, D18S51, D2S1338, D13S317, Amelogenina, FGA, D22SI045 y DIOSI248.
En otra realización todavía más particular, la pareja de cebadores empleada en la reacción de amplificación multiplex específica para cada uno de los loci analizados es la pareja de oligonucleótidos mostrada en las secuencias SEQ ID NO: 1 y SEQ ID NO: 2 para el loeus CSF 1 PO, SEQ ID NO: 3 y SEQ ID NO: 4 para el loeus D5S818, SEQ ID NO: 5 y SEQ ID NO: 6 para el loeus D7S820, SEQ ID NO: 7 y SEQ ID NO: 8 para elloeus D21 S 11, SEQ ID NO: 9 y SEQ ID NO: 10 para el loeus D2S44 1 , SEQ ID NO: 11 y SEQ ID NO: 12 para el loeus DI S 1656, SEQ ID NO: 13 y SEQ ID NO: 14 para elloeus TPOX, SEQ ID NO: 15 y SEQ ID NO: 16 para elloeus VWA, SEQ ID NO: 17 y SEQ ID NO: 18 para el loeus D8S 1179, SEQ ID NO: 19 y SEQ ID NO: 20 para elloeus D 19S433, SEQ ID NO: 21 y SEQ ID NO: 22 para el loeus D 12S391, SEQ ID NO: 23 y SEQ ID NO: 24 para elloeus THOI , SEQ ID NO: 25 y SEQ ID NO: 26 para el loeus D 16S539, SEQ ID NO: 27 y SEQ ID NO: 28 para el loeus D3S 1358, SEQ ID NO: 29 y SEQ ID NO: 30 para el loeus D 18S5 1, SEQ ID NO: 31 y SEQ ID NO: 32 para el loeus D2S 1338, SEQ ID NO: 33 y SEQ ID NO: 34 para el loeus D I3S317, SEQ ID NO: 35 y SEQ ID NO: 36 para el loeus Amelogenina, SEQ ID NO: 37 y SEQ ID NO: 38 para elloeus FGA, SEQ ID NO: 39 y SEQ ID NO: 40 para elloeus D22S 1 045, Y SEQ ID NO: 41 y SEQ ID NO: 42 para el loeus DIOS 1248.
La puesta en práctica de l método de la invención requiere la obtención de un extracto de ADN que procederá, en última instancia, de una muestra biológica que será tratada de forma adecuada para obtener dicho extracto de ADN.
Como entiende el experto en la materia, si el método de la invención está dirigido a obtener el perfil genético de un individuo o la relación de parentesco entre individuos, el extracto de ADN procederá del individuo cuyo perfil genético quiere obtenerse, o de los individuos cuya relación de parentesco quiere determinarse. Sin embargo, si el método de la invención está dirigido a la identificación de restos humanos, el extracto de ADN procederá de los restos humanos que se quieren identificar. En la presente invención, el término "restos humanos" incluye cualquier muestra biológica procedente de un ser
humano VIVO o muerto, pudiendo estar dicho resto humano conservado en formol, congelado, desecado, fijado en parafIna, en estado de descomposición, degradación y/o putrefacción, entre otros.
Ejemplos de muestras de las que se puede obtener ADN son, sin limitar a, fluidos biológicos (sangre, saliva, orina, esperma, etc) ; epidermis, células epiteliales, pelo, heces, W1a muestra vaginal, una muestra de tejido, tejidos quemados, etc. Las muestras más adecuadas para la obtención de extractos de ADN útiles en la identificación de un individuo o de restos humanos incluyen, entre otros, pelos con raíz, hueso compacto, diente, tejidos blandos y sangre.
En una realización particular, el extracto de ADN procede de una muestra de sangre, pelo, saliva, epidennis, esperma, células epiteliales, una muestra vaginal y una muestra de tejido,
La obtención de la muestra biológica debe realizarse en las condiciones y con el material adecuado, tales como torundas, pinzas, etc. y cada muestra debe almacenarse independientemente en frascos o bolsas plásticas separadas y estériles, sin ningún tipo de conservante, en congelación y debidamente rotulados, evitando la contaminación por matcrial biológico foráneo.
Una vez que se ha obtenido la muestra del individuo/s o del resto humano, ésta debe ser procesada para obtener el extracto de ADN. La fracción de ADN adecuada para la puesta en práctica de la invención es el ADN nuclear. La extracción del ADN puede ser llevado a cabo usando cualquier método conocido por los expertos en la materia (Sambrock el aJ., 2001. "Molecular c1ºning: a Laborator y Manual", 3rd ed., Cold Spring Harbor Laborator y Press, N.Y., Vol. 1-3) que incluyen sin limitación, centrifugaciones en gradientes de densidad, extracción en dos tases usando fenol acuoso o cloroformo con etanol, cromatogratia en columna, métodos basados en la capacidad del ADN para unirse en superficies de cristal y/o silicatos, como preparaciones de tierra de diatomeas o lechos de cristal, empleando kits comerciales, por ejemplo, los kits HQ-Biogene fast ONA kit" o el "QIAamp (R) DNA Blood Mini Kit" (Qiagen, Hilden, Alemania) el "G-Spin IIp'' (Intron Biotechnology, Corea) o el "Fast Prep System Bio 101" (Qbiogene, Madrid. España) o los métodos descritos en las solicitudes de patente US5.057.426, US4.923.978 y la solicitud de patente europea EP0512767 A l.
El extracto de AON es cuantificado y normalizado para obtener cantidades iguales de ADN en cada muestra en el caso de que la cantidad de ADN sea suficiente para ello. En el caso de muestras altamente degradadas con ADN escaso y/o degradado es habitual añadir la mayor cantidad de ADN posible en la subsiguiente reacción de PCR multiplexo Tras obtener el extracto de AON de la muestra biológica, éste es sometido a una reacción de amplificación multiplex empleando el conjunto de parejas de cebadores de la invención. La amplificación de los diferentes loei STRs requiere condiciones y procedimientos de reacción específicos para cada una de las parejas de cebadores empleadas, las cuales pueden conseguirse mediante variación sistemática de cada parámetro. El número de ciclos y la temperatura de alineamiento empleada en la reacción de PCR deben de ser
adecuados para la obtención de resultados mediante cada una de las parejas de cebadores de la invención. Parámetros como la concentración de cebadores son específicos para cada cebador y se han ajustado en la validación del conjunto de cebadores. Los cebadores ofrecen resultados en un amplio rango de concentraciones, aunque las concentraciones óptimas para cada pareja de cebadores se recogen en la Tabla 3.
Tabla 3. Resumen de las concentraciones a las que se emplea cada uno de los cebadores y el fluorocromo con el que se ha marcado el extremo 5 'del cebador directo o Jorward (en negrita) de cada pareja de cebadores en el conjunto denominado 1DNAE2 1.
LOCUS SEQ ID NO Intervalo Concentración de cebadores (~MI Concentración de cebadores (~MI Marcaje fluorescente
1 0, 03 -0, 45 0, 10 6-FAM
CSF1PO 2
3 0, 06 -0, 3 0, 11
D5S818 4
5 0, 07-0, 3 0, 14
D7S820 6
02 ISI1 7 0, 07-0, 24 0, 14
Como entiende el experto en la materia, una reacción de amplificación multiplex requiere una serie de reactivos, entre los que Se incluyen, sin limitar a, el ADN molde, la enzima ADN polimerasa, al menos, dos parejas de cebadores (siendo cada cehador de cada pareja complementario a una de las dos hebras del AON) , desoxinucleótidos tri fosfatos (dNTPs) , cloruro de magnesio (MgC12) , tampón de reacción y aditivos opcionales, que pueden añadirse por separado mezclándose en el laboratorio o adquirir previamente mezclados, como es el caso de Qiagen Multiplex PCR Kit (Qiagen, Valencia, CA) o Kapa2GTMFast Multiplex PCR kit (Kapa Biosystems, Ine., USA) , al que se le añaden las parejas de cebadores en las concentraciones adecuadas y el ADN mo1de.
La PCR se lleva a cabo en un termociclador que realiza los ciclos en los tiempos y temperaturas programadas de forma exacta, tales como la temperatura de hibridación o la temperatura de fusión.
En una realización particular del método de la invención, la temperatura de fusión de la reacción de amplificación multiplex que comprende los oligonucleótidos SEQ ID NO: I a SEQ ID NO: 42 (Tabla 1) es desde 57 a 63"C según lo calculado mediante el programa informático Perlprimer (http://perlprimeLsourceforge.neú) .
La amplificación multiplex del conjunto de parejas de cebadores (Tabla 2) ofrece resultados satisfactorios en un amplio rango de temperaturas de fusión, entre 57-63°C, aunque los mejores resultados se obtienen a 60, 5°C. De igual manera, los cebadores ofrecen resultados en un amplio rango de concentraciones, aunque las concentraciones óptimas para cada pareja de cebadores se recogen en la Tabla 2. Respecto al número de ciclos empleado en la reacción de PCR se obtienen resultados satisfactorios entre 28-32 cic los, aunque el número de ciclos óptimo es de 30 ciclos.
Previamente a la reacción de amplificación multiplex, puede llevarse a cabo el marcaje de los cebadores que participan en dicha reacción de amplificación multiplex con el fin de poder detectar posteriormente los fragmentos amplificados. El marcaje de los productos de amplificación puede realizarse por métodos convencionales. Dicho marcaje puede ser directo, para lo cual pueden utilizarse fluoróforos, por ejemplo, Cy3, Cy5, fluoresceína, alexa, etc., enzimas, por ejemplo, fosfatasa alcalina, peroxidasa, etc., isótopos radiactivos, por ejemplo, 33P, 1251, etc., o cualquier otro marcador conocido por el experto en la materia. Alternativamente, dicho marcaje puede ser indirecto mediante el empleo de métodos químicos, enzimáticos, etc.; a modo ilustrativo, el producto de amplificación puede incorporar un miembro de un par de unión específica, por ejemplo, avidina o estreptavidina conjugada con un fluorocromo (locus) , y la sonda se une al otro miembro del par de unión específica, por ejemplo. hiolina (indicador) , efectuándose la lectura mediante fluorimetría, etc., o bien, el producto de amplificación puede incorporar un miembro de un par de unión específica, por ejemplo, un anticuerpo anti-digoxigenina conjugado con una enzima (locus) , y la sonda se une al otfO miembro del par de unión específica, por ejemplo, digoxigenina (indicador) , etc., transfomlándose el sustrato de la enzima en un producto luminiscente o fluorescente, efectuándose la lectura mediante quimio-luminiscencia, fluorimetría, etc.
Así, en una realización particular, el marcaje del producto de amplificación se lleva a cabo mediante el marcaje, en uno de sus extremos, de uno de los oligonucleótidos de cada pareja de cebadores que, en otra realización todavía más particular, el marcaje de los oligonucleótidos se selecciona del grupo que consiste en un radio isótopo, un material fluorescente, digoxigenina y biotina. Ejemplos de materiales fluorescentes que se pueden emplear en el marcaje de oligonucleótidos incluyen, sin limitar a, 5-carboxifluoresceína (5FAM) , 6-FAM, análogo tetraclorinado de t-F AM (TET) , análogo hexaclorinado de 6-FAM (HEX) , 6-carboxitetrametilrodamina (TAMRA) , 6-carboxi-X-rodamina (ROX) , 6-carboxi4', 5'-dicloro-2" 7'-dimetoxifluoresceína (JOE) , NEO, Cy-3, Cy-5, Cy-5.5, fluorescein-6isotiocinato (FITC) y tetrameti Irodamina-5-isotiocinato (TRITC) .
Tras finali zar la reacción de amplificación multiplex, si se desea, se puede proceder a separar los productos de amplificación o amplicones. Prácticamente cualquier método convencional puede ser utilizado dentro del marco de la invención para separar los productos de amplificación. Las técnicas para separar los productos de amplificación están ampliamente descritas en el estado de la técnica, como por ejemplo, en Sambrook el al. , 2001 (citado ad supra) . Técnicas para separar los productos de amplificación son, por ejemplo, electroforesis sumergida con geles de Methafor, electroforesis en geles de poliacrilamida, electroforesis capilar, etc.
Seguidamente a la separación de los productos de amplificación, se procede a identifi car el tamaño de los fragmentos separados, para lo cual puede emplearse cualquiera de los procedimientos de identificación de fragmentos de amplificación conocidos del estado de la técnica, tales como hibridación con sondas marcadas (por ejemplo con un fluoróforo) que serán detectadas por un detector y procesadas mediante un sistema infonnático, tinción, por ejemplo, con bromuro de elidio, tinción de plata, etc. Tal como entiende el experto en la materia, si todo este proceso es integrado en un sistema informático, se puede generar una gráfica denominada electroferograma donde puede identificarse el tamaño de los fragmentos amplificados.
En otro aspecto, la invención se relaciona con el uso del método de la invención para identificar un individuo, determinar relaciones de parentesco entre individuos o para identificar restos humanos.
Kit de la invención Por otro lado, la invención se relaciona con un kit útil para la puesta en práctica del método de la invención, que comprende el conjunto de parejas de cebadores de la invención que comprende 4 O más parejas de cebadores dirigidas a amplificar los loci contenidos en las principales bases de datos empleadas en la identificación de individuos.
Así, en otro aspecto, la invención se relaciona con un kit, de aquí en adelante kit de la invención, que comprende parejas de cebadores específicas para amplificar al menos 4 loei seleccionados del grupo formado por los loci CSF I PO, D5S818, D7S820, D21 S 11, D2S441 , DIS1656, TPOX, VWA, D8S1179, D19S433, D12S391 , THOI , D16S539, D3S 1358, D18S51, D2S 1338, D13S317, Amelogenina, FGA, D22S 1045 y DIOS 1248, en donde a) Al menos uno de los 4 loci se selecciona del grupo formado por los loci STRs CSF1 PO, D5S818, D7S820, TPOX y D 13S317; y
b) Al menos dos de los 4 loci se selecciona del grupo formado por los loci STRs D2S441, DIS1656, D12S391, D22SI045 y DIOSI248.
En una realización particular, el kit de la invención comprende al menos 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20 ó 21 parejas de cebadores específicas para los loci del grupo formado por los loci CSF IPO, D5S818, D7S820, D21 S 11 , 02S44 I , DI S 1656, TPOX, VWA, D8S1179, D19S433, D12S391 , THOI , D16S539, 03S1358, D18S51 , D2S 1338, D13S317, Amelogenina, FGA, 022S 1045 y D10S 1248.
En otra realización todavía más particular del kit de la invención, la pareja de cebadores empleada en la reacción de amplificación multiplex específica para cada uno de los loci analizados es la pareja de oligonucleótidos mostrada en las secuencias SEQ ID NO: I y SEQ ID NO: 2 para elloeus CSFIPO, SEQ ID NO: 3 y SEQ ID NO: 4 para elloeus D5S8 18, SEQ ID NO: 5 y SEQ ID NO: 6 para el locus D7S820, SEQ [D NO: 7 y SEQ ID NO: 8 para el loeus D21S 11, SEQ 10 NO: 9 y SEQ 10 NO: 1°para ellocus D2S441, SEQ ID NO: 1I y SEQ ID NO: 12 para ellocus DIS 1656, SEQ ID NO: 13 y SEQ ID NO: 14 para ellocus TPOX, SEQ ID NO: 15 y SEQ ID NO: 16 para ellocus VWA, SEQ ID NO: 17 y SEQ 10 NO: 18 para el locus D8S 1179, SEQ ID NO: 19 y SEQ ID NO: 20 para ellocus D1 9S433, SEQ 10 NO: 21 y SEQ 10 NO: 22 para ellocus D1 2S39 1, SEQ JO NO: 23 y SEQ ID NO: 24 para ellocus THül, SEQ ID NO: 25 y SEQ ID NO: 26 para ellocus 016S539, SEQ 10 NO: 27 y SEQ ID NO: 28 para el locus D3S 1358, SEQ ID NO: 29 y SEQ ID NO: 30 para el locus D 18S51 , SEQ 10 NO: 31 y SEQ ID NO: 32 para ellocus D2S 1338, SEQ ID NO: 33 y SEQ ID NO: 34 para ellocus D13S317, SEQ ID NO: 35 y SEQ ID NO: 36 para el locus Amelogen;na, SEQ ID NO: 37 y SEQ ID NO: 38 para el locus FGA, SEQ ID NO: 39 y SEQ ID NO: 40 para el locus 022S1045, y SEQ ID NO: 41 y SEQ rD NO: 42 para el locos DIOSI248.
Como entiende el experto en la materia, el kit de la invención además de comprender el conjunto de parejas de cebadores de la invención, puede incluir, opcionalmente, los reactivos necesarios para llevar a cabo la reacción de ampl1ticación multiplex, entre los que se incluyen, sin limitar a, desoxinucleótidos tritosfato (dNTPs) , iones divalentes y/o monovalentes, una solución lampón (b/!ffer) que mantiene el pH adecuado para el funcionamiento de la ADN polimerasa, ADN polimcrasa o mezcla de distintas polimerasas, etc. No obstante, si el kit de la invención no comprende los reactivos necesarios para poner en práctica el método de la invención, éstos están disponibles comercialmente y pueden encontrarse ronnando parte de un kit. Cualquier kit de los disponibles comercialmente que contenga los reactivos necesarios para llevar a cabo una reacción de amplificación, puede emplearse con éxito en la puesta en práctica del método de la invención. Tal como se muestra en los ejemplos, en el cru;o de la presente invención estos reactivos se encuentran previamente mezclados en el reactivo Qiagen Multiplex PCR Kit (Qiagen, Valencia, CA, USA) .
Tal como se ha descrito en párrafos anteriores, previamente a la reacción de amplificación multiplex del método de la invención, si se desea puede llevarse a cabo el marcaje de los cebadores con el fin de poder detectar posterionnente los fragmentos amplificados. De fanna análoga, como entiende el experto en la materia, el kit de la invención puede comprender el primer conjunto de parejas de cebadores de la invención en donde uno de los oligonucléotidos de cada pareja de cebadores está marcado en uno de sus extremos o, alternativamente, puede comprender los reactivos necesarios para llevar a cabo el marcaje de los cebadores. Los distintos metodos que existen en el estado de la técnica para realizar el marcaje de los cebadores, así como los tipos de marcadores que se puede emplear han sido explicados previamente en la presente memoria.
A!>í, en una realización particular, el kit de la invención comprende, además, los reactivos necesarios para marcar las parejas de nucleótidos o, en otra realización particular, uno de los oligonucléotidos de cada pareja de cebadores está marcado en uno de sus extremos.
En una realización todavía más particular del kit de la invención, los marcadores empleados en el marcaje de los oligonuclcótidos seleccionan del grupo que consiste en un radio isótopo, un material fluorescente, digoxigenina y biotina. En otra realización aún más particular, el material fluorescente se selecciona del grupo que consiste en 5carboxifluoresceína (5-FAM) , 6-FAM, análogo tetrac1ºrinado de t-FAM (TET) , análogo hexaclorinado de 6-FAM (HEX) , 6-carboxitctrametilrodamina (TAMRA) , 6-carboxi-Xrodamina (ROX) , 6-carboxi·4', 5'-dicloro-2', 7'-dimetoxifluoresceina (JOE) , NED (AB!) , Cy-3. Cy-S. Cy-5.5, nuorescein-6-isotiocinato (FITC) y tetrametilrodamina-5-isotiocinato (TRITC) .
5 Tal como se ha mencionado previamente, el kit de la invención es útil en la puesta en práctica del método de invención. Por lo tanto, en otro aspecto, la invención se relaciona con el uso del kit de la invención para obtener el perfil genético de un individuo, para detenninar relaciones de parentesco entre individuos o para identificar restos humanos. Los siguientes ejemplos son ilustrativos de la invención y no pretenden ser limitativos de la misma.
10 EJEMPLOS En los ejemplos siguientes se realiza la validación de I-ONAE2 1, para su uso en identificación humana y casos de parentesco y se demuestra a su vez SlIS ventajas frente a las técnicas actuales.
15 Ejemplo 1. En el primer ejemplo se detalla la optimización de los conjuntos de cebadores y de los parámetros de las reacciones de PCR, estudios de concordancia con otras STRs multiplex,
20 Ejemplo 2. En el segundo ejemplo, se realiza un caso práctico de de identificación, con el objetivo de demostrar que la invención es adecuada para su uso en identificación humana.
25 Ejemplo 3. En el tercer ejemplo, se realiza un caso práctico de parentesco en ausencia de un progenitor, con el fin de demostrar la alta capacidad discriminativa de la invención y determinar la probabilidad de parentesco en casos de parentesco humano complejos.
JO EJEMPLO 1 Validación del método de la invención Que comprende una reacción de amplificación multiplex empleando los conjuntos de parejas de cebadores I-DNAE21 para Sil uso en identificación humana
A continuación se describe la validación de I-DNAE21 para su uso en identificación humana. Dicha validación ha consistido en ensayos de optimización de los conjuntos de
cebadores, optimización de tos parámetros de la PCR y estudios de concordancia con otras STRs multiplexo Los resultados obtenidos mostraron que I~DNAE21 es una herramienta adecuada para la obtención de pertiles genéticos humanos.
MATERIALES Y MÉTODOS
.~lues{ras control de ADN humano Se utilizaron los AON controles 9947A del kit AmpFISTR® YFiler (Applied Biosystems, Fostor City, CA) , Control ONA 007 (Applicd Biosystems, Foster City, CA) . 1<562 (Promega® Corpcration, USA) y Control ONA 2800M (Promega Corpcration, USA) para poner a punto las condiciones de PCR y realizar ensayos de sensibilidad. Estas tres muestras se cuantificaron mediante Quantifiler® Human DNA Quantitication Kit (Applied Biosystems. Foster City, CA) en un ABI PRISM® 7000 Sequence Detection System (Applied Biosystems, Foster City, CA) . de acuerdo con las especificaciones del fabricante y fueron diluidas a 1 ngl~1.
Muestras de la población Se tomaron muestras de sangre periférica de 600 individuos sanos: 318 caucasoides europeos (País Vasco, España) y 282 individuos de Colombia (133 negroides y 149 hispanos) .
Extracción de ADN.v cllalltijicación Los extractos de ADN de los individuos de origen caucasoide se obtuvieron mediante lisis proteolítica con proteinasa K y extracción orgánica. Los extractos de ADN procedentes de las muestras biológicas de los individuos de origen negroide e hispano se obtuvieron mediante extracción por QiAamp DNA Micro Kit (Qiagen, CA) . Todos los extractos de ADN se cuantificaron con PicoGreen'A' (Invitrogen) .
Optimización del conjunto de cebadores Se utilizó el programa Perlprimer (http://perlprimer.sourcetorge.net!) para diseñar nuevos cebadores que amplifican 20 loci STRs (D3S 1358, 055818, 0 75820, 0 8511 79, 0135317, 016S539, 018S51, 019S433, D2ISII, C5F IPO, FOA, THOI, TPOX, vWA, 02S1338,
D2S441, DIS1656, D12S39l, D22Sl045 y D10S1248) más amelogenina, en base a las secuencias de referencia cuyos números de acceso a Genbank se recogen en la Tabla 4.
Las regiones tlanqueantes a los loci analizados se estudiaron mediante SNPblast
5 (www.ncbLnlm. nih.gov/SNP/snpb lastByChr.htrnl) con el fin de evitar posiciones variables
en la región de unión de todos los cebadores diseñados. Los amplificados se ex.tienden
desde 49 hasta 389 pb, para abarcar un amplio número de los alelos contenidos en
STRBase website [Ruitberg. C.M., DJ. Reeder, y 1.M. Sutler, 200l. Nuc1eic Acids Res,
29 ( 1) : 320-2]
10
La intensidad de los amplicones y la ausencia de ¡nespecíficos de cada locus se evaluó
mediante el análisis de los productos de PCR por DHPLC con un DNAsep Cartridge
(Transgenomic® WAVE1Y System 4500, Glasgow, UK) . 10 J.ll de amplificado fueron
migrados a 40°C en un gradiente lineal desde 38, 6 a 61, 1 % de rampón B (25 % de
15 acetonitriJo y TEAA 0, 1 M) durante 10 minutos.
Para evitar la adenilación incompleta se utilizó la adición de una guanina al extremo 5' del
cebador inverso . (Brownstein, M.J., lO. Car-pten, and J.R. Smith, 1996. Biotechniques,
20 (6) : 1004-6, 1008-10; Hill CR, B.I., Valone PM, 2009. J Forenúc Sei, 54 (5) : 7; Butler,
20 J.M., Y. Shen, and 8.R. McCord, 2003. J Forensic Sci, 48 (5) : 1054-64) .
Amplificación de PCR. elecrrofol'esis y análisis de datos
Se emplearon 12.5111 de Multiplex PCR Kit Plus de Qiagen:!l (Qiagen, Valencia, CA) ~ 5 J.ll
25 de la mezcla de cebadores, 6, 5 ~l de H, O mQ esteril y 1 f'l de ADN molde (lng ! ~l) . Las
concentraciones de cada pareja de cebadores se detallan en la Tabla 3. Se analizó el
rendimiento de la amplificación en diferentes tennocicladores: Biorad ™ ICycler, CI OOOTM
y Mycycler"t (BioRad, Hercules, CA) y GeneAmp" 9700 PCR System (Applied
Biosysrems, Foster City, CA) , así como en diferentes condiciones de temperaturas de
JO hibridación ("anncaling temperature·') : 57 'C, 58, 9 "C, 60, 5 'C, 6 1, 8 ' C y 63 'C, a distintos
mimeros de ciclos: 28, 29, 30, 31 Y 32 ciclos y a tiempos de extensión final de 30, 45, 60 Y
90 minutos. Se analizaron 2 1-11 de cada producto de amplificado mezclados con 9 ) ll de Hi·
Di™ formamide (Applied Biosystems g;, Foster City, CA) y 0, 5 ~ll de GeneScanH1 500
LIZ® Size Standard (Applied Biosystems*. Foster City, CA) . Tras la desnaturalización de los amplificados (6 minutos a 95 oC) se enfriaron (4 minutos a 4 oC) y se separaron en un ABI PRlSM 3130 Genetic Analyzer (Applied Biosystems"', Foster City, CA) . Los resultados de la electroforesis fueron analizados mediante el software Genmapper versión 4.0 (Applied Biosystems", Foster Cily, CA) .
Estudios de concordancia con otras STRs Inultiplex
Se compararon pertiles genéticos analizados con I-DNAE21, Identifiler~ y NG~ (Applied Biosystems, Foster City, CA) . Para su análisis mediante I-DNAE21 se empleó I
ng de ADN molde de cada individuo. El análisis mediante Identitilerli' y NGM® (Applied Biosystems, Foster City, CA) se realizó scb>ún las condiciones óptimas sugeridas por el fabricantc. RESULTADOS
Optimización de los conjuntos de cebadores La Tabla 4 recoge un amplio rango de alelos para cada locus incluido en 1·DNAE21. Se han considerado los alelos descritos en los principales grupos poblacionales según la infonnación recogida en STRbase [Ruitberg, C.M., D.1. Reeder, y J.M. Butler, 2001. Nuc/óc Adds Res, 29 (1) : 320-2J.
Tabla 4
Tl<01 000269 5-14 57 -93 0, 08 VIC™
0165539 AC024591 5-1. 105 -149 0.10
03$1358 NT_OO5997 9-2. 161-205 0, 1'
01 8$51 APOO1534 7·27 213 -293 0.34
0251338 AC010136 15-26 313-365 0, 07
0135317 Al351628 5-17 72-120 0.10 PE'"
Amelogenlna Sullivan el al.~ X. y 121 , 127 0, 14
FGA M64982 16-51, 2 151 293 0.30
D22S104~ AL022314 8-" 294-327 0, 19
01051248 AL391869 8-111 339-) 79 0, 22
•Sulhvan 1 (;.\1, el. al. 1993. B/Otechmqlles, 15 (4) .636-8, 640-1 .
Se diseñaron 132 cebadores de entre los que se eligieron aquellos capaces de producir amplificados del menor tamaño posible, que en ningún caso excedieran de 400 pb, cuyas 5 temperaturas de fusión ("melting temperature") estuvieran comprendidas entre 57, 8°C y 62, 4"C y que hibridaran en regiones carentes de SNPs (Single Nucleotide Polymorphism) e INOELS (Inserciones/deleciones) descrito hasta la fecha en NCBI (http://W\....w.ncbinlm.nih.gov/snp/) . En la primera tase de optimización se efectuaron amplificaciones PCR singleplcx de cada locus. Los productos PCR fueron analizados 10 mediante DHPLC para evaluar la especiticidad de los cebadores y la intensidad de amplificación. En la segunda fase de optimización. se ensayaron diversos conjuntos de cebadores en multiplex.. Se espaciaron los rangos de alelos de los loci adyacentes en tamaño con el fin de evitar solapamientos entre alelos correspondientes a loci diferentes para asegurar así un correcto genotipado. El análisis mediante DHPLC pennitió evaluar la ausencia de inespecíficos y la eficacia de la amplificación para cada uno de los loci ensayados en formato multiplex..
Finalmente, se seleccionó una reacción de PCR sextaplex (sextaplex A: CSFIPO, D5S818, 07S820, 021SI I, 02S441 y 0151656) Y 3 reacciones de PCR quintuplex (quintuplex B:
TH01, 016S539, 03S1358, 01 8S5 1 y 02S1338; quintuplex C: TPOX, vWA, 08S1179, 0 195433 y 0125391 Y quintuplex O: 0!35317, amelogenina, FGA, D22S I045 y 0 1051248) .
Los cebadores directos de la reacción sextaplex A se marcaron con el marcador 25 fluorescente 6_FAM™, y los cebadores directos de las reacciones quintuplex B, e y D, fueron marcados con VIC™, NEO™ y PET® respectivamente (Applied Biosystems, Foster City, CA) (Tabla 4) . Por último, se agruparon los distintos conjuntos de cebadores en una única reacción de PCR multiplex que permite la amplificación de 20 ¡oei STRs y amelogenina. En la Figura 2 se representa el resultado final de la estrategia en el diseño de cebadores para I-ONAE2 1.
En conclusión, para posibilitar la obtención del perfil genético completo se diseñaron los cebadores de tal modo que pudiesen ser analizados en una única reacción multiplex un total de 21 loci: 20 loci STR (CSFIPO, 010S1248, 0 1S1656, 012S391, 0 13S3 17, 016S539, 018551, 019S433, 021SII, 022S1045, 02S1338, 02S441, 03S1358, 05S818, 07S820, 08S1179, FGA, THOI, TPOX y vWA) más el locus amelogenina.
Oplimizaciól1 de los parámelros de PCR
La optimización de los parámetros de amplificación tales como la concentración óptima de cebadores, temperatura de hibridación, número de ciclos y tiempo de extensión, se realizó mediante el estudio de los electroferogramas en los que se evaluó la altura de los picos, el balance en heterocigosis de los mismos y la adenilación incompleta.
En primer lugar, la concentración de cada pareja de cebadores fue testada entre 0, 0375 ) lM Y 1, 5 ) lM, de tal forma que en cada caso, por debajo de la concentración óptima se observó un aumento en la altura de los picos a medida que se aumentaba la concentración de cebadores. Mientras que a su vez, en concentraciones superiores a la considerada óptima se detectó un aumento tanto del desbalance en heterocigosis y de la adenilación incompleta, como de la intensidad de los artefactos en I-DNAE21 (FAM71, FAM92, FAMI65, VIC85, VIC92, VICl08, NEO 107, NEOI28, NED171, PETI03 Y PETI54) .
En este sentido, las intensidades de los loci analizados mediante I-DNAE2 l se equilibró alrededor de 1000 RFUs en el análisis de I ng de ADN, para alcanzar un equilibrio entre la intensidad de la señal y la ausencia de solapamiento entre las señales correspondientes a diferentes fluorocromos. (Figura 1)
A continuación se procedió a la optimización de la temperatura de hibridación de la reacción PCR multiplex. El aumento de temperatura de hibridación produjo una disminución gradual tanto de la adenilación incompleta, como de la altura de los picos. Los mejores resultados se obtuvieron a la temperatura de hibridación de 60, 5 oc.
Por otfO lado, el aumento en el número de ciclos incrementó de forma generalizada la altura de los picos y la adenilación incompleta. En este sentido, los resultados más equilibrados correspondieron a 30 ciclos. Así mismo la adición de una guanina al extremo 5' del primer reverse eliminó el efecto de la adenilación incompleta, incluso mejor que la adición de pig-taifing. La adición de dicha guanina se representa como una G en la Tabla 2.
Cabe destacar también que, el empleo de los tennocicladores Biorad™ ICycler, C IOOO™ y Mycycler™ (BioRad, Hercules, CA) y GeneAmp® 9700 PCR System (Applied Biosystems, Foster City, CA) no reveló variaciones significativas en cuanto a la calidad de los resultados obtenidos.
Tras la evaluación de todos los parámetros anteriormente mencionados, se llegó a determinar la concentración óptima de cebadores, de tal forma que se obtuvieron las siguientes intensidades medias para cada color en el análisis de 1 ng de ADN de (-ONA 1 [6_FAM™ (702 ± 11 8 RFUs) , VIC™ (725 ± 194 RFUs) , NED™ (895 ± 140 RFUs) y PET® (842 ± 95 RFUs) ].
De esta manera, I-DNAE21 ha demostrado ser una reacción multiplex balanceada y específica, capaz de amplificar 20 ¡oei STRs, además del locus amelogenina, a partir de 1 ng de ADN molde (Figura 1) , mediante la siguientes condiciones de amplificación: un ciclo de desnaturalización inicial durante 5 minutos a 95 oC, 30 ciclos de 30 s a 95 oC, 90 s a 60, 5 oC y 30 s a 72 oC, seguidos de l ciclo de extensión final de 30 minutos a 60 oc.
Estudios de concordancia COII otras SfRs multiplex Los estudios de concordancia se llevaron a cabo mediante la comparación de 2430 al/e/e cafls obtenidos por I·DNAE21 e Identifiler® (Applied Biosystems, Foster City, CA) y la comparación de 665 al/e/e calls obtenidos mediante I·DNAE21 y NGM""' (Applied Biosystems, Foster City, CA) . Se eligieron Identifiler® y NGM" (Applied Biosystems, Foster City, CA) por ser estos sistemas ampliamente utilizados [Hi ll, C.R., el al., 2007. J
5 10 Forensic Sci, 52 (4) : 870-3] y validados [Collins, P.J., el al., 2004. J Forensic Sci, 49 (6) : 1265~77]. Entre los resultados obtenidos ¡ror I-DNAE21 e Identifiler® se encontró una única discordancia lo que supone una concordancia del 99, 9% entre estos sistemas. Dicha discordancia correspondió a un individuo genotipado como homocigoto (15/ 15) pam D3S1358 mediante Identifiler® y como heterocigoto (12/15) mediante i-DNAE21. La muestra fue analizada por triplicado por ambos sistemas con idénticos resultados. En la comparación de I-DNAE21 y NGM' (Applied Biosystems, Foster City, CA) no se encontraron discordancias, lo que supone una concordancia del 100% entre ambos sistemas.
DISCUSIÓN
15 A continuación se discuten los resultados relativos a la validación de I-ONAE21 en los ensayos de optimización del conjunto de cebadores, optimización de parámetros de peR, y eShldios de concordancia.
20 25 [·DNAE21 ha demostrado ser una reacción multiplex balanceada y específica, capaz de amplificar 20 loci STRs además dcllocus amelogenina. De este modo I-DNAE21 es la única reacción capaz de analizar de manera simultánea la totalidad de los loei STRs del CODlS, ECL, N DNAD Y ESS, incluyendo ademas los 5 STRs recomendados por la EDNAP (European DNA Projiling Group) and ENFSI (EI/ropean Network ol Forensic Science Institutes) . Además, al ser la única reacción que pennite el análisis de 20 laci STRs aporta una probabilidad de discriminación superior a todas las reacciones multiplex existentes hasta la fecha.
JO La fiabilidad de I-DNAE21 ha sido comprobada mediante estudios de concordancia entre los perfiles genéticos determinados por este sistema y los obtenidos mediante sistemas preexistentes ampliamente utilizados como son Identifiler@ y NGM® (Applied Bíosystems. Foster City, CA) . En este sentido en primer lugar se constató una concordancia del 99, 9 % entre I-DNAE21 e Identifiler® (Applied Biosystems, Foster City, CA) , donde la única excepción se detectó en un individuo, genotipado como homocigoto
por Identifiler® (Applied Biosystems, Foster City, CA) y como heterocigoto por 1ONAE2 1. Así mismo, se constató la concordancia del 100 % de I-DNAE21 respecto a NGM® (Applied Biosystems, Foster City, CA)
La discordancia hallada es similar a las habitualmente encontradas tras el análisis de idénticos STRs con sistemas que emplean diferentes parejas de cebadores (Hill, C.R. el al., 2007. J Forensic Sci, 2007. 52 (4) : 870-3) . Discordancias similares reportadas en otros estudios se debieron a la presencia de mutaciones que probablemente coincidían con la reg ión de unión del extremo 3' de uno de los cebadores mientras que las variaciones en el tamaño de alelos probablemente se debieron a la presencia de inserciones y/o deleciones en la región flanqueante a la repetición STR [Budowle, 8., et al., 2008. lnt J Legal Med, 122 (5) : 421-7; Zhai, X.D., el aL, 2009., lnt J Legal Med, 124 (5) :457-8]. Dichas mutaciones impiden la amplificación de uno de los alelos y en consecuencia originan pérdidas alélicas. En este sentido, los perfiles genéticos obtenidos mediante I-ONAE2l mostraron una alta fiabilidad.
En conclusión, la presente validación ha puesto de manifiesto que I-DNAE21 constituye un sistema de elevada robustez y fiabilidad en la obtención de perfiles genéticos, lo que lo convierte en una herramienta útil para su utilización en identificación humana. Así mismo, el reducido tamaño de sus amplificados menores en su totalidad a 389 pb, sugiere que la presente invención posee una elevada capacidad de análisis de loei incluidos en las principales bases de datos nacionales como son COOlS, NONAD, ECL y ESS incluso en muestras cuyo ADN pueda estar degradado EJEMPLO 2 Aplicación del conjunto de cebadores de I-DNAE21 en un caso práctico de identificación humana
A continuación se describe la validación de I-DNAE21 para su uso en identificación humana. Dicha validación ha consistido en el análisis de una muestra mediante el conjunto de cebadores de l-DNAE21 con la finalidad de obtener su perfil de identificación genético.
MATERIALES Y MÉTODOS
5 Muestras control de ADN humano Se utilizó el AON contro19947A del kit AmpFISTR, jt! YFiler (Applied Biosystems, Foster City. CA) como control positivo de amplificación.
10 Como control negati vo de amplificación se utilizó H20 mQ estéril (Millipore Corporation, Billerica, . MA, EE.UU) . Mues/ras de análisis Se tomaron muestras de saliva mediante el frolis de la mucosa bucal con un hisopo estéril a un individuo sano de origen caucasoide.
l5 20 25 Extracción de ADNy cllantijicación La extracción de ADN de los hisopos de saliva se realizó mediante el sistema de extracción QiAamp DNA Micro Kit (Qiagcn lne., Valencia, CA, USA) . Todos los extractos de AON se cuantificaron con Quant-iyrM PicoGreen® dsDNA Assay Kit (Tnvitrogen, Carlsbad, CA, USA) . Amplificación de PCR, electroforesis y análisis de datos La amplificación se realizó en un tennociclador GeneAmp® 9700 PCR System (Applied Biosystcms, Foster City, CA) . Para ello se emplearon 1 2.5~1 de Multiplex PCR Kit Plus de Qiagen® (Qiagen, Valencia, CA) , 5 ~T de la mezcla de cebadores de I-DNAE21 , 6.5 ~l de H20 mQ estéril y 1 ~J de ADN molde (1 ng I ~ll) mediante la siguientes condiciones de amplificación: un ciclo de desnaturalización inicial durante 5 minutos a 95 oC, 30 ciclos de 30 s a 95 oC , 90 s a 60, 5 !lC y 30 s a 72 oC, seguidos de 1 ciclo de extensión final de 30 minutos a 60 !lC.
30 Se analizaron 2 ¡.tI de cada producto de ampliticado mezclados con 9 J.d de Hi-Di'fM Formamide (Applied Biosystems®, Foster City, CA) y 0.5 ~l de GeneSeanT" 500 UZ'!l> Size Standard (Applied Biosystems®, Foster City, CA) . Tras la desnaturalización de los ampliticados (6 minutos a 95 ....e) se enfriaron (4 minutos a 4 !le) y se separaron en un ABI
PRISM 3130 Genetic Analyzer (Applied Biosystems®, Fostcr City. CA) . Los resultados de la electroforesis fueron analizados mediante el software Genmapper versión 4.0 (Applied Biosystems®, Fostcr City, CA) .
Cálculos de probabilidad
Se realizó el cálculo de la probabilidad de coincidencia por azar, según la base de datos del Instituto Nacional de Toxicología y Ciencias Forenses ofrecidas en el ejercicio de intercomparación del 20 11 del Grupo de Habla Española y Portu!, '1lcsa de la lruernatiollal
Socielyfor Forensic Gene/fes (GHEP-ISFG) .
RESULTADOS
La Tabla 5 recoge el pertil genético de un individuo obtenido mediante la amplificación con I-DNAE21, elecrroforesis y el análisis de datos del individuo analizado.
TablaS
Muestra loci Alelo 1 Alelo 2 Amelogenina X X
C5F1PO 11 12
01051248 12 18
0125, 91 16 20
0135>17 11 14
01655, 9 10 11
018559 16 16
0195433 14 14
151656 16 17.3
021511 29 30
022S1045 11 12
02513338 16 17
025441 10 14
0351358 15 15
055818 11 13
075820 9 11
0851179 , . 15
FGA 18 22
THOl 6 6
TPOX 8 8
VWA 17 17
El perfil genético de la muestra analizada mediante I-DNAE21 ha mostrado una probabilidad de coincidencia por azar, según los cálculos realizados con la base de datos del Instituto Nacional de Toxicología y Ciencias Forenses ofrecidas en el ejercicio de intercomparación del 20 11 del GHEP-ISFG de 2, 8188 E-30. Este valor de coincidencia por azar indica que de ser hallado este perfil es 354753 cuatrillones de veces más probable que pertenezca al individuo analizado que a otro individuo tomado al azar en la población.
DISCUSIÓN 10 A continuación se discute los resultados obtenidos para la validación de I-DNAE21 en su uso en identificación humana.
Mediante el uso de I-ONAE21 se ha obtenido un valor de probabilidad de coincidencia de 2, 8 188 E-3D, dicho valor resulta sobradamente discriminativo y demuestra por tanto la aplicabilidad de I-DNAE21 para la identificación humana. La probabilidad de coincidencia se define como la probabilidad de que dos personas elegidas al azar en una población determinada tengan el mismo perfil genético.
La probabilidad complementaria es la probabilidad de discriminación, que a su vez se define como la probabilidad de que dos personas elegidas al azar en una población detenninada tengan distinto perfil genético. La suma de la probabilidad de coincidencia y de la probabilidad de discriminación, al ser sucesos complementarios, es 1. Por tanto a menor probabilidad de coincidencia mayor poder de discriminación.
En este sentido cuanto mayor número de marcadores STR altamente pol imórficos se ana licen menor es la probabilidad de coincidencia y por tanto mayor su probabilidad de discriminación.
5 En la actualidad, y como se puede observar en la Tabla 9, ]-ONAE21 es el kit que permite la amplificación simu ltánea de un mayor número de STR. Por ello l-DNAE21 es el kit que ofrece una menor probabilidad de coincidencia y por tanto un mayor poder de discriminación (Tab la 6) .
la Tabla 6
Probabilidad de Coincidencia Kits STR Multiplex
Afro-americanos Caucásicos Hispanos
I-DNAE21 5.S4E-2S 5, 02E-24 3, 89E-24
ESSplex SE kit 8, 17E-22 2, 35E-21 3, 15E-21
NGM Sc1ect 8, 17E-22 2, 35E-21 3, 15E-21
Powerplex ESI-17 8, 17E-22 2, 35E-21 3, lSE-21
Powerplex ESX-17 8, 17E-22 2, 35E-21 3, 15E-21
Powerplex 1 () 7, 04E-19 5, 46E-18 3, 40E-18
ldentifiler 1, 08E-18 7, 94E-18 2, 57E-18
fnveslldp lex 1, 08E-18 7, 94E-18 2, 57E-18
Lovest Nonaplex ESS 1, 27E-17 8, 38E-18 2, 54E-17
J-DNAI 4, 77[-17 2, 51E-16 8.D9E-17
[nvest Dccaplex SE 1, 59E-15 3, 72E-15 2, 08E-15
I-DNA2 5, 03 E-14 1, 88E-13 1, 02E-13
Bioplex-ll 5, 34E-13 1, 01E-12 1, 35E-12
Q8 2, 48E-11 1, 32E-11 1, 68E-11
Minifiler 6, 70E-11 1, 36E-10 5, 74E-11
15 Estos datos reflejan objetivamente la aplicabi lidad y superioridad de I-DNAE21 los kits STR multiplex actualmente existentes en el mercado, en su utilización identificación humana. frente a para la
40
EJEMPLO 3
Aplicación del conjunto de cebadores de I-DNAE21 en un caso práctico de parentesco en ausencia de un progenitor
A continuadón se describe la validación de I-DNAE21 para su uso en la determinación de relaciones de parentesco entre individuos. Dicha validación ha consistido en el análisis de dos muestras mediante el conj unto de cebadores de I-DNAE21 con la finalidad de determinar la supuesta relación de maternidad biológica entre los individuos analizados.
MATERIALES Y MÉTODOS
MueSTras control de ADN humano Se utilizó el ADN control 9947A del kit AmpFISTR:wYFiJer (AppJied Biosystems, Foster City, CA) corno control positivo de ampliticación.
Como control negativo de amplificación se utilizó H20 rnQ esteril (Milliporc Corporation, Billerica, . MA, EE.UU) .
Muestras de análisis Se tomaron muestras de saliva mediante el frotls de la mucosa bucal con hisopos estériles a dos individuos sanos (supuesta madre e hija) de origen caucasoide.
Extracción de ADN y cllantificación La extracción de ADN de los hisopos de saliva se realizó mediante el sistema de extracción QiAamp DNA Micro Kit (Qiagcn Ine., Valencia, CA, USA) .
Todos los extractos de ADN se cuantificaron con Quant·i'f™ PicoGreen:E dsDNA Assay Kit (Invitrogen, Carlsbad, CA, USA) .
Amplificación de peRo electroforesis y análisis de da/m
La ampliticación se realizó en un tennocicJador GeneAmp® 9700 PCR System (Applied Biosystems, Foster City, CA) . Para ello se emplearon 12, 5~1 de Multiplex PCR Kit Plus de Qiagen® (Qiagen, Valencia, CA) , 5 ~I de la mezcla de cebadores de I-DNAE21, 6, 5 ~I de H20 mQ esteril y 1 1-11 de ADN molde (lng 1 1-11) mediante la siguientes condiciones de amplificación: un ciclo de desnaturalización inicial durante 5 minutos a 95 oC, 30 ciclos de 30 s a 95 oC, 90 s a 60, 5 nc y 30 s a 72 ne. seguidos de I ciclo de extensión final de 30 minutos a 60 oc.
Se analizaron 2 ¡.ü de cada producto de amplificado mezclados con 9 111 de Hi·Dinl' Formamide (Applied Biosystems'lt'. Foster City. CA) y 0, 5 !JI de GeneScan™ 500 uiXl Sizc Standard (Applied Biosystems®, Foster City, CA) . Tras la desnaturalización de los amplificados (6 minutos a 95 OC) se enfriaron (4 minutos a 4 OC) Yse separaron en un ASI PRISM 3130 Genctic Analyzer (Applicd Siosystcms@, Foster City, CA) . Los resultados de la dectrotoresis lueron analizados mediante el software Genmappcr versión 4.0 (Applied Biosystems:®, Foster City, CA) .
Cálculos de probabilidad
Se realizó el cálculo de la probabilidad de maternidad mediante el software de cálculo de probabilidad Familias (J. Drábek, 2008. For Science lnternational: Genetics, Volumen 3, Número 2, Páginas 112.118) según la base de datos del Instituto Nacional de Toxicologia y Ciencias Forenses ofrecidas en el ejercicio de intercomparación del 2011 del Grupo de Habla Española y Porrnguesa de la lnternational Society Jor Forensic Genetics (GHEPISFG) .
RESULTADOS
La Tabla 7 recoge los perfiles genéticos de dos individuos obtenidos mediante la amplitkación con I-DNAE21. clecrroforesis y el análisis de datos de los individuos analizados.
El análisis estadístico. teniendo en cuenta la estructw"a genotípica del supuesto padre y las distribuciones alélicas de los marcadores analizados, ha proporcionado una Probabilidad de Maternidad de 99, 99947%.
Tabla 7
Supuesta Madre Hija
LOc1
Alelo 1 Ale lo 2 Ale lo 1 Alelo 2
Amelogenina X X X X
CSFIPO 10 11 11 11
D1051248 13 16 13 13
0125391 19 25 19 22
0135317 11 11 8 11
0165539 11 12 10 12
018559 14 17 17 17
D195433 13 14 13 14
0151656 12 17 12 14
021511 30 30 28 30
02251045 15 16 15 16
02513338 19 25 20 25
025441 10 14 14 15
0351358 15 18 15 17
055818 11 13 12 13
075820 9 10 9 11
D851179 12 14 12 13
FGA 21 21 21 27
THOl 6 9.3 6 9.3
TPOX 8 9 8 8
VWA 17 18 17 18
DISCUSiÓN
A continuación se discute los resultados obtenidos para la validación de l-DNAE21 en su uso en la detenninación de relaciones de parentesco entre individuos.
Mediante el uso de I-DNAE21 Se ha obtenido una Probabilidad de Maternidad de 5 99, 99947%. El Índice de Maternidad obtenido indica que la maternidad biológica es 192294 veces más probable que la de otra mujer tomada al azar en la población.
Dentro del área de la investigación biológica de parentesco se establece que un valor de probabilidad de parentesco superior al 99, 99% es considerado como que el parentesco biológico queda demostrado "más allá de cualquier duda razonable".
En este sentido, existen ocasiones en las que resulta de gran dificultad obtener un valor de probabilidad de parentesco superior a dicho umbral mediante la aplicación de un único kit STR multiplexo Este problema es habitual cuando se quiere determinar una paternidad o maternidad en ausencia de algún progenitor, en dctcnninaciones de hennanidad o parentescos mas complejos como medio~hermanos, abuelo-nieto, tjo~sobrino etc. En estos casos, con el fin de alcanzar una probabilidad de parentesco que pcnnita demostrar el parentesco, es necesario aumentar el número de STRs analizados e incluso analizar STRs ligados a cromosomas sexuales (cromosoma X e Y) .
La probabilidad de exclusión a priori detennina el potencial teórico de un kit, se define como la probabi lidad de demostrar la exclusión del parentesco de un individuo falsamente implicado mediante el estudio de diversos marcadores genéticos. En este sentido, I~ DNAE21 incluye un número de STRs mayor que cualquier kit STR multiplex
comercializado hasta la fecha, por ello alcanza una probabilidad de exclusión a priori mayor a los ki ts ampliamente utilizados en los laboratorios en los que se analizan relaciones de parentesco. (Tabla 8) Tabla 8
Probabilidad de exclusión a priori Kits STR Multiplex
Hispanos Caucásicos Afro-americanos
I-DNAE21 99, 9999984 99, 99999932 99, 99999981
ESSp1ex SE kit 99, 9999918 99, 9999985 99, 99999905
NGM seJect 99, 9999918 99, 9999985 99 , 99999905
44
PI' ES I-I 7 99.99999 18 99.9999985 99, 99999905
PP ESX-17 99, 9999918 99, 9999985 99.99999905
pp 16' 99, 99983 99, 999940 99, 999960
IdentitiJer 99, 999902 99, 99985 99, 999941
mvcsl Idplex 99, 999902 99, 99985 99.999941
lnvestNonaplex ESS 99, 99980 99, 99997 1 99, 99997 1
I-DNAI 99, 99962 99, 99939 99, 9997 1
Invest Decaplex SE 99.99947 99, 99967 99, 99970
I-DNA2 99.9972 99, 9960 99, 9983
Bioplcx-ll 99, 991 1 99, 9944 99.9962
Q8 99, 987 99, 9937 99, 9909
Minif¡Jer 99, 975 99, 975 99, 984
En este ejemplo I-DNAE2I , sin necesidad de análisis adicionales. ha resultado óptimo para resolver un caso de maternidad biológica en ausencia de padre obteniendo un [ndice de maternidad superior al 99, 99% y por tanto demostrando "más allá de cualquier duda
ra:conable" la maternidad.
Se ha demostrado por tanto la gran aplicabilidad y fiabilidad de I-DNAE21 para su uso en
parentesco biológico, incluso en casos de parentesco complejo.
"
E
o ."
o ."••
"
"
~
"
e"
"
"
'-"
'6
•
e '"
"
•o ."
';¡
, 5
"
"
.2 g
u ~
o ."
o u ."" 01
V>
'"'
u ."
u E
- , o O
"
."
o •~
"
•u o u "
o
-o•o '5 "
'"'"'
'"
]
u ."
x
Q.
"
-;;
"
:;;¡'"
•
-"
"
"
';j
.§
'"Q
•
::;
, ..•
TRADUCCIÓN AL ESPAÑOL DEL TEXTO DE LA LISTA DE SECUENCIAS
"SEQUENCE L1STlNG" -Lista de secuencias "METHOD FOR OBTArNlNG THE GENE PROFLLE OF AN rNDIVIDUAL":
Método para obtener el perfil genético de un individuo.
"ARTIFICIAL SEQUEN CE": Secuencia Artificial "DNA": ADN "FORWARD PRIMER DESIGNED TO AMPLlFY CSFIPO LOCUS" -Cebador
directo diseñado para amplificar ellocus CSF 1PO
"REWARD PRIMER DESIGNED TO AMPUFY CSFI PO LOCUS" -Cebador
inverso diseñado para amplificar ellocus CSF I PO
"FORWARD PRIMER DESIGNED TO AMPUFY D5S818 LOCUS" -Cebador
directo diseñado para amplificar el locus 05S818
"REWARD PRIMER DESIGNED TO AMPLlFY D5S818 LOCUS" -Cebador
inverso diseñado para amplificar el locus 05S818
"FORWARD PRIMER DESIGNED TO AMPUFY D7S820 LOCUS" -Cebador
directo diseñado para amplificar ellocus 0 7S820
"REWARD PRIMER DESIGNED TO AMPUFY D7S820 LOCUS" -Cebador
inverso diseñado para amplificar el locus 0 7S820
"FORWARD PRIMER DESIGNED TO AMPLlFY D21S I1 LOCUS" -Cebador
directo diseñado para amplificar ellocus 021 S 11
"REWARD PRIMER DESIGNED TO AMPLlFY D2ISII LOCUS" -Cebador
inverso diseñado para amplificar el IOGUS D21 S I1
"FORWARD PRIMER DESIGNED TO AMPLlFY D2S441 LOCUS" -Cebador
directo diseñado para amplificar ellocus 02S441
"REWARD PRIMER DESIGNED TO AMPUFY D2S441 LOCUS" -Cebador
inverso diseñado para amplificar ellocus 0 2S441
"FORWARD PRIMER DESIGNED TO AMPLlFY DISI656 LOCUS" -Cebador
directo diseñado para amplificar el locus DI S 1656
"REWARD PRIMER DESIGNED TO AMPUFY DI S 1656 LOCUS" -Cebador
inverso diseñado para amplificar ellocus DI S 1656
"FORWARD PRIMER DESIGNED TO AMPLlFY TPOX LOCUS" -Cebador
directo diseñado para amplificar ellocus TPOX
"REWARD PRIMER DESIGNED TO AMPLIFY TPOX LOCUS" -Cebador
inverso diseñado para amplificar el locus TPOX
"FOR WARD PRIMER DESIGNED TO AMPLIFY VWA LOCUS" -Cebador
directo di señado para amplificar ellocus VWA
"REWARD PRIMER DESIGNED TO AMPLIFY VWA LOCUS" -Cebador
inverso diseñado para amplificar ellocus VWA
"FORWARD PRIMER DESIGNED TO AMPLIFY D8S 11 79 LOCUS" -Cebador
directo diseñado para amplificar ellocus D8S 1179
"REWARD PRIMER DESIGNED TO AMPLIFY D8S 1179 LOCUS" -Cebador
inverso diseñado para amplificar ellocus D8S 1179
"FORWARD PRIMER DESIGNED TO AMPLIFY DI9S433 LOCUS" -Cebador
directo diseñado para amplificar ellocus 019S433
"REWARD PRIMER DESIGNED TO AMPLlFY D 19S433 LOCUS" -Cebador
inverso diseñado para amplificar el locus O 19S433
"FORWARD PRIMER DESIGNED TO AMPLIFY DI2S391 LOCUS" -Cebador
directo diseñado para amplificar ellocus 012S391
"REWARD PRIMER DESIGNED TO AMPLlFY DI2S391 LOCUS" -Cebador
inverso diseñado para amplificar el locus O 12S391
"FORWARD PRIMER DESIGNED TO AMPLIFY THOI LOCUS" -Cebador
directo diseñado para amplificar ellocus THOl
"REWARD PRIMER DESIGNED TO AMPLIFY THOI LOCUS" -Cebador
inverso diseñado para amplificar el IOGUS THO 1
"FORWARD PRIMER DESIGNED TO AMPLIFY D I6S539 LOCUS" -Cebador
directo diseñado para amplificar ellocus 016S539
"REWARD PRIMER DESIGNED TO AMPLlFY DI6S539 LOCUS" -Cebador
inverso diseñado para amplificar el locus O 16S539
"FORWARD PRIMER DESIGNED TO AMPLIFY D3S1358 LOCUS" -Cebador
directo diseñado para amplificar el locus D3S 1358
"REWARD PRIMER DESIGNED TO AMPLlFY D3S1358 LOCUS" -Cebador
inverso diseñado para amplificar ellocus D3S 1358
"FORWARD PRIMER DESIGNED TO AMPLlFY DI8S5 1 LOCUS" -Cebador
directo diseñado para amplificar el locus D 18S51
"REW ARD PRlMER DESIGNED TO AMPLlFY D 18S5 1 LOCUS" -Cebador
inverso diseñado para amplificar ellocus O18SS 1
"FOR WARD PRlMER DESIGNED TO AMPLlFY D2S 1338 LOCUS" -Cebador
directo diseñado para amplificar ellocus D2S 1338
"REWARD PRlMER DESIGNED TO AMPLlFY D2S1338 LOCUS" -Cebador
inverso diseñado para amp li ficar el locus D2S 1338
"FORWARD PRlMER DESIGNED TO AMPLlFY D I3S317 LOCUS" -Cebador
directo diseñado para amplificar el locus O13S317
"REWARD PRlMER DESIGNED TO AMPLIFY DI3S3 17 LOCUS" -Cebador
inverso diseñado para amplificar ellocus O 13S317
"FORWARD PRlMER DESIGNED TO AMPLlFY AMELOGEN INA LOCUS"
Cebador directo diseñado para amplificar el locus Amelogenina "REWARD PRIMER DESIGNED TO AMPLlFY AMELOGENINA LOCUS"
Cebador inverso diseñado para ampl ificar el locus Amelogenina "FORWARD PRlMER DESIGNED TO AMPLIFY FGA LOCUS" -Cebador
directo diseñado para amp li ficar el locus FGA
"REWARD PRIMER DESIGNED TO AMPLlFY FGA LOCUS" -Cebador
inverso diseñado para amplificar el locus FGA
"FORWARD PRlMER DESIGNED TO AMPLlFY D22SI045 LOCUS" -Cebador
directo diseñado para amplificar el locus 022S 1 045
"REWARD PRlMER DESIGNED TO AMPLlFY D22S I045 LOCUS" -Cebador
inverso diseñado para amp li ficar el loGus 022S 1 045
"FORWARD PRlMER DESIGNED TO AMPLlFY DIOSI248 LOCUS -Cebador
directo diseñado para amplificar el locus O 1 OS 1248
"REWARD PRIMER DESIGNED TO AMPLlFY DIOSI248 LOCUS -Cebador
inverso diseñado para amplificar el locus O 1 OS 1248