Biosensor para determinar la función exportadora de CRM1 CAMPO DE LA INVENCIÓN
La presente invención se refiere a un método para determinar si la función de una variante de CRM1 está alterada en una muestra y a un método para identificar un compuesto con capacidad de modular la función de CRM1 o de una variante equivalente de la misma. La presente invención también se refiere a una proteína de fusión y al uso de dicha proteína de fusión para determinar si la función de una variante de CRM1 está alterada en una muestra y para identificar un compuesto con capacidad de modular la función de CRM1.
ANTECEDENTES DE LA INVENCIÓN
La proteína CRM1/exportina1, es un miembro de la familia de las carioferinas, un grupo de proteínas que funcionan como receptores en el transporte de macromoléculas entre el núcleo y el citoplasma a través de los poros nucleares. Los receptores de transporte nuclear se pueden clasificar funcionalmente en dos grandes grupos: los receptores de importación (importinas) y los receptores de exportación (exportinas). En el citoplasma celular, las importinas reconocen y se unen a secuencias específicas de aminoácidos, denominadas señales de localización nuclear (NLS, nuclear localization signal) en las proteínas "cargo" que han de ser transportadas al núcleo. La importina facilita la entrada del cargo al núcleo a través del poro nuclear y, una vez en el núcleo, el complejo importina/cargo se disocia por la unión de RanGTP a la importina. El proceso de transporte inverso, la exportación de proteínas al citoplasma, esta mediada principalmente por el receptor de exportación CRM1. En el núcleo, y en presencia de RanGTP, CRM1 reconoce y se une a secuencias de aminoácidos denominadas señales de exportación nuclear (NES, nuclear export signal) en los cargos que han de ser exportados. El complejo trimérico CRM1/cargo/RanGTP atraviesa el poro nuclear y se disocia en el citoplasma tras la hidrólisis del GTP. El transporte nucleocitoplásmico de proteínas es un proceso esencial para la homeostasis celular, y se encuentra alterado en varios procesos patológicos, incluido el cáncer.
Numerosas proteínas celulares dependen de la función de CRM1 para ser exportadas al citoplasma y así desarrollar de modo correcto su función. Entre estas proteínas se encuentran importantes reguladores del ciclo celular y de la apoptosis como p53 o survivina
(Stommel et al., 1999, EMBO J. 18:1660-1672; Rodríguez et al., 2002, Exp. Cell Res. 275: 44-53), cuya alteración es causa frecuente del desarrollo tumoral. Recientemente, se han identificado mutaciones puntuales del gen XPO1, que codifica CRM1, en pacientes con leucemia linfocítica crónica (CLL) (Puente et al., 2011, Nature. 475: 101-105). Debido a su importante función en la homeostasis celular, y a su papel central como regulador de proteínas relacionadas con el desarrollo de tumores, CRM1 constituye una interesante diana terapéutica para el tratamiento del cancer (Turner et al., 2012, Biochem. Pharmacol., 83:1021-1032).
La función de CRM1 se ha analizado en numerosos estudios utilizando diferentes métodos, dirigidos fundamentalmente a determinar su capacidad de unión a una secuencia NES (aislada o en el contexto de una proteína). Estos métodos pueden clasificarse en dos grandes grupos según se lleven a cabo en un tampón de reacción bien definido bioquímicamente (ensayos in vitro), o en células intactas o permeabilizadas (ensayos celulares).
Los ensayos in vitro se basan en la utilización de proteínas recombinantes producidas in vitro o purificadas a partir de sistemas de expresión procarióticos o eucarióticos. A la secuencia de aminoácidos de estas proteínas recombinantes se añaden a menudo epítopos artificiales (por ejemplo GST o 6xHistidine) que facilitan su aislamiento o detección. Usualmente, las proteínas recombinantes (CRM1 y NES) purificadas se añaden a un tampón, que contiene RanGTP, el tercer componente del complejo de exportación. Utilizando diversas variantes de ensayos de co-purificación (por ejemplo GST-pull down) (Grespin et al., 2008, J. Biol. Chem. 283: 25576-25588; Güttler et al., 2010, Nat. Struct. Mol. Biol. 17:1367-1376) o ensayos basados en la cuantificación de la hidrólisis de GTP (RanGAP protection assay) (Askjaer et al., 1999, Mol. Cell. Biol., 19: 6276-6285) se determina si se produce la interacción CRM1/NES. Los ensayos in vitro presentan la limitación de que se llevan a cabo en un medio distinto al fisiológico.
Los ensayos celulares pueden estar dirigidos a evaluar la función de la proteína CRM1 producida de modo natural por las propias células en las que se realiza el ensayo (CRM1 endógena), por ejemplo mediante la transfección o microinyección de sustratos de CRM1 fluorescentes (Ossareh-Nazari et al., 1997, Science 278: 141-144; Cabot et al. 2002, Biol. Reprod. 67: 814-819; Fetz et al., 2009, Sensors 9: 5423-5445). Sin embargo, los ensayos que analizan la función de CRM1 endógena no permiten comparar directamente la función de distintas variantes mutadas de CRM1. Dicha comparación sí es posible utilizando
ensayos celulares en los que se induce la expresión ectópica de CRM1 mediante transfección. La interacción de CRM1 ectópica con una NES se ha investigado mediante co-inmunoprecipitación (Kanai et al., 2007, Nat. Cell Biol., 9: 1175 - 1183), mediante ensayos de doble híbrido (Yang et al., 2001, Mol. Cell 8: 397-406) y también mediante ensayos de relocalización. En estos últimos, se co-transfectan células con plásmidos de expresión que codifican CRM1 y una proteína con NES fusionadas a epítopos que faciliten su detección mediante microscopía de fluorescencia (por ejemplo GFP o Flag). La proteína con NES se utiliza como "cebo" y la interacción CRM1/NES se detecta como un cambio en la localización subcelular de CRM1 (Daelemans et al., 2002, Proc. Nati. Acad. Sci. USA 99: 14440-14445). Estos ensayos evalúan la capacidad de CRM1 para unirse a una NES, pero no directamente su capacidad para exportar una proteína.
Existe por tanto, una necesidad en el estado de la técnica de desarrollar biosensores que permitan la determinación de la funcionalidad en un entorno celular de variantes de CRM1 así como la identificación de compuestos capaces de modular la función de CRM1 basados en el análisis de la capacidad de exportación de dicha exportina.
COMPENDIO DE LA INVENCIÓN
Los autores de la presente invención han desarrollado un método para evaluar la función de la exportina CRM1 basado en la detección de la localización subcelular de un biosensor construido a partir de un cargo natural de CRM1, survivina. Survivina es una proteína constitutivamente citoplasmática. Los autores de la presente invención han diseñado una proteína de fusión que comprende survivina cuya localización es constitutivamente nuclear y que relocaliza al citoplasma en respuesta a la sobreexpresión de una proteína CRM1 funcional.
En un primer aspecto, la invención se refiere a un método para determinar si la función de una variante de CRM1 en una muestra que comprende al menos una célula está alterada, que comprende:
(i) proporcionar una muestra que comprende al menos una célula en donde dicha al menos una célula comprende una proteína de fusión y en donde dicha proteína de fusión comprende:
a) un primer dominio polipeptídico que comprende una variante de survivina seleccionada entre:
1) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional; y
2) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional y comprende la señal de exportación nuclear (NES) de survivina;
b) al menos, un segundo dominio polipeptídico que comprende una señal de localización nuclear (NLS); y
c) al menos, un tercer dominio polipeptídico reportero;
en donde si la variante de survivina carece de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además
d) un cuarto dominio polipeptídico que comprende una NES;
(ii) introducir en dicha al menos una célula un casete de expresión o un plásmido que codifica para dicha variante de CRM1;
(iii) crecer dicha al menos una célula bajo condiciones que permitan la correcta expresión de dicha variante de CRM1;
(iv) detectar la señal del dominio reportero de dicha proteína de fusión;
(v) determinar la localización subcelular de dicha proteína de fusión;
(vi) comparar la localización subcelular de dicha proteína de fusión determinada en la etapa (v) con dicha localización subcelular obtenida para dicha proteína de fusión en una muestra de referencia;
en donde una alteración de la localización subcelular de dicha proteína de fusión es indicativa de una función alterada de CRM1.
En un segundo aspecto, la invención se relaciona con un método para identificar un compuesto con capacidad de modular la función de CRM1 o de una variante funcionalmente equivalente de la misma en una muestra que comprende al menos una célula, comprendiendo dicho método:
(i) poner en contacto un compuesto candidato con una muestra que comprende al menos una célula en donde dicha al menos una célula comprende:
a) una proteína de fusión que comprende:
1) un primer dominio polipeptídico que comprende una variante de survivina seleccionada entre:
- una variante de survivina que carece de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional; y
- una variante de survivina que carece de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional y comprende una señal de exportación nuclear (NES) de survivina;
2) al menos, un segundo dominio polipeptídico que comprende una señal de localización nuclear (NLS); y
3) al menos, un tercer dominio polipeptídico reportero;
en donde si la variante de survivina carece de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además
4) un cuarto dominio polipeptídico que comprende una NES;
b) un casete de expresión o un plásmido que codifica para dicha CRM1 o dicha variante funcionalmente equivalente de la misma;
(ii) detectar la señal del dominio reportero de dicha proteína de fusión;
(iii) detectar la localización subcelular de dicha proteína de fusión; y
(iv) comparar la localización subcelular de dicha proteína de fusión obtenida en la etapa (iii) con la localización subcelular de dicha proteína de fusión obtenida en una muestra que comprende al menos una célula que no ha sido tratada con dicho compuesto;
en donde una alteración de la localización subcelular de la proteína de fusión detectada en la etapa (iii) con respecto a la localización subcelular en dicha muestra no tratada es indicativa de que dicho compuesto es capaz de modular la función de CRM1 o de una variante funcionalmente equivalente de la misma.
En un tercer aspecto, la invención se relaciona con una proteína de fusión que comprende:
(i) un primer dominio polipeptídico que comprende una variante de survivina seleccionada entre:
a) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional; y
b) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional y comprende una señal de exportación nuclear (NES) de survivina;
(ii) al menos, un segundo dominio polipeptídico que comprende una señal de localización nuclear (NLS);
(iii) al menos, un tercer dominio polipeptídico reportero;
en donde si la variante de survivina carece de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además
(iv) un cuarto dominio polipeptídico que comprende una NES.
En un cuarto aspecto, la invención se refiere a un ácido nucleico que codifica para dicha proteína de fusión.
En un quinto aspecto, la invención se refiere a un casete de expresión que comprende dicho ácido nucleico operativamente unido a un sistema de transcripción y/o traducción apropiado.
En un sexto aspecto, la invención se refiere a un plásmido que comprende dicho ácido nucleico o dicho casete de expresión.
En un séptimo aspecto, la invención se refiere a una célula hospedadora que comprende dicho ácido nucleico, dicho casete de expresión o dicho plásmido.
En un octavo aspecto, la invención se refiere al uso de dicha proteína de fusión para determinar si la función de una variante de CRM1 está alterada en una muestra o para identificar un compuesto con capacidad de modular la función de CRM1 o de una variante funcionalmente equivalente de la misma en una muestra.
BREVE DESCRIPCIÓN DE LAS FIGURAS
Figura 1. Elementos funcionales y secuencia de la proteína de fusión (SEQ ID NO: 52). El panel A muestra una representación simplificada de la proteína survivina humana y la proteína de fusión derivada de ella. En la representación de survivina se indica su tamaño (142 aminoácidos), la posición de la NES, el dominio de dimerización (dim) y el segundo dominio de exportación carboxiterminal (C-exp). En la representación de la proteína de fusión se indica la posición de la NES, las NLS y el epitopo 3xFlag. El panel B muestra la secuencia de aminoácidos de la proteína de fusión indicando la secuencia de la NES (en recuadro), las NLS (subrayadas) y el epitopo 3xFlag (subrayado doble). El panel C muestra la secuencia de nucleótidos que codifica la proteína de fusión, indicando la secuencia que codifica la NES (en recuadro), las NLS (subrayadas), el epitopo 3xFlag (subrayado doble) y
el codón de parada (negrita). En mayúscula, se indican los sitios de restricción BglII (AGATCT), HindIII (AAGCTT) y NotI (CGGCCGCG).
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
Método para determinar si la función de una variante de CRM1 está alterada
En un primer aspecto, la invención se refiere a un método, de aquí en adelante "primer método de la invención", para determinar si la función de una variante de CRM1 en una muestra que comprende al menos una célula está alterada, que comprende:
(i) proporcionar una muestra que comprende al menos una célula en donde dicha al menos una célula comprende una proteína de fusión y en donde dicha proteína de fusión comprende:
a) un primer dominio polipeptídico que comprende una variante de survivina seleccionada entre:
1) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional; y
2) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional y comprende la señal de exportación nuclear (NES) de survivina;
b) al menos, un segundo dominio polipeptídico que comprende una señal de localización nuclear (NLS); y
c) al menos, un tercer dominio polipeptídico reportero;
en donde si la variante de survivina carece de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además
d) un cuarto dominio polipeptídico que comprende una NES;
(ii) introducir en dicha al menos una célula un casete de expresión o un plásmido que codifica para dicha variante de CRM1;
(iii) crecer las células bajo condiciones que permitan la correcta expresión de dicha variante de CRM1;
(iv) detectar la señal del dominio reportero de dicha proteína de fusión;
(v) determinar la localización subcelular de dicha proteína de fusión;
(vi) comparar la localización subcelular de dicha proteína de fusión determinada en la etapa (v) con dicha localización subcelular obtenida para dicha proteína de fusión en una muestra de referencia;
en donde una alteración de la localización subcelular de dicha proteína de fusión es indicativa de una función alterada de CRM1.
La etapa (i) del primer método de la invención comprende proporcionar una muestra que comprende al menos una célula en donde dicha al menos una célula comprende una proteína de fusión y en donde dicha proteína de fusión comprende:
a) un primer dominio polipeptídico que comprende una variante de survivina seleccionada entre:
1) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional y
2) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional y comprende la señal de exportación nuclear (NES) de survivina;
b) al menos, un segundo dominio polipeptídico que comprende una señal de localización nuclear (NLS); y
c) al menos, un tercer dominio polipeptídico reportero;
en donde si la variante de survivina carece de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además
d) un cuarto dominio polipeptídico que comprende una NES;
El primer método de la invención está dirigido a determinar si la función de una variante de CRM1 está alterada.
El término "CRM1" (del inglés, Chromosomal Maintenance 1) o "exportina 1" según se usa en la presente descripción, se refiere a una proteína que media el transporte nuclear de macromoléculas (incluyendo ARN y proteínas) desde el núcleo celular hacia el citoplasma mediante el reconocimiento en dichas macromoléculas de una señal de exportación nuclear (NES) rica en residuos de leucina. La proteína CRM1 está formada por varios dominios HEAT (del inglés, Huntingtin, elongation factor 3, protein phosphatase 2A and the yeast kinase Tor1), cuyo número es variable dependiendo de la especie (por ejemplo, CRM1 humana contiene 20 dominios HEAT), que a su vez están constituidos por una cadena alfa y
una cadena beta antiparalelas que dan lugar a "ranuras hidrofóbicas" en las que se acomodan los residuos hidrofóbicos de la secuencia NES. El transporte de dichas macromoléculas lleva asociado un consumo de energía en forma de GTP y se lleva a cabo mediante el acoplamiento de CRM1 con un complejo proteico formado por la proteína RANBP3 y una GTPasa. La proteína CRM1 es el producto del gen crm1 o xpo1. CRM1 incluye la proteína CRM1 de cualquier mamífero incluyendo, pero sin estar limitado a, animales domésticos y de granja (vacas, caballos, cerdos, ovejas, cabras, perros, gatos o roedores), primates y humanos.
El término "variante de CRM1" según se utiliza en la presente descripción, se refiere a toda aquella proteína o polipéptido, o a la secuencia de nucleótidos que codifica la misma, que resulta de la inserción, deleción o sustitución de uno o varios aminoácidos de la secuencia de CRM1. Variantes de CRM1 según la invención incluyen polipéptidos que son sustancial mente homólogos a CRM1. Un polipéptido es sustancial mente homólogo a otro polipéptido cuando su secuencia de aminoácidos tiene un grado de identidad de al menos el 50%, al menos el 60%, al menos el 70%, al menos el 80%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%. El grado de identidad entre dos secuencias de aminoácidos puede determinarse por métodos convencionales, por ejemplo, mediante algoritmos estándar de alineamiento de secuencias conocidos en el estado de la técnica, tales como, por ejemplo BLAST (Altschul S.F. et al. Basic Local Alignment Search Tool. J Mol Biol. 1990 Oct 5; 215(3):403-10). En una realización preferida de la invención, dicha variante de CRM1 es una variante de la proteína CRM1 humana. En una realización aún más preferida de la invención, dicha variante de CRM1 es CRM1 A541K en donde el residuo de alanina en la posición 541 es sustituido por una lisina (SEQ ID NO: 1).
La expresión "función de una variante de CRM1" se refiere a la capacidad de una variante de CRM1 de exportar macromoléculas, tal como, por ejemplo, la proteína de fusión definida en la presente invención, desde el núcleo al citoplasma.
El término "muestra", según se usa en el presente documento, se refiere a una pequeña parte de un sujeto que comprende al menos una célula, y puede estar constituida por una única célula, 2 células, 3 células, 10 células, 20 células, 100 células, 500 células, 1000 células, 2000 células, 5000 células, 10000 células o más. La muestra puede ser fresca o congelada. Dicha célula debe ser una célula eucariota. Ejemplos de células eucariotas para llevar a cabo el primer método de la invención incluyen células de mamíferos, plantas,
insectos y hongos. Células de hongos incluyen, preferiblemente, células de levaduras tales como Saccharomyces, Pichia pastorís y Hansenula polymorpha. Células de insectos incluyen, sin limitación, células de Drosophila y células Sf9. Células de plantas incluyen, entre otras, células de plantas de cultivos tales como cereales, plantas medicinales, ornamentales o de bulbos. Células de mamíferos adecuadas para llevar a cabo el primer método de la presente invención incluyen líneas celulares epiteliales (porcinas, humanas, etc.), líneas celulares tumorales como por ejemplo, líneas celulares de osteosarcoma (humanas, etc.), líneas celulares de neuroblastoma (humanas, etc.), carcinomas epiteliales (humanos, etc.), células gliales (murinas, etc.), líneas celulares hepáticas (de mono, etc.), células CHO (Chínese Hámster Ovary), células COS, células BHK, células HeLa, 911, AT1080, A549, 293 o PER.C6, células ECCs (Embryonal Cáncer Cells) humana NTERA-2, células D3 de la línea de mESCs (Mouse Embryonic Stem Cells), células troncales embrionarias humanas tales como HS293 y BGV01, SHEF1, SHEF2 y HS181, células NIH3T3, 293T, REH y MCF-7 y células hMSCs (human Mesenquimal Stem Cells). En una realización preferida de la invención, dicha muestra comprende una población de células 293T.
El término "proteína de fusión" tal y como se usa en el presente documento, se refiere a proteínas generadas mediante ingeniería genética que consisten en dos o más dominios funcionales derivados de distintas proteínas. Una proteína de fusión puede ser obtenida mediante cualquier técnica convencional conocida en el estado de la técnica (por ejemplo, mediante la expresión de una secuencia nucleotídica que codifica para dicha proteína de fusión en una célula adecuada). A modo ilustrativo, la proteína de fusión puede generarse como se muestra en el Ejemplo 1 de la presente solicitud.
De acuerdo con el primer método de la invención, la proteína de fusión comprende:
a) un primer dominio polipeptídico que comprende una variante de survivina seleccionada entre:
1) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional; y
2) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional y comprende la señal de exportación nuclear (NES) de survivina;
ll
b) al menos, un segundo dominio polipeptídico que comprende una señal de localización nuclear (NLS); y
c) al menos, un tercer dominio polipeptídico reportero;
en donde si la variante de survivina carece de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además
d) un cuarto dominio polipeptídico que comprende una NES;
El término "dominio polipeptídico o polipéptido", según se usa en la presente descripción, usado aquí indistintamente con proteína, se refiere a una cadena de aminoácidos de cualquier longitud en donde los distintos aminoácidos se encuentran unidos entre sí mediante enlaces peptídicos. Cada dominio polipeptídico comprende una secuencia de aminoácidos y tiene una estructura de una proteína activa funcionalmente y que puede existir independientemente del resto de la cadena proteica. Cada dominio polipeptídico forma una estructura tridimensional compacta y, a menudo, puede adquirir su conformación estable de manera independiente.
Primer dominio polipeptídico
De acuerdo con el primer método de la invención, el primer dominio polipeptídico de la proteína de fusión comprende una variante de survivina seleccionada entre:
1) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional ; y
2) una variante de survivina que carece de la totalidad o parte del
dominio de homodimerización resultando en un dominio de
homodimerización no funcional y comprende la señal de exportación nuclear (NES) de survivina.
El término "survivina", también denominada "BIRC5" (del inglés Baculoviral Inhibitor of apoptosis Repeat-Containing 5), según se utiliza en el presente documento, se refiere a una proteína miembro de la familia de inhibidores de apoptosis (IAP). La función de survivina es inhibir la activación de las caspasas, lo cual tiene como consecuencia la regulación negativa (inhibición) del proceso apoptótico o muerte celular programada. Survivina también es una proteína reguladora del ciclo celular e interviene en la separación de las cromátidas y en la citoquinesis. Survivina es un "cargo" natural de CRM1. Estructuralmente, dicha proteína comprende en el extremo amino terminal un dominio BIR, una señal de exportación nuclear
(NES) y un dominio de homodimerización localizado en el extremo carboxilo terminal de survivina que está poco caracterizado. El dominio BIR (del inglés Baculovirus Inhibitor of Apoptosis protein Repeat) es un motivo estructural muy conservado de aproximadamente, 70 residuos de aminoácidos que comprende 3 cisteínas y 1 histidina queladas con un ion de zinc. Típicamente, el dominio BIR está compuesto por 5 alfa hélices y 3 láminas beta. La señal de exportación nuclear (NES) de survivina está formada por una secuencia de aminoácidos similar a la secuencia NES consenso (0-X2_3- <t>-X2.3- <t>-X-<t>, en donde 0 representa un aminoácido hidrofóbico). El dominio de homodimerización de survivina permite la formación de dímeros de survivina. Dicho dominio, estructuralmente poco caracterizado, es rico en residuos hidrofóbicos y solapa parcialmente con la señal NES de survivina. La señal NES de survivina humana está comprendida entre las posiciones 84 y 109 de la secuencia aminoacídica. La proteína survivina es producto del gen survivina que da lugar a cuatro transcritos alternativos según se lleve a cabo el procesamiento del ARNm: survivina (constituida por 3 intrones y 4 exones), survivina 2B (con un exón 2 alternativo al exón 2 de survivina), survivina-delta-ex3 (en donde el exón 3 es eliminado) y survivina 3B (con un exón 3 alternativo al exón 4 de survivina). Survivina incluye la proteína survivina de cualquier mamífero incluyendo, pero sin estar limitado a, animales domésticos y de granja (vacas, caballos, cerdos, ovejas, cabras, perros, gatos o roedores), primates y humanos. La secuencia de la proteína survivina humana se encuentra depositada en la base de datos de GenBank bajo el número de acceso ACC51660 (versión del 2 de septiembre de 2004)
El término "variante de survivina" según se utiliza en la presente descripción, se refiere a toda aquella proteína que resulta de la inserción, deleción o sustitución de uno o varios aminoácidos de la secuencia de survivina. La expresión "variante de survivina que carece de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional" tal y como se usa en la presente descripción, se refiere a un polipéptido sustancialmente homólogo a survivina que no es capaz de dimerizar. El término "capacidad de dimerizar" o "capacidad de dimerización" tal y como se usa en la presente descripción, se refiere a la capacidad que tiene una proteína, en particular una variante de survivina, de formar un dímero mediante la asociación con otra molécula similar. La determinación de la capacidad de dimerización de las variantes de survivina contempladas en la presente invención puede llevarse a cabo mediante cualquier técnica conocida en el estado de la técnica (Scopes, Protein Purification: principies and practice, 1897, Springer- Verlag, Nueva York). A modo ilustrativo se pueden citar técnicas de separación bioquímica para resolver proteínas en base a su tamaño molecular (por ejemplo, electroforesis en gel nativo en condiciones no reductoras, cromatografía de filtración en gel, ultracentrifugación
analítica, etc), y/o comparación de propiedades físico-químicas antes y después de la inducción de la ruptura de los enlaces entre ambos monómeros mediante el empleo de agentes activos con sulfihidrilo (por ejemplo, yodoacetamida, N-etilmaleimida) o reductores de disulfuro (por ejemplo 2-mercaptoetanol, ditiotreitol), u otras metodologías equivalentes. Dicha variante de survivina incluye variantes de la proteína survivina de cualquier mamífero incluyendo, pero sin estar limitado a, animales domésticos y de granja (vacas, caballos, cerdos, ovejas, cabras, perros, gatos o roedores), primates y humanos. En una realización particular de la invención, dicha variante de survivina es una variante de survivina humana.
En una realización particular, dicha variante de survivina es una forma mutada de survivina que comprende un dominio de homodimerización truncado obtenido mediante la deleción parcial de dicho dominio. El experto en la materia entenderá que dicha variante podrá presentar deleciones en cualquier región de la secuencia de aminoácidos de dicho dominio de homodimerización, siempre y cuando la variante de survivina resultante carezca de dicha capacidad de dimerización con otro monómero de survivina. La generación de las variantes de survivina contempladas en la presente invención puede llevarse a cabo mediante técnicas de ingeniería genética bien conocidas en el estado de la técnica. Véase, por ejemplo, Alberts B, et al, "Molecular Biology of the Cell" (Garland Publishing Inc., Nueva York, NY, E.E.U.U., 2008).
En una realización particular, dicha variante de survivina carece de la totalidad del dominio de homodimerización, y, en consecuencia, presenta la señal NES truncada. En una realización preferida, dicha variante de survivina carece de los residuos de aminoácidos comprendidos entre las posiciones 96 y 104 de la secuencia de survivina humana.
En una realización todavía más particular, dicha variante de survivina carece de la totalidad del dominio de homodimerización y de la totalidad del dominio NES. En una realización preferida, dicha variante de survivina carece de los aminoácidos comprendidos entre las posiciones 84 y 142 de la secuencia de survivina humana (SEQ ID NO: 2).
Alternativamente, la variante de survivina contemplada en la presente invención carece de parte del dominio de homodimerización, es decir de uno o más aminoácidos de dicho dominio de homodimerización, en donde dichos uno o más aminoácidos forman parte de los residuos que codifican la señal NES de survivina. Por lo tanto, en una realización particular una variante de survivina comprende una survivina con el dominio de homodimerización y la señal NES truncados. Alternativamente, la variante de survivina contemplada en la presente
invención carece de parte del dominio de homodimerización, es decir, de uno o más aminoácidos de dicho dominio de homodimerización en donde dichos uno o más aminoácidos no forman parte de los residuos que codifican la señal NES de survivina. Por lo tanto, en otra realización particular, la variante de survivina comprende una survivina con el dominio de homodimerización truncado pero en donde la señal NES no carece de ningún residuo aminoacídico, es decir, en donde la señal NES está completa. En otra realización particular de la invención, dicha variante de survivina carece de los aminoácidos comprendidos entre las posiciones 101 y 142 de la secuencia de survivina humana.
Segundo dominio polipeptídico
De acuerdo con el primer método de la invención, la proteína de fusión comprende, al menos, un segundo dominio polipeptídico que comprende, una señal de localización nuclear (NLS). El término "al menos uno" tal y como se usa en la presente descripción, se refiere a uno o más. Es decir, en una realización particular, dicha proteína de fusión comprende un segundo dominio polipeptídico que comprende una NLS; en otra realización particular, dicha proteína de fusión comprende un segundo dominio polipeptídico que comprende dos NLS. La presente invención también contempla realizaciones en donde dicha proteína de fusión comprende un segundo dominio polipeptídico que comprende tres NLS, cuatro NLS, cinco NLS o más.
Tal como se usa en la presente descripción, el término "señal de localización nuclear" o "NLS" se refiere a una secuencia que dirige el polipéptido al que está unido al núcleo. Secuencias de señalización nuclear adecuadas para el transporte de la proteína de fusión de la invención al núcleo comprenden, tanto secuencias que actúan independientemente de activadores externos como secuencias que son externamente activables en cuyo caso la célula que comprende el polipéptido se pone en contacto con un compuesto capaz de activar la señal de localización nuclear. Secuencias NLS que no requieren de un activador para promover la translocación de las proteínas son ampliamente conocidas para el experto en la materia e incluyen todas aquellas secuencias capaces de ser reconocidas por un receptor de importación formando un complejo que se transloca a través del poro nuclear mediante un proceso en el que ocurre hidrólisis de GTP. Un tipo de NLS son aquellas formadas por una región corta de aminoácidos básicos, tales como la NLS del antígeno T
grande del virus SV40 formada por la secuencia PKKKRKV (SEQ ID NO: 3), que también ha demostrado ser efectiva en células de mamíferos. Otro tipo de NLSs son las que están formadas por una secuencia bipartita formada por dos regiones de aminoácidos básicos separados por un espaciador de 10 a 12 aminoácidos, tales como la NLS de la nucleoplasmina formada por la secuencia KRPAATKKAGQAKKKK (SEQ ID NO: 4). Un tercer tipo de NLS son aquellas que se asemejan al homeodominio de la proteína c-myc formada por la secuencia RQRRNELKRSF (SEQ ID NO: 5) en donde no se observa una acumulación particular de aminoácidos básicos. Otros ejemplos de NLS incluyen, la secuencia RMRKFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 6) del dominio IBB de la importina alfa, las secuencias VSRKRPRP (SEQ ID NO: 7) y PPKKARED (SEQ ID NO: 8) de la proteína T de mioma, la secuencia NLS de la proteína p53 humana, la secuencia SALIKKKKKMAP (SEQ ID NO: 9) de la proteína c-abl IV de ratón, las secuencias DRLRR (SEQ ID NO: 10) y PKQKKRK (SEQ ID NO: 11) del virus de la gripe, la secuencia RKLKKKIKKL (SEQ ID NO: 12) del antígeno delta del virus de la hepatitis, la secuencia REKKKFLKRR (SEQ ID NO: 13) de la proteína Mx1 de ratón, la secuencia KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 14) de la poli(ADP-ribosa) polimerasa, la secuencia RKCLQAGMNLEARKTKK (SEQ ID NO: 15) de los receptores de hormonas esteroideas humanos y la secuencia NLS de la proteína p17 del reovirus aviar (IAAKRGRQLD- SEQ ID NO: 16). Adicionalmente, la invención contempla el uso de NLS tales como las descritas en US2006121513 y W005120588 así como de sustituyentes del tipo de los descritos en EP1695717 que permiten el transporte de proteínas que los contienen a través de la membrana nuclear.
En una realización particular, dicho segundo polipéptido comprende la secuencia NLS del antígeno T grande del virus SV40 (SEQ ID NO: 3).
En otra realización particular, dicha proteína de fusión comprende dos segundos dominios polipeptídicos en donde dichos dos segundos dominios polipeptídicos son iguales o diferentes. Es decir, la proteína de fusión puede presentar dos cualesquiera de las secuencias NLS mencionadas anteriormente. En una realización particular, dichos dos segundos dominios polipeptídicos son diferentes. En otra realización particular, dicha proteína de fusión comprende dos segundos dominios polipeptídicos idénticos. En una realización aún más particular, dicha proteína de fusión comprende dos segundos dominios polipeptídicos idénticos en donde cada uno de dichos dos segundos dominios polipeptídicos comprende la secuencia NLS del antígeno T grande del virus SV40 (SEQ ID NO: 3).
Tercer dominio polipeptídico
La proteína de fusión comprende al menos, un tercer dominio polipeptídico reportero. El término "dominio polipeptídico reportero" o "polipéptido reportero" tal y como se usa en el presente documento, se refiere a un polipéptido que permite la detección y/o purificación de dicha proteína de fusión. Dicho polipéptido reportero es capaz de unirse con alta afinidad a uno o más ligandos, como por ejemplo anticuerpos específicos o sustratos inmovilizados y en ningún caso interferirá significativamente con la actividad del polipéptido al que está unido. Polipéptidos reporteros adecuados para detectar y/o purificar la proteína de fusión de acuerdo a la presente invención incluyen el epítopo flag, el epítopo HA, el epítopo Myc, los epítopos AU1 y AU5, el epítopo Glu-Glu, el epítopo KT3, el epítopo IRS, el epítopo Btag, el epítopo de proteína quinasa C, el epítopo de VSV, polipéptido de hexahistidinas y péptido de unión a calmodulina.
En una realización particular, dicho tercer dominio polipeptídico reportero comprende el epítopo flag.
En otra realización particular, dicha proteína de fusión comprende dos terceros dominios polipeptídicos en donde dichos dos terceros dominios polipeptídicos son iguales o diferentes. Es decir, la proteína de fusión puede presentar dos cualesquiera de los polipéptidos reporteros mencionados anteriormente. En una realización particular, dichos dos terceros dominios polipeptídicos son diferentes. En otra realización particular, dicha proteína de fusión comprende dos terceros dominios polipeptídicos idénticos. En otra realización particular, dicha proteína de fusión comprende tres terceros dominios polipeptídicos en donde dichos tres terceros dominios polipeptídicos son iguales o diferentes. Es decir, la proteína de fusión puede presentar tres cualesquiera de los polipéptidos reporteros definidos anteriormente. En una realización particular, dicha proteína de fusión comprende tres terceros dominios polipeptídicos diferentes. En otra realización particular, dicha proteína de fusión comprende tres terceros dominios polipeptídicos idénticos. En una realización aún más particular, dicha proteína de fusión comprende tres terceros dominios polipeptídicos idénticos en donde cada uno de dichos tres terceros dominios polipeptídicos comprende el epítopo flag.
Cuarto dominio polipeptídico
De acuerdo con el primer método de la invención, tal y como se ha mencionado en el contexto del primer dominio polipeptídico de la proteína de fusión, en caso de que la variante de survivina carezca de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional y carezca de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además un cuarto dominio polipeptídico que comprende una NES.
El término "señal de exportación nuclear" o NES" según se usa en la presente descripción, se refiere a una secuencia que dirige al péptido al que está unido al citoplasma. Secuencias de exportación nuclear adecuadas para el transporte de la proteína de fusión de la invención al citoplasma comprenden la secuencia consenso 0-X2_3- <t>-X2.3- <t>-X-<t>, en donde <t> representa un aminoácido hidrofóbico. Secuencias NES adecuadas para la presente invención incluyen pero no están limitadas a: la secuencia NES de survivina humana formada por la secuencia CAFLSVKKQFEELTL (SEQ ID NO: 17), la secuencia NES del inhibidor de la proteína quinasa dependiente de AMPc humano formada por la secuencia LALKLAGLDI (SEQ ID NO: 18), la secuencia NES de p53 humana formada por la secuencia EMFRELNEALELKD (SEQ ID NO: 19), la secuencia NES de ubiquitin-proteín ligasa Mdm2 humana formada por la secuencia SISLSFDESLALCVI (SEQ ID NO: 20), la secuencia NES de Xsmad4a de Xenopus spp formada por la secuencia GIDLSGLTLQ (SEQ ID NO: 21), la secuencia NES de catenina p120 humana (isoforma 3AB) formada por la secuencia ESLEEELDVLVLDDEGG (SEQ ID NO: 22), la secuencia NES de MAP quinasa 2 murina formada por la secuencia DKERWEDVKEEMTSALATMRVDYE (SEQ ID NO: 23), la secuencia NES de p150 murina formada por la secuencia EAINKLESNLRELQICPAT (SEQ ID NO: 24) secuencia NES de ciclina B1 humana formada por la secuencia DLCQAFSDVILAV (SEQ ID NO: 25), la secuencia NES de actina de Saccharomyces spp formada por la secuencia SLPHAILRIDLA (SEQ ID NO: 26), la secuencia NES de la proteína Rev del virus HIV-1 formada por la secuencia LPPLERLTL (SEQ ID NO: 27), la secuencia NES de la proteína Rex del virus T-linfotrópico tipo 1 formada por la secuencia LSLDS (SEQ ID NO: 28), la secuencia NES de MAP quinasa quinasa específica dual 1 de Xenopus spp formada por la secuencia LQKKLEELELDEQ (SEQ ID NO: 29), la secuencia NES de la proteína sustrato 15 del receptor del factor de crecimiento epidérmico humano formada por la secuencia LELAIALSKSEI (SEQ ID NO: 30), la secuencia NES de BRCA1 humana formada por la secuencia LECPICLEL (SEQ ID NO: 31), la secuencia NES de p65 humana formada por la secuencia LSEALLQLQF (SEQ ID NO: 32), la secuencia NES del factor de crecimiento similar a AP-1 de Schizosaccharomyces spp formada por la secuencia
ESFDIDDLCSKLKNKAKCS (SEQ ID NO: 33) y la secuencia NES del factor de transcripción STAT-1 humano formada por la secuencia LLLKKMYLM (SEQ ID NO: 34).
En una realización particular, dicho cuarto polipéptido comprende la secuencia NES de survivina humana (SEQ ID NO: 17).
El experto en la materia entenderá que puede ser deseable que la proteína de fusión comprenda adicionalmente un péptido flexible que una dos dominios de manera covalente. El término "péptido flexible", "péptido espaciador", "péptido linker" o "péptido conector". según se usa en la presente descripción, se refiere a un péptido que une de manera covalente dos dominios, que no forma parte de dichos dominios, permitiendo el movimiento de un dominio con respecto del otro, sin causar sustancialmente un detrimento en la función de uno de los dominios unidos. La proteína de fusión puede comprender un péptido espaciador entre el primer y segundo dominio polipeptídico y/o un péptido espaciador entre el segundo y tercer dominio polipeptídico y/o un péptido espaciador entre el tercer y cuarto dominio polipeptídico.
El péptido flexible comprende al menos un aminoácido, al menos dos aminoácidos, al menos tres aminoácidos, al menos cuatro aminoácidos, al menos cinco aminoácidos, al menos seis aminoácidos, al menos siete aminoácidos, al menos ocho aminoácidos, al menos nueve aminoácidos, al menos 10 aminoácidos, al menos 12 aminoácidos, al menos 14 aminoácidos, al menos 16 aminoácidos, al menos 18 aminoácidos, al menos 20 aminoácidos, al menos 25 aminoácidos, al menos 30 aminoácidos, al menos 35 aminoácidos, al menos 40 aminoácidos, al menos 45 aminoácidos o aproximadamente 50 aminoácidos.
Péptidos flexibles adecuados para su uso en la presente invención se describen en el documento W02009150284. Péptidos enlazadores adecuados para su uso en la presente invención incluyen péptidos que comprenden las secuencias (Gly-Ser)n, (GlymSer)n o (SermGly)n, en donde m es 1 a 6, en particular 1 a 4 y típicamente 2a4ynes1a30o1a 10 y, típicamente, 1 a 4 y que, opcionalmente, comprenden algunos restos de glutámico (Glu) o lisina (Lys) repartidos a lo largo de la secuencia para mejorar la solubilidad (véase, por ejemplo, WO 96/06641, que proporciona ejemplos de péptidos enlazadores). Péptidos enlazadores ilustrativos incluyen, sin limitación, péptidos que comprenden la secuencia GGSSRSSSSGGGGSGGGG (SEQ ID NO: 35), GSGRSGGGGSGGGGS (SEQ ID NO: 36), EGSSGSGSESKST (SEQ ID NO: 37), EGKSSGSGSESKSTQ (SEQ ID NO: 38),
EGKSSGSGSESKVD (SEQ ID NO: 39), GSTSGSGKSSEGKG (SEQ ID NO: 40), KESGSVSSEQLAQFRSLD (SEQ ID NO: 41) y ESGSVSSEELAFRSLD (SEQ ID NO: 42). Otros ejemplos no limitativos de péptidos flexibles incluyen los siguientes: el péptido de secuencia TATPATTPTTAPTAGT (SEQ ID NO: 43); el péptido de secuencia TATPATTPTTAPTAGTTATPATTPTTAPTAGT (SEQ ID NO: 44); el péptido de secuencia GTKVHMK (SEQ ID NO: 45) formado por los residuos 53-56 y 57-59 de tetranectina (Nielsen et al., 1997, "Crystal structure of tetranectin, a trimeric plasminogen-binding protein with an alpha-helical coiled coil." FEBS Lett 412:388-396); la hebra conectora 3 de la fibronectina humana; la subsecuencia PGTSGQQPSVGQQ (SEQ ID NO: 46) correspondiente al número de aminoácidos 2037-2049 de la fibronectina, y dentro de esa subsecuencia el fragmento GTSGQ (SEQ ID NO: 47) correspondiente a los aminoácidos 2038-2042; la secuencia de 10 aminoácidos de la región de la bisagra superior de la IgG3 murina PKPSTPPGSS (SEQ ID NO: 48); el péptido de secuencia APAETKAEPMT (SEQ ID NO: 49); el péptido de secuencia GAP; el péptido de secuencia SGGSGSGGQ (SEQ ID NO: 50); y el péptido de secuencia GGSSRSSS (SEQ ID NO: 51).
En una realización particular dicha proteína de fusión comprende la secuencia mostrada en SEQ ID NO: 52.
Los dominios que forman la proteína de fusión no han de estar necesariamente dispuestos en dicho orden. Por lo tanto, realizaciones particulares de la invención incluyen cualquier combinación en el orden de la disposición relativa de dichos primero, segundo y tercer dominio polipeptídico; es decir, la invención contempla proteínas de fusión en las que el primer dominio polipeptídico está situado en posición amino-terminal respecto al segundo dominio polipeptídico y el segundo dominio polipeptídico está situado en posición amino- terminal respecto al tercer dominio polipeptídico. En otra realización particular, la invención contempla proteínas de fusión en las que el primer dominio polipeptídico está situado en posición carboxilo-terminal con respecto al segundo dominio polipeptídico y el segundo dominio polipeptídico está situado en posición carboxilo-terminal con respecto al tercer dominio polipeptídico. En otra realización particular, la invención contempla proteínas de fusión en las que el segundo dominio polipeptídico está situado en posición amino-terminal respecto al primer dominio polipeptídico y el primer dominio polipeptídico está situado en posición amino-terminal con respecto al tercer dominio polipeptídico.
En aquellas realizaciones en donde dicha proteína de fusión comprende adicionalmente un cuarto dominio polipeptídico tal y como se ha definido anteriormente, dichos primero,
segundo, tercero y cuarto dominios polipeptídicos pueden estar dispuestos en cualquier orden relativo. En una realización particular, la invención contempla proteínas de fusión en las que el primer dominio polipeptídico está situado en posición amino-terminal respecto al segundo dominio polipeptídico, el segundo dominio polipeptídico está situado en posición amino-terminal respecto al tercer dominio polipeptídico y el tercer dominio polipeptídico está situado en posición amino-terminal con respecto al cuarto dominio polipeptídico. En otra realización particular, la invención contempla proteínas de fusión en las que el primer dominio polipeptídico está situado en posición carboxilo-terminal con respecto al segundo dominio polipeptídico, el segundo dominio polipeptídico está situado en posición carboxilo- terminal con respecto al tercer dominio polipeptídico y el tercer dominio polipeptídico está situado en posición carboxilo-terminal con respecto al cuarto dominio polipeptídico.
En una realización aún más particular, el orden relativo de dichos dominios polipeptídicos es el mostrado en la secuencia SEQ ID NO: 52.
De acuerdo con la etapa (i) del primer método de la invención se proporciona una muestra que comprende al menos una célula que comprende una proteína de fusión según se ha definido anteriormente. Según esta etapa (i), dicha al menos una célula se ha modificado de forma que exprese dicha proteína de fusión. Para ello, dicha célula puede haber sido modificada genéticamente mediante la introducción de un ácido nucleico que codifique la proteína de fusión. La proteína de fusión puede ser introducida en dicha célula de forma que se exprese de manera estable o de manera transitoria. En una realización preferida de la invención, dicha célula expresa de forma transitoria dicha proteína de fusión. Con el fin de obtener una expresión estable es necesario incluir en la transfección un gen que codifique para resistencia a un determinado antibiótico o un gen reportero que permita la identificación de las células que han incorporado el ácido nucleico que codifica la proteína de fusión al genoma y diferenciarlas de las células en las que el ácido nucleico se encuentra en posición extracromosómica. El gen que permite seleccionar las células se puede aportar formando parte del mismo vector que contiene el ácido nucleico que codifica dicha proteína de fusión o, alternativamente, se puede aportar separadamente mediante co-transfección con un segundo plásmido que contiene dicho gen de resistencia. En este último caso, el vector que contiene el ácido nucleico que codifica dicha proteína de fusión se aporta a la mezcla de transfección en un exceso molar con respecto al gen de resistencia de forma que por cada evento de integración del gen de resistencia exista una alta probabilidad de integración del gen que contiene el promotor objeto de estudio. La selección de las células se puede llevar a cabo mediante cualquier proceso de selección convencional (véase por ejemplo Ausubel,
F.M. et al., Current Protocols in Molecular Biology (1997) 9.5.1-9.5.19). Métodos adecuados para la introducción de material genético en la célula o células incluyen, sin limitación, precipitación con fosfato de calcio, lipofección, bombardeo de partículas, microinyección, electroporación, sistemas de dispersión coloidal (es decir, complejos de macromoléculas, nanocápsulas, microesferas, perlas y sistemas a base de lípidos incluyendo emulsiones de aceite en agua, micelas, micelas mixtas y liposomas), etc. Estos métodos son conocidos y se describen en la bibliografía publicada de manera que permita a un experto en la técnica realizar estos métodos. En una realización preferida de la invención, la modificación de las células para que expresen la proteína de fusión se lleva a cabo mediante la técnica de lipofección. Dicha técnica está basada en la introducción del ácido nucleico que codifica la proteína de fusión en un liposoma catiónico que entra en la célula por endocitosis.
Alternativamente, la célula se puede haber obtenido mediante la introducción directa de la proteína de fusión bien mediante microinyección o bien mediante modificación de la proteína de fusión con una región polipeptídica que permite la translocación de dicho polipéptido a través de membranas biológicas. Como el experto en la materia entenderá, la obtención de la célula que expresa la proteína de fusión de la invención mediante el empleo de la técnica de microinyección de dicha proteína de fusión comprende un paso previo de expresión de dicha proteína de fusión en un sistema adecuado (por ejemplo, en una célula bacteriana) y su posterior purificación mediante cualquier método apropiado para ello conocido en el estado de la técnica. Estas secuencias son conocidas de forma genérica como "dominios de transducción de proteína" (Protein-transducing domains) o "PTDs". PTDs adecuados para su uso en la presente invención incluyen, sin limitación, polipéptidos que comprenden la región mínima de la proteína TAT de HIV formada por la secuencia de aminoácidos RKKRRQRR (residuos 49-57 de TAT) (SEQ ID NO: 53), variantes sintéticas de dicha secuencia tales como YARKARRQARR (SEQ ID NO: 54); YARAARRAARR (SEQ ID NO: 55); YARAARRAARA (SEQ ID NO: 56); YARAAARQARA (SEQ ID NO: 57), la proteína VP22 de HSV-1, polipéptidos que comprenden la secuencia RQIKIWFQNRRMKWKK (SEQ ID NO: 58), derivada de la tercera hélice del homeodominio de la proteína Antennapedia, homeodominios derivados de las proteínas Fushi tarazu (Ftz) y Engrailed (En), polilisina, poliarginina (por ejemplo, Arg9), secuencias formadas por lisina y arginina, Transportan, MAP, MTS, o PEP-1.
De acuerdo con la etapa (ii) del primer método de la invención se introduce en dicha al menos una célula un casete de expresión o un plásmido que codifica para dicha variante de CRM1 cuya función se desea analizar. La expresión "introducir en dicha al menos una célula
un casete de expresión o un plásmido que codifica para dicha variante de CRM1", tal y como se usa en la presente descripción, se refiere a un proceso para transportar dicho casete de expresión o plásmido a la célula. Dichos casete de expresión o plásmido que codifica para dicha variante de CRM1 pueden ser introducidos en dicha célula de forma que la variante de CRM1 se exprese de manera estable o de manera transitoria. Métodos apropiados para introducir un casete de expresión o un plásmido (es decir, un ácido nucleico) en una célula se han detallado en el contexto de la etapa (i) del primer método de la invención. En una realización preferida de la invención, dicha célula expresa de forma transitoria dicha variante de CRM1. En una realización más preferida de la invención, la introducción de una variante de CRM1 en dicha célula se realiza mediante lipofección.
Las características de la variante de CRM1 han sido definidas anteriormente. En una realización particular, dicha variante de CRM1 está fusionada a una secuencia que codifica para un polipéptido reportero que permite la detección y/o purificación de dicha variante. Es decir, opcionalmente dicho plásmido o dicho casete de expresión codifica para una proteína de fusión que comprende dicha variante de CRM1 y un polipéptido reportero. En una realización preferida, dicho polipéptido reportero es un grupo detectable. Los grupos detectables útiles incluyen fluoróforos. Por "fluoróforo" o "fluorocromo" o "cromóforo" se entiende un compuesto fluorescente que puede reemitir luz tras excitación lumínica. Los fluoróforos que se pueden usar incluyen fluoróforos biológicos (por ejemplo, proteínas) y químicos. Fluoróforos biológicos ilustrativos comprenden T-zafiro, Cerulean, mCFPm, CyPet, EGFP, PA-EGFP, Emerald, YFP, Venus, mCitrine, mKO, mOrange, DSRed, JRed, mStrawberry, mCherry, PA-mCherry, mRuby, Tomato, mPlum, mKate, mKatushka, Kaede, Halotag y flúor supereclíptico. Fluoróforos químicos ilustrativos comprenden Alexafluor, rodamina, BODIPY, tetrametilrodamina, colorantes de cianina, fluoresceína, puntos cuánticos, colorantes IR, colorantes FM, colorante ATTO.
En una realización todavía más preferida de la invención, dicho grupo detectable es un fluoróforo. Ejemplos ilustrativos no limitativos de fluoróforos han sido definidos anteriormente en la descripción. En una realización preferida de la invención, dicha variante de CRM1 está fusionada al fluoróforo biológico YFP. Como el experto en la materia entenderá, la proteína de fusión que comprende dicha variante de CRM1 y la proteína fluorescente YFP, puede comprender adicionalmente, un péptido enlazador entre ambas proteínas. El término "péptido enlazador" ha sido definido anteriormente y se usa de la misma manera.
En una realización todavía más preferida de la invención, dicha variante de CRM1 es CRM1 A541K fusionada al fluoróforo biológico YFP (SEQ ID NO: 59).
En una realización preferida, las etapas (i) y (ii) del primer método de la invención se llevan a cabo de manera simultánea. Es decir, de acuerdo con la presente invención la modificación de dicha al menos una célula para que exprese dicha proteína de fusión definida en la etapa (i) del primer método de la invención y la introducción en dicha al menos una célula de un casete de expresión o un plásmido que codifica para dicha variante de CRM1 tal y como se ha explicado en la etapa (ii) del primer método de la invención se llevan a cabo al mismo tiempo tal y como se muestra en el Ejemplo 2 de la presente solicitud. La modificación de dicha al menos una célula para que exprese dicha proteína de fusión y dicha variante de CRM1 se puede llevar a cabo mediante cualquiera de las técnicas detalladas en el contexto de la etapa (i) del primer método de la invención.
En una realización preferida, la transformación de dicha al menos una célula con dicha proteína de fusión y dicha variante de CRM1 se lleva a cabo mediante lipofección. En otra realización preferida, dicha al menos una célula expresa de manera transitoria ambas proteínas, la proteína de fusión y la variante de CRM1, definidas anteriormente. La expresión de proteínas simultáneamente puede llevarse a cabo mediante la utilización de un único vector de expresión que permita la expresión de dichas proteínas bajo un único promotor o bajo promotores diferentes. La expresión de proteínas simultáneamente también puede llevarse a cabo mediante la co-transfeccción de dos vectores de expresión independientes. En este último caso es deseable que cada vector de expresión constituya aproximadamente la mitad de la cantidad de ADN total transfectado; por ejemplo, se puede utilizar entre aproximadamente ente 0,1 y 3 pg de cada vector, preferiblemente 500 ng del vector de expresión que codifica para dicha proteína de fusión y 500 ng del vector que codifica para dicha variante de CRM1.
La etapa (iii) del primer método de la invención comprende crecer dicha al menos una célula bajo condiciones que permitan la correcta expresión de dicha variante de CRM1. Dichas condiciones adecuadas para la expresión de una variante de CRM1 según la invención incluyen condiciones que permiten un crecimiento óptimo de dicha al menos una célula y las que permiten la expresión de la variante de CRM1 en dicha al menos una célula. El experto en la materia sabrá qué tipo de condiciones son las óptimas para cada tipo celular donde se exprese la variante de CRM1. Se elegirán los medios y condiciones apropiadas para el crecimiento óptimo de dicha al menos una célula y para la correcta expresión de la variante
de CRM1; dichos medios y condiciones de cultivo son ampliamente conocidos por los expertos en la materia. La elección de dichos medios y condiciones de cultivo dependerá del tipo celular elegido para la expresión de la variante de CRM1. En aquellas realizaciones en donde las etapas (i) y (ii) se llevan a cabo simultáneamente, las condiciones de esta etapa
(iii) también se referirán a condiciones apropiadas para la expresión de la proteína de fusión.
En una forma de realización preferida, las células transformadas con dicha variante de CRM1 son de la línea celular 293T. Dichas células son transformadas con un plásmido que codifica para dicha variante de CRM1, preferiblemente para una proteína de fusión que comprende la variante de CRM1 fusionada a YFP. Las condiciones óptimas para el crecimiento celular y la expresión de dicha variante de CRM1 son, por ejemplo, esas en donde las células crecen en condiciones de saturación de C02 de aproximadamente el 5% y a una temperatura aproximada de 37°C durante un periodo de tiempo entre 24 y 72 horas. Estas condiciones también son óptimas para la expresión de la proteína de fusión.
Con el fin de comprobar si dicha variante de CRM1 se expresa correctamente, el experto en la materia puede utilizar cualquier método conocido que permita determinar la expresión de una proteína. La determinación de los niveles de expresión de las proteínas se puede llevar a cabo mediante técnicas inmunológicas tales como por ejemplo, ELISA,
inmunotransferencia o inmunofluorescencia. La inmunotransferencia se basa en la detección de proteínas previamente separadas mediante electroforesis en gel en condiciones desnaturalizantes e inmovilizadas en una membrana, generalmente nitrocelulosa, mediante incubación con un anticuerpo específico y un sistema de revelado (por ejemplo, quimioluminiscencia). El análisis mediante inmunofluorescencia requiere el uso de un anticuerpo específico para la proteína diana para el análisis de la expresión. El ELISA está basado en el uso de antígenos o anticuerpos marcados con enzimas de modo que los conjugados formados entre el antígeno diana y el anticuerpo marcado dan como resultado la formación de complejos enzimáticamente activos. Puesto que uno de los componentes (el antígeno o el anticuerpo marcado) están inmovilizados sobre un soporte, los complejos antígeno-anticuerpo están inmovilizados sobre el soporte y de esta manera, se pueden detectar mediante la adición de un sustrato que es convertido por la enzima en un producto que es detectable mediante, por ejemplo, espectrofotometría o fluorometría. Cuando se usa un método inmunológico, se puede usar cualquier anticuerpo o reactivo que se sabe se une a las proteínas diana con alta afinidad para detectar la cantidad de proteínas diana. Sin embargo, se prefiere el uso de un anticuerpo, por ejemplo sueros policlonales, sobrenadantes de hibridomas o anticuerpos monoclonales, fragmentos de anticuerpos, Fv,
Fab, Fab y F(ab)2, scFv, diacuerpos, triacuerpos, tetracuerpos y anticuerpos humanizados. También es frecuente usar un control de fondo.
En una realización preferida de la invención, cuando la variante de CRM1 está fusionada a un fluoróforo (por ejemplo, YFP) la determinación de la correcta expresión de la variante de CRM1 se lleva a cabo mediante visualización directa de la fluorescencia tal y como muestra el Ejemplo 2 de la presente solicitud.
La etapa (iv) del primer método de la invención comprende detectar la señal del dominio reportero de dicha proteína de fusión que comprende la variante de survivina. El polipéptido reportero permite la detección y/o purificación de dicha proteína de fusión. Virtualmente, se puede usar cualquier método convencional para detectarla, por ejemplo mediante inmunotransferencia o inmunofluorescencia. La inmunofluorescencia (IF) es una técnica basada en microscopía de fluorescencia utilizada principalmente para testar muestras biológicas. Esta técnica usa la especificidad de los anticuerpos hacia su antígeno lo que permite la visualización de la molécula diana en la muestra. Se puede usar IF en líneas cultivadas o en células individuales, y se puede usar para analizar la distribución de proteínas, glicanos y pequeñas moléculas biológicas y no biológicas. Además, también se puede usar IF en combinación con otros métodos de tinción fluorescente no de anticuerpos, tales como por ejemplo DAPI, para marcar ADN. Se puede usar más de un anticuerpo al mismo tiempo para detectar, por ejemplo más de una proteína. Se pueden usar varios diseños de microscopio para el análisis de muestras de IF, tal como el microscopio de epifluorescencia y el microscopio confocal. También se pueden usar varios diseños de microscopio de super-resolución cuya capacidad de resolución es mucho mayor.
En una realización preferida de la invención, la etapa (iv) del primer método de la invención comprende detectar el epítopo flag. La detección de dicho epítopo flag puede llevarse a cabo mediante la técnica de inmunofluorescencia indirecta mediante el empleo de un anticuerpo primario específico que reconozca dicho epítopo y el empleo de un anticuerpo secundario específico para dicho anticuerpo primario acoplado a un grupo detectable. Si se desea, la señal de fluorescencia puede ser cuantificada. Por ejemplo, dicha al menos una célula que expresa la proteína de fusión según se ha definido en la presente invención, se puede fijar con una solución de formaldehido (2-4%) y permeabilizar con Tx-100 al 0,1- 0,3%. La detección de la señal del dominio reportero puede llevarse a cabo mediante la incubación de la célula con un anticuerpo específico primario que reconozca el epítopo flag (por ejemplo, Flag M2, Sigma) seguido de la incubación con un anticuerpo específico
secundario que reconozca dicho anticuerpo primario marcado con un fluoróforo, por ejemplo AlexaFluor594 (Invitrogen). En una realización preferida de la invención, la detección de dicha señal del dominio polipeptídico reportero se realiza al mismo tiempo que se detecta la correcta expresión de la variante de CRM1.
Opcionalmente, esta etapa (iv) comprende detectar una estructura o compartimento celular (por ejemplo, el núcleo, retículo endoplasmático, aparato de Golgi, mitocondrias etc.) que puede tomarse como referencia y facilite la determinación subcelular de la proteína de fusión en la etapa (v) del presente método. Así en una realización todavía más preferida de la invención, esta etapa (iv) comprende la tinción del núcleo celular mediante el empleo de cualquier colorante apropiado para ello, por ejemplo DAPI o el colorante Hoescht. El experto en la materia entenderá que para la detección simultánea de dos o más proteínas en una célula es necesario emplear fluoróforos de colores distintos para que los espectros de emisión de los mismos no solapen. El Ejemplo 2 de la solicitud muestra la detección simultánea de la proteína de fusión definida en la primera etapa del primer método de la invención mediante el empleo de un anticuerpo secundario unido a un fluoróforo, cuyo espectro de emisión está localizado en la región roja del espectro visible; y de la variante de CRM1 expresada como una proteína de fusión que comprende dicha variante de CRM1 y la proteína fluorescente YFP cuyo espectro de emisión está localizado en la zona amarilla del espectro visible.
La etapa (v) del primer método de la invención comprende determinar la localización subcelular de la proteína de fusión definida en la etapa (i) de dicho primer método de la invención. El término "localización subcelular" según se usa en la presente descripción, se refiere a la ubicación de dicha proteína de fusión en un compartimento celular. El término "compartimento celular" tal y como se utiliza en la presente descripción, se refiere a las partes cerradas dentro del citosol de una célula eucariota normalmente rodeadas por una membrana lipídica de capa única o doble capa. La mayoría de los orgánulos celulares son compartimentos celulares: mitocondrias, cloroplastos (en células vegetales), peroxisomas, liposomas, retículo endoplasmático, aparato de Golgi y núcleo celular. La determinación de la localización subcelular de dicha proteína de fusión se lleva a cabo analizando la señal del dominio polipeptídico reportero detectada en la etapa (iv) del primer método de la invención mediante cualquier técnica apropiada para ello, preferiblemente mediante inmunofluorescencia. Por lo tanto, si la señal del dominio polipeptídico reportero se detecta en el interior del compartimento nuclear entonces la localización subcelular de la proteína de
fusión es nuclear; si la señal del dominio polipeptídico reportero se detecta en el citoplasma, entonces la localización subcelular de la proteína de fusión es citoplasmática.
La proteína de fusión definida en la etapa (i) del primer método de la invención comprende secuencias de localización, NLS y NES que determinan la localización subcelular de dicha proteína. En una realización particular de la invención, la proteína de fusión según se ha definido en la etapa (i) del primer método de la invención, comprende un dominio polipeptídico que comprende una señal NES, preferiblemente la señal NES de survivina, y dos dominios polipeptídicos en donde cada uno de dichos dos dominios comprende una señal NLS, preferiblemente la señal NLS del antígeno T del virus SV40. En esta forma de realización, la localización subcelular de la proteína de fusión es nuclear.
La etapa (vi) del primer método de la invención comprende comparar la localización subcelular de la proteína de fusión determinada en la etapa (v) de dicho primer método con dicha localización subcelular obtenida para dicha proteína de fusión en una muestra de referencia. El término "muestra de referencia" tal y como se utiliza en el presente documento, se refiere a una muestra que comprende al menos una célula que comprende: a) la proteína de fusión según se ha definido en la etapa (i) del primer método de la invención y b) CRM1 o una variante de CRM1 cuya capacidad de unión a secuencias NES no está alterada. Técnicas para determinar si CRM1 es capaz de unir secuencias NES son conocidas en el estado de la técnica. Ilustrativamente dichas técnicas incluyen, pero no están limitadas a, ensayos in vitro que permiten la reconstitución in vitro de un complejo de exportación formado por CRM1 y RanGTP y en los que se determina dicha interacción mediante ensayos basados en la cuantificación de la hidrólisis de GTP (Askjaer et al., Mol. Cell Biol., 19: 6276-6285). Otros métodos conocidos en el estado de la técnica apropiados para determinar si dicha variante de CRM1 no tiene alterada la capacidad de interaccionar con secuencias NES incluyen pero no están limitados a ensayos de cromatografía de afinidad, pulí down, inmunoprecipitación, colocalización etc.
En una realización preferida de la invención, dicha muestra de referencia comprende la proteína CRM1. En una realización todavía más preferida de la invención, dicha CRM1 es CRM1 humana.
En esta etapa (vi) dicha muestra de referencia es una muestra que comprende al menos una célula que comprende una proteína de fusión según se ha definido anteriormente y CRM1 o una variante de la misma con capacidad de unión a secuencias NES. Por lo tanto, dicha al
menos una célula se ha modificado genéticamente de forma que exprese dichas proteínas. Métodos adecuados para la introducción de material genético en una célula han sido detallados en el contexto de la etapa (i) del primer método de la invención. En una realización preferida de la invención, dicha muestra de referencia comprende al menos una célula que expresa de forma transitoria dichas proteínas. En una realización aún más preferida de la invención, la modificación de dicha célula para que exprese dichas proteínas se lleva a cabo mediante la técnica de lipofección.
Tal y como se ha explicado anteriormente, es necesario proporcionar condiciones adecuadas que permitan la expresión de dichas proteínas en la muestra de referencia. Condiciones adecuadas para la correcta expresión de la proteína de fusión y CRM1 o de una variante de CRM1 han sido detalladas en la etapa (ii) del primer método de la invención. En una forma de realización preferida, las células transformadas con dicha CRM1 son de la línea celular 293T. Con el fin de comprobar si dichas proteínas se expresan correctamente, el experto en la materia puede utilizar cualquier método conocido que permita determinar la expresión de una proteína. En una realización preferida de la invención, dicha CRM1 o variante de CRM1 con capacidad de unión a secuencias NES comprende, adicionalmente, una secuencia que codifica para un polipéptido reportero que permite la detección y/o purificación de dicha variante. En una realización todavía más preferida, dicho grupo detectable es un fluoróforo. Ejemplos ilustrativos no limitativos de fluoróforos han sido mencionados anteriormente en la descripción. En una realización preferida de la invención, dicha CRM1 o dicha variante de CRM1 con capacidad de unión a secuencias NES está fusionada al fluoróforo biológico YFP. Como el experto en la materia entenderá, la proteína de fusión, que comprende dicha CRM1 o dicha variante de CRM1 con capacidad de unión a secuencias NES y la proteína fluorescente YFP, puede comprender adicionalmente, un péptido enlazador entre ambas proteínas. En una realización todavía más preferida, dicha muestra de referencia comprende la proteína CRM1 fusionada a YFP que comprende la secuencia de aminoácidos mostrada en la SEQ ID NO: 60.
La etapa (vi) del primer método de la invención comprende detectar la señal del dominio polipeptídico reportero de la proteína de fusión en la muestra de referencia. Métodos para detectar dicha señal han sido detallados en el contexto de la etapa (iv) del primer método de la invención. En una realización preferida de la invención, el método empleado es inmunofluorescencia.
Preferiblemente el método empleado en la etapa (iv) de dicho primer método de la invención para detectar la señal del dominio polipeptídico reportero de la proteína de fusión en la muestra problema y el método empleado en la etapa (vi) para detectar la señal del dominio reportero de dicha proteína de fusión en la muestra de referencia es el mismo. En una realización preferida, el método empleado en las etapas (iv) y (vi) para detectar la señal del dominio polipeptídico reportero de la proteína de fusión en la muestra problema y en la muestra de referencia, de acuerdo al primer método de la invención es inmunofluorescencia.
La etapa (vi) del primer método de la invención comprende comparar la localización subcelular de la proteína de fusión definida anteriormente en la muestra que comprende al menos una célula en donde se desea determinar si CRM1 es funcional con la señal obtenida en una muestra de referencia que comprende CRM1 o una variante de CRM1 cuya capacidad de unión a secuencias NES no está alterada. Así, una alteración de la localización de dicha proteína de fusión es indicativa de una función alterada de CRM1.
Tal y como se ha detallado anteriormente en la etapa (i) del primer método de la invención, la proteína de fusión se localiza en el núcleo de la célula debido a que las señales NLS la dirigen hacia dicho compartimento celular. En presencia de la proteína CRM1 o de la variante de CRM1 en dicha muestra de referencia, la localización de la proteína de fusión será citoplasmática debido a que la capacidad de exportación de CRM1 o de dicha variante en la muestra de referencia está intacta. Por lo tanto, en la muestra de referencia la proteína de fusión se transporta desde el núcleo hacia el citoplasma.
La expresión "alteración de la localización subcelular de la proteína de fusión", tal y como se utiliza en el presente documento, hace referencia a que la localización subcelular de dicha proteína de fusión es una localización subcelular distinta a la que ocupa en dicha muestra de referencia. En una realización particular de la invención, dicha alteración de la localización de la proteína de fusión se refiere a que, en presencia de la variante de CRM1 cuya función se desea determinar, la localización de la proteína de fusión es nuclear.
El primer método de la invención puede llevarse a cabo, ilustrativamente, tal y como se muestra en el Ejemplo 2 del presente documento.
Método para identificar un compuesto con capacidad de modular la función de CRM1
El diseño de la proteína de fusión que han desarrollado los inventores con capacidad de relocalizar al citoplasma en respuesta a una sobreexpresión de CRM1 funcional permite también la identificación de compuestos que modulen la función exportadora de CRM1.
Por lo tanto, en un segundo aspecto inventivo, la invención se refiere a un método, de aquí en adelante "segundo método de la invención", para identificar un compuesto con capacidad de modular la función de CRM1 o de una variante funcionalmente equivalente de la misma en una muestra que comprende al menos una célula, comprendiendo dicho método:
(i) poner en contacto un compuesto candidato con una muestra que comprende al menos una célula en donde dicha al menos una célula comprende:
a) una proteína de fusión que comprende:
1) un primer dominio polipeptídico que comprende una variante de survivina seleccionada entre:
- una variante de survivina que carece de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional; y
- una variante de survivina que carece de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional y comprende una señal de exportación nuclear (NES) de survivina;
2) al menos, un segundo dominio polipeptídico que comprende una señal de localización nuclear (NLS); y
3) al menos, un tercer dominio polipeptídico reportero;
en donde si la variante de survivina carece de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además
4) un cuarto dominio polipeptídico que comprende una NES;
b) un casete de expresión o un plásmido que codifica para dicha CRM1 o dicha variante funcionalmente equivalente de la misma; y
(ii) detectar la señal del dominio reportero de dicha proteína de fusión;
(iii) determinar la localización subcelular de dicha proteína de fusión; y
(iv) comparar la localización subcelular de dicha proteína de fusión obtenida en la etapa (iii) con la localización subcelular de dicha proteína de fusión obtenida en una muestra que comprende al menos una célula que no ha sido tratada con dicho compuesto;
en donde una alteración de la localización subcelular de la proteína de fusión detectada en la etapa (iii) con respecto a dicha localización en dicha muestra no tratada es indicativa de
que dicho compuesto es capaz de modular la función de CRM1 o de una variante funcionalmente equivalente de la misma.
El término "variante funcionalmente equivalente de CRM1" tal y como se utiliza en el presente documento, se refiere a todos aquellos polipéptidos derivados de la secuencia de CRM1 mediante modificación, inserción y/o deleción de uno o más aminoácidos siempre y cuando se mantenga sustancialmente la función de la proteína CRM1. En concreto, las variantes funcionalmente equivalentes mantendrán la capacidad de unión a secuencias NES. También serán variantes funcionalmente equivalentes de CRM1 aquellas con capacidad de exportar macromoléculas desde el núcleo al citoplasma. Si se desea, la capacidad de exportar macromoléculas (por ejemplo, proteínas) desde el núcleo al citoplasma para determinar si una variante de CRM1 es una variante funcionalmente equivalente de la misma puede ser determinada mediante el primer método de la invención. Métodos para determinar la unión de CRM1 a secuencias NES son conocidos en el estado de la técnica y se han detallado en el contexto del primer método de la invención.
Variantes funcionalmente equivalentes de CRM1 incluyen aquellas que muestran al menos un 25%, al menos 40%, al menos 60%, al menos 70%, al menos 80%, al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad de secuencia de aminoácidos con respecto a la secuencia de CRM1 indicada anteriormente en el contexto del primer método de la invención. El grado de identidad entre dos secuencias de aminoácidos puede determinarse por métodos convencionales mencionados en el contexto del primer método de la invención. El experto en la materia entenderá que las secuencias de aminoácidos a las que se hace referencia en esta descripción pueden estar modificadas químicamente, por ejemplo, mediante modificaciones químicas que son fisiológicamente relevantes, tales como, fosforilaciones, acetilaciones, etc.
La expresión "compuesto con capacidad de modular la función de CRM1 o de una variante funcionalmente equivalente de la misma" tal y como se usa en el presente documento, se refiere a cualquier compuesto que se une específicamente a CRM1 (o a la variante funcionalmente equivalente de la misma) y que al unirse es capaz de causar una alteración en la función de dicha proteína con respecto a un valor de referencia. En una realización preferida, dicha alteración en la función de CRM1 se refiere a la inhibición de la función de CRM1. Como el experto en la materia entenderá, la alteración en la función de dicha proteína puede llevar asociado una alteración en el nivel de ARNm o de proteína CRM1 con respecto a un valor de referencia.
La etapa (i) del segundo método de la invención comprende poner en contacto un compuesto candidato con una muestra que comprende una al menos una célula que comprende una proteína de fusión, en donde dicha proteína de fusión ha sido definida anteriormente en el contexto del primer método de la invención.
El término "poner en contacto" un compuesto candidato con dicha muestra, tal y como se utiliza en la presente descripción, se refiere a cualquier posible forma de llevar dicho compuesto candidato hasta el interior de la célula que expresa dicha proteína de fusión y dicha CRM1 o una variante funcionalmente equivalente de la misma. En caso de que el compuesto candidato sea una molécula de bajo peso molecular, es suficiente con añadir dicha molécula al medio de cultivo. El término "compuesto de bajo peso molecular", tal y como se usa en el presente documento se refiere a compuestos cuyo peso molecular es de aproximadamente, igual o menor a 900 Daltons. Ejemplos ilustrativos no limitativos de dichos compuestos incluyen compuestos naturales como, por ejemplo, metabolitos secundarios tales como alcaloides, glicósidos, lípidos, péptidos no ribosomales, fezaninas, fenoles naturales (incluyendo flavonoides), poliquétidos, terpenos, tetrapirroles etc., y compuestos artificiales como fármacos sintetizados mediante síntesis química.
En caso de que el compuesto candidato sea una molécula de alto peso molecular (por ejemplo polímeros biológicos tales como un ácido nucleico o una proteína), es necesario aportar los medios para que dicha molécula pueda acceder al interior celular. El término "compuesto de alto peso molecular tal y como se usa en la presente descripción, se refiere a compuestos cuyo peso molecular es, aproximadamente, mayor a 900 Daltons. En caso de que el compuesto candidato sea una proteína, la célula puede ponerse en contacto tanto con la proteína como con el ácido nucleico que la codifica acoplado a elementos que permitan su transcripción/traducción una vez que se encuentre en el interior celular. Para ello se puede emplear cualquiera de los métodos mencionados anteriormente en el contexto del primer método de la invención.
El compuesto a ensayar puede encontrarse aislado o formando parte de una mezcla más o menos compleja, bien derivada de una fuente natural, o bien formando parte de una biblioteca de compuestos. Ejemplos de bibliotecas de compuestos que pueden ser ensayadas según el método de la presente invención incluyen, sin limitación, bibliotecas de péptidos incluyendo tanto péptidos como análogos peptídicos que comprenden D-amino ácidos o péptidos que comprenden enlaces no peptídicos, bibliotecas de ácidos nucleicos
incluyendo ácidos nucleicos con enlaces no fosfodiéster del tipo de fosforotioato o ácidos nucleicos peptídicos, bibliotecas de anticuerpos, de carbohidratos, de compuestos de bajo peso molecular, preferiblemente moléculas orgánicas, de peptidomiméticos, y similares. En el caso de que se use una biblioteca de compuestos orgánicos de bajo peso molecular, la biblioteca puede haber sido preseleccionada para que contenga compuestos que puedan acceder al interior celular con mayor facilidad. Así, los compuestos se pueden seleccionar en base a determinados parámetros tales como tamaño, lipofilicidad, hidrofilicidad, capacidad de formar puentes de hidrógeno, etc.
En caso de que el compuesto candidato se encuentre formando parte de una mezcla de mayor o menor complejidad, el método de la invención comprende adicionalmente una o varias etapas de fraccionamiento de la mezcla ensayada y la repetición de los pasos (i) a (iv) con cada una de las fracciones obtenidas hasta que se aísla el compuesto en la mezcla con capacidad de modular la función de CRM1 o una variante funcionalmente equivalente de la misma. Métodos para el fraccionamiento de compuestos presentes en una mezcla incluyen cromatografía (en capa fina, de gases o de exclusión molecular en gel, de afinidad), cristalización, destilación, filtración, precipitación, sublimación, extracción, evaporación, centrifugación, espectrometría de masas, adsorción y similares. Alternativamente, los compuestos a ensayar pueden estar formando parte de un extracto obtenido de una fuente natural. La fuente natural puede ser animal, vegetal obtenido de cualquier entorno, incluyendo, sin limitación, extractos de organismos terrestres, aéreos, marinos y similares.
El término "muestra" así como las realizaciones particulares de la muestra empleada en la presente invención, han sido definidos anteriormente en el primer método de la invención y se usan de la misma manera en este segundo aspecto.
El término "proteína de fusión" ha sido definido en el contexto del primer método de la invención y se usa de la misma manera en este segundo método de la invención. Las características de cada uno de los dominios polipeptídicos de la proteína de fusión definida en la etapa (i) del segundo método de la invención y las realizaciones particulares de dichos dominios polipeptídicos, han sido detalladas en la etapa (i) del primer método de la invención y se aplican aquí de igual manera.
En la etapa (i) del segundo método de la invención se pone en contacto el compuesto candidato con una muestra que comprende al menos una célula que comprende una proteína de fusión según se ha definido anteriormente y un casete de expresión o un
plásmido que codifica para CRM1 o una variante funcionalmente equivalente de la misma. Según esta etapa (i), dicha al menos una célula se ha modificado de forma que expresa dicha proteína de fusión y dicha CRM1 (o una variante funcionalmente equivalente de la misma). Métodos adecuados para modificar dicha al menos una célula para que exprese dicha proteína de fusión han sido detallados en el contexto del primer método de la invención. Dichos métodos son igualmente aplicables para la transfección de dicha al menos una célula con un casete de expresión o un plásmido que codifica para dicha CRM1 o una variante funcionalmente equivalente de la misma. En una realización preferida de la invención, dicha célula expresa de forma transitoria ambas proteínas. Técnicas apropiadas para la expresión transitoria de proteínas han sido detalladas en el contexto del primer método de la invención. El experto en la materia entenderá que en otras realizaciones de la invención, puede ser deseable que la expresión de dicha proteína de fusión y dicha CRM1 o una variante funcionalmente equivalente de la misma sea estable.
Tal y como se ha explicado en la etapa (iii) del primer método de la invención, dicho plásmido o dicho casete de expresión codifica para una proteína de fusión comprende dicha CRM1 o dicha variante funcionalmente equivalente de la misma, fusionada a un polipéptido reportero, preferiblemente un grupo detectable, aún más preferiblemente dicha CRM1 o una variante funcionalmente equivalente de la misma está fusionada al fluoróforo biológico YFP.
La etapa (ii) del segundo método de la invención comprende detectar la señal del dominio polipeptídico reportero de dicha proteína de fusión. Condiciones y métodos apropiados para la detección de dicho dominio polipeptídico reportero se han descrito en detalle en el primer método de la invención y se aplican aquí de igual manera. Opcionalmente, dicha etapa comprende la detección de una estructura celular o de un compartimento celular (por ejemplo, el núcleo celular) que puede ser utilizado como referencia para determinar la localización subcelular de la proteína de fusión en la etapa (iii) del segundo método de la invención.
La etapa (iii) del segundo método de la invención comprende determinar la localización subcelular de la proteína de fusión. El término "localización subcelular" ha sido definido en el primer método de la invención y se usa aquí de igual manera. La determinación de la localización subcelular de dicha proteína de fusión se lleva a cabo analizando la señal del dominio reportero detectada en la etapa (ii) del segundo método de la invención mediante cualquier técnica apropiada para ello, preferiblemente mediante inmunofluorescencia. Por lo tanto, si la señal del dominio polipeptídico reportero se detecta en el interior del
compartimento nuclear entonces la localización subcelular de la proteína de fusión es nuclear; Por el contrario, si la señal del dominio polipeptídico reportero se detecta en el citoplasma, entonces la localización subcelular de la proteína de fusión es citoplasmática.
La etapa (iv) del segundo método de la invención comprende comparar la localización subcelular de la proteína de fusión determinada en la etapa (iii) de dicho método con dicha localización subcelular obtenida para dicha proteína de fusión en una muestra que comprende al menos una célula que no ha sido tratada con dicho compuesto. El término "muestra que no ha sido tratada" tal y como se utiliza en el presente documento, se refiere a una muestra que comprende al menos una célula en donde dicha al menos una célula comprende dicha proteína de fusión y dicho casete o plásmido que codifica para CRM1 o una variante funcionalmente equivalente de la misma definidas en la primera etapa del segundo método de la invención, con la particularidad de que dicha muestra no se pone en contacto con el compuesto candidato que se desea analizar.
La modificación de dicha al menos una célula en la muestra no tratada para que exprese dichas proteína de fusión y CRM1, o una variante funcionalmente equivalente de la misma, puede llevarse a cabo empleando cualquier método del estado de la técnica apropiado para ello tal y como se ha detallado en el contexto del primer método de la invención.
Preferiblemente la muestra no tratada será de la misma naturaleza que la muestra que se pone en contacto con el compuesto candidato. Por ejemplo, si la muestra que se pone en contacto con el compuesto candidato es una población de células 293T entonces la muestra no tratada también es una población de células 293T, preferiblemente ambas muestras tendrán aproximadamente el mismo número de células y serán sometidas a las mismas condiciones de cultivo. Si se desea, la modificación de dicha al menos una célula de la muestra no tratada y de la muestra a analizar puede llevarse a cabo simultáneamente. Preferiblemente, se emplea la misma técnica para la transformación celular y bajo las mimas condiciones. Por ejemplo, si la muestra que va a ser tratada con el compuesto candidato se transfecta mediante lipofección con entre aproximadamente ente 0,1 y 3 ^g de cada vector, preferiblemente 500 ng del vector de expresión que codifica para dicha proteína de fusión y 500 ng del vector que codifica para dicha CRM1, entonces preferiblemente, la muestra que no va a ser tratada se transfecta con dichas mismas cantidades de cada plásmido.
La detección del dominio reportero de la proteína de fusión en la muestra que no ha sido tratada puede llevarse a cabo por cualquier técnica apropiada para ello. Preferiblemente, se
lleva a cabo empleando la misma técnica empleada para la detección del dominio polipeptídico reportero en la muestra que se pone en contacto con el compuesto candidato. La detección del dominio polipeptídico reportero de la proteína de fusión puede llevarse a cabo en paralelo en la muestra tratada con el compuesto candidato y en la muestra no tratada. Tras la detección del dominio polipeptídico reportero en la muestra tratada con el compuesto candidato y en la muestra no tratada, la etapa (iv) del segundo método de la invención comprende comparar la localización subcelular de dicha proteína de fusión en ambos tipos de muestra.
Como se ha explicado anteriormente en el contexto del primer método de la invención, si dicha al menos una célula de la muestra que se está analizando expresa la proteína CRM1 funcional, entonces la localización subcelular de la proteína de fusión es citoplasmática puesto que dicha exportina reconoce a la proteína de fusión a través de la secuencia NES, preferiblemente la secuencia NES de survivina humana, y en asociación con una GTPasa transporta dicha proteína desde el núcleo hacia el citoplasma. Por lo tanto, de acuerdo con el segundo método de la invención, la localización subcelular de la proteína de fusión en la muestra no tratada es citoplasmática. Una alteración de la localización citoplasmática de la proteína de fusión en la muestra tratada es indicativa de que dicho compuesto podría impedir el correcto desarrollo de la función de CRM1 o de una variante equivalente de la misma, es decir de la podría modular la función de CRM1 o de dicha variante equivalente de la misma.
Proteína de fusión de la invención
Los autores de la presente invención han diseñado una proteína de fusión que actúa como un biosensor indicador de la actividad exportadora de la exportina CRM1.
Por lo tanto, en un tercer aspecto, la invención se relaciona con una proteína de fusión que comprende:
(i) un primer dominio polipeptídico que comprende una variante de survivina seleccionada entre:
a) una variante de survivina que carece de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional; y
b) una variante de survivina que carece de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional y comprende la señal de exportación nuclear (NES) de survivina
(ii) al menos, un segundo dominio polipeptídico que comprende una señal de localización nuclear (NLS); y
(iii) al menos, un tercer dominio polipeptídico reportero;
en donde si la variante de survivina carece de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además
(iv) un cuarto dominio polipeptídico que comprende una NES.
El término "proteína de fusión", "dominio polipeptídico" y métodos para generar una proteína de fusión se han mencionado anteriormente y se usan de la misma manera en este tercer aspecto inventivo.
El primer, segundo, tercer y cuarto dominio polipeptídico de la proteína de fusión de la invención así como las realizaciones particulares de los mismos han sido detallados en el contexto del primer método de la invención y se aplican aquí de igual manera.
Tal y como se ha detallado en el primer y segundo aspecto inventivo, la proteína de fusión de la invención es útil para determinar si la función de una variante de CRM1 en una muestra está alterada y/o para identificar un compuesto con capacidad de modular la función de CRM1 o de una variante equivalente de la misma. Por lo tanto, en otro aspecto la invención se relaciona con el uso de la proteína de fusión de la invención para determinar si la función de una variante de CRM1 en una muestra está alterada y/o para identificar un compuesto con capacidad de modular la función de CRM1 o de una variante funcionalmente equivalente de la misma.
Ácidos nucleicos, casetes de expresión y vectores de la invención
En otro aspecto, la presente invención se relaciona con un ácido nucleico que codifica para la proteína de fusión de la invención y de cualquiera de sus realizaciones. El término "ácido nucleico", según se usa en la presente descripción, se refiere a polímeros formados por la
repetición de monómeros llamados nucleótidos, unidos mediante enlaces fosfodiéster. En una realización particular, dicho ácido nucleico comprende la secuencia de nucleótidos mostrada en SEQ ID NO: 61.
Dicho ácido nucleico de la invención puede incorporar, operativamente unida, una secuencia reguladora de la expresión de las secuencias de nucleótidos que codifican para la proteína de fusión de la invención, constituyendo de este modo una construcción génica. Según se utiliza en el presente documento, la expresión "operativamente unida" significa que el polipéptido de la proteína de fusión codificado por la secuencia de ácido nucleico de la invención, es expresado en el marco de lectura correcto bajo el control de las secuencias de control o reguladoras de expresión. Por tanto, en otro aspecto, la invención proporciona un casete de expresión que comprende la construcción génica de la invención operativamente unida a una secuencia de control de expresión. La construcción génica de la invención puede obtenerse mediante el empleo de técnicas ampliamente conocidas en el estado de la técnica [Sambrook et al., "Molecular cloning, a Laboratory Manual", 2nd ed., Coid Spring Harbor Laboratory Press, N.Y., 1989 Vol 1-3].
Las secuencias de control son secuencias que controlan y regulan la transcripción y, en su caso, la traducción de dicha proteína de fusión, e incluyen secuencias promotoras, secuencias codificantes para reguladores transcripcionales, secuencias de unión a ribosomas (RBS) y/o secuencias terminadoras de transcripción. El casete de expresión de la presente invención puede incluir además un potenciador, que puede estar adyacente o distante a la secuencia del promotor y puede funcionar aumentando la transcripción a partir del mismo. Dicha secuencia de control de expresión es funcional en células y organismos eucariotas, por ejemplo, células de insecto, células vegetales, células de mamífero, etc.
Se puede usar cualquier promotor disponible en la presente metodología. En una forma de
realización preferida de la presente invención, el promotor utilizado para la construcción de
ácido nucleico de la presente invención es activo en la población celular específica
transformada. Ejemplos ilustrativos, no limitativos, de promotores ubicuos que pueden estar
presentes en el casete de expresión proporcionado por esta invención incluyen el promotor
de citomegalovirus humano (hCMV), el promotor de SV40, el promotor para EF1-alfa, y el
promotor de ubiquitina C. Ejemplos ilustrativos, no limitativos, de promotores específicos de
tipo celular y/o específicos de tejido incluyen promotores tales como albúmina que es
específico de hígado [Pinkert et al., (1987) Genes Dev. 1:268-277], promotores linfoides
específicos [Caíame et al.] (1988) Adv. Immunol. 43:235-275]; en particular promotores de
los receptores de células T [Winoto et al., (1989) EMBO J. 8:729-733] e inmunoglobulinas; [Banerji et al. (1983) Cell 33729-740], promotores específicos de neuronas tal como el promotor de neurofilamentos [Byrne et al. (1989) Proc. Nati. Acad. Sci. USA 86:5473-5477], promotores específicos de páncreas [Edlunch et al. (1985) Science 230:912-916] o promotores específicos de glándula mamaria tal como el promotor de suero de leche (patente de EE UU No. 4.873.316 y publicación de solicitud europea No. 264.166). El casete de expresión CAG-GS está compuesto de un elemento del enhancer CMV, el promotor de la (3-actina de pollo y el elemento regulador postranscripcional (WPRE) del virus de la hepatitis de marmota (Woodchuck Hepatitis Virus, WHP) [Niwa et al. (1991) Gene 108: 193-9]. La combinación del promotor y este elemento favorece unos niveles de expresión del transgen in vivo altos.
Ventajosamente, dicho casete de expresión comprende, además, un marcador o gen que codifica para un motivo o para un fenotipo que permita la selección de la célula hospedadora transformada con dicho casete de expresión. Ejemplos ilustrativos de dichos marcadores que podrían estar presentes en el casete de expresión de la invención incluyen genes de resistencia a antibióticos, genes de resistencia a compuestos tóxicos, y, en general, todos aquellos que permitan seleccionar a las células manipuladas genéticamente.
La construcción génica de la invención, o el casete de expresión proporcionado por esta invención, puede ser insertada en un vector apropiado. Así, en otro aspecto, la invención se relaciona con un vector, tal como un vector de expresión, que comprende dicha construcción de génica de la invención o dicho casete de expresión. La elección del vector dependerá de la célula hospedadora en la que se va a introducir posteriormente. A modo ilustrativo, el vector donde se introduce dicha secuencia de ácido nucleico puede ser un plásmido o un vector que, cuando se introduce en una célula hospedadora, se integra o no en el genoma de dicha célula. La obtención de dicho vector puede realizarse por métodos convencionales conocidos por los técnicos en la materia [Sambrook et al., 1989, citado supra]. En una realización particular, dicho vector recombinante es un vector útil para transformar células animales.
Dicho vector puede ser utilizado para transformar, transfectar o infectar células eucariotas susceptibles de ser transformadas, transfectadas o infectadas por dicho vector. Por tanto, en otro aspecto, la invención se relaciona con una célula hospedadora transformada, transfectada o infectada con un vector proporcionado por esta invención. Dicha célula
transformada, transfectada o infectada comprende, por tanto, una construcción génica de la invención, o bien dicho casete de expresión o vector proporcionado por esta invención.
Células transformadas, transfectadas o infectadas pueden ser obtenidas por métodos convencionales conocidos por los técnicos en la materia (Sambrook et al., 1989, citado supra). Células adecuadas para llevar a cabo la invención, incluyen, sin limitación, células de mamíferos, plantas, insectos y de hongos. Ejemplos ilustrativos y no limitativos de dichas células se encuentran en el contexto del primer método de la invención y se usan aquí de igual manera.
En una realización preferida, dicha célula hospedadora es una célula animal transformada, transfectada o infectada con un vector apropiado, siendo dicha célula animal transformada, transfectada o infectada capaz de expresar la proteína de fusión proporcionada por esta invención, por lo que dichos vectores pueden utilizarse para la expresión en células animales de la proteína de fusión proporcionada por esta invención.
La construcción génica, o casete de expresión, o vector o célula hospedadora de la invención pueden ser utilizados para producir una proteína de fusión que comprende:
(i) un primer dominio polipeptídico que comprende una variante de survivina seleccionada entre:
a) una variante de survivina que carece de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional ; y
b) una variante de survivina que carece de la totalidad o parte del dominio de homodimerización resultando en un dominio de homodimerización no funcional y comprende la señal de exportación nuclear (NES) de survivina
(i) al menos, un segundo dominio polipeptídico que comprende una señal de localización nuclear (NLS); y
(ii) al menos, un tercer dominio polipeptídico reportero;
en donde si la variante de survivina carece de la totalidad o parte de su señal NES, entonces dicha proteína de fusión comprende además
(iii) un cuarto dominio polipeptídico que comprende una NES.
***
Los siguientes ejemplos son meramente ilustrativos y no se deben de considerar como limitativos de la presente invención.
EJEMPLOS
EJEMPLO 1
Generación de la proteína de fusión
Para construir la proteína de fusión, se llevaron a cabo varias etapas de clonación utilizando métodos estándar de biología molecular (PCR, digestión con enzimas de restricción, ligación y transformación de bacterias competentes):
Etapa 1- En el vector pEGFP-N1, se reemplazó la secuencia de DNA que codifica GFP por otra que codifica el epítopo 3xFlag. Sitios de restricción utilizados: PinAI/Notl.
Etapa 2- Se añadió en el extremo 5' de 3xFlag una secuencia de DNA que codifica una NLS del antígeno T grande del virus SV40 (SV40NLS). Sitios de restricción utilizados: HindIII/BamHI.
Etapa 3.- Se añadió en el extremo 5'- del casette [SV40NLS-3xFlag] una secuencia de DNA que codifica el fragmento 1-100 de la proteína Survivin humana. Sitios de restricción utilizados: Bglll/Hindlll.
Etapa 4. Se reemplazó el casette [SV40NLS-3xFlag] por otro casette [SV40NLS- 3xFlag-SV40NLS]. Sitios de restricción utilizados: Hindlll/Notl Tras cada etapa de clonación se confirmó la secuencia recombinante obtenida mediante secuenciación.
Determinación de la funcionalidad de variantes de CRM1
Para determinar si una variante mutada de CRM1 es funcional mediante la proteína de fusión de la invención, se procedió del siguiente modo.
1. Se sembraron células 293T en tres pocilios de una placa de cultivo sobre cubreobjetos de cristal estériles, y se transfectaron el día siguiente utilizando el reactivo de transfeccion FugeneHD (Roche) de acuerdo con el protocolo del fabricante. En una muestra se transfectó sólo el ácido nucleico que codifica para la proteína de fusión (SEQ ID NO: 52), en otra muestra se transfectó dicha proteína de fusión junto con YFP-CRM1 wild type (normal) (SEQ ID NO: 60) y en la tercera dicha proteína de fusión junto con YFP-CRM1 mutada (mutación A541K).(SEQ ID NO: 59) Se utilizaron aproximadamente 500 nanogramos de cada plásmido en la transfeccion.
2. Aproximadamente 24 horas más tarde, las células se fijaron con formaldehido 3,7% en PBS (30 min). Las células fijadas se permeabilizaron con 0.2% Tritón X-100 (10 min) y se bloquearon con 3% BSA en PBS (1 h). Para detectar dicha proteína de fusión se utilizó un anticuerpo monoclonal anti Flag M2 (Sigma) diluido 1:300 en la solución de bloqueo (3% BSA en PBS). Se aplicó a continuación un anticuerpo secundario marcado con AlexaFluor594 (Invitrogen) y el colorante nuclear Hoechst. La incubación con cada anticuerpo se llevó a cabo durante una hora a temperatura ambiente. Finalmente, las muestras se lavaron con PBS, se montaron en portaobjetos utilizando Vectashield (Vector) y se sellaron con laca de uñas.
Utilizando un microscopio de fluorescencia o un microscopio confocal se determinó la localización de la proteína de fusión en células que no expresan CRM1 ectópica (las células del control negativo) y en células que sí expresan CRM1 ectópica.
El análisis de las imágenes de microscopía mostró que dicha proteína de fusión es nuclear en células 293T que expresan únicamente CRM1 endógena. Este resultado indica que los niveles de CRM1 endógena en estas células no son suficientes para contrarrestar la importación al núcleo mediada por las dos NLSs de dicha proteína de fusión.
Por el contrario, dicha proteína de fusión mostró localización citoplásmica en aquellas células que expresan YFP-CRM1. Este resultado indica que la proteína CRM1 ectópica transfectada es funcional como receptor de exportación.
Las imágenes de microscopía mostraron que dicha proteína de fusión es nuclear en las células que expresan YFP-CRM1 mutada (A541K). Estudios in vitro han demostrado que esta mutación reduce notablemente la afinidad de CRM1 por las secuencias NES. Este resultado indica que la proteína YFP-CRM1 (A541K) presenta 5 una actividad reducida en un entorno celular como receptor de exportación.