Sistema para mejorar la experiencia de usuario sin capacidades de abstracción en la consulta de información
Sector de la técnica
La presente invención se enmarca en el campo de los asistentes conversacionales capaces de generar, mediante inteligencia artificial, diálogos en lenguaje natural.
Antecedentes de la invención
Avances recientes en inteligencia artificial han permitido que los chatbots generen respuestas de forma automática ante peticiones de los usuarios [1]. Como resultado, actualmente los chatbots se utilizan en los negocios [2], la educación [3] y la medicina [4]. Sin embargo, imitar la inteligencia humana todavía está fuera de su alcance. Por consiguiente, los chatbots se utilizan en tareas muy especializadas y sus interacciones son dirigidas, precisas y breves. Además, a los usuarios les resulta más fácil comunicarse con un chatbot si este emplea mensajes breves, y así permanecen interesados más tiempo [5].
El dominio de la presente invención es proporcionar entretenimiento e información a usuarios que no tienen la capacidad de abstraer conceptos cuando necesitan buscar información.
Algunos chatbots para entretenimiento, como EduRobot [6], cantan y cuentan historias. En el ámbito de la salud existen plataformas en línea para cuidado médico generalista como HealthTap [7], Oscar [8] y Molly [9], a través de las cuales interactúan médicos y pacientes. Ninguno de estos sistemas soluciona la incapacidad de abstracción de información de algunos colectivos de usuarios. De hecho, en el caso de las personas mayores, el foco suele ponerse en el cuidado médico y no en el entretenimiento. Aunque existen chatbots relatores de noticias [10], no se les ha dotado de empatía ni habilidades para tratar con personas con dificultades para abstraer información.
En lo que respecta al estado del arte previo protegido mediante patentes, en [11] se plantea aumentar las expresiones de búsqueda mediante técnicas de aprendizaje máquina, pero no se incita al usuario a introducir información mediante un diálogo artificial, ni se analizan sus sentimientos mediante técnicas de inteligencia artificial. En [12] se plantea un sistema para facilitar a los ancianos la navegación en línea mediante comandos de voz, pero, en caso de problemas (como pueden ser los problemas de abstracción de conceptos) , el sistema se apoya en voluntarios humanos que acceden en línea. En [13] se plantea un terminal con interfaz gráfica en la que un avatar guía a un usuario a través de los menús de aplicaciones mediante voz, incluyendo los de los buscadores de información, pero la invención no dispone de capacidades inteligentes de abstracción conceptual. En [14] se plantea un sistema para facilitarle información a usuarios que tienen problemas de acceso a Internet.
Utiliza una interfaz basada en conversión voz-texto para recibir las peticiones de los usuarios, que se transforman en consultas de información en línea. Este sistema estima el grado de interés de los usuarios, si bien en vez de procesado de lenguaje natural se analizan las inflexiones de la voz, las expresiones faciales y la expresión oral. Además, este sistema emplea una interfaz gráfica de tipo avatar que se adapta al sentimiento percibido, así como un asistente conversacional para presentarle la información al usuario. Sin embargo, en esa invención el sistema conversacional no se utiliza para guiar al usuario (dialogar con él/ella para deducir sus intereses de cara a realizar búsquedas) , sino que las búsquedas se realizan en ase a información recabada del usuario antes de iniciar la conversación. El asistente se utiliza para presentarle la información al usuario y generar un perfil del mismo de cara a búsquedas futuras. Es decir, el sistema no dispone de capacidades automáticas de abstracción conceptual. En [15] se plantea un sistema que recaba información personal del usuario y, posteriormente, cuando el usuario realiza búsquedas de información, las ajusta en función de la información personal recabada. Es decir, los ajustes de las búsquedas se personalizan con información del usuario recolectada a priori.
Referencias:
[1] Xu, A., Liu, Z., Guo, Y., Sinha, V., & Akkiraju, R. (2017) . A new chatbot for customer Service on social media. En Proc. Conference on Human Factors in Computing Systems, pp. 3506 3510, 2017.
[2] Thomas, N. T. (2016) . An e-business chatbot using AIML and LSA. En Proc. International Conference on Advances in Computing, Communications and Informatics, pp.2740-2742.
[3] Robins, B., Dautenhahn, K., Te Boekhorst, R., & Billard, A. (2005) . Robotic assistants in therapy and education of children with autism: can a small humanoid robot help encourage social interaction skills?. Universal access in the information society, 4 (2) , pp. 105-120.
[4] Kumar, V., & Keerthana, A. (2016) . Sanative Chatbot For Health Seekers. International Journal Of Engineering And Computer Science, 5, pp. 16022-16025.
[5] Hill, J., Randolph Ford, W., & Farreras, I. G. (2015) . Real conversations with artificial intelligence: A comparison between human human online conversations and human chatbot conversations. Computers in Human Behavior 49, pp., 245-250.
[6] Budiharto, W., Cahyani, A. D., Rumondor, P. C., & Suhartono, D. (2017) . EduRobot: Intelligent Humanoid Robot with Natural Interaction for Education and Entertainment. Procedia Computer Science 116, pp. 564-570.
[7] https://www.healthtap.com
[8] https://www.hioscar.com/
[9] http://www.senselv.com/
[10] Matsumoto, R., Nakayama, H., Harada, T., & Kuniyoshi, Y. (2007) . Journalist robot: Robot system making news articles from real world. In 2007 IEEE/RSJ International Conference on Intelligent Robots and Systems, pp. 1234-1241. IEEE.
[11] Alternative search quer y prediction. Patente CN101268463A, China.
[12] One-stop type intelligent comprehensive knowledge Service system for the elderly based on cloud computing. Patente CN103914794A, China.
[13] The ¡Information terminal device. Patente JP2004013836A, Japón.
[14] Electronic personal ¡nteractive device that determines topics of interest using a conversational agent. Patente US9634855B2, Estados Unidos.
[15] Method and device for improving accessability to information displayed on a Computer. Patente US20110072257A1, Estados Unidos.
[16] Su, M. H., Wu, C. H., Huang, K. Y., Hong, Q. B., & Wang, H. M. (2018) . A chatbot using LSTM-based multi-layer embedding for elderly care. En Proceedings of the 2017 International Conference on Orange Technologies, ICOT 2017, pp. 70-74.
[17] Fernández Gavilanes, M., Álvarez López, T., Juncal Martínez, J., Costa Montenegro, E., González Castaño, F. J. Unsupervised method for sentiment analysis in online texts. Expert Systems with Applications 58 (2016) , pp. 57-75.
[18] García Méndez, S., Fernández Gavilanes, M., Costa Montenegro, E., Juncal Martínez, J., González Castaño, F. J. (2019) . A librar y for automatic natural language generation of spanish texts. Expert Systems with Applications 120, pp. 372-386.
Explicación de la invención
La presente invención se refiere a proporcionar ayuda a usuarios que no tienen la capacidad de abstraer conceptos cuando necesitan buscar información. Los sistemas actuales de búsqueda de información en Internet asumen que el usuario tiene dicha capacidad, pero algunos colectivos (personas muy mayores, personas con diversidad cognitiva) carecen de ella. Además, para estos colectivos puede ser difícil realizar búsquedas de información mediante interfaces textuales o incluso consultar la información de forma textual. Para solucionar este problema se plantea un sistema que dialogue con el usuario para extraer conocimiento sobre información presentada en forma de noticias que llamen su atención y el sentimiento y emoción que esta le suscite, todo ello mediante lenguaje natural, apoyándose en técnicas de conversión voz-texto y texto-voz.
Así pues, la presente invención usa un procedimiento y un sistema novedosos que mejorarán la experiencia de usuario cuando éste consulte información de fuentes en línea, especialmente adecuado para usuarios que experimenten dificultades para abstraer los conceptos necesarios para realizar las búsquedas.
El elemento central es el asistente conversacional o chatbot que induce al usuario a expresar sus intereses y opiniones mediante mensajes sencillos, expresados en voz natural. En función de la fase del diálogo (determinada por el chatbot) , la opinión que subyace tras las expresiones del usuario en voz natural, analizadas mediante técnicas de inteligencia artificial, y las palabras clave contenidas en dichas expresiones, un analizador de interés dirige a un buscador de información en Internet. El analizador de interés toma sus decisiones en base a las reacciones que producen las noticias en el usuario, detectadas mediante técnicas de inteligencia artificial.
Por consiguiente, mediante técnicas de inteligencia artificial se extraen las palabras significativas de las expresiones del usuario y se analizan su sentimiento y sus emociones, y las nuevas búsquedas se realizan combinando las palabras significativas de las expresiones del usuario con las palabras significativas contenidas en las noticias, en caso de que el sentimiento y emoción suscitados en el usuario sean positivos. Es decir, si comparamos nuestra propuesta con el estado de la técnica, el propio diálogo conducido por el sistema se utiliza deducir los intereses del usuario de cara a realizar búsquedas, en vez de que éstas dependan de información recabada del usuario antes de iniciar la conversación.
Realización preferente de la invención
La descripción y los dibujos ilustran los principios de la invención. Aunque la presente invención se ha descrito con referencia a realizaciones específicas, los expertos en la materia deben entender que tanto dichas modificaciones como sus detalles pueden sufrir cambios sin alejarse del alcance de la presente invención como definen las reivindicaciones.
Además, todos los ejemplos mencionados en el presente documento están principalmente y expresamente destinados a fines pedagógicos para ayudar al lector a comprender los principios de la invención y los conceptos aportados por el o los inventores para fomentar la técnica, y deben interpretarse sin limitación a los ejemplos y condiciones específicamente mencionados. Además, todas las afirmaciones del presente documento que mencionan principios, aspectos y realizaciones de la invención, así como sus ejemplos específicos, pretenden abarcar sus equivalentes.
El procedimiento y el sistema presentes se refieren a un dispositivo electrónico de cualquier tipo, como un teléfono móvil, un portátil un ordenador de sobremesa o un dispositivo fabricado ex profeso, con acceso a una pantalla gráfica (101) , un micrófono (102) , un altavoz (103) y a fuentes de información en línea, como Internet (104) , que ejecuta un asistente conversacional o chatbot inteligente capaz de sostener diálogos con un usuario para ayudarle a abstraer conceptos de cara a realizar búsquedas de información. Para ello, el asistente inteligente interacciona con una serie de elementos funcionales que le proporcionan funciones de inteligencia artificial y procesado de lenguaje natural En algunas realizaciones, alguno o algunos de los periféricos hardware antedichos no estarán incluidos en el propio dispositivo, sino que serán periféricos externos del mismo, o el dispositivo se conectará con otros dispositivos que dispongan de dichos periféricos para utilizarlos cuando los precise.
En una realización, la Figura 1 muestra los elementos de la invención. En la pantalla (101) se muestra una representación simbólica de un personaje que refleja estados de ánimo y emociones (105) . En el ejemplo de la realización el personaje refleja tristeza. En la pantalla (101) se muestra un texto que el dispositivo reproduce como voz sintética por el altavoz (103) . En la pantalla se muestra un icono de indicación de turno (107) con dos estados. Uno de los estados le indica al usuario cuando puede hablar. El otro indica que no puede hacerlo.
En una realización, la Figura 2 muestra los bloques funcionales que intervienen en las funciones inteligentes del dispositivo.
El asistente conversacional o chatbot (205) induce al usuario a expresar sus intereses y opiniones mediante mensajes sencillos (201) , que se transforman en voz mediante un conversor texto-voz (202) . En una realización, se pueden implementar los diálogos del chatbot mediante lenguaje AIML.
Las respuestas del usuario se traducen a texto mediante un conversor voztexto (203) . En función de la fase del diálogo, determinada por el chatbot, y de la opinión que subyace tras la expresión del usuario (detectada mediante un analizador de sentimiento y emoción (204) ) , el sistema decide si el chatbot (205) produce la siguiente respuesta (201) directamente en base a la aplicación de reglas o en tiempo real mediante un generador de lenguaje natural (206) . En una realización, para ello pueden emplearse técnicas de inteligencia artificial [16]. El generador de lenguaje natural emplea como entradas las palabras clave contenidas en la respuesta del usuario (extraídas por el extractor de palabras clave (207) ) y la salida del analizador de sentimiento (204) . En una realización, el extractor de palabras clave elimina palabras con poca o nula carga semántica (determinantes, preposiciones, conjunciones, etc., así como ronombres y verbos de uso general, por ejemplo) , elimina redundancias mediante lematización y las palabras restantes son las palabras clave. El campo del estado de arte que define este tipo de técnicas es el procesado de lenguaje natural. En una realización, el analizador de sentimiento y emoción puede utilizar técnicas como las descritas en [17] y sus referencias. En una realización, el chatbot puede apoyarse para la generación de sus respuestas en un expansor externo de lenguaje natural como el descrito en [18].
A fin de realizar una abstracción automática de los intereses del usuario para ofrecerle información, un analizador de interés (208) decide las búsquedas de un buscador (209) de información en Internet. El analizador de interés toma sus decisiones en base a las reacciones que producen las noticias en el usuario (consultando la salida del analizador de sentimiento y emoción (204) ) y la proximidad semántica del contenido de las expresiones del usuario (proporcionado por el extractor de palabras clave (207) ) a las noticias presentadas previamente al usuario. Un extractor de noticias (210) extrae las noticias de los sitios de Internet que identifica el buscador (209) . En una realización, el extractor de noticias es un scrapper que extrae texto de páginas web de periódicos, portales, blogs o noticieros. En una realización, el analizador del interés (208) puede seleccionar las palabras del usuario que pertenezcan a la misma categoría semántica que las palabras principales de las noticias (excluyendo las palabras con nula o baja carga semántica) mediante la herramienta Multilingual Central Repositor y .
En una realización, el dispositivo dirige el diálogo mostrando en pantalla un icono verde cuando se espera una respuesta del usuario y rojo cuando el propio dispositivo está hablando (107) .
En una realización, cuando el dispositivo está hablando muestra en pantalla la transcripción (106) de su locución.
En una realización, para determinado sentimiento o determinadas emociones del usuario o la locución del dispositivo, el avatar muestra una expresión acorde (105) mediante las convenciones gráficas usuales de codificación de sentimiento, tales como emoticonos.