Con métodos computacionales detectan depresión, anorexia, ironía y mensajes de odio en redes sociales
Santa María Tonantzintla, Puebla, a 15 de julio. Como resultado del desarrollo de métodos computacionales novedosos, investigadores mexicanos están detectando en redes sociales a usuarios que padecen depresión, anorexia y otros trastornos mentales, así como mensajes irónicos y de odio.
Ello, como parte del trabajo que se desarrolla en el Laboratorio de Tecnologías del Lenguaje del Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) y como resultado del proyecto Fuerza de tracción textual: hacia un nuevo paradigma de clasificación de documentos, liderado por el Dr. Manuel Montes y Gómez, científico de este centro público de investigación.
El proyecto fue financiado por el Consejo Nacional de Ciencia y Tecnología (Conacyt) en la convocatoria 2017 de Fronteras de la Ciencia y estará concluido en octubre próximo.
Dr. Manuel Montes y Gómez. Foto: archivo INAOE.
En entrevista, el Dr. Manuel Montes explica que el Laboratorio de Tecnologías del Lenguaje del INAOE se creó en 2002 con el objetivo de analizar lenguaje natural escrito y oral. Sin embargo, en los últimos años, debido al boom de las redes sociales y a la facilidad de obtener datos de éstas, los esfuerzos se han centrado en el análisis de contenidos de redes sociales, desde buscar información hasta caracterizar usuarios. "Justo ahora estamos aplicando los métodos desarrollados en el proyecto de Fronteras de la Ciencia a distintas problemáticas", dice.
El citado proyecto está orientado a desarrollar métodos de clasificación de información textual en lo general: "Proponemos cambiar el paradigma de únicamente ver a los documentos como puntos en un espacio métrico y medir distancias entre ellos, a verlos como si fueran objetos físicos con masa, y entonces llevamos conceptos de la teoría gravitacional al modelado de documentos. Se trata de verlos como objetos que se atraen unos con otros, se atraen los que se parecen, se repelen los que no y eso aplicarlo para la recuperación y clasificación de documentos", indica.
Uno de los temas en donde se han aplicado estos métodos es en la detección de ironía: "Dado un texto, tratamos de detectar el contenido que no es explícito. En redes sociales vemos que muchas veces las burlas o críticas no se hacen de manera directa sino con ironía. El gran problema de la ironía es que los humanos somos buenos detectándola cuando estamos en una conversación porque hay elementos extralingüísticos, como los movimientos de la persona, la sonrisa y el tono que emplea, que nos ayudan a decir que alguien está siendo irónico y que no debemos interpretarlo literalmente. Pero en un documento escrito donde no hay esos elementos extralingüísticos es más difícil su detección".
En el trabajo de detección de ironía el equipo del Laboratorio de Tecnologías del Lenguaje ha estado probando y recolectando datos de comentarios irónicos de México, Cuba y España junto con investigadores de la Universidad de Oriente de Cuba y de la Politécnica de Valencia, de España: "Lanzamos una tarea en la cual hubo alrededor de 15 grupos participantes que evaluaron métodos en los datos que nosotros recolectamos. Nuestro grupo en particular recolectó noticias políticas de México, sobre la película Roma, cosas de Venezuela, de Trump, del muro".
Otra problemática en la cual han aplicado estos métodos es la detección de comentarios agresivos y de odio en redes sociales: "Este fenómeno se ha acrecentado mucho debido al fácil uso de las redes y al anonimato que hay en ellas. Incluso, aunque si se sabe quién está atrás de una cuenta, como no se está enfrente del ofendido las redes se prestan mucho a las expresiones de odio y a comentarios ofensivos en contra de mujeres, migrantes, minorías religiosas, políticas. Hemos estado analizando cómo detectar estos comentarios, lo que no es tan fácil porque no basta con detectar por ejemplo groserías y malas palabras".
"Proponemos cambiar el paradigma de únicamente ver a los documentos como puntos en un espacio métrico y medir distancias entre ellos, a verlos como si fueran objetos físicos con masa, y entonces llevamos conceptos de la teoría gravitacional al modelado de documentos", dijo el investigador. Foto: archivo INAOE.
Uno de los temas que mayor interés ha despertado recientemente en el equipo de trabajo es la detección de usuarios con depresión y anorexia. El investigador de la Coordinación de Ciencias Computacionales aclara que esta problemática se investiga a nivel mundial. Se sospecha, agrega, que no hay datos fidedignos en cuanto al número de casos de depresión porque mucha gente no acude al doctor cuando se siente mal. Lo mismo sucede con la anorexia.
"No hay estadísticas claras para hacer políticas públicas en materia de depresión y anorexia. Una manera de detectarlas puede ser a través de las redes sociales porque los psicolingüistas han visto que hay una conexión clara entre el lenguaje y el estado de ánimo o ciertos trastornos mentales. Y como la gente utiliza las redes sociales de manera más natural, sí se pueden emplear esos datos para determinar cuántas personas están deprimidas o cuáles usuarios en particular pueden padecer alguno de estos trastornos", expresa.
Justo ahora hay optimismo en el equipo científico porque han comenzado a obtener algunos resultados muy prometedores. "Tenemos dos estudiantes trabajando en esto, y también estamos colaborando con gente de la Universidad Autónoma de Chihuahua, codirigiendo algunas tesis allá".
Interrogado sobre el futuro del proyecto, el Dr. Montes puntualiza: "A nivel de investigación nos interesa seguir proponiendo distintos métodos para hacer la detección, pero no solo de manera estática sino también queremos hacerlo en tiempo real, lo que implica hacer una predicción temprana de que alguien tal vez no está completamente deprimido, pero ya muestra ciertos signos de depresión. Este es un problema difícil desde la perspectiva computacional y de modelado de los datos".
Un obstáculo que enfrentan es conseguir los datos: "Hemos avanzado poco a poco pues no es sencillo conseguir datos suficientes y de calidad para estas tareas, así que también queremos aprovechar lo que hay en otros lenguajes para hacer detección en español. Aquí entra un componente interesante, pues hay que preguntarse si los datos que tenemos en otro idioma nos ayudan a detectar a los mexicanos con depresión porque muchas veces la manifestación de la depresión es cultural. Es probable que esos datos no nos sirvan, pero parte de lo interesante será investigarlo".
Para el Dr. Montes esta línea de investigación ofrece muchas posibilidades, aunque se debe tomar en cuenta el componente ético en la inteligencia artificial, "porque qué tan ético puede ser estar observando los datos que publica una persona en sus redes y decir que tiene depresión sin su consentimiento, aunque esos datos sean públicos, o etiquetar a alguien de misógino, hay una línea muy delgada entre lo que sí se vale o debe y lo que no. Este componente limita algunas cosas de lo que se podría hacer tecnológicamente hablando, pero hay un horizonte muy amplio de posibilidades en estos análisis: desde ayudar a los que toman decisiones de política pública hasta identificar a personas en particular con problemas. En redes sociales se puede hacer un monitoreo más masivo de usuarios con comentarios de odio, pero siempre será un humano el que al final tome las decisiones".
Finalmente, subraya que gracias a este proyecto el INAOE se ha vinculado a grupos de investigación de la Universidad Politécnica de Valencia, la Nacional de Colombia, la Nacional de San Luis en Argentina, la Autónoma de Chihuahua, el CIMAT y la UAM.
Luis Enrique Erro # 1, Tonantzintla, Puebla, México, Código Postal 72840, Tel: (222) 266.31.00, difusion@inaoep.mx
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.5 Mexico License.