ChatGPT: la IA que ayuda a detectar los primeros signos de alzhéimer
28/12/2022
Los médicos podrían disponer algún día de la ayuda de la inteligencia artificial para diagnosticar precozmente la enfermedad de Alzheimer, según muestra un nuevo estudio que ha probado la capacidad del programa de chatbot ChatGPT para detectar el alzhéimer en sus primeras fases. Este programa puede generar respuestas escritas parecidas a las de los humanos sobre algunas de las consultas más creativas, y sus algoritmos pueden ayudar a identificar a los pacientes en una etapa temprana de este tipo de demencia.
La investigación de la Escuela de Ingeniería Biomédica, Ciencias y Sistemas de Salud de la Universidad de Drexel ha demostrado que el programa GPT-3 de OpenAI es capaz de identificar pistas del habla espontánea que pueden predecir las primeras etapas de la demencia con una precisión del 80%. Sus resultados se han publicado en la revista PLOS Digital Health.
El objetivo del estudio era demostrar que los programas de procesamiento del lenguaje natural son eficaces para la detección precoz de la enfermedad de Alzheimer, basándose en otras investigaciones que sugieren que el deterioro del lenguaje puede ser un indicador temprano de los trastornos neurodegenerativos. “Sabemos por investigaciones en curso que los efectos cognitivos de la enfermedad de Alzheimer pueden manifestarse en la producción del lenguaje”, ha señalado Hualou Liang, profesor de la Escuela de Ingeniería Biomédica, Ciencias y Sistemas de Salud de Drexel y coautor de la investigación.
“GPT3 es un candidato prometedor para identificar las características sutiles del habla que pueden predecir la aparición de la demencia”
“Las pruebas más utilizadas para la detección temprana de la enfermedad de Alzheimer analizan las características acústicas, como las pausas, la articulación y la calidad vocal, además de las pruebas de cognición. Pero creemos que la mejora de los programas de procesamiento del lenguaje natural ofrece otra vía para apoyar la identificación temprana de alzhéimer”, añade.
Lucía Ortiz de Zárate, Investigadora predoctoral en Ética y Gobernanza de la Inteligencia Artificial en el departamento de Ciencia Política y Relaciones Internacionales de la Universidad Autónoma de Madrid, ha señalado en declaraciones a SMC España: “El deterioro del lenguaje (disminución en el tiempo de respuesta a ciertas preguntas, cambios en la estructura de oraciones, etcétera) es un marcador importante a la hora de realizar diagnósticos de enfermedades neurodegenerativas. Utilizando 237 grabaciones de voz procedentes de la base de datos ADReSSo Challenge, los investigadores han entrenado al algoritmo GPT-3 y han mostrado que este puede detectar inicios de alzhéimer con una tasa de acierto del 80%. Estos resultados igualan y superan, en algunos casos, las tasas de acierto de otros modelos y test convencionales para la detección del alzhéimer”.
La experta advierte, sin embargo, que “Aunque se trata de unos resultados prometedores, el estudio tiene algunas limitaciones importantes que evidencian la necesidad de realizar estudios posteriores más amplios y detallados. La muestra con la que se ha trabajado en este caso es baja, por tanto, para ser capaces de verificar la utilidad real de este y otros chatbots será necesario contar con muestras mucho mayores que permitan una generalización mayor de los resultados del estudio. Además, es importante señalar la posible presencia de sesgos y otros problemas éticos en las muestras utilizadas y que es necesario abordar para asegurar que la IA funciona igual de bien en el diagnóstico de personas de cualquier género, etnia, nacionalidad, edad, etcétera. En este sentido, estudios de este tipo evidencian la necesidad de incorporar la perspectiva ética en cualquier estudio de IA aplicada a la sociedad”.
Una aplicación web para ayudar a diagnosticar el alzhéimer
El deterioro del lenguaje es un síntoma que presentan entre el 60 y el 80% de los pacientes con demencia, por lo que los investigadores se han centrado en programas que pueden captar pistas sutiles, como vacilación, cometer errores de gramática y pronunciación y olvidar el significado de las palabras, como una prueba rápida que podría indicar si un paciente debe someterse o no a un examen completo.
GPT-3 constituye la tercera generación de General Pretrained Transformer (GPT) de OpenAI y usa un algoritmo de aprendizaje profundo, entrenado mediante el procesamiento de amplias franjas de información de internet, enfocándose en concreto en cómo se usan las palabras y cómo se construye el lenguaje. Este entrenamiento permite que produzca una respuesta humana a cualquier tarea en la que intervenga el lenguaje, desde respuestas a preguntas sencillas, hasta escribir poemas o ensayos.
El programa es especialmente bueno en el “aprendizaje de datos cero”, por lo que puede responder a preguntas que por lo general requerirían un conocimiento externo que no se ha proporcionado. Por ejemplo, solicitarle que escriba “Notas de Cliff” de un texto, normalmente precisaría una explicación de que esto significa un resumen, pero GPT-3 ha sido suficientemente entrenado para entender lo que se pide y adaptarse para producir la respuesta esperada.
“El enfoque sistémico de GPT3 para el análisis y la producción del lenguaje lo convierte en un candidato prometedor para identificar las características sutiles del habla que pueden predecir la aparición de la demencia”, afirma Felix Agbavor, investigador de doctorado en la Facultad y autor principal del artículo. “Entrenar a GPT-3 con un conjunto masivo de datos de entrevistas, algunas de las cuales son con pacientes de Alzheimer, le proporcionaría la información que necesita para extraer patrones del habla que luego podrían aplicarse para identificar marcadores en futuros pacientes”.
Los investigadores entrenaron el programa con un conjunto de transcripciones procedentes de un conjunto de datos de grabaciones de voz compiladas con el apoyo de los Institutos Nacionales de Salud para probar la capacidad de los programas de procesamiento del lenguaje natural para predecir la demencia. El programa captó características significativas del uso de las palabras, la estructura de las oraciones y el significado del texto para generar lo que los investigadores denominan una “incrustación”, un perfil característico del habla de la enfermedad de Alzheimer.
Después utilizaron la incrustación para entrenar el programa de nuevo, y lo convirtieron así en una máquina de detección de Alzheimer. Para probarlo, pidieron al programa que revisara docenas de transcripciones del conjunto de datos y decidiera si cada una fue producida, o no, por alguien que estaba desarrollando la enfermedad de Alzheimer.
Cuando ejecutaron dos de los mejores programas de procesamiento de lenguaje natural a la misma velocidad, los científicos comprobaron que GPT-3 funcionaba mejor que ambos en términos de identificar con precisión ejemplos de alzhéimer, identificar ejemplos que no son de alzhéimer, y con menos casos perdidos que ambos programas.
“Nuestros resultados demuestran que la incrustación de texto, generada por GPT-3, se puede utilizar de forma fiable no solo para detectar personas con enfermedad de Alzheimer de controles sanos, sino también para inferir la puntuación de las pruebas cognitivas del sujeto, ambas basadas únicamente en los datos del habla”, han escrito los investigadores. “Además, demostramos que la incrustación de texto supera el enfoque convencional basado en características acústicas e incluso funciona de manera competitiva con modelos ajustados. Estos resultados, en conjunto, sugieren que la incrustación de texto basada en GPT-3 es un enfoque prometedor para la evaluación de la enfermedad de Alzheimer y tiene el potencial para mejorar el diagnóstico precoz de la demencia”.
Los investigadores tienen la intención de aprovechar los resultados del estudio para desarrollar una aplicación web que se podría usar en el hogar del paciente o en el consultorio del médico como una herramienta para determinar quiénes deberían someterse a otras pruebas diagnósticas. “Nuestra prueba de concepto muestra que esta podría ser una herramienta simple, accesible y adecuadamente sensible para las pruebas basadas en la comunidad”, concluye Liang. Esto podría ser muy útil para la detección temprana y la evaluación de riesgos antes de un diagnóstico clínico”.
Actualizado: 5 de mayo de 2023