Un grupo de científicos ha descubierto que la aplicación de chatbot de inteligencia artificial ChatGPT diagnostica erróneamente la mayoría de los casos pediátricos, según un artículo publicado este martes en la revista JAMA Pediatrics.
Concretamente, la versión 3.5 de ChatGPT dio un diagnóstico incorrecto en 83 de cada 100 casos pediátricos. Entre los diagnósticos incorrectos, 72 eran realmente erróneos y 11 estaban clínicamente relacionados con el diagnóstico correcto, pero eran demasiado amplios para considerarse correctos.
"El decepcionante rendimiento diagnóstico del chatbot observado en este estudio subraya el inestimable papel que desempeña la experiencia clínica", señala la investigación. "El chatbot evaluado en este estudio, a diferencia de los médicos, no fue capaz de identificar algunas relaciones, como la que existe entre el autismo y las deficiencias vitamínicas", añade.
Asimismo, los autores del estudio señalan que los profesionales de la salud podrían utilizar los chatbots basados en modelos grandes de lenguaje (LLM, por sus siglas en inglés) como una herramienta complementaria a la hora de diagnosticar y elaborar una lista diferencial para casos complejos.
"A pesar de la alta tasa de error del chatbot, los médicos deberían seguir investigando las aplicaciones de LLM a la medicina", continúan. "Los LLM y los chatbots tienen potencial como herramienta administrativa para los médicos, demostrando competencia en la redacción de artículos de investigación y generando instrucciones para los pacientes", concluyen.