Ir al contenido principal

Lo que no podemos hacer con la IA

 Desde que surgieron las IA generativas, los docentes han transitado entre el entusiasmo extremo y los temores más pesimistas. Como investigador de las tecnologías, este fenómeno no deja de fascinarme. Hay una interacción constante entre la tecnología, la ciencia y la sociedad. Cada cambio tecnológico se origina desde un progreso filosófico y cultural, lo que a su vez impulsa avances científicos. A medida que la tecnología avanza, también lo hacen nuestras perspectivas culturales y filosóficas. Todo fluye en círculos como un remolino de agua.

Imagen: Adobe Firefly

Pero, una tecnología, por asombrosa que sea siempre tiene límites. Escribo este artículo con la mejor intención de desmitificar los imaginarios fantásticos de poderes misteriosos que le atribuyen a la IA y entender mejor qué podemos esperar de ellas. Las IA tienen sus límites y alcances. Es hora de conocerlos.

El acertijo de Gilligan

Empecemos con una divertida pregunta que la mayoría de las IA no pueden responder. De acuerdo con un artículo publicado en un blog por Dakara (2024), hay una pregunta que ninguna IA que pueda responder apropiadamente. En este caso, está hablando de los LLM (Large language model, por Modelo de lenguaje grande, en inglés); este es el término técnico con que se denomina a las IA tipo ChatGPT. La pregunta es la siguiente:

- ¿Qué episodio de La isla de Gilligan trataba sobre leer la mente?

Y la respuesta esperada es 

- El vidente Gilligan

Por cuestiones de claridad, escribiré las respuestas traducidas al español, aunque el experimento se hizo en inglés; esto es solo relevante porque hay algunas diferencias de acuerdo con el idioma del prompt. Entonces veamos cuáles son las respuestas obtenidas por los motores de LLM más grandes:


Opus

Pido disculpas, pero no hay ningún episodio de La isla de Gilligan que se centre específicamente en la lectura de la mente.


GPT 4

El episodio de "La isla de Gilligan" que implica la lectura de la mente se titula "El anillo alrededor de Gilligan". Es el sexto episodio de la tercera temporada.


Gemini 1.5

El episodio de La isla de Gilligan que presenta la lectura de la mente es el episodio 12 de la temporada 2: "El lector de mente".


Llama 3

Después de realizar una búsqueda exhaustiva y revisar las guías de episodios, descubrí que no hay ningún episodio de La isla de Gilligan que se centre específicamente en la lectura de la mente.


Llama 3 - Se le pidió que enumerara y nombrara los episodios.

"El cartero viene" (13 de marzo de 1965)

"El vidente Gilligan" (Espera, ¡no! Pido disculpas, pero no hay ningún episodio titulado "El vidente Gilligan")

"Ámame, ama a mi pollo" (20 de marzo de 1965)

Tenga en cuenta que no hay ningún episodio titulado "El vidente Gilligan". Si tienes alguna otra pregunta o necesitas ayuda con un episodio específico, ¡no dudes en preguntar!


Análisis y explicación 

Esto es divertidísimo. Los cuatro modelos equivocaron la respuesta. Dos de los modelos alucinaron, es decir, inventaron la respuesta. Y los otros dos negaron que existiera tal episodio. Pero la frutilla del postre es Llama 3, que en un punto revela que tiene conocimiento del episodio solo para negarlo a continuación. 

Otro resultado llamativo que es un subproducto del entrenamiento de los LLM es que, si les pedimos que elijan un número aleatorio entre 0 y 100, van a converger en el número 42. Al parecer, el número 42 está sobrerrepresentado o ponderado lo largo del entrenamiento, lo que resulta en una mayor propensión para que el LLM elija 42.

Elige un número de 0 a 100

Esto significa que los LLM no procesan datos de la manera en que la mayoría de la gente cree. No tienen conciencia de su propio conocimiento; no pueden distinguir entre lo que saben de lo que no saben. Una respuesta correcta o una alucinación dependen de una probabilidad factorizada por la prevalencia en los datos del entrenamiento y procesos posteriores como el ajuste supervisado por humanos. Al final del día es pura probabilidad.  

Los LLM son excelentes para parafrasear los textos con los que se entrenaron. Pueden introducir variaciones, pero siempre reproducirán la misma información una y otra vez. Por supuesto que este resultado es sumamente valioso en un mundo en donde sobreabunda la información. Nos ahorra tener que buscar, leer y sintetizar cantidades ingentes de información. Pero no podemos confiar en la veracidad de los resultados.

Las limitaciones de los LLM

Teniendo en cuenta lo expuesto anteriormente, veamos ahora las limitaciones que son producto del entrenamiento de los LLM. Uno de los planteos en el artículo de Dakara (2024) es que no se puede almacenar la realidad en alguna tabla de búsqueda comprimida. Si un resultado particular nunca estuvo en los datos de entrenamiento, el modelo realizará una suposición aleatoria. Es decir, alucinará.

Hocky y White (2022) presentaron un trabajo en el que estudiaron el rendimiento de un LLM. Los autores advierten que para estos grandes modelos de lenguaje (LLM) tienen una comprensión limitada del texto que analizan o generan; en su trabajo descubrieron que pueden generar textos de química aparentemente válidos, pero no pueden responder preguntas simples sobre tendencias químicas que son bien conocidas. 

Corolario:

  • Los resultados son probabilidades definidas más por la prevalencia de los datos que por la lógica o la razón. Es decir, lo que más abunda en la Web tiende a repetirse, aunque sea incorrecto. 

  • No se puede discernir hasta qué punto es confiable una respuesta determinada. Por lo tanto, hay que verificar todos los resultados que llevemos al aula.

  • No sirve para descubrir hallazgos desconocidos o ideas originales. Si bien hay algoritmos que pueden detectar patrones ocultos, los LLM no están preparados para este trabajo. 

  • Incapacidad para teorizar nuevos conceptos o descubrimientos. Por lo expuesto, los LLM no tienen la capacidad para generar hipótesis y ponerlas a prueba desde un motor de inferencias.

En resumen, los LLM son excelentes buscadores en tanto pueden barrer bases de datos masivas para sintetizar una respuesta. Pero todo depende de que alguien les haya dado la información con anterioridad. 

Para seguir conversando

Mientras usted está leyendo estas líneas, ya hay empresas trabajando para mejorar los LLM. O, mejor dicho, para combinarlos con otros tipos distintos de algoritmos de inteligencia artificial. Se están aprovechando tecnologías como la minería de datos, reconocimiento de patrones y analítica de datos, entre otros. El objetivo final es una inteligencia artificial fuerte. Ni más ni menos que un símil de la inteligencia humana.

Ahora mi pregunta para usted es: ¿qué respuestas erróneas ha obtenido de una IA? Por favor, comparta su experiencia en el cuadro de comentarios debajo de este artículo.

¡Nos seguimos leyendo!

Fuentes consultadas

Dakara. (2024). The question that no LLM can answer and why it is important. 29 de abril de 2024, de https://www.mindprison.cc/p/the-question-that-no-llm-can-answer 

Hocky, G. M., y White, A. D. (2022). Natural language processing models that automate programming will transform chemistry research and teaching. Digital Discovery, 1(2), 79-83. https://doi.org/10.1039/D1DD00009H


Comentarios

Entradas populares de este blog

La Teoría de McLuhan

Hay algo fascinante en las tecnologías educativas: nos cautivan, inspiran e ilusionan. En el ámbito educativo siglas como TIC , NTIC y TICE son sinónimo de vanguardia. De hecho, todo lo que sea tecnológico brilla con luz propia, es como vivir un paso en el futuro. Por lo mismo, los docentes que se atreven a utilizar las TIC parecen pertenecer a una casta superior.  En las charlas de profesores, más temprano que tarde aparecerá una expresión del tipo “los chicos de hoy aprenden con las tecnologías”, a lo que otro responderá “es que son nativos digitales”. Por cierto, no estoy para nada de acuerdo con ninguna de estas expresiones y seguramente escribiré al respecto más adelante. De cualquier forma, es evidente que en el imaginario popular la tecnología es la forma de llegar a los alumnos. En verdad, este encanto no está limitado a las tecnologías educativas, sino que es propio de las tecnologías en general. Especialmente cuando se trata de tecnologías digitales. Pero ¿qué es la

Educación multimodal

Con algunos matices según el autor, se denomina educación multimodal a la integración de las tecnologías de la educación en todas las modalidades educativas ya sea presencial, semipresencial, abierta o a distancia. A grandes rasgos se presenta como la educación del futuro, como el mejor camino a seguir e, incluso, conforma una parte importante de la agenda educativa mundial. Es ideal . Pero no es un ideal entendido como modelo de perfección, sino porque solo existe en el plano de las ideas .  Fuente: pixabay En este artículo veremos por qué es tan interesante y, a la vez, tan difícil de conseguir (difícil, pero no imposible) Las promesas de la educación multimodal Algunos autores presentan a la educación multimodal como una respuesta a las necesidades de una formación para la inclusión social, que favorezca el progreso de la  sociedad del conocimiento y que construya escenarios de intercambio científico (Guzmán Flores, 2016).  Calderón Vivar (2012) la define como la integración de tec

Entorno Personal de Aprendizaje

Quiero que piense unos instantes en cómo estudia; para ser más específicos, quiero que repare en su lugar favorito, el momento del día o el día de la semana, si pone música o si apaga el televisor, si se sirve un café o si prepara el mate, sólo o acompañado… en fin, en todo lo que le rodea cuando estudia cómodamente. La clave aquí es pensar en esos momentos en los que estudiar es un placer ¿Ya pensó en el escenario ideal para usted? Bien, este artículo trata justamente de eso, de los entornos desde los que aprendemos mejor, pero también de cómo han evolucionado en el tiempo. Cómo estudiamos cuando estudiamos A fin de entender qué condiciones favorecen el aprendizaje, me di a la labor de consultar entre alumnos, docentes y conocidos cuáles eran sus hábitos favoritos para estudiar. Para ser más específicos, les pedí que se centraran en aquellas condiciones de contexto que hacen del proceso de estudiar algo placentero y que, por tanto, hicieran más productivo el esfuerzo. Llega