Confabulación

kon-fab-yoo-LAY-shun

Also known as: hallucination

behavior beginner

Definición

Confabulación es el término preferido de Geoffrey Hinton para las “alucinaciones” de IA - el fenómeno donde los modelos generan información plausible pero incorrecta. Hinton argumenta que el término refleja mejor que los humanos hacen lo mismo.

¿Por Qué Confabulación, No Alucinación?

“Alucinación” implica ver cosas que no están ahí - una condición patológica. “Confabulación” es un término psicológico para la construcción de memoria, que es un comportamiento humano normal.

“Hallucinations should be called confabulations - we do them too.” “Las alucinaciones deberían llamarse confabulaciones - nosotros también las hacemos.” — Geoffrey Hinton

El Ejemplo de John Dean

Hinton usa el testimonio de Watergate como prueba de que los humanos confabulan:

John Dean testificó bajo juramento sobre reuniones con Nixon. Estaba tratando de decir la verdad, pero estaba “equivocado sobre un gran número de detalles” - reuniones que nunca ocurrieron, citas mal atribuidas. Sin embargo, “la esencia de lo que dijo era exactamente correcta.”

Cómo Funciona Realmente la Memoria

Ni los humanos ni los LLMs almacenan información como archivos:

“We don’t store files and retrieve them; we construct memories when we need them, influenced by everything we’ve learned since.” “No almacenamos archivos y los recuperamos; construimos memorias cuando las necesitamos, influenciadas por todo lo que hemos aprendido desde entonces.”

Este proceso de construcción puede introducir errores - el mismo mecanismo detrás tanto de los falsos recuerdos humanos como de las confabulaciones de IA.

Implicaciones

  1. La confabulación es normal - no es un error único de la IA
  2. La verificación importa - tanto para salidas humanas como de IA
  3. Calibración de confianza - el problema real es no saber cuándo estás confabulando

Términos Relacionados

Mentioned In

Video thumbnail

Geoffrey Hinton

Hallucinations should be called confabulations - we do them too. We don't store files and retrieve them; we construct memories when we need them.