La IA antes de los LLM
Por qué los modelos lingüísticos son un capítulo reciente de una historia más amplia
Comprenda que la IA no empezó con los chatbots modernos: antes de los LLM, hubo décadas de intentos basados en la lógica, las reglas, la búsqueda, la estadística y las redes neuronales.
La IA no nació conversando
Hoy en día, mucha gente se encuentra por primera vez con la IA en forma de conversación: un chatbot que responde preguntas, escribe textos, resume documentos y ayuda con el código. Esto da la impresión de que la inteligencia artificial siempre fue fluida en lenguaje natural. Pero no es así.
Durante gran parte de la historia de la IA, el sueño era otro: hacer que las máquinas resolvieran problemas, siguieran reglas, demostraran teoremas, planificaran acciones, jugaran al ajedrez, reconocieran patrones o emularan a los expertos humanos en ámbitos específicos.
Primera gran visión: la inteligencia como razonamiento simbólico
Una de las primeras apuestas fuertes fue la IA simbólica. La idea era representar el conocimiento mediante símbolos, reglas y lógica. En lugar de aprender de millones de ejemplos, la máquina recibiría reglas explícitas sobre el mundo.
Este tipo de planteamiento coincide con afirmaciones como: si una persona es humana, es mortal; Sócrates es humano; por tanto, Sócrates es mortal. La máquina manipula símbolos según reglas formales. Parece elegante, y lo es. Pero el mundo real suele ser mucho más complicado que un ejercicio de lógica.
Sistemas expertos: máquinas con manual de experto
Luego llegaron los sistemas expertos: programas que intentaban plasmar los conocimientos de médicos, ingenieros, analistas u otros especialistas en una gran colección de reglas.
Podían trabajar bien en ámbitos limitados cuando las reglas eran claras. Pero tenían dificultades con las excepciones, la ambigüedad, el sentido común y las situaciones nuevas. Era como intentar encajar el mundo entero en un archivador de reglas. Valientes, pero un poco locos, en el mejor sentido académico.
Búsqueda: la inteligencia como exploración de posibilidades
Otra tradición importante de la IA es la búsqueda. Imaginemos un juego, un laberinto o un problema de planificación. La máquina tiene que explorar posibles caminos hasta encontrar una buena solución.
En lugar de "entender" el mundo como lo hace una persona, puede probar estados: si hago esto, acabo allí; si elijo otro camino, puede que llegue mejor. Esta visión era muy importante en los juegos, la planificación y la resolución de problemas.
Grafos: el conocimiento como red de relaciones
Los gráficos aparecen de forma natural cuando queremos representar relaciones: una cosa unida a otra. Personas conectadas en una red social, ciudades conectadas por carreteras, conceptos conectados por significados, páginas conectadas por enlaces.
En IA, los grafos ayudan a representar el conocimiento y la búsqueda. Si "café" está vinculado a "bebida", "cafeína" y "taza", la máquina puede navegar por estas relaciones. Esto es muy útil para el conocimiento explícito, pero no resuelve por sí solo la complejidad del lenguaje humano.
El giro estadístico: aprender patrones de los datos
Con el tiempo, una idea cobró fuerza: en lugar de escribir todas las reglas a mano, podemos dar ejemplos a la máquina y dejar que aprenda patrones.
Este giro estadístico desplaza el centro de la IA. La pregunta pasa de "¿qué reglas debemos escribir?" a "¿qué patrones aparecen en los datos?". Esto abre el camino a la clasificación, la predicción, el reconocimiento del habla, la traducción automática y, más tarde, los modelos lingüísticos modernos.
Redes neuronales: conexiones ajustables
Las redes neuronales entran en esta historia como sistemas con muchas conexiones ajustables. Reciben una entrada, la transforman a través de capas y producen una salida. Durante el entrenamiento, los pesos de estas conexiones se ajustan para reducir el error.
Resulta tentador decir que "imitan al cerebro", pero esta metáfora debe utilizarse con cuidado. Para este curso, es mejor pensar en ellas como máquinas matemáticas flexibles que aprenden transformaciones a partir de ejemplos.
Por qué los LLM son un encuentro de varias tradiciones
Los grandes modelos lingüísticos no surgieron de la nada. Combinan varios hilos históricos: la estadística para predecir patrones, las redes neuronales para aprender representaciones, los tokens para transformar el texto en unidades manipulables, la atención para conectar partes del contexto y un hardware potente para hacer todo esto a escala.
Cuando observamos un LLM, estamos viendo un capítulo reciente de una historia más amplia. No sustituye a toda la IA anterior; hereda ideas, resuelve algunos problemas antiguos y crea otros nuevos. Un paquete completo: brillante, costoso y, en ocasiones, dramático.
Mapa mental inicial
Escribe tres formas diferentes de imaginar la "inteligencia" en una máquina: seguir reglas, buscar caminos y aprender patrones. Después, pon un ejemplo sencillo de cada una.
Ver respuesta esperada
Seguir las normas: si llueve, llévate un paraguas. Buscar caminos: encontrar la ruta más corta en el mapa. Aprender patrones: ver muchas frases y darse cuenta de que después de "bien" suele venir "mañana". Estas tres ideas aparecen en distintas fases de la IA.
Los LLM son recientes, pero forman parte de una larga historia. Antes de ellos, la IA exploraba las reglas, la lógica, los sistemas expertos, la búsqueda, los grafos, la estadística y las redes neuronales.