MÓDULO 0 - ANTES DE LA MÁQUINA

Historia y fundamentos de la IA

Antes de construir, ayuda entender de dónde viene la IA. Reglas, lógica, gráficos, búsqueda, estadística, redes neuronales, GPUs, tokens y, finalmente, LLMs. Este módulo prepara el terreno - nada de lecciones falsas: cada una llega cuando realmente se escribe.

Principio del módulo

Los LLM no cayeron del cielo. En ellos confluyen muchas ideas antiguas con la escala moderna.

Lección completa25 minIntrodução histórica

0.1

La IA antes de los LLM

Por qué los modelos lingüísticos son un capítulo reciente de una historia más amplia

Objetivo de la lección

Comprenda que la IA no empezó con los chatbots modernos: antes de los LLM, hubo décadas de intentos basados en la lógica, las reglas, la búsqueda, la estadística y las redes neuronales.

La IA no nació conversando

Hoy en día, mucha gente se encuentra por primera vez con la IA en forma de conversación: un chatbot que responde preguntas, escribe textos, resume documentos y ayuda con el código. Esto da la impresión de que la inteligencia artificial siempre fue fluida en lenguaje natural. Pero no es así.

Durante gran parte de la historia de la IA, el sueño era otro: hacer que las máquinas resolvieran problemas, siguieran reglas, demostraran teoremas, planificaran acciones, jugaran al ajedrez, reconocieran patrones o emularan a los expertos humanos en ámbitos específicos.

Primera gran visión: la inteligencia como razonamiento simbólico

Una de las primeras apuestas fuertes fue la IA simbólica. La idea era representar el conocimiento mediante símbolos, reglas y lógica. En lugar de aprender de millones de ejemplos, la máquina recibiría reglas explícitas sobre el mundo.

Este tipo de planteamiento coincide con afirmaciones como: si una persona es humana, es mortal; Sócrates es humano; por tanto, Sócrates es mortal. La máquina manipula símbolos según reglas formales. Parece elegante, y lo es. Pero el mundo real suele ser mucho más complicado que un ejercicio de lógica.

Sistemas expertos: máquinas con manual de experto

Luego llegaron los sistemas expertos: programas que intentaban plasmar los conocimientos de médicos, ingenieros, analistas u otros especialistas en una gran colección de reglas.

Podían trabajar bien en ámbitos limitados cuando las reglas eran claras. Pero tenían dificultades con las excepciones, la ambigüedad, el sentido común y las situaciones nuevas. Era como intentar encajar el mundo entero en un archivador de reglas. Valientes, pero un poco locos, en el mejor sentido académico.

Búsqueda: la inteligencia como exploración de posibilidades

Otra tradición importante de la IA es la búsqueda. Imaginemos un juego, un laberinto o un problema de planificación. La máquina tiene que explorar posibles caminos hasta encontrar una buena solución.

En lugar de "entender" el mundo como lo hace una persona, puede probar estados: si hago esto, acabo allí; si elijo otro camino, puede que llegue mejor. Esta visión era muy importante en los juegos, la planificación y la resolución de problemas.

Grafos: el conocimiento como red de relaciones

Los gráficos aparecen de forma natural cuando queremos representar relaciones: una cosa unida a otra. Personas conectadas en una red social, ciudades conectadas por carreteras, conceptos conectados por significados, páginas conectadas por enlaces.

En IA, los grafos ayudan a representar el conocimiento y la búsqueda. Si "café" está vinculado a "bebida", "cafeína" y "taza", la máquina puede navegar por estas relaciones. Esto es muy útil para el conocimiento explícito, pero no resuelve por sí solo la complejidad del lenguaje humano.

El giro estadístico: aprender patrones de los datos

Con el tiempo, una idea cobró fuerza: en lugar de escribir todas las reglas a mano, podemos dar ejemplos a la máquina y dejar que aprenda patrones.

Este giro estadístico desplaza el centro de la IA. La pregunta pasa de "¿qué reglas debemos escribir?" a "¿qué patrones aparecen en los datos?". Esto abre el camino a la clasificación, la predicción, el reconocimiento del habla, la traducción automática y, más tarde, los modelos lingüísticos modernos.

Redes neuronales: conexiones ajustables

Las redes neuronales entran en esta historia como sistemas con muchas conexiones ajustables. Reciben una entrada, la transforman a través de capas y producen una salida. Durante el entrenamiento, los pesos de estas conexiones se ajustan para reducir el error.

Resulta tentador decir que "imitan al cerebro", pero esta metáfora debe utilizarse con cuidado. Para este curso, es mejor pensar en ellas como máquinas matemáticas flexibles que aprenden transformaciones a partir de ejemplos.

Por qué los LLM son un encuentro de varias tradiciones

Los grandes modelos lingüísticos no surgieron de la nada. Combinan varios hilos históricos: la estadística para predecir patrones, las redes neuronales para aprender representaciones, los tokens para transformar el texto en unidades manipulables, la atención para conectar partes del contexto y un hardware potente para hacer todo esto a escala.

Cuando observamos un LLM, estamos viendo un capítulo reciente de una historia más amplia. No sustituye a toda la IA anterior; hereda ideas, resuelve algunos problemas antiguos y crea otros nuevos. Un paquete completo: brillante, costoso y, en ocasiones, dramático.

[práctica]

Mapa mental inicial

Escribe tres formas diferentes de imaginar la "inteligencia" en una máquina: seguir reglas, buscar caminos y aprender patrones. Después, pon un ejemplo sencillo de cada una.

Ver respuesta esperada

Seguir las normas: si llueve, llévate un paraguas. Buscar caminos: encontrar la ruta más corta en el mapa. Aprender patrones: ver muchas frases y darse cuenta de que después de "bien" suele venir "mañana". Estas tres ideas aparecen en distintas fases de la IA.

✓ Lo que se lleva

Los LLM son recientes, pero forman parte de una larga historia. Antes de ellos, la IA exploraba las reglas, la lógica, los sistemas expertos, la búsqueda, los grafos, la estadística y las redes neuronales.

Mapa del módulo

Las próximas lecciones aparecen como una hoja de ruta: entran en el menú una vez escritas.

0.1publicado

La IA antes de los LLM

El primer panorama: de las normas y la búsqueda a los modelos modernos.

0.2publicado

IA simbólica, lógica y Prolog

Cuando la inteligencia parecía escribir reglas claras sobre el mundo.

0.3publicado

Grafos y conocimiento en red

Cómo las relaciones, los nodos y los caminos ayudan a las máquinas a representar el mundo.

0.4publicado

Búsqueda y planificación

La inteligencia como exploración de caminos, opciones y estados posibles.

0.5publicado

Estadística y aprendizaje a partir de datos

El paso de la escritura de reglas al aprendizaje de patrones a partir de ejemplos.

0.6publicado

Redes neuronales sin misticismo

Entradas, capas, pesos, error y ajuste — sin demasiada neuro-poesía.

0.7publicado

Por qué importan las GPU

Paralelismo, escala y el matrimonio entre la IA moderna y el hardware.

0.8publicado

De las palabras a los tokens

Por qué el texto debe convertirse en bloques numéricos antes de convertirse en aprendizaje.

0.9publicado

Transformers y LLM

Atención, escala y predicción del siguiente token como motor del lenguaje moderno.

0.10publicado

El mapa completo de la IA

Simbólica, estadística y neuronal: tres familias que siguen coexistiendo.

Glosario vivo

Términos que encontraremos en este módulo.

IA simbólica

Enfoque que representa el conocimiento mediante símbolos, reglas y lógica explícita.

Símbolo

Representación manipulable de una cosa, idea, categoría o relación, como "humano", "mortal" o "vive_en".

Dato

Una afirmación que el sistema considera verdadera dentro de un dominio, como "Ana es médico".

Regla

Relación lógica que permite sacar conclusiones, como "si alguien es médico, trabaja en la sanidad".

Inferencia

El proceso de llegar a una conclusión a partir de hechos y reglas.

Prolog

Lenguaje de programación lógica asociado a la IA simbólica, basado en hechos, reglas y consultas.

Sistema experto

Programa que trata de imitar las decisiones de los expertos utilizando una base de reglas.

Buscar en

El proceso de explorar posibilidades hasta encontrar una solución o camino adecuado.

Gráfico

Estructura formada por nodos y conexiones, útil para representar relaciones y caminos.

Estadísticas

Conjunto de métodos para observar datos, estimar patrones y tratar la incertidumbre.

Red neuronal

Un sistema matemático con conexiones ajustables que aprende transformaciones a partir de ejemplos.

LLM

Gran modelo lingüístico: un gran modelo lingüístico entrenado para procesar y generar texto a escala.

Nodo

En un gráfico, cada cosa representada: una persona, una ciudad, una palabra o un concepto.

Borde

En un grafo, vínculo entre dos nodos, normalmente con una relación nominal ("es un", "vive en").

Heurística

Una conjetura que orienta la búsqueda hacia caminos prometedores, sin garantizar la mejor solución.

Planificación

Establecer de antemano una secuencia de acciones que conduzcan de una situación inicial a un objetivo.

Generalización

La capacidad de acertar en casos nuevos, no sólo en los ejemplos vistos durante la formación.

Sobreajuste

Cuando el modelo memoriza demasiado los ejemplos de entrenamiento y obtiene malos resultados en casos nuevos.

Peso

Número ajustable para una conexión en una red neuronal. El entrenamiento es el proceso de ajuste de los pesos (también llamados parámetros).

Formación

El proceso de mostrar ejemplos, medir el error y ajustar las ponderaciones repetidamente hasta que el modelo se equivoque menos.

GPU

Hardware que realiza miles de cálculos sencillos en paralelo, ideal para entrenar y ejecutar redes neuronales.

Paralelismo

Realizar muchas operaciones al mismo tiempo, en lugar de una tras otra.

Transformador

Una arquitectura de red neuronal basada en la atención que procesa el contexto en paralelo; la base de los LLM.

Atención

Un mecanismo que pondera qué partes del contexto son más relevantes para la siguiente decisión.

Alucinación

Cuando un modelo afirma con seguridad algo incorrecto o inventado, generando un texto verosímil en lugar de consultar una verdad.

Historia y fundamentos de la IA

Principio del módulo

Los LLM no cayeron del cielo. En ellos confluyen muchas ideas antiguas con la escala moderna.

Lección completa25 minIntrodução histórica

0.1

La IA antes de los LLM

Por qué los modelos lingüísticos son un capítulo reciente de una historia más amplia

Objetivo de la lección

Comprenda que la IA no empezó con los chatbots modernos: antes de los LLM, hubo décadas de intentos basados en la lógica, las reglas, la búsqueda, la estadística y las redes neuronales.

La IA no nació conversando

Primera gran visión: la inteligencia como razonamiento simbólico

Sistemas expertos: máquinas con manual de experto

Luego llegaron los sistemas expertos: programas que intentaban plasmar los conocimientos de médicos, ingenieros, analistas u otros especialistas en una gran colección de reglas.

Búsqueda: la inteligencia como exploración de posibilidades

Grafos: el conocimiento como red de relaciones

El giro estadístico: aprender patrones de los datos

Con el tiempo, una idea cobró fuerza: en lugar de escribir todas las reglas a mano, podemos dar ejemplos a la máquina y dejar que aprenda patrones.

Redes neuronales: conexiones ajustables

Por qué los LLM son un encuentro de varias tradiciones

[práctica]

Mapa mental inicial

Escribe tres formas diferentes de imaginar la "inteligencia" en una máquina: seguir reglas, buscar caminos y aprender patrones. Después, pon un ejemplo sencillo de cada una.

Ver respuesta esperada

✓ Lo que se lleva