LAB - MÓDULO 2

Construir la máquina, paso a paso

Esta es la máquina de las lecciones 7 y 10, en directo. Usted alimenta el corpus y observa cómo funciona cada pieza: tokenización, vocabulario, tabla de continuación y generación de token por token, con las probabilidades en pantalla. Sin magia ni redes neuronales: puro recuento que se puede ver.

Fichas

piezas observadas en el corpus

Vocabulario

fichas únicas conocidas

Contextos

entradas en la tabla

Contexto

palabras utilizadas para predecir

El corpus

El pequeño mundo que conoce la máquina. Una frase por línea.

Ejemplos:

14 frases · 61 fichas · 32 en vocabulario

Tokenización

Cada frase dividida en trozos (palabras y signos de puntuación).

1eugostodecafé

2eugostodechá

3eugostodecafécomleite

4elagostadecafé

5elagostadepão

6ocaféestáquente

7ocháestáfrio

8eubebocafédemanhã

9elabebecháànoite

10cafécombinacompão

11chácombinacombolo

12amáquinaaprendepadrões

+2 más frases...

Vocabulario

Fichas únicas, cada una con un número (ID) y cuántas veces ha aparecido.

1eu4×2gosto3×3de6×4café6×5chá4×6com3×7leite1×8ela3×9gosta2×10pão2×11o2×12está2×13quente1×14frio1×15bebo1×16manhã1×17bebe1×18à1×19noite1×20combina2×21bolo1×22a2×23máquina2×24aprende1×25padrões1×26gera1×27texto1×28aprender1×29inteligência1×30artificial1×31é1×32divertido1×

Tamaño del contexto

En cuántas palabras anteriores se fija la máquina para predecir la siguiente.

Tabla de continuación

La memoria de la máquina: después de cada contexto de 2 palabras, lo que vino después, y cuántas veces.

a máquina→aprende1gera1

à noite→- fin1

aprende padrões→- fin1

aprender inteligência→artificial1

artificial é→divertido1

bebe chá→à1

bebo café→de1

café com→leite1

café combina→com1

café de→manhã1

café está→quente1

chá à→noite1

chá combina→com1

chá está→frio1

com bolo→- fin1

com leite→- fin1

com pão→- fin1

combina com→bolo1pão1

de café→- fin2com1

de chá→- fin1

de manhã→- fin1

de pão→- fin1

é divertido→- fin1

ela bebe→chá1

ela gosta→de2

está frio→- fin1

está quente→- fin1

eu bebo→café1

eu gosto→de3

gera texto→- fin1

gosta de→café1pão1

gosto de→café2chá1

inteligência artificial→é1

máquina aprende→padrões1

máquina gera→texto1

o café→está1

o chá→está1

Generación: la máquina escribe

Mira el contexto, comprueba la tabla, elige el siguiente token y repite.

Comience con (opcional)

Cómo elegir

Temperatura · 0.8bajo = más obvio y estable - alto = más variado y arriesgado

Eso es. Cambiando el corpus, el tamaño del contexto y el método de selección, se ve de dónde viene cada palabra, y por qué la misma máquina puede sonar predecible o creativa. Los modelos gigantes siguen el mismo ciclo, con incrustaciones y atención en lugar de recuento en bruto.

← Volver a la lección 10

Construir la máquina, paso a paso