LAB - MODULE 2

Construire la machine, étape par étape

Il s'agit de la machine des leçons 7 et 10 - en direct. Vous alimentez le corpus et vous observez le travail de chaque pièce : la tokenisation, le vocabulaire, la table de continuation et la génération token par token, avec les probabilités affichées. Pas de magie, pas de réseau neuronal : du comptage pur que vous pouvez voir à travers.

Jetons

pièces observées dans le corpus

Vocabulaire

jetons uniques connus

Contextes

entrées dans le tableau

Contexte

mots utilisés pour prédire

Le corpus

Le petit monde que connaît la machine. Une phrase par ligne.

Exemples :

14 peines · 61 jetons · 32 en vocabulaire

Tokenisation

Chaque phrase est décomposée en morceaux (mots et ponctuation).

1eugostodecafé

2eugostodechá

3eugostodecafécomleite

4elagostadecafé

5elagostadepão

6ocaféestáquente

7ocháestáfrio

8eubebocafédemanhã

9elabebecháànoite

10cafécombinacompão

11chácombinacombolo

12amáquinaaprendepadrões

+2 plus de phrases...

Vocabulaire

Des jetons uniques, chacun avec un numéro (ID) et le nombre de fois qu'il est apparu.

1eu4×2gosto3×3de6×4café6×5chá4×6com3×7leite1×8ela3×9gosta2×10pão2×11o2×12está2×13quente1×14frio1×15bebo1×16manhã1×17bebe1×18à1×19noite1×20combina2×21bolo1×22a2×23máquina2×24aprende1×25padrões1×26gera1×27texto1×28aprender1×29inteligência1×30artificial1×31é1×32divertido1×

Taille du contexte

Nombre de mots précédents pris en compte par la machine pour prédire le mot suivant.

Tableau de continuation

La mémoire de la machine : après chaque contexte de 2 mots, ce qui s'est passé ensuite - et combien de fois.

a máquina→aprende1gera1

à noite→- fin1

aprende padrões→- fin1

aprender inteligência→artificial1

artificial é→divertido1

bebe chá→à1

bebo café→de1

café com→leite1

café combina→com1

café de→manhã1

café está→quente1

chá à→noite1

chá combina→com1

chá está→frio1

com bolo→- fin1

com leite→- fin1

com pão→- fin1

combina com→bolo1pão1

de café→- fin2com1

de chá→- fin1

de manhã→- fin1

de pão→- fin1

é divertido→- fin1

ela bebe→chá1

ela gosta→de2

está frio→- fin1

está quente→- fin1

eu bebo→café1

eu gosto→de3

gera texto→- fin1

gosta de→café1pão1

gosto de→café2chá1

inteligência artificial→é1

máquina aprende→padrões1

máquina gera→texto1

o café→está1

o chá→está1

Génération : la machine écrit

Il examine le contexte, vérifie le tableau, choisit le jeton suivant et recommence.

Commencer par (facultatif)

Comment choisir

Température · 0.8faible = plus évident et stable - élevé = plus varié et risqué

C'est cela. En modifiant le corpus, la taille du contexte et la méthode de sélection, vous voyez d'où vient chaque mot et pourquoi la même machine peut sembler prévisible ou créative. Les modèles géants suivent le même cycle, avec des enchâssements et de l'attention au lieu du comptage brut.

← Retour à la leçon 10

Construire la machine, étape par étape