MODULE 3 - MODERNE

Évolution vers des concepts modernes

Après la machine transparente, nous sophistiquons sans retourner dans le brouillard. Des mini-laboratoires visuels relient la petite machine à langage à des concepts modernes : embeddings (carte du sens), attention (poids de focalisation), recherche de documents (RAG) et systèmes hybrides.

Principe du module

Moderniser n'est pas mystifier. Il s'agit de remplacer des éléments simples par des éléments plus souples, tout en conservant la carte mentale.

Carte d'intégration

Sélectionnez un mot et voyez quels sont les mots les plus proches. Carte simplifiée en 2D - les vrais enchâssements ont des centaines de dimensions.

Parole :

Sélectionné

café

groupe didactique : bebidas

Voisins les plus proches

chádist. 7.2

leitedist. 11.2

xícaradist. 12.6

pãodist. 22.5

bolodist. 28.8

Simulateur d'attention

Ne calcule pas l'attention réelle du transformateur. Illustre l'idée : les jetons reçoivent des poids différents en fonction de leur contribution à l'interprétation du centre d'intérêt.

Exemple :

Focus

ela

AnaemprestouocasacoparaJúliaporqueelaestavacomfrio

Ana28%

emprestou18%

o4%

casaco62%

para20%

Júlia90%

porque16%

ela100%

estava42%

com12%

frio55%

Mini-RAG : chercher avant de répondre

Modifiez les documents, posez une question et voyez quels passages sont retrouvés. Notation par chevauchement de mots - simple mais instructif.

Base documentaire

Question

Réponse étayée

Le passage le plus pertinent semble être le suivant "Documento 3: Atenção ajuda o modelo a pesar quais partes do contexto são mais relevantes.".

Document 375% match

Documento 3: Atenção ajuda o modelo a pesar quais partes do contexto são mais relevantes.

atençãoajudamodelo

Document 225% match

Documento 2: Embeddings representam palavras e textos como posições em um espaço numérico.

como

Document 10% match

Documento 1: A Small Language Machine usa um corpus pequeno para aprender padrões de continuação.

Document 40% match

Documento 4: RAG combina busca em documentos com geração de linguagem.

Document 50% match

Documento 5: GPUs aceleram muitas operações matemáticas paralelas usadas no treinamento de redes neurais.

Quelles sont les qualités de chaque pièce ?

L'objectif n'est pas de choisir une technique gagnante, mais de comprendre comment elles se complètent.

N-gramas

La force Muito transparentes e fáceis de explicar.

Limite Dependem de repetição exata e generalizam pouco.

Utilisation Ensino, protótipos, demonstrações de previsão.

Embeddings

La force Capturam proximidade de significado.

Limite São aproximações e podem carregar vieses dos dados.

Utilisation Busca semântica, recomendação, comparação de textos.

Atenção

La force Ajuda a conectar partes relevantes do contexto.

Limite Não é compreensão humana nem garante verdade.

Utilisation Transformers, LLMs, tradução, resumo, geração.

RAG

La force Apoia respostas em documentos externos.

Limite Depende da qualidade da busca e das fontes.

Utilisation Perguntas sobre bases internas, pesquisa, suporte.

Leçon complète30 minPonte conceitual

3.1

Du comptage aux modèles neuronaux

Ce qui change lorsque nous abandonnons le tableau des n-grammes

Objectif de la leçon

Comprendre la transition entre une machine à compter transparente et des modèles neuronaux qui apprennent des représentations plus flexibles.

Ce que notre machine à n-grammes a bien fait

La machine interactive du module 2 observe les séquences et compte les suites. Si, après "J'aime", le mot "café" apparaît, elle l'enregistre dans le tableau.

Cette approche est excellente pour l'apprentissage car elle est transparente. Nous pouvons ouvrir le tableau, voir les comptes et expliquer chaque choix.

La limite de la répétition exacte

Le problème est que la machine à n-grammes dépend fortement des séquences déjà vues. Si le corpus n'a jamais eu "J'aime le café", il peut ne pas savoir que cette séquence est similaire à "J'aime le café".

Les modèles neuronaux apprennent à mieux gérer la similarité, le contexte et la généralisation. Au lieu de dépendre uniquement de la répétition exacte, ils apprennent des représentations internes.

Les représentations sont le saut

Le mot "café" cesse d'être une simple étiquette ou une entrée dans un tableau. Il commence à être représenté par des nombres qui rendent compte des relations avec d'autres mots.

Ce saut ouvre la voie aux encastrements, à l'attention et aux modèles modernes. La machine commence à travailler avec des voisinages de sens, et pas seulement avec des comptages locaux.

[pratique ]

L'écart de comptage

Pensez à un corpus qui contient "J'aime le café" mais qui n'a jamais eu "J'aime le café". Pourquoi la machine à n-grammes ne peut-elle pas utiliser la similarité entre "like" et "love" ? De quoi aurait-elle besoin ?

Voir la réponse attendue

Pour le tableau, "like" et "love" sont des symboles différents sans aucune relation - il ne connaît que des séquences exactes. Il aurait besoin d'une représentation qui rapproche les mots de signification similaire. C'est exactement ce que proposent les "embeddings".

✓ Ce que vous retenez

Les modèles modernes n'abandonnent pas les statistiques, ils les sophistiquent. Nous passons de comptages explicites à des représentations apprises qui permettent une meilleure généralisation.

Glossaire vivant

Termes que nous rencontrerons dans ce module.

Représentation

Forme numérique ou structurelle que la machine utilise pour travailler avec une idée, un mot ou un document.

Intégration

Représentation numérique qui positionne des mots ou des textes dans un espace de sens.

Similitude

Mesure de la proximité entre deux représentations.

Attention

Mécanisme qui attribue des poids différents à certaines parties du contexte.

Attention poids

Valeur indiquant l'importance accordée à un jeton à une étape donnée.

RAG

Génération assistée par la recherche : génération assistée par la recherche de documents.

Récupération

Le processus de recherche de documents ou de passages pertinents pour une question.

Contexte externe

Information apportée en dehors du modèle pour étayer une réponse.

Système hybride

Un système qui combine différentes techniques, telles que les LLM, la recherche, les règles, les graphes et les bases de données.

Évolution vers des concepts modernes

Principe du module

Moderniser n'est pas mystifier. Il s'agit de remplacer des éléments simples par des éléments plus souples, tout en conservant la carte mentale.