MÓDULO 3 — MODERNO

Evoluindo para conceitos modernos

Depois da máquina transparente, vamos sofisticar sem voltar à névoa. Mini-laboratórios visuais conectam a Small Language Machine aos conceitos modernos: embeddings (mapa de significado), atenção (pesos de foco), busca em documentos (RAG) e sistemas híbridos.

Princípio do módulo

Modernizar não é mistificar. É trocar peças simples por peças mais flexíveis — mantendo o mapa mental.

Mapa de embeddings

Selecione uma palavra e veja quais ficam mais próximas. Mapa 2D simplificado — embeddings reais têm centenas de dimensões.

Palavra:

Selecionado

café

grupo didático: bebidas

Vizinhos mais próximos

chádist. 7.2

leitedist. 11.2

xícaradist. 12.6

pãodist. 22.5

bolodist. 28.8

Simulador de atenção

Não calcula atenção real de Transformer. Ilustra a ideia: tokens recebem pesos diferentes conforme ajudam a interpretar o foco.

Exemplo:

Foco

ela

AnaemprestouocasacoparaJúliaporqueelaestavacomfrio

Ana28%

emprestou18%

o4%

casaco62%

para20%

Júlia90%

porque16%

ela100%

estava42%

com12%

frio55%

Mini-RAG: buscar antes de responder

Edite os documentos, faça uma pergunta e veja quais trechos são recuperados. A pontuação é por sobreposição de palavras — simples, mas didática.

Base de documentos

Pergunta

Resposta apoiada

O trecho mais relevante parece ser: "Documento 3: Atenção ajuda o modelo a pesar quais partes do contexto são mais relevantes.".

Documento 375% match

Documento 3: Atenção ajuda o modelo a pesar quais partes do contexto são mais relevantes.

atençãoajudamodelo

Documento 225% match

Documento 2: Embeddings representam palavras e textos como posições em um espaço numérico.

como

Documento 10% match

Documento 1: A Small Language Machine usa um corpus pequeno para aprender padrões de continuação.

Documento 40% match

Documento 4: RAG combina busca em documentos com geração de linguagem.

Documento 50% match

Documento 5: GPUs aceleram muitas operações matemáticas paralelas usadas no treinamento de redes neurais.

O que cada peça faz bem?

Não se trata de eleger uma técnica vencedora, mas de entender como elas se complementam.

N-gramas

Força Muito transparentes e fáceis de explicar.

Limite Dependem de repetição exata e generalizam pouco.

Uso Ensino, protótipos, demonstrações de previsão.

Embeddings

Força Capturam proximidade de significado.

Limite São aproximações e podem carregar vieses dos dados.

Uso Busca semântica, recomendação, comparação de textos.

Atenção

Força Ajuda a conectar partes relevantes do contexto.

Limite Não é compreensão humana nem garante verdade.

Uso Transformers, LLMs, tradução, resumo, geração.

RAG

Força Apoia respostas em documentos externos.

Limite Depende da qualidade da busca e das fontes.

Uso Perguntas sobre bases internas, pesquisa, suporte.

Aula completa30 minPonte conceitual

3.1

Da contagem aos modelos neurais

O que muda quando saímos da tabela de n-gramas

▸ Objetivo da aula

Entender a transição entre uma máquina de contagem transparente e modelos neurais que aprendem representações mais flexíveis.

O que nossa máquina de n-gramas fazia bem

A máquina interativa do Módulo 2 observava sequências e contava continuações. Se depois de ‘eu gosto de’ aparecia ‘café’, ela guardava isso na tabela.

Essa abordagem é excelente para aprender porque é transparente. Podemos abrir a tabela, ver as contagens e explicar cada escolha.

O limite da repetição exata

O problema é que a máquina de n-gramas depende muito de sequências já vistas. Se o corpus nunca teve ‘eu adoro café’, ela talvez não saiba que isso é parecido com ‘eu gosto de café’.

Modelos neurais entram para lidar melhor com semelhança, contexto e generalização. Em vez de depender só de repetição exata, eles aprendem representações internas.

Representações são o salto

A palavra ‘café’ deixa de ser apenas uma etiqueta ou uma entrada numa tabela. Ela passa a ser representada por números que capturam relações com outras palavras.

Esse salto abre caminho para embeddings, atenção e modelos modernos. A máquina começa a trabalhar com vizinhanças de significado, não só com contagens locais.

[ prática ]

O furo da contagem

Pense num corpus que tem ‘eu gosto de café’ mas nunca teve ‘eu adoro café’. Por que a máquina de n-gramas não consegue aproveitar a semelhança entre ‘gosto’ e ‘adoro’? O que faltaria para ela conseguir?

Ver resposta esperada

Para a tabela, ‘gosto’ e ‘adoro’ são símbolos diferentes, sem nenhuma relação — ela só conhece sequências exatas. Faltaria uma representação que aproximasse palavras de sentido parecido. É exatamente o que os embeddings trazem.

✓ Resumo que você leva daqui

Modelos modernos não abandonam a estatística; eles a sofisticam. Saímos de contagens explícitas para representações aprendidas que permitem generalizar melhor.

Glossário vivo

Termos que vamos encontrar neste módulo.

Representação

Forma numérica ou estrutural usada pela máquina para trabalhar com uma ideia, palavra ou documento.

Embedding

Representação numérica que posiciona palavras ou textos em um espaço de significado.

Similaridade

Medida de proximidade entre duas representações.

Atenção

Mecanismo que atribui pesos diferentes a partes do contexto.

Peso de atenção

Valor que indica quanta importância um token recebe em uma etapa.

RAG

Retrieval-Augmented Generation: geração apoiada por recuperação de documentos.

Recuperação

Processo de buscar documentos ou trechos relevantes para uma pergunta.

Contexto externo

Informação trazida de fora do modelo para apoiar uma resposta.

Sistema híbrido

Sistema que combina diferentes técnicas, como LLMs, busca, regras, grafos e bancos de dados.

Evoluindo para conceitos modernos

Princípio do módulo

Modernizar não é mistificar. É trocar peças simples por peças mais flexíveis — mantendo o mapa mental.