A partir de agora algumas informações do site serão pagas.

✦ Kaique Yamamoto — Full Stack & AI Engineer

Roadmap Completo de Roadmap IA & LLMs

Roadmap visual com provedores de LLM, frameworks e ferramentas para AI engineering.

6 trilhas

~80 tópicos

LLMs 2025

Zero → MLOps

Trilhas de Aprendizado

Seis módulos, uma jornada

Cada trilha é independente, mas o progresso é cumulativo. Siga a ordem ou pule para o que precisar.

01

01

Módulo 1 · Fundamentos

Fundamentos de LLMs

transformersattentiontokenizaçãoembeddingssampling

Arquitetura transformer
Attention mechanism
Multi-head attention
Tokenização BPE
SentencePiece
Embedding spaces
Temperature sampling
Top-p e top-k
Context window
Positional encoding
Hallucination
Grounding

Estimado: ~20h

TRILHA 1/6

02

02

Módulo 2 · Engenharia de Prompts

Prompt Engineering

zero-shotfew-shotCoTReActToT

Zero-shot prompting
Few-shot prompting
Chain-of-Thought
ReAct pattern
Tree of Thoughts
System prompts
Delimitadores
Output formatting
Prompt injection defenses
Constitutional AI

Estimado: ~15h

TRILHA 2/6

03

03

Módulo 3 · Integração

APIs & SDKs

claudeopenaigeminitool-usestreaming

Anthropic Claude API
OpenAI API
Gemini API
Tool use / function calling
Streaming responses
Batch API
Vision multimodal
Structured outputs
Prompt caching
Rate limits e retry

Estimado: ~20h

TRILHA 3/6

04

04

Módulo 4 · Recuperação & Busca

RAG & Vector DBs

pgvectorpineconeqdrantrerankingBM25

Chunking strategies
Embedding models
text-embedding-3
nomic-embed
pgvector
Pinecone
Qdrant
Reranking
Hybrid search BM25+vector
Late chunking
Contextual retrieval
Avaliação de RAG

Estimado: ~25h

TRILHA 4/6

05

05

Módulo 5 · Especialização de Modelos

Fine-tuning & Treinamento

LoRAQLoRADPOunslothW&B

LoRA / QLoRA
PEFT
Instruction tuning
DPO / RLHF
Unsloth
Axolotl
Dataset preparation
Avaliação MMLU
HumanEval benchmark
Weights & Biases
Model merging
ORPO / SimPO

Estimado: ~30h

TRILHA 5/6

06

06

Módulo 6 · Deploy & Observabilidade

Deploy & MLOps de LLMs

vLLMollamaGGUFlangsmithguardrails

vLLM
Ollama
llama.cpp
Quantização GGUF
GPTQ / AWQ
HF Inference Endpoints
LangSmith observabilidade
LangFuse
Guardrails
A/B testing de modelos
Custo por token
Latência e throughput

Estimado: ~25h

TRILHA 6/6

← Monitoramento de Tokens ← Todos os treinamentos