Kaique Yamamoto — Full Stack & AI Engineer

Roadmap Completo de Roadmap IA & LLMs

Roadmap visual com provedores de LLM, frameworks e ferramentas para AI engineering.

6 trilhas
~80 tópicos
LLMs 2025 
Zero → MLOps 
Trilhas de Aprendizado

Seis módulos, uma jornada

Cada trilha é independente, mas o progresso é cumulativo. Siga a ordem ou pule para o que precisar.

01
01
Módulo 1 · Fundamentos
Fundamentos de LLMs
transformersattentiontokenizaçãoembeddingssampling
  • Arquitetura transformer
  • Attention mechanism
  • Multi-head attention
  • Tokenização BPE
  • SentencePiece
  • Embedding spaces
  • Temperature sampling
  • Top-p e top-k
  • Context window
  • Positional encoding
  • Hallucination
  • Grounding
Estimado: ~20h
TRILHA 1/6
02
02
Módulo 2 · Engenharia de Prompts
Prompt Engineering
zero-shotfew-shotCoTReActToT
  • Zero-shot prompting
  • Few-shot prompting
  • Chain-of-Thought
  • ReAct pattern
  • Tree of Thoughts
  • System prompts
  • Delimitadores
  • Output formatting
  • Prompt injection defenses
  • Constitutional AI
Estimado: ~15h
TRILHA 2/6
03
03
Módulo 3 · Integração
APIs & SDKs
claudeopenaigeminitool-usestreaming
  • Anthropic Claude API
  • OpenAI API
  • Gemini API
  • Tool use / function calling
  • Streaming responses
  • Batch API
  • Vision multimodal
  • Structured outputs
  • Prompt caching
  • Rate limits e retry
Estimado: ~20h
TRILHA 3/6
04
04
Módulo 4 · Recuperação & Busca
RAG & Vector DBs
pgvectorpineconeqdrantrerankingBM25
  • Chunking strategies
  • Embedding models
  • text-embedding-3
  • nomic-embed
  • pgvector
  • Pinecone
  • Qdrant
  • Reranking
  • Hybrid search BM25+vector
  • Late chunking
  • Contextual retrieval
  • Avaliação de RAG
Estimado: ~25h
TRILHA 4/6
05
05
Módulo 5 · Especialização de Modelos
Fine-tuning & Treinamento
LoRAQLoRADPOunslothW&B
  • LoRA / QLoRA
  • PEFT
  • Instruction tuning
  • DPO / RLHF
  • Unsloth
  • Axolotl
  • Dataset preparation
  • Avaliação MMLU
  • HumanEval benchmark
  • Weights & Biases
  • Model merging
  • ORPO / SimPO
Estimado: ~30h
TRILHA 5/6
06
06
Módulo 6 · Deploy & Observabilidade
Deploy & MLOps de LLMs
vLLMollamaGGUFlangsmithguardrails
  • vLLM
  • Ollama
  • llama.cpp
  • Quantização GGUF
  • GPTQ / AWQ
  • HF Inference Endpoints
  • LangSmith observabilidade
  • LangFuse
  • Guardrails
  • A/B testing de modelos
  • Custo por token
  • Latência e throughput
Estimado: ~25h
TRILHA 6/6
Monitoramento de Tokens← Todos os treinamentos