Referências Teóricas — YouTube, Papers e Artigos para Entrevista
Baixar PDFCompilação de vídeos, papers e artigos essenciais para embasar teoricamente em entrevistas e testes práticos de engenharia de IA. Canais, cursos e leituras recomendadas.
Referências Teóricas — YouTube, Papers e Artigos para Entrevista
Meu caro buscador, em uma entrevista de engenharia de IA, não basta saber fazer — precisa saber explicar por que faz. E para explicar, precisa de embasamento.
Aqui estão as referências que vão te dar vocabulário técnico, contexto histórico e profundidade conceitual para qualquer pergunta que vier.
1. Canais do YouTube — Estude Assistindo
1.1 Fundamentos de ML/DL
| Canal | O que cobre | Link |
|---|---|---|
| 3Blue1Brown | Álgebra linear, redes neurais, backpropagation (visual, intuitivo) | youtube.com/@3blue1brown |
| Andrej Karpathy | Neural networks do zero, GPT, attention, LLMs (ex-engenheiro Tesla/OpenAI) | youtube.com/@AndrejKarpathy |
| StatQuest with Josh Starmer | ML, estatística, modelos clássicos (explicações claras, sem jargão) | youtube.com/@statquest |
| Sentdex | Python, ML prático, deep learning com código | youtube.com/@sentdex |
1.2 LLMs e AI Engineering
| Canal | O que cobre | Link |
|---|---|---|
| AI Jason | Agentes, RAG, LangChain, ferramentas de IA | youtube.com/@ai_jason |
| Sam Witteveen | LLMs, fine-tuning, RAG, deployment | youtube.com/@samwitteveenai |
| Prompt Engineering (DAIR.AI) | Prompt engineering, chain-of-thought, técnicas avançadas | youtube.com/@DAIR.AI |
| All About AI | Novidades em IA, tutoriais, comparações de ferramentas | youtube.com/@AllAboutAI |
1.3 Pesquisa e Papers
| Canal | O que cobre | Link |
|---|---|---|
| Yannic Kilcher | Papers de ML/LLM explicados em detalhe | youtube.com/@YannicKilcher |
| Two Minute Papers | Resumos rápidos de papers de IA | youtube.com/@TwoMinutePapers |
| Arxiv Insights | Papers importantes explicados visualmente | youtube.com/@ArxivInsights |
2. Vídeos Específicos — Assista Antes da Entrevista
2.1 "Attention Is All You Need" (Transformers)
- Paper: arxiv.org/abs/1706.03762
- Vídeo explicativo: Yannic Kilcher — "Attention Is All You Need" (40 min)
- Vídeo visual: 3Blue1Brown — "Attention in transformers, visually explained" (25 min)
- Por que importa: É O paper que criou a arquitetura de todos os LLMs atuais. Se souber explicar self-attention, já se destaca.
2.2 RAG (Retrieval-Augmented Generation)
- Paper original: arxiv.org/abs/2005.11401 (Lewis et al., 2020)
- Vídeo: Sam Witteveen — "RAG from Scratch" (playlist completa)
- Vídeo: AI Jason — "Build RAG with LangChain" (tutorial prático)
- Por que importa: É a técnica mais cobrada em testes práticos atualmente.
2.3 Fine-tuning e RLHF
- Paper InstructGPT: arxiv.org/abs/2203.02155 (Ouyang et al., 2022)
- Vídeo: Andrej Karpathy — "Let's build GPT from scratch" (2h, épico)
- Vídeo: Yannic Kilcher — "InstructGPT" (explica RLHF)
- Por que importa: Explica como modelos como ChatGPT são alinhados. Pergunta recorrente em entrevistas.
2.4 LoRA e Fine-tuning Eficiente
- Paper LoRA: arxiv.org/abs/2106.09685 (Hu et al., 2021)
- Vídeo: Sam Witteveen — "LoRA explained + fine-tuning tutorial"
- Vídeo: AI Jason — "Fine-tune Llama for free with QLoRA"
- Por que importa: É como se treina modelos proprietários hoje. Sem LoRA, fine-tuning é inviável.
2.5 Agentes e Function Calling
- Paper ReAct: arxiv.org/abs/2210.03629 (Yao et al., 2022)
- Vídeo: AI Jason — "Build AI Agents from Scratch"
- Vídeo: LangChain — "LangGraph Agents Tutorial"
- Por que importa: Agentes são o futuro de engenharia de IA. Saber construir um te diferencia.
3. Papers Essenciais — O que Citar
| Paper | Ano | Importância | O que diz |
|---|---|---|---|
| Attention Is All You Need | 2017 | Fundamental | Criou a arquitetura Transformer |
| BERT (Devlin et al.) | 2018 | Alta | Demonstrou poder do pre-training bidirecional |
| GPT-3 (Brown et al.) | 2020 | Alta | Few-shot learning com LLMs grandes |
| RAG (Lewis et al.) | 2020 | Muito Alta | Combinação de retrieval + generation |
| InstructGPT / RLHF | 2022 | Muito Alta | Alinhamento de LLMs com feedback humano |
| LoRA (Hu et al.) | 2021 | Alta | Fine-tuning eficiente com baixo custo |
| ReAct (Yao et al.) | 2022 | Alta | Agentes que raciocinam e agem |
| Chain-of-Thought (Wei et al.) | 2022 | Alta | Raciocínio passo a passo em LLMs |
| Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks | 2020 | Muito Alta | Fundamento do RAG |
| LLM Agents Survey (Wang et al.) | 2024 | Média | Survey sobre agentes autônomos |
4. Artigos e Blogs — Leitura Rápida
| Fonte | O que cobre | Link |
|---|---|---|
| Hugging Face Blog | Tutoriais, modelos, fine-tuning | huggingface.co/blog |
| OpenAI Cookbook | Exemplos práticos de API, RAG, function calling | cookbook.openai.com |
| Anthropic Docs | Claude API, system prompts, safety | docs.anthropic.com |
| LangChain Docs | Framework, LangGraph, agentes | python.langchain.com |
| Pinecone Learning Center | Vetor DB, embeddings, RAG | pinecone.io/learn |
| Lilian Weng's Blog | Papers explicados em profundidade | lilianweng.github.io |
| Chip Huyen's Blog | MLOps, avaliação, produção | huyenchip.com |
5. Cursos — Se Tiver Tempo
| Curso | Plataforma | Duração | Foco |
|---|---|---|---|
| Andrew Ng — Machine Learning | Coursera | ~60h | Fundamentos ML |
| Andrew Ng — Deep Learning Specialization | Coursera | ~120h | Deep Learning completo |
| Fast.ai — Practical Deep Learning | Fast.ai (grátis) | ~30h | Deep learning prático |
| DeepLearning.AI — LangChain for LLM | Coursera | ~10h | LangChain, RAG, agentes |
| Full Stack LLM Bootcamp | YouTube (grátis) | ~8h | AI engineering completo |
| Hugging Face NLP Course | HF (grátis) | ~20h | Transformers, fine-tuning |
6. Como Usar Essas Referências na Entrevista
6.1 O modelo de resposta
Quando perguntarem "como você implementaria X?", use este modelo:
1. PRINCÍPIO: "Segundo o paper de [autor] sobre [técnica]..."
2. CONCEITO: "A ideia é que [explicação simples]"
3. IMPLEMENTAÇÃO: "Na prática, eu usaria [ferramenta] com [approach]"
4. TRADE-OFF: "O trade-off é [custo vs qualidade, latência vs precisão]"6.2 Exemplos prontos
"Como você evitaria alucinações?"
"Segundo o paper original de RAG (Lewis et al., 2020), o modelo gera respostas baseadas em documentos recuperados — não apenas no parametric knowledge. Eu implementaria um pipeline com re-ranking (cross-encoder) e avaliaria com faithfulness score via Ragas, que mede se a resposta se sustenta nos documentos fornecidos."
"Como você faria fine-tuning?"
"Usaria LoRA (Hu et al., 2021) — adapter de baixa rank que congela os pesos originais e treina apenas matrizes de baixa dimensão. Com QLoRA, é possível fine-tunar um modelo de 7B em uma GPU de 16GB. A avaliação seria feita com LLM-as-judge comparando antes e depois do fine-tuning."
Dica Final
Não precisa assistir tudo. Escolha 3 vídeos da lista de "específicos" e 3 papers da lista de "essenciais". Assista/leia nos próximos dias. Isso já dá embasamento suficiente para qualquer pergunta teórica.
E lembre-se: o entrevistador não quer que você saiba tudo — quer que você saiba como pensar. Citar um paper mostra que você lê pesquisa. Explicar o trade-off mostra que você pensa como engenheiro. Isso basta.
MLOps e Deploy — Colocando IA em Produção
Como colocar modelos de IA em produção: FastAPI, Docker, versionamento de modelos e prompts, monitoramento, CI/CD para ML e padrões de deploy para sistemas de IA.
Implementação Mínima — Modelo Próprio com Phi-2 e TinyLlama
Implementação passo a passo de um modelo de linguagem pré-treinado (Phi-2, TinyLlama) com inferência, fine-tuning com LoRA, RAG e API REST. Código completo e executável para demonstração em entrevista.