Compilação de vídeos, papers e artigos essenciais para embasar teoricamente em entrevistas e testes práticos de engenharia de IA. Canais, cursos e leituras recomendadas.

Referências Teóricas — YouTube, Papers e Artigos para Entrevista

Meu caro buscador, em uma entrevista de engenharia de IA, não basta saber fazer — precisa saber explicar por que faz. E para explicar, precisa de embasamento.

Aqui estão as referências que vão te dar vocabulário técnico, contexto histórico e profundidade conceitual para qualquer pergunta que vier.

1. Canais do YouTube — Estude Assistindo

1.1 Fundamentos de ML/DL

Canal	O que cobre	Link
3Blue1Brown	Álgebra linear, redes neurais, backpropagation (visual, intuitivo)	youtube.com/@3blue1brown
Andrej Karpathy	Neural networks do zero, GPT, attention, LLMs (ex-engenheiro Tesla/OpenAI)	youtube.com/@AndrejKarpathy
StatQuest with Josh Starmer	ML, estatística, modelos clássicos (explicações claras, sem jargão)	youtube.com/@statquest
Sentdex	Python, ML prático, deep learning com código	youtube.com/@sentdex

1.2 LLMs e AI Engineering

Canal	O que cobre	Link
AI Jason	Agentes, RAG, LangChain, ferramentas de IA	youtube.com/@ai_jason
Sam Witteveen	LLMs, fine-tuning, RAG, deployment	youtube.com/@samwitteveenai
Prompt Engineering (DAIR.AI)	Prompt engineering, chain-of-thought, técnicas avançadas	youtube.com/@DAIR.AI
All About AI	Novidades em IA, tutoriais, comparações de ferramentas	youtube.com/@AllAboutAI

1.3 Pesquisa e Papers

Canal	O que cobre	Link
Yannic Kilcher	Papers de ML/LLM explicados em detalhe	youtube.com/@YannicKilcher
Two Minute Papers	Resumos rápidos de papers de IA	youtube.com/@TwoMinutePapers
Arxiv Insights	Papers importantes explicados visualmente	youtube.com/@ArxivInsights

2. Vídeos Específicos — Assista Antes da Entrevista

2.1 "Attention Is All You Need" (Transformers)

Paper: arxiv.org/abs/1706.03762
Vídeo explicativo: Yannic Kilcher — "Attention Is All You Need" (40 min)
Vídeo visual: 3Blue1Brown — "Attention in transformers, visually explained" (25 min)
Por que importa: É O paper que criou a arquitetura de todos os LLMs atuais. Se souber explicar self-attention, já se destaca.

2.2 RAG (Retrieval-Augmented Generation)

Paper original: arxiv.org/abs/2005.11401 (Lewis et al., 2020)
Vídeo: Sam Witteveen — "RAG from Scratch" (playlist completa)
Vídeo: AI Jason — "Build RAG with LangChain" (tutorial prático)
Por que importa: É a técnica mais cobrada em testes práticos atualmente.

2.3 Fine-tuning e RLHF

Paper InstructGPT: arxiv.org/abs/2203.02155 (Ouyang et al., 2022)
Vídeo: Andrej Karpathy — "Let's build GPT from scratch" (2h, épico)
Vídeo: Yannic Kilcher — "InstructGPT" (explica RLHF)
Por que importa: Explica como modelos como ChatGPT são alinhados. Pergunta recorrente em entrevistas.

2.4 LoRA e Fine-tuning Eficiente

Paper LoRA: arxiv.org/abs/2106.09685 (Hu et al., 2021)
Vídeo: Sam Witteveen — "LoRA explained + fine-tuning tutorial"
Vídeo: AI Jason — "Fine-tune Llama for free with QLoRA"
Por que importa: É como se treina modelos proprietários hoje. Sem LoRA, fine-tuning é inviável.

2.5 Agentes e Function Calling

Paper ReAct: arxiv.org/abs/2210.03629 (Yao et al., 2022)
Vídeo: AI Jason — "Build AI Agents from Scratch"
Vídeo: LangChain — "LangGraph Agents Tutorial"
Por que importa: Agentes são o futuro de engenharia de IA. Saber construir um te diferencia.

3. Papers Essenciais — O que Citar

Paper	Ano	Importância	O que diz
Attention Is All You Need	2017	Fundamental	Criou a arquitetura Transformer
BERT (Devlin et al.)	2018	Alta	Demonstrou poder do pre-training bidirecional
GPT-3 (Brown et al.)	2020	Alta	Few-shot learning com LLMs grandes
RAG (Lewis et al.)	2020	Muito Alta	Combinação de retrieval + generation
InstructGPT / RLHF	2022	Muito Alta	Alinhamento de LLMs com feedback humano
LoRA (Hu et al.)	2021	Alta	Fine-tuning eficiente com baixo custo
ReAct (Yao et al.)	2022	Alta	Agentes que raciocinam e agem
Chain-of-Thought (Wei et al.)	2022	Alta	Raciocínio passo a passo em LLMs
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks	2020	Muito Alta	Fundamento do RAG
LLM Agents Survey (Wang et al.)	2024	Média	Survey sobre agentes autônomos

4. Artigos e Blogs — Leitura Rápida

Fonte	O que cobre	Link
Hugging Face Blog	Tutoriais, modelos, fine-tuning	huggingface.co/blog
OpenAI Cookbook	Exemplos práticos de API, RAG, function calling	cookbook.openai.com
Anthropic Docs	Claude API, system prompts, safety	docs.anthropic.com
LangChain Docs	Framework, LangGraph, agentes	python.langchain.com
Pinecone Learning Center	Vetor DB, embeddings, RAG	pinecone.io/learn
Lilian Weng's Blog	Papers explicados em profundidade	lilianweng.github.io
Chip Huyen's Blog	MLOps, avaliação, produção	huyenchip.com

5. Cursos — Se Tiver Tempo

Curso	Plataforma	Duração	Foco
Andrew Ng — Machine Learning	Coursera	~60h	Fundamentos ML
Andrew Ng — Deep Learning Specialization	Coursera	~120h	Deep Learning completo
Fast.ai — Practical Deep Learning	Fast.ai (grátis)	~30h	Deep learning prático
DeepLearning.AI — LangChain for LLM	Coursera	~10h	LangChain, RAG, agentes
Full Stack LLM Bootcamp	YouTube (grátis)	~8h	AI engineering completo
Hugging Face NLP Course	HF (grátis)	~20h	Transformers, fine-tuning

6. Como Usar Essas Referências na Entrevista

6.1 O modelo de resposta

Quando perguntarem "como você implementaria X?", use este modelo:

1. PRINCÍPIO: "Segundo o paper de [autor] sobre [técnica]..."
2. CONCEITO: "A ideia é que [explicação simples]"
3. IMPLEMENTAÇÃO: "Na prática, eu usaria [ferramenta] com [approach]"
4. TRADE-OFF: "O trade-off é [custo vs qualidade, latência vs precisão]"

6.2 Exemplos prontos

"Como você evitaria alucinações?"

"Segundo o paper original de RAG (Lewis et al., 2020), o modelo gera respostas baseadas em documentos recuperados — não apenas no parametric knowledge. Eu implementaria um pipeline com re-ranking (cross-encoder) e avaliaria com faithfulness score via Ragas, que mede se a resposta se sustenta nos documentos fornecidos."

"Como você faria fine-tuning?"

"Usaria LoRA (Hu et al., 2021) — adapter de baixa rank que congela os pesos originais e treina apenas matrizes de baixa dimensão. Com QLoRA, é possível fine-tunar um modelo de 7B em uma GPU de 16GB. A avaliação seria feita com LLM-as-judge comparando antes e depois do fine-tuning."

Não precisa assistir tudo. Escolha 3 vídeos da lista de "específicos" e 3 papers da lista de "essenciais". Assista/leia nos próximos dias. Isso já dá embasamento suficiente para qualquer pergunta teórica.

E lembre-se: o entrevistador não quer que você saiba tudo — quer que você saiba como pensar. Citar um paper mostra que você lê pesquisa. Explicar o trade-off mostra que você pensa como engenheiro. Isso basta.

Referências Teóricas — YouTube, Papers e Artigos para Entrevista

Referências Teóricas — YouTube, Papers e Artigos para Entrevista

1. Canais do YouTube — Estude Assistindo

1.1 Fundamentos de ML/DL

1.2 LLMs e AI Engineering

1.3 Pesquisa e Papers

2. Vídeos Específicos — Assista Antes da Entrevista

2.1 "Attention Is All You Need" (Transformers)

2.2 RAG (Retrieval-Augmented Generation)

2.3 Fine-tuning e RLHF

2.4 LoRA e Fine-tuning Eficiente

2.5 Agentes e Function Calling

3. Papers Essenciais — O que Citar

4. Artigos e Blogs — Leitura Rápida

5. Cursos — Se Tiver Tempo

6. Como Usar Essas Referências na Entrevista

6.1 O modelo de resposta

6.2 Exemplos prontos

Dica Final

On this page