Kaique Mitsuo Silva Yamamoto
Ia

Referências Teóricas — YouTube, Papers e Artigos para Entrevista

Compilação de vídeos, papers e artigos essenciais para embasar teoricamente em entrevistas e testes práticos de engenharia de IA. Canais, cursos e leituras recomendadas.

Referências Teóricas — YouTube, Papers e Artigos para Entrevista

Meu caro buscador, em uma entrevista de engenharia de IA, não basta saber fazer — precisa saber explicar por que faz. E para explicar, precisa de embasamento.

Aqui estão as referências que vão te dar vocabulário técnico, contexto histórico e profundidade conceitual para qualquer pergunta que vier.


1. Canais do YouTube — Estude Assistindo

1.1 Fundamentos de ML/DL

CanalO que cobreLink
3Blue1BrownÁlgebra linear, redes neurais, backpropagation (visual, intuitivo)youtube.com/@3blue1brown
Andrej KarpathyNeural networks do zero, GPT, attention, LLMs (ex-engenheiro Tesla/OpenAI)youtube.com/@AndrejKarpathy
StatQuest with Josh StarmerML, estatística, modelos clássicos (explicações claras, sem jargão)youtube.com/@statquest
SentdexPython, ML prático, deep learning com códigoyoutube.com/@sentdex

1.2 LLMs e AI Engineering

CanalO que cobreLink
AI JasonAgentes, RAG, LangChain, ferramentas de IAyoutube.com/@ai_jason
Sam WitteveenLLMs, fine-tuning, RAG, deploymentyoutube.com/@samwitteveenai
Prompt Engineering (DAIR.AI)Prompt engineering, chain-of-thought, técnicas avançadasyoutube.com/@DAIR.AI
All About AINovidades em IA, tutoriais, comparações de ferramentasyoutube.com/@AllAboutAI

1.3 Pesquisa e Papers

CanalO que cobreLink
Yannic KilcherPapers de ML/LLM explicados em detalheyoutube.com/@YannicKilcher
Two Minute PapersResumos rápidos de papers de IAyoutube.com/@TwoMinutePapers
Arxiv InsightsPapers importantes explicados visualmenteyoutube.com/@ArxivInsights

2. Vídeos Específicos — Assista Antes da Entrevista

2.1 "Attention Is All You Need" (Transformers)

  • Paper: arxiv.org/abs/1706.03762
  • Vídeo explicativo: Yannic Kilcher — "Attention Is All You Need" (40 min)
  • Vídeo visual: 3Blue1Brown — "Attention in transformers, visually explained" (25 min)
  • Por que importa: É O paper que criou a arquitetura de todos os LLMs atuais. Se souber explicar self-attention, já se destaca.

2.2 RAG (Retrieval-Augmented Generation)

  • Paper original: arxiv.org/abs/2005.11401 (Lewis et al., 2020)
  • Vídeo: Sam Witteveen — "RAG from Scratch" (playlist completa)
  • Vídeo: AI Jason — "Build RAG with LangChain" (tutorial prático)
  • Por que importa: É a técnica mais cobrada em testes práticos atualmente.

2.3 Fine-tuning e RLHF

  • Paper InstructGPT: arxiv.org/abs/2203.02155 (Ouyang et al., 2022)
  • Vídeo: Andrej Karpathy — "Let's build GPT from scratch" (2h, épico)
  • Vídeo: Yannic Kilcher — "InstructGPT" (explica RLHF)
  • Por que importa: Explica como modelos como ChatGPT são alinhados. Pergunta recorrente em entrevistas.

2.4 LoRA e Fine-tuning Eficiente

  • Paper LoRA: arxiv.org/abs/2106.09685 (Hu et al., 2021)
  • Vídeo: Sam Witteveen — "LoRA explained + fine-tuning tutorial"
  • Vídeo: AI Jason — "Fine-tune Llama for free with QLoRA"
  • Por que importa: É como se treina modelos proprietários hoje. Sem LoRA, fine-tuning é inviável.

2.5 Agentes e Function Calling

  • Paper ReAct: arxiv.org/abs/2210.03629 (Yao et al., 2022)
  • Vídeo: AI Jason — "Build AI Agents from Scratch"
  • Vídeo: LangChain — "LangGraph Agents Tutorial"
  • Por que importa: Agentes são o futuro de engenharia de IA. Saber construir um te diferencia.

3. Papers Essenciais — O que Citar

PaperAnoImportânciaO que diz
Attention Is All You Need2017FundamentalCriou a arquitetura Transformer
BERT (Devlin et al.)2018AltaDemonstrou poder do pre-training bidirecional
GPT-3 (Brown et al.)2020AltaFew-shot learning com LLMs grandes
RAG (Lewis et al.)2020Muito AltaCombinação de retrieval + generation
InstructGPT / RLHF2022Muito AltaAlinhamento de LLMs com feedback humano
LoRA (Hu et al.)2021AltaFine-tuning eficiente com baixo custo
ReAct (Yao et al.)2022AltaAgentes que raciocinam e agem
Chain-of-Thought (Wei et al.)2022AltaRaciocínio passo a passo em LLMs
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks2020Muito AltaFundamento do RAG
LLM Agents Survey (Wang et al.)2024MédiaSurvey sobre agentes autônomos

4. Artigos e Blogs — Leitura Rápida

FonteO que cobreLink
Hugging Face BlogTutoriais, modelos, fine-tuninghuggingface.co/blog
OpenAI CookbookExemplos práticos de API, RAG, function callingcookbook.openai.com
Anthropic DocsClaude API, system prompts, safetydocs.anthropic.com
LangChain DocsFramework, LangGraph, agentespython.langchain.com
Pinecone Learning CenterVetor DB, embeddings, RAGpinecone.io/learn
Lilian Weng's BlogPapers explicados em profundidadelilianweng.github.io
Chip Huyen's BlogMLOps, avaliação, produçãohuyenchip.com

5. Cursos — Se Tiver Tempo

CursoPlataformaDuraçãoFoco
Andrew Ng — Machine LearningCoursera~60hFundamentos ML
Andrew Ng — Deep Learning SpecializationCoursera~120hDeep Learning completo
Fast.ai — Practical Deep LearningFast.ai (grátis)~30hDeep learning prático
DeepLearning.AI — LangChain for LLMCoursera~10hLangChain, RAG, agentes
Full Stack LLM BootcampYouTube (grátis)~8hAI engineering completo
Hugging Face NLP CourseHF (grátis)~20hTransformers, fine-tuning

6. Como Usar Essas Referências na Entrevista

6.1 O modelo de resposta

Quando perguntarem "como você implementaria X?", use este modelo:

1. PRINCÍPIO: "Segundo o paper de [autor] sobre [técnica]..."
2. CONCEITO: "A ideia é que [explicação simples]"
3. IMPLEMENTAÇÃO: "Na prática, eu usaria [ferramenta] com [approach]"
4. TRADE-OFF: "O trade-off é [custo vs qualidade, latência vs precisão]"

6.2 Exemplos prontos

"Como você evitaria alucinações?"

"Segundo o paper original de RAG (Lewis et al., 2020), o modelo gera respostas baseadas em documentos recuperados — não apenas no parametric knowledge. Eu implementaria um pipeline com re-ranking (cross-encoder) e avaliaria com faithfulness score via Ragas, que mede se a resposta se sustenta nos documentos fornecidos."

"Como você faria fine-tuning?"

"Usaria LoRA (Hu et al., 2021) — adapter de baixa rank que congela os pesos originais e treina apenas matrizes de baixa dimensão. Com QLoRA, é possível fine-tunar um modelo de 7B em uma GPU de 16GB. A avaliação seria feita com LLM-as-judge comparando antes e depois do fine-tuning."


Dica Final

Não precisa assistir tudo. Escolha 3 vídeos da lista de "específicos" e 3 papers da lista de "essenciais". Assista/leia nos próximos dias. Isso já dá embasamento suficiente para qualquer pergunta teórica.

E lembre-se: o entrevistador não quer que você saiba tudo — quer que você saiba como pensar. Citar um paper mostra que você lê pesquisa. Explicar o trade-off mostra que você pensa como engenheiro. Isso basta.

On this page