Fundamentos de IA — Treinamento

O que é Inteligência Artificial

Inteligência Artificial (IA) é o campo da computação que busca criar sistemas capazes de realizar tarefas que normalmente requerem inteligência humana — como reconhecer padrões, tomar decisões, entender linguagem natural e aprender com experiências.

IA Fraca (Narrow AI)

Sistemas especializados em uma única tarefa. Ex: ChatGPT, AlphaGo, reconhecimento facial.

IA Geral (AGI)

Sistema com capacidade cognitiva equivalente à humana em qualquer domínio. Ainda teórico.

Abordagem Simbólica

Regras explícitas codificadas por humanos (sistemas especialistas, lógica formal).

Abordagem Conexionista

Aprendizado a partir de dados via redes neurais. Base da IA moderna.

Insight: A revolução atual da IA é conexionista — modelos aprendem padrões estatísticos em enormes volumes de dados, não seguem regras programadas manualmente.

Machine Learning

Machine Learning (ML) é a subcategoria de IA onde os sistemas aprendem a partir de dados sem serem explicitamente programados para cada tarefa.

Tipos de Aprendizado

Supervisionado: Modelo aprende a partir de pares entrada→saída rotulados. Ex: classificação de spam, previsão de preços.
Não-supervisionado: Modelo encontra padrões sem rótulos. Ex: clustering, detecção de anomalias, PCA.
Por Reforço: Agente aprende por tentativa e erro, maximizando recompensas. Ex: AlphaGo, robótica.
Semi-supervisionado: Combinação — pequena quantidade de dados rotulados + grande volume não-rotulado.

Conceitos Fundamentais

Features (Características)

Variáveis de entrada usadas pelo modelo para fazer previsões.

Labels (Rótulos)

Saídas esperadas no treinamento supervisionado.

Overfitting

Modelo memoriza dados de treino mas generaliza mal para novos dados.

Underfitting

Modelo muito simples — não captura os padrões dos dados.

# Exemplo simples com scikit-learn
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
model = LogisticRegression()
model.fit(X_train, y_train)
accuracy = model.score(X_test, y_test)

Deep Learning & Redes Neurais

Deep Learning é um subcampo do ML baseado em redes neurais artificiais com múltiplas camadas (daí "deep" — profundo). É responsável pela maioria dos avanços recentes em visão computacional, NLP e geração de conteúdo.

Arquitetura Básica

Input Layer -> [Hidden Layer 1] -> [Hidden Layer 2] -> ... -> Output Layer
   (features)   (representacoes intermediarias)           (predicao)

Componentes Essenciais

Neurônio artificial: Recebe entradas ponderadas, aplica função de ativação, produz saída.
Backpropagation: Algoritmo que ajusta pesos da rede propagando o erro de volta.
Gradient Descent: Otimização que minimiza a função de perda.
Função de ativação: ReLU, Sigmoid, Tanh — introduz não-linearidade.
Dropout: Técnica de regularização que desativa neurônios aleatoriamente durante treino.

CNN (Convolutional)

Ideal para imagens. Extrai features espaciais via filtros convolucionais.

RNN / LSTM

Para sequências e séries temporais. Mantém estado interno.

Transformer

Arquitetura por atenção — base de todos os LLMs modernos (GPT, Claude, Gemini).

Diffusion Models

Geração de imagens (Stable Diffusion, DALL-E). Aprende a reverter ruído.

Transformers:A arquitetura "Attention is All You Need" (2017) revolucionou o campo. Mecanismo de self-attention permite que o modelo relacione qualquer parte do input com qualquer outra, paralelamente.

Large Language Models (LLMs)

LLMs são modelos de linguagem treinados em enormes corpora de texto para prever o próximo token. Emergem capacidades de raciocínio, tradução, código e muito mais — sem treinamento específico para essas tarefas.

Como um LLM é treinado

Pre-training: Treinamento autossupervisionado em bilhões de tokens de texto (web, livros, código).
SFT (Supervised Fine-Tuning): Ajuste com exemplos de conversas de alta qualidade.
RLHF (Reinforcement Learning from Human Feedback): Humanos ranqueiam respostas; modelo aprende a preferir as melhores.
Constitutional AI / DPO: Técnicas mais modernas de alinhamento sem feedback humano constante.

Conceitos de Inferência

Temperature

Controla aleatoriedade. 0 = determinístico, 1 = mais criativo, >1 = caótico.

Top-p / Top-k

Filtra o espaço de tokens candidatos antes de amostrar.

Context Window

Quantidade máxima de tokens que o modelo processa de uma vez (input + output).

System Prompt

Instrução inicial que configura o comportamento e persona do modelo.

// Chamada basica a API Claude
const response = await anthropic.messages.create({
  model: "claude-opus-4-7",
  max_tokens: 1024,
  system: "Voce e um assistente tecnico especializado em IA.",
  messages: [{ role: "user", content: "O que e atencao em Transformers?" }]
});

Embeddings e Representação Semântica

Embeddings são representações vetoriais densas de texto (ou imagens, áudio) em espaço de alta dimensão, onde itens semanticamente similares ficam próximos geometricamente.

Por que importa

Busca semântica — encontrar documentos por significado, não por palavras-chave exatas.
RAG — recuperar contexto relevante para alimentar LLMs.
Clustering e classificação de textos.
Detecção de duplicatas e similaridade.

// Gerando embedding com OpenAI
const embedding = await openai.embeddings.create({
  model: "text-embedding-3-small",
  input: "Aprendizado de maquina com Python"
});
// resultado: vetor de 1536 dimensoes
const vector = embedding.data[0].embedding;

Bancos de Dados Vetoriais

Pinecone

Managed vector DB, serverless. Ideal para produção rápida.

Qdrant

Open-source, alta performance. Pode rodar localmente ou em cloud.

pgvector

Extensão do PostgreSQL para vetores. Ótimo se já usa Postgres.

Chroma

Local-first, ideal para protótipos e desenvolvimento.

RAG — Retrieval Augmented Generation

RAG é uma arquitetura que combina busca em base de conhecimento externa com geração de LLM. Resolve o problema de conhecimento desatualizado e alucinações sobre dados privados.

Fluxo RAG

Pergunta do usuario
    v
Gerar embedding da pergunta
    v
Buscar chunks similares no vector DB (top-k)
    v
Montar prompt: system + contexto recuperado + pergunta
    v
LLM gera resposta fundamentada nos documentos
    v
Resposta ao usuario

Técnicas Avançadas

Chunking strategy: Como dividir documentos (por tamanho fixo, por parágrafo, por seção).
Hybrid search: Combina busca vetorial (semântica) + BM25 (keyword).
Re-ranking: Reordena resultados com modelo cross-encoder antes de enviar ao LLM.
Metadata filtering: Filtra por data, categoria, autor antes da busca vetorial.
HyDE: Gera documento hipotético com LLM, usa seu embedding para buscar.

Atenção: RAG não é uma bala de prata. Qualidade do chunking e da indexação impacta diretamente a qualidade das respostas. Invista tempo na estratégia de indexação.

Agentes de IA

Agentes são sistemas de IA que usam LLMs como motor de raciocínio para executar tarefas complexas de múltiplos passos, utilizando ferramentas (tools) e tomando decisões em loop.

Componentes de um Agente

LLM (Cérebro)

Decide qual ação tomar, interpreta resultados, planeja próximos passos.

Tools (Ferramentas)

Funções que o agente pode chamar: busca web, código, APIs, banco de dados.

Memory (Memória)

Curta duração (contexto) e longa duração (vector store, banco).

Planning

ReAct, CoT, Tree-of-Thought — estratégias de raciocínio estruturado.

Padrão ReAct

Thought: Preciso buscar informacoes sobre X
Action: search_web("X latest news")
Observation: [resultado da busca]
Thought: Com base nisso, posso concluir Y
Action: generate_report(...)
Final Answer: ...

Multi-agentes: Sistemas como CrewAI, Agno e LangGraph permitem orquestrar múltiplos agentes especializados colaborando em uma tarefa complexa.

Ética e Responsabilidade em IA

À medida que sistemas de IA se tornam mais poderosos e pervasivos, questões éticas e de segurança ganham importância crítica.

Principais Preocupações

Viés algorítmico: Modelos treinados em dados enviesados reproduzem e amplificam discriminações.
Privacidade: LLMs podem vazar dados de treinamento ou de conversas anteriores.
Desinformação: Geração de conteúdo falso convincente em escala.
Alucinações: Modelos geram fatos incorretos com alta confiança.
Dependência e autonomia: Risco de delegação excessiva de decisões críticas.

Boas Práticas

Validar outputs de LLM antes de usar em decisões críticas.
Implementar guardrails — filtros de input e output.
Manter humano no loop para ações irreversíveis.
Documentar e auditar modelos em produção.
Seguir frameworks como EU AI Act, NIST AI RMF.

Prompt Injection: Ataques que manipulam o comportamento do agente via inputs maliciosos. Valide e sanitize todo input antes de passar para o LLM em sistemas de produção.

🧠O que é Inteligência Artificial