O que é Inteligência Artificial
Inteligência Artificial (IA) é o campo da computação que busca criar sistemas capazes de realizar tarefas que normalmente requerem inteligência humana — como reconhecer padrões, tomar decisões, entender linguagem natural e aprender com experiências.
IA Fraca (Narrow AI)
Sistemas especializados em uma única tarefa. Ex: ChatGPT, AlphaGo, reconhecimento facial.
IA Geral (AGI)
Sistema com capacidade cognitiva equivalente à humana em qualquer domínio. Ainda teórico.
Abordagem Simbólica
Regras explícitas codificadas por humanos (sistemas especialistas, lógica formal).
Abordagem Conexionista
Aprendizado a partir de dados via redes neurais. Base da IA moderna.
Machine Learning
Machine Learning (ML) é a subcategoria de IA onde os sistemas aprendem a partir de dados sem serem explicitamente programados para cada tarefa.
Tipos de Aprendizado
- Supervisionado: Modelo aprende a partir de pares entrada→saída rotulados. Ex: classificação de spam, previsão de preços.
- Não-supervisionado: Modelo encontra padrões sem rótulos. Ex: clustering, detecção de anomalias, PCA.
- Por Reforço: Agente aprende por tentativa e erro, maximizando recompensas. Ex: AlphaGo, robótica.
- Semi-supervisionado: Combinação — pequena quantidade de dados rotulados + grande volume não-rotulado.
Conceitos Fundamentais
Features (Características)
Variáveis de entrada usadas pelo modelo para fazer previsões.
Labels (Rótulos)
Saídas esperadas no treinamento supervisionado.
Overfitting
Modelo memoriza dados de treino mas generaliza mal para novos dados.
Underfitting
Modelo muito simples — não captura os padrões dos dados.
# Exemplo simples com scikit-learn
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
model = LogisticRegression()
model.fit(X_train, y_train)
accuracy = model.score(X_test, y_test)Deep Learning & Redes Neurais
Deep Learning é um subcampo do ML baseado em redes neurais artificiais com múltiplas camadas (daí "deep" — profundo). É responsável pela maioria dos avanços recentes em visão computacional, NLP e geração de conteúdo.
Arquitetura Básica
Input Layer -> [Hidden Layer 1] -> [Hidden Layer 2] -> ... -> Output Layer
(features) (representacoes intermediarias) (predicao)Componentes Essenciais
- Neurônio artificial: Recebe entradas ponderadas, aplica função de ativação, produz saída.
- Backpropagation: Algoritmo que ajusta pesos da rede propagando o erro de volta.
- Gradient Descent: Otimização que minimiza a função de perda.
- Função de ativação: ReLU, Sigmoid, Tanh — introduz não-linearidade.
- Dropout: Técnica de regularização que desativa neurônios aleatoriamente durante treino.
CNN (Convolutional)
Ideal para imagens. Extrai features espaciais via filtros convolucionais.
RNN / LSTM
Para sequências e séries temporais. Mantém estado interno.
Transformer
Arquitetura por atenção — base de todos os LLMs modernos (GPT, Claude, Gemini).
Diffusion Models
Geração de imagens (Stable Diffusion, DALL-E). Aprende a reverter ruído.
Large Language Models (LLMs)
LLMs são modelos de linguagem treinados em enormes corpora de texto para prever o próximo token. Emergem capacidades de raciocínio, tradução, código e muito mais — sem treinamento específico para essas tarefas.
Como um LLM é treinado
- Pre-training: Treinamento autossupervisionado em bilhões de tokens de texto (web, livros, código).
- SFT (Supervised Fine-Tuning): Ajuste com exemplos de conversas de alta qualidade.
- RLHF (Reinforcement Learning from Human Feedback): Humanos ranqueiam respostas; modelo aprende a preferir as melhores.
- Constitutional AI / DPO: Técnicas mais modernas de alinhamento sem feedback humano constante.
Conceitos de Inferência
Temperature
Controla aleatoriedade. 0 = determinístico, 1 = mais criativo, >1 = caótico.
Top-p / Top-k
Filtra o espaço de tokens candidatos antes de amostrar.
Context Window
Quantidade máxima de tokens que o modelo processa de uma vez (input + output).
System Prompt
Instrução inicial que configura o comportamento e persona do modelo.
// Chamada basica a API Claude
const response = await anthropic.messages.create({
model: "claude-opus-4-7",
max_tokens: 1024,
system: "Voce e um assistente tecnico especializado em IA.",
messages: [{ role: "user", content: "O que e atencao em Transformers?" }]
});Embeddings e Representação Semântica
Embeddings são representações vetoriais densas de texto (ou imagens, áudio) em espaço de alta dimensão, onde itens semanticamente similares ficam próximos geometricamente.
Por que importa
- Busca semântica — encontrar documentos por significado, não por palavras-chave exatas.
- RAG — recuperar contexto relevante para alimentar LLMs.
- Clustering e classificação de textos.
- Detecção de duplicatas e similaridade.
// Gerando embedding com OpenAI
const embedding = await openai.embeddings.create({
model: "text-embedding-3-small",
input: "Aprendizado de maquina com Python"
});
// resultado: vetor de 1536 dimensoes
const vector = embedding.data[0].embedding;Bancos de Dados Vetoriais
Pinecone
Managed vector DB, serverless. Ideal para produção rápida.
Qdrant
Open-source, alta performance. Pode rodar localmente ou em cloud.
pgvector
Extensão do PostgreSQL para vetores. Ótimo se já usa Postgres.
Chroma
Local-first, ideal para protótipos e desenvolvimento.
RAG — Retrieval Augmented Generation
RAG é uma arquitetura que combina busca em base de conhecimento externa com geração de LLM. Resolve o problema de conhecimento desatualizado e alucinações sobre dados privados.
Fluxo RAG
Pergunta do usuario
v
Gerar embedding da pergunta
v
Buscar chunks similares no vector DB (top-k)
v
Montar prompt: system + contexto recuperado + pergunta
v
LLM gera resposta fundamentada nos documentos
v
Resposta ao usuarioTécnicas Avançadas
- Chunking strategy: Como dividir documentos (por tamanho fixo, por parágrafo, por seção).
- Hybrid search: Combina busca vetorial (semântica) + BM25 (keyword).
- Re-ranking: Reordena resultados com modelo cross-encoder antes de enviar ao LLM.
- Metadata filtering: Filtra por data, categoria, autor antes da busca vetorial.
- HyDE: Gera documento hipotético com LLM, usa seu embedding para buscar.
Agentes de IA
Agentes são sistemas de IA que usam LLMs como motor de raciocínio para executar tarefas complexas de múltiplos passos, utilizando ferramentas (tools) e tomando decisões em loop.
Componentes de um Agente
LLM (Cérebro)
Decide qual ação tomar, interpreta resultados, planeja próximos passos.
Tools (Ferramentas)
Funções que o agente pode chamar: busca web, código, APIs, banco de dados.
Memory (Memória)
Curta duração (contexto) e longa duração (vector store, banco).
Planning
ReAct, CoT, Tree-of-Thought — estratégias de raciocínio estruturado.
Padrão ReAct
Thought: Preciso buscar informacoes sobre X
Action: search_web("X latest news")
Observation: [resultado da busca]
Thought: Com base nisso, posso concluir Y
Action: generate_report(...)
Final Answer: ...Ética e Responsabilidade em IA
À medida que sistemas de IA se tornam mais poderosos e pervasivos, questões éticas e de segurança ganham importância crítica.
Principais Preocupações
- Viés algorítmico: Modelos treinados em dados enviesados reproduzem e amplificam discriminações.
- Privacidade: LLMs podem vazar dados de treinamento ou de conversas anteriores.
- Desinformação: Geração de conteúdo falso convincente em escala.
- Alucinações: Modelos geram fatos incorretos com alta confiança.
- Dependência e autonomia: Risco de delegação excessiva de decisões críticas.
Boas Práticas
- Validar outputs de LLM antes de usar em decisões críticas.
- Implementar guardrails — filtros de input e output.
- Manter humano no loop para ações irreversíveis.
- Documentar e auditar modelos em produção.
- Seguir frameworks como EU AI Act, NIST AI RMF.