## Escolha do modelo: Sonnet, Opus - Qual devo usar?
Depois de instalar e fazer login no Claude Code, você não precisa se preocupar imediatamente com o modelo - ele usa Claude Sonnet por padrão, que é suficiente na maioria das vezes.
### Modelos que você pode usar no Claude Code
Atualmente, exist…
## Fluxo de Autenticação: Login pelo Navegador e Configuração Manual da Chave de API
Após instalar o Claude Code, você precisa autenticar para usá-lo. Você precisa vincular a ferramenta à sua conta Anthropic. Existem duas formas de vincular: **Login pelo Navegador** e **Configuração Manual da Chave…
## Como Instalar o Claude Code
A instalação do Claude Code não tem um "próximo" em uma interface gráfica; tudo é feito na linha de comando. Se você costuma usar npm, todo o processo não leva mais de dois minutos.
### Pré-requisitos
Antes de começar, certifique-se de ter o seguinte:
- **Node.js 1…
## Cenários Típicos de Uso
Divido os cenários de uso em quatro categorias, organizadas por frequência, da mais alta para a mais baixa.
---
### Primeira Categoria: Entender o Código
Este é provavelmente o uso mais frequente. Ao assumir um projeto de outra pessoa, revisar um módulo antigo ou abrir…
## 1.3 Por que escrever código no terminal?
Imagine: você está escrevendo uma nova funcionalidade e de repente precisa modificar uma função utilitária de baixo nível que está espalhada em três arquivos, com algumas chamadas cruzando módulos. Você abre o editor, pesquisa globalmente, folheia arquivo…
## 1.2 A "Relação de Parentesco" entre Claude Code, Claude Chat e API
Muitos desenvolvedores, ao ouvirem falar de Claude Code pela primeira vez, naturalmente pensam em outros dois formatos de produto: **Claude Chat** (interface de chat web) e **Claude API** (interface de programação). Ambos são da …
## 1.1 O que é o Claude Code?
### Definição em uma frase
**Claude Code é um agente de programação de IA da Anthropic que é executado no terminal (Terminal)**. Os desenvolvedores descrevem tarefas em linguagem natural, e ele lê ativamente o repositório de código, propõe alterações, executa comandos, …
Um bom **Spec Coding** (Programação Orientada por Especificações) tem como núcleo transformar "ideias vagas" em "contratos precisos, verificáveis e executáveis". Não se trata apenas de escrever um documento, mas de estabelecer uma **linguagem de comunicação inequívoca** entre humanos e AI (ou entre …
O modo "orientado por sensação/atmosfera" do Vibe Coding é muito legal para prototipagem rápida e exploração criativa, mas se não for controlado, é fácil cair em várias armadilhas típicas. Abaixo, resumimos a partir de cinco dimensões: **qualidade do código, manutenibilidade, segurança, evolução de …
Este é um problema que a maioria dos programadores enfrenta. **Vibe Coding** e **Spec Coding** são duas formas de trabalho distintas ao programar com a ajuda de grandes modelos de linguagem (LLM). A diferença central é: **o "input" que você dá à IA é uma sensação vaga ou uma especificação precisa**.…
A injeção maliciosa de consultas (injeção maliciosa de Prompt / envenenamento de recuperação) é uma ameaça de segurança muito real em sistemas RAG na prática. Atacantes podem tentar, por meio de entradas cuidadosamente construídas, fazer o modelo vazar informações sensíveis, contornar restrições, ex…
Ajuste de Prompt (Prompt Engineering / Optimization) é a habilidade chave para fazer o modelo de linguagem grande "obedecer", especialmente em sistemas RAG, determinando diretamente se o modelo está disposto a seguir fielmente o conteúdo recuperado, evitar alucinações e gerar saída com formato padrã…
A otimização do RAG não é um ajuste de etapa única, mas um processo de **otimização de cadeia completa**. A partir das quatro dimensões **lado de indexação de dados, lado de recuperação, lado de geração e lado de avaliação**, apresento estratégias sistemáticas de otimização, juntamente com experiênc…
## O que Embedding realmente faz? — Da essência técnica à resposta em entrevista
### 1. Essência Técnica: Uma Frase que Esclarece o Núcleo
**O trabalho central do Embedding é mapear dados discretos não estruturados (texto, imagens, etc.) para um espaço vetorial contínuo e de baixa dimensão, de mod…
A acurácia é a linha vital central de sistemas de perguntas e respostas de conhecimento, especialmente quando se tenta aplicá-los em cenários sérios (como medicina, direito, suporte interno de empresas). Minha opinião pode ser resumida como: **Acurácia é um conceito multidimensional; não se deve olh…
### O que é RAG?
**RAG** é a sigla para **Retrieval-Augmented Generation**, que em português significa **Geração Aumentada por Recuperação**.
Simplificando, é uma tecnologia que **dá ao modelo de linguagem grande um "livro de referência" que pode ser consultado a qualquer momento**.
Você pode ima…
## 1. Conceito Central de Skill
Uma Skill é uma unidade de capacidade executável encapsulada em um **Agente** ou **Sistema de IA**. Geralmente inclui:
- **Condição de disparo**: quando é chamada (ex.: comando do usuário, evento do sistema).
- **Parâmetros de entrada**: dados ou contexto que precis…
## Três Metodologias Principais do AI Agent: ReAct, Plan-and-Solve e Reflection
AI Agent é um agente inteligente capaz de perceber o ambiente, tomar decisões e executar ações de forma autônoma. Suas metodologias principais são três: ReAct, Plan-and-Solve e Reflection. Abaixo, apresentamos cada uma,…
## O que é o Modo Misto de Especialistas MOA (Mixture-of-Agents)?
**MOA** é uma **arquitetura de colaboração multiagente** cuja ideia central é: combinar múltiplos modelos de IA independentes (chamados de "especialistas" ou "Agentes") através de um **mecanismo de roteamento/escalonamento**, fazendo…
# Design do Sistema de Memória do Agente: Implementação de Memória de Curto e Longo Prazo
Este artigo explora o design do sistema de memória de um agente, dividindo-o em dois níveis: memória de curto prazo e memória de longo prazo, e detalha suas respectivas implementações e considerações.
## Estr…