## Choisir le modèle : Sonnet ou Opus, lequel utiliser ?
Une fois Claude Code installé et connecté, vous n'avez pas besoin de vous soucier immédiatement du modèle — il utilise par défaut Claude Sonnet, qui est suffisant la plupart du temps.
### Les modèles que vous pouvez utiliser dans Claude Code…
## Processus d'authentification : Connexion via navigateur et configuration manuelle de la clé API
Après avoir installé Claude Code, vous devez vous authentifier avant de pouvoir l'utiliser. Vous devez lier l'outil à votre compte Anthropic. Il existe deux méthodes de liaison : **connexion via navig…
## Comment installer Claude Code
L'installation de Claude Code ne comporte pas d'interface graphique avec des boutons "Suivant" ; tout se fait en ligne de commande. Si vous utilisez habituellement npm, le processus ne prendra pas plus de deux minutes.
### Prérequis
Avant de commencer, assurez-vou…
## Cas d'utilisation typiques
Je classe les cas d'utilisation en quatre catégories, par ordre de fréquence décroissante.
---
### Première catégorie : Comprendre le code
C'est probablement la plus utilisée. Lorsque vous reprenez le projet de quelqu'un d'autre, examinez un module ancien ou ouvrez …
## 1.3 Pourquoi coder dans le terminal ?
Imaginons : vous êtes en train d'écrire une nouvelle fonctionnalité quand vous découvrez que vous devez modifier une fonction utilitaire de base éparpillée dans trois fichiers, avec des appels qui traversent des modules. Vous ouvrez votre éditeur, faites une…
## 1.2 La "parenté" entre Claude Code, Claude Chat et Claude API
De nombreux développeurs, lorsqu'ils entendent parler de Claude Code pour la première fois, font naturellement le lien avec deux autres produits : **Claude Chat** (interface de chat web) et **Claude API** (interface de programmation).…
## 1.1 Qu'est-ce que Claude Code ?
### Définition en une phrase
**Claude Code est un agent de programmation IA (Agent) lancé par Anthropic, qui fonctionne dans le terminal.** Le développeur décrit une tâche en langage naturel, et il peut lire activement la base de code, proposer des modifications, e…
Un bon **Spec Coding** (codage piloté par les spécifications) consiste à transformer des « idées floues » en « contrats précis, vérifiables et exécutables ». Il ne s'agit pas seulement d'écrire un document, mais d'établir un langage de communication **sans ambiguïté** entre humains et IA (ou entre h…
Le mode "ressenti/ambiance" du Vibe Coding, bien qu'agréable pour le prototypage rapide et l'exploration créative, peut facilement tomber dans plusieurs pièges typiques s'il n'est pas contrôlé. Voici un résumé sous cinq dimensions : **qualité du code, maintenabilité, sécurité, évolution des besoins …
C'est une question que la plupart des programmeurs rencontrent. **Vibe Coding** et **Spec Coding** sont deux paradigmes de travail distincts lors de la programmation assistée par grand modèle de langage (LLM). Leur différence fondamentale réside dans ce que vous donnez en entrée à l'IA : une sensati…
L'injection malveillante de requêtes (injection malveillante de prompts / empoisonnement des résultats de recherche) constitue une menace de sécurité très réelle pour les systèmes RAG en production. Un attaquant peut, via une entrée soigneusement conçue, tenter de faire fuiter des informations sensi…
L'optimisation de prompt (Prompt Engineering / Optimization) est une compétence clé pour faire en sorte que les grands modèles de langage « obéissent », en particulier dans les systèmes RAG, car elle détermine directement si le modèle est disposé à suivre fidèlement le contenu récupéré, à éviter les…
L'optimisation du RAG ne consiste pas en un ajustement unique, mais en un processus d'**optimisation de bout en bout**. Ci-dessous, je présente des stratégies d'optimisation systématiques selon quatre dimensions : **côté indexation des données, côté recherche, côté génération, côté évaluation**, acc…
## Qu'est-ce que l'Embedding fait réellement ? — De l'essence technique à la réponse en entretien
### I. Essence technique : un résumé en une phrase
**Le travail principal de l'Embedding est de mapper des données non structurées discrètes (texte, images, etc.) dans un espace vectoriel continu de f…
Le taux de précision est la ligne de vie centrale d'un système de questions-réponses, surtout lorsqu'on tente de l'appliquer à des scénarios sérieux (comme la médecine, le droit, le support interne d'entreprise). Mon point de vue peut se résumer ainsi : **Le taux de précision est un concept multidim…
### Qu'est-ce que le RAG ?
**RAG** signifie **Retrieval-Augmented Generation**, en français **Génération augmentée par récupération**.
En termes simples, il s'agit d'une technique qui **donne au grand modèle de langage un « livre de référence consultable à tout moment »**.
Imaginez le grand modèl…
## I. Concept central de la compétence
Une compétence est un ensemble d'unités de capacité exécutables encapsulées dans un **Agent** ou un **système d'IA**. Elle comprend généralement :
- **Condition de déclenchement** : quand elle est invoquée (par exemple, instruction utilisateur, événement syst…
## Les trois méthodologies fondamentales des agents IA : ReAct, Plan-and-Solve et Reflection
Un agent IA est un agent intelligent capable de percevoir son environnement, de prendre des décisions et d'exécuter des actions de manière autonome. Ses méthodologies fondamentales sont principalement au no…
## Qu'est-ce que le mode expert mixte MOA (Mixture-of-Agents) ?
**MOA** est une **architecture de collaboration multi-agents** dont l'idée centrale est de combiner plusieurs modèles d'IA indépendants (appelés « experts » ou « Agents ») via un **mécanisme de routage/ordonnancement**, permettant à ch…
# Conception du système de mémoire d'un Agent : Solutions pour la mémoire à court terme et à long terme
Cet article explore la conception du système de mémoire d'un Agent, en le divisant en deux niveaux : la mémoire à court terme et la mémoire à long terme, et détaille leurs solutions de mise en œu…