## Выбор модели: Sonnet, Opus – какую использовать?
После установки и входа в Claude Code не нужно сразу ломать голову над выбором модели – по умолчанию используется Claude Sonnet, которого в большинстве случаев достаточно.
### Доступные модели в Claude Code
На данный момент в командной строке мо…
## Аутентификация: вход через браузер и ручная настройка API Key
После установки Claude Code необходимо пройти аутентификацию, чтобы начать использование. Вам нужно привязать инструмент к своей учетной записи Anthropic. Существует два способа привязки: **вход через браузер** и **ручная настройка AP…
## Как установить Claude Code
Установка Claude Code не имеет графического интерфейса с кнопкой «Далее», всё выполняется в командной строке. Если вы привыкли работать с npm, весь процесс займёт не больше двух минут.
### Предварительные требования
Перед началом убедитесь, что у вас есть:
- **Node.…
## Типичные сценарии использования
Я разделяю сценарии использования на четыре категории, упорядоченные по частоте от высокой к низкой.
---
### Первая категория: Понимание кода
Это, пожалуй, самая часто используемая. Когда вы берете чужой проект, смотрите давний модуль или открываете репозиторий…
## 1.3 Зачем писать код в терминале?
Представьте: вы пишете новую функцию и внезапно понимаете, что нужно изменить базовую вспомогательную функцию, которая разбросана по трём файлам, а некоторые вызовы пересекают модули. Вы открываете редактор, глобальный поиск, перелистываете файл за файлом, остор…
## 1.2 Его «родственные связи» с Claude Chat и API
Многие разработчики, впервые услышав о Claude Code, естественно вспоминают два других продукта: **Claude Chat** (веб-интерфейс) и **Claude API** (программный интерфейс). Все они действительно от Anthropic и используют одно семейство моделей Claude,…
## 1.1 Что такое Claude Code?
### Определение в одной фразе
**Claude Code — это AI-агент программирования (Agent), выпущенный Anthropic, работающий в терминале (Terminal).** Разработчик описывает задачу на естественном языке, и он активно читает код, предлагает изменения, выполняет команды, запускае…
Хорошее **Spec Coding** (спецификация-ориентированное программирование) заключается в превращении "туманных идей" в "точные, проверяемые, исполнимые контракты". Это не просто документ, а создание **однозначного языка общения** между человеком и AI (или между людьми). Ниже я рассмотрю четыре аспекта:…
Режим Vibe Coding, основанный на «ощущении/атмосфере», хотя и приятен при быстром прототипировании и творческом исследовании, при отсутствии контроля может легко привести к нескольким типичным ловушкам. Ниже приведено обобщение по пяти измерениям: **качество кода, поддерживаемость, безопасность, эво…
Это проблема, с которой сталкивается большинство программистов. **Вайб-кодинг** и **Спек-кодинг** — это две совершенно разные парадигмы работы при программировании с использованием больших языковых моделей (LLM). Их ключевое различие в том: **ваш \"ввод\" для ИИ — это расплывчатое ощущение или точна…
Вредоносная инъекция в Query (вредоносная инъекция в Prompt / отравление поиска) представляет собой очень реальную угрозу безопасности при практическом внедрении RAG-систем. Злоумышленник может с помощью тщательно сконструированного ввода попытаться заставить модель раскрыть конфиденциальную информа…
Оптимизация Prompt (Prompt Engineering / Optimization) — ключевой навык, позволяющий большим языковым моделям «слушаться». Особенно в RAG-системах от неё напрямую зависит, будет ли модель добросовестно следовать извлечённому содержимому, избегать галлюцинаций и выдавать форматированный вывод.
---
…
Оптимизация RAG — это не настройка одного компонента, а **оптимизация всего конвейера**. Ниже я привожу систематические стратегии оптимизации с четырех сторон: **индексации данных, поиска, генерации и оценки**, а также практический опыт, который можно упомянуть на собеседовании.
---
## 1. Оптимиза…
## Что на самом деле делает Embedding? — от сути технологии до ответов на собеседовании
### 一、Техническая суть: суть в одной фразе
**Основная работа Embedding — отображение дискретных неструктурированных данных (текст, изображения и т.д.) в непрерывное низкоразмерное векторное пространство, где се…
Точность — ключевая характеристика системы вопросов-ответов, особенно при попытке применить её в серьёзных сценариях (например, медицина, юриспруденция, внутренняя поддержка предприятия). Моё мнение можно обобщить так: **точность — многомерное понятие, нельзя смотреть только на одно число; необходим…
### Что такое RAG?
**RAG** расшифровывается как **Retrieval-Augmented Generation**, что означает **генерация с расширенным поиском**.
Проще говоря, это технология, которая **даёт большой языковой модели "справочник, который можно открыть в любой момент"**.
Представьте большую языковую модель как …
## 1. Основные концепции навыка
Навык — это инкапсулированный набор исполняемых единиц способностей в **Агенте** или **AI системе**. Обычно он включает:
- **Условия запуска**: когда вызывается (например, команда пользователя, системное событие).
- **Входные параметры**: данные или контекст, которы…
## Три основные методологии AI Agent: ReAct, Plan-and-Solve и Reflection
AI Agent — это интеллектуальный агент, способный самостоятельно воспринимать окружающую среду, принимать решения и выполнять действия. Существуют три основные методологии: ReAct, Plan-and-Solve и Reflection. Ниже они описаны с…
## Что такое смешанный режим экспертов MOA (Mixture-of-Agents)?
**MOA** — это **многоагентная архитектура сотрудничества**, основная идея которой заключается в объединении нескольких независимых моделей ИИ (называемых «экспертами» или «агентами») с помощью **механизма маршрутизации/планирования**, …
# Проектирование системы памяти агента: реализация краткосрочной и долгосрочной памяти
В этой статье рассматривается проектирование системы памяти агента, разделенной на два уровня: краткосрочную и долгосрочную память, а также подробно описываются соответствующие схемы реализации и меры предосторож…