Хорошее **Spec Coding** (спецификация-ориентированное программирование) заключается в превращении "туманных идей" в "точные, проверяемые, исполнимые контракты". Это не просто документ, а создание **однозначного языка общения** между человеком и AI (или между людьми). Ниже я рассмотрю четыре аспекта:…
Режим Vibe Coding, основанный на «ощущении/атмосфере», хотя и приятен при быстром прототипировании и творческом исследовании, при отсутствии контроля может легко привести к нескольким типичным ловушкам. Ниже приведено обобщение по пяти измерениям: **качество кода, поддерживаемость, безопасность, эво…
Это проблема, с которой сталкивается большинство программистов. **Вайб-кодинг** и **Спек-кодинг** — это две совершенно разные парадигмы работы при программировании с использованием больших языковых моделей (LLM). Их ключевое различие в том: **ваш \"ввод\" для ИИ — это расплывчатое ощущение или точна…
Вредоносная инъекция в Query (вредоносная инъекция в Prompt / отравление поиска) представляет собой очень реальную угрозу безопасности при практическом внедрении RAG-систем. Злоумышленник может с помощью тщательно сконструированного ввода попытаться заставить модель раскрыть конфиденциальную информа…
Оптимизация Prompt (Prompt Engineering / Optimization) — ключевой навык, позволяющий большим языковым моделям «слушаться». Особенно в RAG-системах от неё напрямую зависит, будет ли модель добросовестно следовать извлечённому содержимому, избегать галлюцинаций и выдавать форматированный вывод.
---
…
Оптимизация RAG — это не настройка одного компонента, а **оптимизация всего конвейера**. Ниже я привожу систематические стратегии оптимизации с четырех сторон: **индексации данных, поиска, генерации и оценки**, а также практический опыт, который можно упомянуть на собеседовании.
---
## 1. Оптимиза…
## Что на самом деле делает Embedding? — от сути технологии до ответов на собеседовании
### 一、Техническая суть: суть в одной фразе
**Основная работа Embedding — отображение дискретных неструктурированных данных (текст, изображения и т.д.) в непрерывное низкоразмерное векторное пространство, где се…
Точность — ключевая характеристика системы вопросов-ответов, особенно при попытке применить её в серьёзных сценариях (например, медицина, юриспруденция, внутренняя поддержка предприятия). Моё мнение можно обобщить так: **точность — многомерное понятие, нельзя смотреть только на одно число; необходим…
### Что такое RAG?
**RAG** расшифровывается как **Retrieval-Augmented Generation**, что означает **генерация с расширенным поиском**.
Проще говоря, это технология, которая **даёт большой языковой модели "справочник, который можно открыть в любой момент"**.
Представьте большую языковую модель как …
## 1. Основные концепции навыка
Навык — это инкапсулированный набор исполняемых единиц способностей в **Агенте** или **AI системе**. Обычно он включает:
- **Условия запуска**: когда вызывается (например, команда пользователя, системное событие).
- **Входные параметры**: данные или контекст, которы…
## Три основные методологии AI Agent: ReAct, Plan-and-Solve и Reflection
AI Agent — это интеллектуальный агент, способный самостоятельно воспринимать окружающую среду, принимать решения и выполнять действия. Существуют три основные методологии: ReAct, Plan-and-Solve и Reflection. Ниже они описаны с…
## Что такое смешанный режим экспертов MOA (Mixture-of-Agents)?
**MOA** — это **многоагентная архитектура сотрудничества**, основная идея которой заключается в объединении нескольких независимых моделей ИИ (называемых «экспертами» или «агентами») с помощью **механизма маршрутизации/планирования**, …
# Проектирование системы памяти агента: реализация краткосрочной и долгосрочной памяти
В этой статье рассматривается проектирование системы памяти агента, разделенной на два уровня: краткосрочную и долгосрочную память, а также подробно описываются соответствующие схемы реализации и меры предосторож…
# Руководство по собеседованию и технический анализ векторных баз данных
Эта статья представляет собой обмен опытом собеседований и технический анализ векторных баз данных. В ней систематически объясняются основные концепции, технические принципы, рекомендации по выбору и сценарии применения вектор…
# Обзор технологии Function Calling
## 1. Определение
Function Calling — это механизм, позволяющий разработчикам описывать доступные внешние инструменты (например, API) для большой языковой модели (LLM) с помощью JSON-схемы. Когда модель решает, что для ответа на вопрос пользователя необходимо вызв…
# AI Вопрос на собеседовании 2: Как обеспечить надежность вызова инструментов большой языковой моделью (LLM)
Как обеспечить, чтобы большая языковая модель (LLM) при вызове инструментов работала надежно и контролируемо, а не просто полагалась на подсказки для "убеждения" модели. Необходимо системати…
# Различия между вызовом инструментов агента и обычным вызовом функций
В этой статье в основном обсуждаются ключевые различия между вызовом инструментов агента и обычным вызовом функций, а также подробно описываются механизм, ценность, типичные сценарии отказов и стратегии их преодоления при вызове…