## Избор на модел: Sonnet или Opus – кој да го користам?
Откако ќе го инсталирате и најавите Claude Code, не треба веднаш да се грижите за моделот – стандардно користи Claude Sonnet, кој во повеќето случаи е доволен.
### Модели што можете да ги користите во Claude Code
Моментално, динамично доста…
## Процес на автентификација: Најава преку прелистувач и рачно конфигурирање на API Key
Откако ќе го инсталирате Claude Code, треба да завршите со автентификација за да го користите. Треба да ја поврзете алатката со вашата Anthropic сметка. Постојат два начина на поврзување: **најава преку прелисту…
## Како да го инсталирате Claude Code
Инсталацијата на Claude Code нема графички интерфејс со „Следно“ – сè се прави во командната линија. Ако веќе користите npm, целиот процес ќе трае не повеќе од две минути.
### Предуслови
Пред да започнете, проверете дали ги имате следниве работи:
- **Node.js…
## Типични сценарија за употреба
Ги делам сценаријата во четири категории, подредени по фреквенција од висока до ниска.
---
### Прва категорија: Разбирање на кодот
Ова е веројатно најкористената категорија. Кога преземате туѓ проект, гледате стар модул, или отворате складиште без документација, …
## 1.3 Зошто да пишуваме код во терминал?
Да земеме пример: работите на нова функција и одеднаш треба да промените основна алатка која е расфрлана во три датотеки, а некои повици се преку модули. Го отворате уредникот, пребарувате глобално, прелистувате датотека по датотека, внимателно менувате, по…
## 1.2 Неговата „роднинска врска“ со Claude Chat и API
Многу програмери, кога првпат слушаат за Claude Code, природно помислуваат на другите два облици на производот: **Claude Chat** (веб-интерфејс за разговор) и **Claude API** (програмски интерфејс). Сите тие доаѓаат од Anthropic и користат истата…
## 1.1 Што е Claude Code?
### Една реченица дефиниција
**Claude Code е AI програмски агент (Agent) на Anthropic кој работи во терминал (Terminal)**. Развивачите опишуваат задачи на природен јазик, а тој активно чита кодна база, предлага промени, извршува команди, тестира, работи со Git, па дури и ба…
Доброто **Spec Coding** (спецификациско кодирање) суштински го претвора „нејасната идеја“ во „точен, проверлив и извршен договор“. Тоа не е само пишување документ, туку воспоставување јазик за комуникација **без двосмисленост** помеѓу човек и AI (или помеѓу луѓе). Подолу ќе го опишам изгледот на доб…
Режимот на Vibe Coding „чувство/атмосфера“ иако е одличен за брз прототип и креативно истражување, без контрола лесно може да доведе до неколку типични замки. Подолу се сумирани пет димензии: **квалитет на код, одржливост, безбедност, еволуција на барањата, тимска соработка**
---
## 1. Замки на кв…
Ова е проблем со кој се соочуваат повеќето програмери. **Vibe Coding** и **Spec Coding** се две сосема различни работни парадигми при програмирање со помош на голем јазичен модел (LLM). Нивната основна разлика е: **дали „влезот“ што му го давате на AI е нејасно чувство или прецизна спецификација**.
…
Малициозно инјектирање на Query (злонамерно инјектирање на промпт / отровување на пребарувањето) е реална безбедносна закана за RAG системите во практична примена. Напаѓачите може да користат внимателно конструиран влез за да се обидат да предизвикаат моделот да открие чувствителни информации, да ги…
Оптимизацијата на промпт (Prompt Engineering / Optimization) е клучна вештина за да се натера големиот јазичен модел да „слуша“, особено во RAG системите, директно одредува дали моделот е подготвен верно да се придржува до преземената содржина, да избегнува халуцинации и да го следи форматниот излез…
Оптимизацијата на RAG не е прилагодување на една единечна фаза, туку процес на **оптимизација на целиот ланец**. Подолу давам систематски стратегии за оптимизација од **четири димензии**: страна на индексирање податоци, страна на пребарување, страна на генерирање и страна на евалуација, заедно со пр…
## Што всушност прави Embedding? – Од техничката суштина до одговори на интервју
### 1. Техничка суштина: една реченица што ја објаснува основата
**Основната работа на Embedding е да ги мапира дискретните неструктурирани податоци (текст, слики итн.) во континуиран, нискодимензионален векторски про…
### Што е RAG?
**RAG** е кратенка за **Retrieval-Augmented Generation**, на македонски **Генерација збогатена со пребарување**.
Едноставно кажано, тоа е техника која **на големиот јазичен модел му дава „прирачник што може да го прелистува во секое време“**.
Замислете го големиот јазичен модел как…
Точноста е главната животна линија на системите за прашања и одговори, особено кога се обидувате да ги примените во сериозни сценарија (како медицина, право, внатрешна поддршка на компании). Моето гледиште може да се сумира како: **точноста е повеќедимензионален концепт, не треба да се гледа само на…
## 1. Основен концепт на вештина
Вештина е група на извршни способности инкапсулирани во **Агент (интелигентен систем)** или **AI систем**. Таа обично вклучува:
- **Услов за активирање**: кога се повикува (на пример, корисничка команда, системски настан).
- **Влезни параметри**: податоци или конте…
## Трите основни методологии на AI Agent: ReAct, Plan-and-Solve и Reflection
AI Agent е интелигентен агент кој може самостојно да ја перципира околината, да донесува одлуки и да извршува дејства. Постојат три главни методологии: ReAct, Plan-and-Solve и Reflection. Подолу се дадени описи, дијаграми …
## Што е MOA (Mixture-of-Agents)?
**MOA** е **повеќеагентна колаборативна архитектура** чија основна идеја е: комбинирање на повеќе независни АИ модели (наречени „експерти“ или „агенти“) преку **механизам за рутирање/распоредување**, така што секој експерт се справува со потзадачата за која е најдо…
# Дизајн на мемориски систем на агенти: Имплементација на краткорочна и долгорочна меморија
Оваа статија го истражува дизајнот на меморискиот систем на агенти, поделен на две нивоа: краткорочна и долгорочна меморија, и детално ги опишува нивните имплементации и размислувања.
## Рамка и клучни глед…