Dobar **Spec Coding** (specifikacijsko programiranje) ima za cilj pretvoriti "nejasne ideje" u "precizan, provjerljiv i izvršiv ugovor". Ne radi se samo o pisanju dokumenta, već o uspostavljanju **nedvosmislenog komunikacijskog jezika** između ljudi i AI-ja (ili među ljudima). U nastavku ću opisati …
Iako je model "osjećaj/atmosfera" Vibe Codinga vrlo ugodan pri brzom razvoju prototipa i kreativnom istraživanju, ako se ne kontroliše, lako upada u nekoliko tipičnih zamki. U nastavku se sumiraju iz pet dimenzija: **kvalitet kôda, održivost, sigurnost, evolucija zahtjeva, timska saradnja**
---
##…
Ovo je problem s kojim se suočava većina programera. **Vibe Coding** i **Spec Coding** su dva potpuno različita radna paradigma kada se programira uz pomoć velikih jezičkih modela (LLM). Njihova ključna razlika je: **da li je vaš 'unos' AI-ju nejasan osjećaj ili precizna specifikacija**.
---
## 1. …
Zlonamjerna injekcija upita (zlonamjerna injekcija prompta / trovanje pretrage) predstavlja vrlo realnu sigurnosnu prijetnju u stvarnoj implementaciji RAG sistema. Napadači mogu putem pažljivo konstruiranog unosa pokušati natjerati model da otkrije osjetljive informacije, zaobiđe ograničenja, izvrši…
Optimizacija prompta (Prompt Engineering / Optimization) je ključna vještina da se veliki jezički model "sluša", posebno u RAG sistemima, direktno određuje da li će model vjerno slijediti pretraženi sadržaj, izbjeći halucinacije i ispoštovati format izlaza.
---
## 1. Ključni principi optimizacije …
Optimizacija RAG-a nije prilagođavanje jedne faze, već **proces optimizacije cijelog lanca**. U nastavku dajem sistematske strategije optimizacije iz četiri dimenzije: **strana indeksiranja podataka, strana pretraživanja, strana generiranja i strana evaluacije**, uz praktična iskustva koja se mogu s…
## Šta Embedding zapravo radi? — Od tehničke suštine do odgovora na intervjuu
### 1. Tehnička suština: Jedna rečenica koja objašnjava srž
**Osnovni posao Embeddinga je preslikavanje diskretnih nestrukturiranih podataka (tekst, slike itd.) u kontinuirani, niskodimenzionalni vektorski prostor, tako …
Tačnost je ključna odlika sistema za odgovaranje na pitanja, posebno kada se pokušava primijeniti u ozbiljnim scenarijima (poput medicine, prava, interne podrške preduzeća). Moje viđenje može se sažeti na sljedeći način: **Tačnost je višedimenzionalni koncept, ne treba gledati samo jedan broj, već j…
### Šta je RAG?
**RAG** je skraćenica za **Retrieval-Augmented Generation**, na bosanskom **Generisanje potpomognuto pretraživanjem**.
Jednostavno rečeno, to je tehnika koja **velikom jezičkom modelu daje „priručnik koji može listati u svakom trenutku"**.
Zamislite veliki jezički model kao „super…
## 1. Osnovni koncept Skill-a
Skill je skup izvršnih jedinica sposobnosti inkapsuliranih u **Agent** ili **AI sistem**. Obično uključuje:
- **Okidački uslov**: Kada se poziva (npr. korisnička naredba, sistemski događaj).
- **Ulazni parametri**: Podaci ili kontekst koje treba primiti.
- **Logika iz…
## Tri ključne metodologije AI Agenta: ReAct, Plan-and-Solve i Reflection
AI Agent je inteligentni entitet koji može samostalno percipirati okolinu, donositi odluke i izvršavati akcije. Njegove ključne metodologije su tri: ReAct, Plan-and-Solve i Reflection. U nastavku ih predstavljamo, uz dijagram…
## Šta je MOA (Mixture-of-Agents)?
**MOA** je **multi-agentna kolaborativna arhitektura** čija je osnovna ideja: kombinirati više nezavisnih AI modela (nazvanih "eksperti" ili "agenti") putem **mehanizma rutiranja/raspoređivanja**, tako da svaki ekspert obrađuje podzadatke u kojima je najbolji, a z…
# Dizajn Memorijskog Sistema Agenta: Implementacija Kratkoročne i Dugoročne Memorije
Ovaj članak istražuje dizajn memorijskog sistema Agenta, dijeleći ga na dva nivoa: kratkoročnu i dugoročnu memoriju, te detaljno opisuje njihove implementacijske pristupe i važna razmatranja.
## Okvir i Ključne Ta…
# Sažetak razlike između poziva alata agenta i običnog poziva funkcije
Ovaj članak uglavnom raspravlja o ključnim razlikama između poziva alata agenta i običnog poziva funkcije, te detaljno objašnjava mehanizam, vrijednost, uobičajene načine neuspjeha i strategije suočavanja s pozivom alata agenta.…
# AI intervju pitanje 2: Kako osigurati pouzdanost pozivanja alata od strane velikog jezičkog modela (LLM)
Kako osigurati da veliki jezički model (LLM) pri pozivanju alata radi pouzdano i kontrolirano, a ne samo da se oslanja na upute (prompts) da "uvjeri" model. Potrebno je sistematski dati višesl…
# Sažetak tehnologije Function Calling
## 1. Definicija
Function Calling je mehanizam koji omogućava programerima da opišu dostupne vanjske alate (poput API-ja) velikom jezičkom modelu (LLM) putem JSON sheme. Kada model procijeni da je potrebno pozvati alat kako bi odgovorio na korisničko pitanje, …
# Vodič za intervju o vektorskim bazama podataka i tehnička analiza
Ovaj članak je dijeljenje iskustva s intervjua i tehnička analiza o vektorskim bazama podataka. Sistematski objašnjava osnovne koncepte, tehničke principe, preporuke za odabir i scenarije primjene vektorskih baza podataka.
## 1. O…