Un bon **Spec Coding** (programació basada en especificacions) consisteix a convertir "idees vagues" en "contractes precisos, verificables i executables". No es tracta només d'escriure un document, sinó d'establir un **llenguatge de comunicació sense ambigüitats** entre humans i IA (o entre humans).…
El mode "sentiment/atmosfera" del Vibe Coding, tot i que és molt útil per a prototipatge ràpid i exploració creativa, si no es controla, pot caure fàcilment en diversos paranys típics. A continuació es resumeixen des de cinc dimensions: **qualitat del codi, mantenibilitat, seguretat, evolució de req…
Aquesta és una pregunta que la majoria de programadors s'enfronten. **Vibe Coding** i **Spec Coding** són dues maneres de treballar completament diferents quan es programa amb l'ajuda de models de llenguatge grans (LLM). La diferència clau és: **l'"entrada" que dones a la IA és una sensació vaga o u…
La injecció maliciosa de Query (injecció maliciosa de Prompt / contaminació de la recuperació) és una amenaça de seguretat molt real en el desplegament pràctic de sistemes RAG. Un atacant pot intentar que el model reveli informació sensible, evadeixi restriccions, executi instruccions no previstes o…
L'ajust de prompts (enginyeria/optimització de prompts) és una habilitat clau per fer que els models de llenguatge grans siguin "obedients", especialment en sistemes RAG, determinant directament si el model vol basar-se fidelment en el contingut recuperat, evitar al·lucinacions i donar un format de …
L'optimització de RAG no és un ajust d'un sol enllaç, sinó un procés **d'optimització de tota la cadena**. A continuació, des de quatre dimensions: **costat d'indexació de dades, costat de recuperació, costat de generació i costat d'avaluació**, dono estratègies d'optimització sistemàtiques, juntame…
## Què fa realment l'Embedding? — De l'essència tècnica a la resposta d'entrevista
### I. Essència tècnica: una frase per al nucli
**La tasca principal de l'Embedding és mapejar dades no estructurades discretes (text, imatges, etc.) a un espai vectorial continu i de baixa dimensió, de manera que o…
La precisió és la línia de vida d'un sistema de pregunta-resposta, especialment quan s'intenta aplicar en entorns seriosos (com medicina, dret, suport intern empresarial). La meva opinió es pot resumir així: **la precisió és un concepte multidimensional; no es pot mirar només un sol número, sinó que…
### Què és RAG?
**RAG** és l'acrònim de **Retrieval-Augmented Generation**, que en català significa **Generació Augmentada per Recuperació**.
En poques paraules, és una tècnica que **dota al model de llenguatge gran d'un "llibre de consulta" que es pot fullejar en qualsevol moment**.
Pots imagina…
## 1. Concepte central de Skill
Una Skill és una unitat de capacitat executable encapsulada dins d'un **Agent** o **sistema d'IA**. Normalment inclou:
- **Condició de dispar**: Quan es crida (p. ex., instrucció d'usuari, esdeveniment del sistema).
- **Paràmetres d'entrada**: Dades o context que ca…
## Tres metodologies bàsiques de l'Agent d'IA: ReAct, Plan-and-Solve i Reflection
Un Agent d'IA és un agent intel·ligent capaç de percebre l'entorn de manera autònoma, prendre decisions i executar accions. Les seves metodologies bàsiques són principalment tres: ReAct, Plan-and-Solve i Reflection. A…
## Què és el Mode d'Experts Mixtos MOA (Mixture-of-Agents)?
**MOA** és una **arquitectura de col·laboració multiagent** el nucli de la qual és: combinar múltiples models d'IA independents (anomenats "experts" o "Agent") mitjançant un **mecanisme d'encaminament/planificació**, de manera que cada exp…
# Disseny del Sistema de Memòria de l'Agent: Solucions per a la Memòria a Curt i Llarg Termini
Aquest article explora el disseny del sistema de memòria de l'Agent, dividint-lo en dos nivells: memòria a curt termini i memòria a llarg termini, i detalla les seves respectives solucions i consideracion…
# Resum de la diferència entre la crida d'eines d'Agent i la crida de funcions normals
Aquest article discuteix principalment les diferències clau entre la crida d'eines d'Agent i la crida de funcions normals, i detalla el mecanisme, el valor, els modes de fallada comuns i les estratègies de respos…
# Pregunta d'entrevista AI 2: Com assegurar que la crida d'eines d'un model de llenguatge gran (LLM) sigui fiable
Com assegurar que un model de llenguatge gran (LLM) treballi de manera fiable i controlable en la crida d'eines, sense dependre únicament de les indicacions per "convèncer" el model. Ca…
# Resum de la tecnologia Function Calling
## 1. Definició
Function Calling és un mecanisme que permet als desenvolupadors descriure eines externes (com API) a un model de llenguatge gran (LLM) mitjançant un esquema JSON. Quan el model determina que necessita cridar una eina per respondre a la pregu…
# Guia d'entrevista i anàlisi tècnica de bases de dades vectorials
Aquest article és una experiència d'entrevista i anàlisi tècnica sobre bases de dades vectorials. Explica sistemàticament els conceptes clau, principis tècnics, recomanacions de selecció i escenaris d'aplicació de les bases de dades…