Spec Coding yang baik (pengaturcaraan berasaskan spesifikasi) berfokus pada mengubah "idea kabur" menjadi "kontrak yang tepat, boleh disahkan, dan boleh dilaksana". Ia bukan sekadar menulis dokumen, tetapi membina bahasa komunikasi tanpa kekaburan antara manusia dan AI (atau antara manusia). Di bawa…
Walaupun mod "panduan perasaan/suasana" bagi Vibe Coding sangat menyeronokkan ketika prototaip cepat dan penerokaan kreatif, jika tidak dikawal, ia mudah terjerumus ke dalam beberapa perangkap biasa. Berikut adalah ringkasan dari lima dimensi: **kualiti kod, kebolehselenggaraan, keselamatan, evolusi…
Ini adalah masalah yang dihadapi oleh kebanyakan pengaturcara. **Vibe Coding** dan **Spec Coding** adalah dua paradigma kerja yang berbeza apabila menggunakan Model Bahasa Besar (LLM) untuk pengaturcaraan. Perbezaan utama mereka ialah: **"input" yang anda berikan kepada AI adalah perasaan yang kabur…
Suntikan berniat jahat pada Query (Suntikan Prompt Berniat Jahat / Keracunan Carian) adalah ancaman keselamatan yang sangat nyata dalam pelaksanaan sebenar sistem RAG. Penyerang mungkin menggunakan input yang dibina dengan teliti untuk cuba membuat model mendedahkan maklumat sensitif, memintas sekat…
Penalaan Prompt (Kejuruteraan Prompt / Pengoptimuman) adalah kemahiran utama untuk membuat model bahasa besar 'patuh', terutamanya dalam sistem RAG, ia menentukan secara langsung sama ada model bersedia untuk mematuhi kandungan yang diambil, mengelakkan halusinasi, dan mengeluarkan format yang stand…
Pengoptimuman RAG bukanlah pelarasan satu peringkat, tetapi proses **pengoptimuman rantaian penuh**. Saya akan memberikan strategi pengoptimuman sistematik dari empat dimensi: **sisi indeks data, sisi pengambilan, sisi penjanaan, dan sisi penilaian**, serta menyertakan pengalaman praktikal yang bole…
Penyempurnaan RAG bukanlah pelarasan satu bahagian, tetapi proses **pengoptimuman rantaian penuh**. Seterusnya, saya akan memberikan strategi pengoptimuman sistematik dari empat dimensi: **sisi indeks data, sisi carian, sisi penjanaan, dan sisi penilaian**, serta menyertakan pengalaman praktikal yan…
## Apa Sebenarnya Yang Dilakukan oleh Embedding? — Daripada Intipati Teknikal kepada Jawapan Temuduga
### I. Intipati Teknikal: Satu Ayat Menjelaskan Teras
**Tugas teras Embedding ialah memetakan data tak berstruktur diskret (teks, imej, dsb.) ke dalam ruang vektor selanjar berdimensi rendah, supa…
### Apakah RAG?
**RAG** adalah singkatan untuk **Retrieval-Augmented Generation**, dalam Bahasa Melayu bermaksud **Penjanaan Dipertingkatkan dengan Pengambilan Semula**.
Secara ringkas, ia adalah teknologi **memberikan model bahasa besar "sebuah buku rujukan yang boleh dirujuk pada bila-bila masa"…
Ketepatan adalah nadi utama sistem soal jawab pengetahuan, terutamanya apabila cuba mengaplikasikannya dalam senario serius (seperti perubatan, undang-undang, sokongan dalaman perusahaan). Pandangan saya boleh diringkaskan sebagai: **Ketepatan adalah konsep pelbagai dimensi, tidak boleh hanya meliha…
## Satu: Konsep Teras Skill
Skill ialah unit keupayaan boleh laksana yang dibungkus dalam **Agent (agen pintar)** atau **sistem AI**. Ia biasanya mengandungi:
- **Keadaan pencetus**: Bila ia dipanggil (contohnya arahan pengguna, peristiwa sistem).
- **Parameter input**: Data atau konteks yang perl…
## Tiga Metodologi Teras AI Agent: ReAct, Plan-and-Solve dan Reflection
AI Agent ialah ejen pintar yang boleh melihat persekitaran secara autonomi, membuat keputusan dan melaksanakan tindakan. Terdapat tiga metodologi teras: ReAct, Plan-and-Solve dan Reflection. Berikut adalah penerangan masing-mas…
## Apakah Mod Pakar Campuran MOA (Mixture-of-Agents)?
**MOA** ialah **seni bina kerjasama berbilang ejen** yang idea utamanya adalah: menggabungkan beberapa model AI bebas (dipanggil "pakar" atau "Ejen") bersama-sama, melalui **mekanisme penghalaan/penjadualan**, membolehkan setiap pakar mengendali…
# Reka Bentuk Sistem Memori Agent: Pelaksanaan Memori Jangka Pendek dan Jangka Panjang
Artikel ini membincangkan reka bentuk sistem memori Agent, membahagikannya kepada dua peringkat: memori jangka pendek dan memori jangka panjang, serta memperkenalkan secara terperinci pelaksanaan masing-masing da…
# Ringkasan Perbezaan Antara Panggilan Alat Agent dan Panggilan Fungsi Biasa
Artikel ini membincangkan perbezaan utama antara panggilan alat Agent dan panggilan fungsi biasa, serta menerangkan secara terperinci mekanisme, nilai, mod kegagalan biasa, dan strategi tindak balas bagi panggilan alat Age…
# Soalan Temuduga AI 2: Bagaimana Memastikan Panggilan Alat oleh Model Bahasa Besar (LLM) Boleh Dipercayai
Bagaimana memastikan Model Bahasa Besar (LLM) berfungsi dengan boleh dipercayai dan terkawal semasa panggilan alat, bukan hanya bergantung pada prompt untuk "meyakinkan" model. Perlu diberikan…
# Ringkasan Teknik Function Calling
## 1. Definisi
Function Calling adalah mekanisme yang membolehkan pembangun menerangkan alat luaran (seperti API) yang tersedia kepada Model Bahasa Besar (LLM) melalui skema JSON. Apabila model menilai bahawa alat perlu dipanggil untuk menjawab soalan pengguna, i…
# Panduan Temuduga Pangkalan Data Vektor dan Analisis Teknikal
Artikel ini adalah perkongsian pengalaman temuduga dan analisis teknikal mengenai pangkalan data vektor. Ia menerangkan secara sistematik konsep teras, prinsip teknikal, cadangan pemilihan, dan senario aplikasi pangkalan data vektor.
#…