## Chọn mô hình: Nên dùng Sonnet hay Opus?
Sau khi cài đặt và đăng nhập Claude Code, bạn không cần phải lo lắng ngay về vấn đề mô hình — nó mặc định dùng Claude Sonnet, hầu hết thời gian là đủ dùng.
### Các mô hình bạn có thể dùng trong Claude Code
Hiện tại, có ba mô hình có thể chọn động trong d…
## Quy trình xác thực: Đăng nhập qua trình duyệt và cấu hình thủ công API Key
Sau khi cài đặt Claude Code, bạn cần phải xác thực để sử dụng. Bạn cần liên kết công cụ với tài khoản Anthropic của mình. Có hai cách liên kết: **Đăng nhập qua trình duyệt** và **Cấu hình thủ công API Key**. Cả hai cách đ…
## Cách cài đặt Claude Code
Quá trình cài đặt Claude Code không có giao diện đồ họa với nút "Tiếp theo", mọi thứ đều thực hiện qua dòng lệnh. Nếu bạn đã quen với npm, toàn bộ quá trình sẽ không quá hai phút.
### Điều kiện tiên quyết
Trước khi bắt đầu, hãy đảm bảo bạn có những thứ sau:
- **Node.j…
## Các trường hợp sử dụng điển hình
Tôi chia các trường hợp sử dụng thành bốn loại, sắp xếp theo tần suất từ cao đến thấp.
---
### Loại thứ nhất: Hiểu code
Đây có lẽ là loại được sử dụng nhiều nhất. Khi tiếp nhận dự án của người khác, xem một module cũ, hoặc mở một kho lưu trữ không có tài liệu,…
## 1.3 Tại sao phải viết code trong terminal?
Hãy tưởng tượng: Bạn đang viết một tính năng mới, bỗng phát hiện cần sửa một hàm tiện ích cơ bản nằm rải rác trong ba file, một số lời gọi xuyên module. Bạn mở editor, tìm kiếm toàn cục, lật từng file, sửa cẩn thận, rồi chạy lại bài kiểm tra—đỏ. Xem lỗi…
## 1.2 Mối quan hệ "họ hàng" với Claude Chat và API
Khi lần đầu nghe đến Claude Code, nhiều nhà phát triển thường liên tưởng đến hai sản phẩm khác: **Claude Chat** (giao diện trò chuyện web) và **Claude API** (giao diện lập trình). Cả ba đều đến từ Anthropic, đều sử dụng dòng mô hình Claude ở nền t…
## 1.1 Claude Code là gì?
### Định nghĩa ngắn gọn
**Claude Code là một tác nhân lập trình AI (Agent) do Anthropic phát hành, chạy trong terminal (Terminal).** Nhà phát triển mô tả nhiệm vụ bằng ngôn ngữ tự nhiên, nó có thể chủ động đọc kho mã, đề xuất sửa đổi, thực thi lệnh, chạy kiểm thử, thao tác …
Một **Spec Coding** (lập trình dựa trên đặc tả) tốt, cốt lõi là biến "ý tưởng mơ hồ" thành "hợp đồng chính xác, có thể kiểm chứng và thực thi". Nó không chỉ là viết một tài liệu, mà là xây dựng một **ngôn ngữ giao tiếp không mơ hồ** giữa con người và AI (hoặc giữa người với người). Dưới đây, tôi sẽ …
Chế độ "cảm giác/không khí" của Vibe Coding rất thú vị khi tạo mẫu nhanh và khám phá sáng tạo, nhưng nếu không kiểm soát, dễ rơi vào một số cạm bẫy điển hình. Dưới đây là tổng kết từ năm khía cạnh: **Chất lượng mã, Khả năng bảo trì, Bảo mật, Sự tiến hóa yêu cầu, và Cộng tác nhóm**
---
## 1. Cạm bẫ…
Đây là vấn đề mà hầu hết lập trình viên đều phải đối mặt. **Vibe Coding** và **Spec Coding** là hai phương thức làm việc hoàn toàn khác biệt khi lập trình với sự hỗ trợ của mô hình ngôn ngữ lớn (LLM) hiện nay. Sự khác biệt cốt lõi nằm ở: **"đầu vào" bạn cung cấp cho AI là cảm nhận mơ hồ hay đặc tả c…
Tiêm nhiễm độc hại Query (tiêm Prompt độc hại / đầu độc truy xuất) là một mối đe dọa bảo mật rất thực tế khi triển khai hệ thống RAG. Kẻ tấn công có thể thông qua đầu vào được xây dựng tinh vi để khiến mô hình rò rỉ thông tin nhạy cảm, vượt qua các giới hạn, thực thi các lệnh không mong muốn hoặc là…
Tối ưu Prompt (Prompt Engineering / Optimization) là kỹ năng quan trọng để khiến mô hình ngôn ngữ lớn “nghe lời”, đặc biệt trong hệ thống RAG, nó quyết định trực tiếp liệu mô hình có trung thành dựa vào nội dung truy xuất, tránh ảo giác, và tuân thủ định dạng đầu ra hay không.
---
## I. Nguyên tắc…
Việc tối ưu hóa RAG không phải là điều chỉnh một khâu duy nhất, mà là một quá trình **tối ưu toàn bộ chuỗi**. Dưới đây, tôi sẽ đưa ra các chiến lược tối ưu hệ thống từ bốn chiều: **phía chỉ mục dữ liệu, phía truy xuất, phía sinh, phía đánh giá**, kèm theo kinh nghiệm thực tế có thể đề cập trong phỏn…
## Embedding thực sự làm gì? — Từ bản chất kỹ thuật đến câu trả lời phỏng vấn
### Một, Bản chất kỹ thuật: Một câu nói rõ cốt lõi
**Công việc cốt lõi của Embedding là ánh xạ dữ liệu phi cấu trúc rời rạc (văn bản, hình ảnh, v.v.) vào một không gian vector liên tục, có chiều thấp, sao cho các đối tượ…
Độ chính xác là huyết mạch cốt lõi của hệ thống hỏi đáp kiến thức, đặc biệt khi bạn cố gắng áp dụng nó vào các tình huống nghiêm trọng (như y tế, pháp luật, hỗ trợ nội bộ doanh nghiệp). Quan điểm của tôi có thể tóm gọn: **Độ chính xác là một khái niệm đa chiều, không thể chỉ nhìn vào một con số, mà …
### RAG là gì?
**RAG** là viết tắt của **Retrieval-Augmented Generation**, nghĩa là **Tạo sinh tăng cường truy xuất**.
Nói đơn giản, nó là kỹ thuật **"trang bị cho mô hình ngôn ngữ lớn một cuốn sách tham khảo có thể tra cứu bất cứ lúc nào"**.
Bạn có thể hình dung mô hình ngôn ngữ lớn như một "siê…
## I. Khái niệm cốt lõi của Skill
Skill là một đơn vị khả năng thực thi được đóng gói trong **Agent (Tác tử)** hoặc **Hệ thống AI**. Nó thường bao gồm:
- **Điều kiện kích hoạt**: Khi nào được gọi (ví dụ: lệnh người dùng, sự kiện hệ thống).
- **Tham số đầu vào**: Dữ liệu hoặc ngữ cảnh cần nhận.
- *…
## Ba phương pháp luận cốt lõi của AI Agent: ReAct, Plan-and-Solve và Reflection
AI Agent là tác nhân thông minh có khả năng tự nhận thức môi trường, đưa ra quyết định và thực hiện hành động. Các phương pháp luận cốt lõi của nó chủ yếu có ba loại: ReAct, Plan-and-Solve và Reflection. Dưới đây lần l…
## Mô hình Chuyên gia Hỗn hợp MOA (Mixture-of-Agents) là gì?
**MOA** là một **kiến trúc cộng tác đa tác tử**, với ý tưởng cốt lõi: kết hợp nhiều mô hình AI độc lập (gọi là "chuyên gia" hoặc "Agent") thông qua một **cơ chế định tuyến/điều phối**, để mỗi chuyên gia xử lý nhiệm vụ con mà nó giỏi nhất,…
# Thiết kế hệ thống bộ nhớ Agent: Giải pháp triển khai bộ nhớ ngắn hạn và dài hạn
Bài viết này thảo luận về thiết kế hệ thống bộ nhớ Agent, chia thành hai lớp: bộ nhớ ngắn hạn và bộ nhớ dài hạn, đồng thời trình bày chi tiết các giải pháp triển khai và lưu ý tương ứng.
## Khung và quan điểm cốt lõi…