Bản đồ SDK agent năm 2026
Từ cuối năm 2025 đến Q1 năm 2026, thị trường agent SDK đột ngột bước vào kỷ nguyên 5 mạnh. Năm SDK: Anthropic Agent SDK (hỗ trợ cả Python/TypeScript, v0.9), Vercel AI SDK 5 (tích hợp `generateText`+`experimental_agent`), LangGraph Studio (phương pháp state machine dòng LangChain), Mastra (framework nhẹ native TypeScript) và OpenAI Assistants v2 (phiên bản mới nhất được tích hợp với Responses API), mỗi SDK thể hiện triết lý thiết kế khác nhau.
Điều quan trọng là chúng không chỉ là "wrapper LLM" đơn thuần. Chúng được thiết kế như nền tảng tổng hợp xử lý vòng lặp agent, gọi tool, lưu trữ trạng thái, observability, subagent, thực thi song song và policy retry khi thất bại. Quyết định triển khai sản xuất phụ thuộc vào lựa chọn SDK nhiều hơn chất lượng mô hình.
Anthropic Agent SDK: Triển khai chuẩn vòng lặp ReAct
Anthropic Agent SDK là SDK trích xuất engine nội bộ của chính Claude Code, lấy `ClaudeAgentClient` làm trục và có API đơn giản hoàn thành bằng `agent.run()`. Vòng lặp là pattern ReAct thuần túy, tự động quản lý vòng lặp tin nhắn `tool_use` và `tool_result` bên trong. Đáng chú ý là "memory tool" và "context compression" được tích hợp sẵn, và ngay cả hội thoại dài hạn vượt 200K token, tóm tắt và lưu trữ cũng chạy tự động.
Phiên bản Python được cung cấp bằng `anthropic.agent.AgentClient`, TypeScript bằng `@anthropic-ai/agent-sdk`. Khởi động subagent thực hiện minh bạch bằng `agent.spawn_subagent()` và có thể đo lượng token sử dụng của từng cha-con riêng biệt. Trong môi trường sản xuất, có thể tinh tế hóa kiểm toán chi phí bằng cách gán API key độc lập cho từng subagent.
Định nghĩa tool tương thích JSON Schema, và đăng ký bằng decorator `@tool` (Python) hoặc `defineTool()` (TS). Kết hợp với tính năng Managed Agents có thể host agent chạy serverless phía Anthropic, không cần vận hành runtime riêng.
Vercel AI SDK 5: Tối ưu hóa tích hợp UI và streaming
Điểm mạnh của Vercel AI SDK 5 là sự tinh tế vượt trội của tích hợp frontend. Chỉ cần gọi `experimental_agent` từ hook `useChat`, streaming UI trong khi thực thi tool, hiển thị kết quả dần, dừng và khôi phục đều có thể viết khai báo. Tích hợp mật với Next.js App Router, và pattern khởi động agent qua Server Actions đã thực tế trở thành tiêu chuẩn.
Vòng lặp agent nghiêng về Plan-and-Execute và có thể chèn middleware theo đơn vị `step`. Với callback `onStepFinish`, có thể kiểm tra output của từng step và cắt vòng lặp khi vi phạm guardrail. Lớp trừu tượng có thể chuyển đổi nhiều provider (Anthropic, OpenAI, Google, Mistral) cũng xuất sắc, và thường code phía gọi không thay đổi ngay cả khi đổi mô hình sau này.
Mặt khác, đối với workflow cần state machine sâu (luồng phê duyệt có can thiệp người dùng v.v.), đôi khi hơi thiếu sức mạnh và kết hợp với LangGraph là lựa chọn thực tế.
LangGraph Studio: Agent như state machine
LangGraph triệt để áp dụng mô hình tinh thần "agent = đồ thị có hướng". Node là xử lý, edge là điều kiện chuyển tiếp, `StateGraph` điều khiển vòng lặp. Phát huy sức biểu đạt vượt trội trong các trường hợp muốn thiết kế rõ ràng control flow như phân nhánh có điều kiện, cycle, human-in-the-loop và checkpoint.
Phiên bản 2026 có LangGraph Studio (Web IDE) vào GA, và trực quan hóa đồ thị, thực thi từng bước, xác nhận state diff hoàn thành trong trình duyệt. Bằng cách lưu trữ `Checkpoint` vào Postgres, "debug du hành thời gian" có thể phân nhánh và thực thi lại từ bất kỳ trạng thái quá khứ nào đã đạt mức thực dụng trong sản xuất. Tuy nhiên, học phí cao nhất trong số 5 mạnh.
Để xây dựng agent kiểu Tree Search (đánh giá nhiều nhánh tìm kiếm và chấp nhận tốt nhất), LangGraph là tối ưu hiện tại, với triển khai điển hình là chạy song song node phân nhánh bằng Send API và chấm điểm tại node hội tụ.
Mastra và OpenAI Assistants v2
Mastra là framework nhẹ native TypeScript cấu thành từ 3 primitive: `Agent`, `Workflow`, `RAG`. Điểm đặc trưng là cung cấp mô hình event-driven tương thích Inngest như workflow engine trong khi bọc mỏng Vercel AI SDK 5. Phù hợp để khởi động nhanh ở quy mô startup.
OpenAI Assistants v2 được cải tổ lớn nhờ tích hợp vào Responses API, và mô hình phức tạp của `threads` và `runs` được tập hợp vào một lần gọi `responses.create()`. File Search, Code Interpreter, Function Calling là first-class, và đặc biệt thực thi sandbox của Code Interpreter trưởng thành hơn các công ty khác ở thời điểm hiện tại.
Observability: Langfuse, Arize, LangSmith
Điều tạo ra sự khác biệt lớn nhất trong vận hành sản xuất là observability. Langfuse là OSS có thể tự host, không có khái niệm đơn giá trace nên cực kỳ rẻ trong vận hành quy mô lớn. Arize Phoenix mạnh về evaluation và được chọn nhờ tự động hóa job evaluation offline. LangSmith có tích hợp liền mạch nhất với LangGraph và có thể xem phân phối latency theo đơn vị graph node chỉ bằng một click.
Tại KGA, chúng tôi phân biệt sử dụng: Langfuse trong sản xuất, Arize trong evaluation CI, chỉ LangSmith trong dự án LangGraph. Semantic convention của OpenTelemetry (thuộc tính `gen_ai.*`) vào GA trong Q1 năm 2026, và output trace tiêu chuẩn cũng được thống nhất phía SDK, nên việc chuyển đổi backend trở nên dễ dàng hơn nhiều so với trước đây.
Tiêu chí phán xét cách phân biệt sử dụng
Ưu tiên tích hợp frontend và UX → Vercel AI SDK 5. Muốn ra kết quả chất lượng sản xuất nhanh nhất với chủ yếu mô hình Anthropic → Anthropic Agent SDK. State machine phức tạp, luồng phê duyệt có con người → LangGraph. TypeScript startup → Mastra. Mô hình OpenAI + Code Interpreter bắt buộc → Assistants v2. Phán xét theo 5 trục này sẽ không sai lầm lớn.