Agent chỉ hiệu quả khi tool cho nó cũng chất lượng. Anthropic vừa công bố bài phân tích kỹ thuật chi tiết về những gì thực sự tạo nên tool cho AI agent hữu ích trong production — và câu trả lời không hề đơn giản.
Tool là một loại hợp đồng phần mềm hoàn toàn mới
Phần mềm truyền thống mang tính đeterministic: getWeather("HN") luôn lấy thời tiết Hà Nội theo cùng một cách. Nhưng tool dành cho agent thì khác. Khi người dùng hỏi "Tôi có cần mang ô không?", agent có thể gọi tool thời tiết, trả lời từ kiến thức có sẵn, hoặc hỏi lại để làm rõ trước.
Điều này nghĩa là viết tool cho agent đòi hỏi thay đổi hoàn toàn cách suy nghĩ. Bạn không viết cho developer khác — bạn viết cho một hệ thống non-deterministic, có thể hiểu sai, hallucinate, hoặc không nắm được cách dùng tool.
Prototype nhanh, Evaluate nghiêm túc
Workflow được Anthropic khuyến nghị: prototype nhanh, evaluate nghiêm túc, iterate cùng với agent.
Prototype cục bộ bằng cách bọc tool trong MCP server hoặc Desktop extension (DXT). Kết nối với Claude Code bằng claude mcp add <name> <command>, hoặc với Claude Desktop qua Settings. Tự mình test tool trước khi bàn giao.
Chạy evaluation có cấu trúc. Điểm mấu chốt là tạo evaluation task dựa trên use case thực tế — không phải ví dụ đơn giản. Task chất lượng cao đòi hỏi nhiều lời gọi tool và phải đi kèm kết quả có thể verify. Dùng simple agentic loop: một loop cho mỗi evaluation task.
Nguyên tắc vàng cho tool MCP chất lượng cao
Anthropic đúc kết nhiều năm kinh nghiệm xây dựng tool thành năm nguyên tắc:
Dùng chính Claude để tối ưu Tool của nó
Một trong những pattern mạnh nhất Anthropic mô tả: dùng Claude Code để tự động tối ưu các tool mà nó có quyền truy cập. Cung cấp kết quả evaluation cho Claude và yêu cầu nó viết lại mô tả tool, điều chỉnh response format, tinh chỉnh parameters. Agent trở thành một phần trong vòng lặp cải thiện chính nó.
Điều gì làm suy yếu hiệu suất Agent
Test set trên internal Slack tools của Anthropic cho thấy những failure mode có thể dự đoán:
- Mô tả tool quá mơ hồ để agent phân biệt
- Response format thiếu context then chốt mà agent cần
- Tool có phạm vi chồng chéo, khiến agent gọi nhầm
- Evaluation quá đơn giản, không bắt được pattern lỗi thực tế
Credit
- Bài gốc: Writing effective tools for AI agents — with agents
- Nguồn: Anthropic Engineering Blog
- Đăng: 11 tháng 9, 2025