Khoản Chi Không Ai Lường Trước
Hai tổ chức engineering lớn, đi đầu về AI, vừa chạm phải một kiểu thất bại ngân sách mà không đội tài chính nào dự đoán được. Đó mới là điều mà các CXO cần chú ý. Các công cụ không hỏng. Chúng hoạt động tốt đến mức các engineer không thể ngừng sử dụng — và mô hình tính phí theo consumption biến "được đội ngũ yêu thích" thành "khoản chi làm phá sản dự toán Q2."
Công Cụ AI Agentic Không Tính Phí Như Phần Mềm Thông Thường
Các công cụ coding AI agentic như Claude Code không được định giá như phần mềm mà đội ngũ procurement quen thuộc. Một seat licence truyền thống có chi phí cố định. Mua một nghìn seat, bạn biết chi phí hàng năm, và việc sử dụng nhiều hay ít không thay đổi gì.
Tính phí theo token đảo ngược điều đó. Hóa đơn phản ánh mức độ sử dụng model — mỗi prompt, mỗi phiên agent dài, mỗi context window lớn. Với một công cụ mà các engineer thực sự yêu thích, tốc độ adopt và chi phí phát sinh trở thành một con số duy nhất.
Case Uber: Khi Động Lực Adopt Phản Tác Dụng
Uber không tình cờ rơi vào tình trạng này. Công ty khuyến khích adopt và chạy bảng xếp hạng nội bộ xếp hạng các engineer theo mức độ hoạt động trên Claude Code. Mọi động lực đều hướng về việc sử dụng nhiều hơn — và với tính phí theo token, sử dụng nhiều hơn đồng nghĩa chi phí cao hơn.
Bảng xếp hạng đã hiệu quả. Ngân sách thì không.
Cơ Chế Lặp Lại Ở Mọi Đội
Các seat licence phẳng giữ cho chi tiêu token trở nên vô hình vì giá không thay đổi theo mức sử dụng. Ngay khi công cụ được tính phí theo consumption, mỗi prompt, mỗi phiên agent dài, mỗi context window lớn đều xuất hiện trên hóa đơn chi tiết — và tổng số trở nên đáng ngạc nhiên.
Những công ty mở rộng coding agentic mà không bị surprise ở Q2 sẽ là những công ty đối xử với khoản chi này như một tiện ích được đo lường thay vì một subscription phần mềm — và xây dựng các biện pháp kiểm soát phù hợp.
Lựa Chọn Của Microsoft: Làm Chủ Toàn Bộ Stack
Lựa chọn của Microsoft là GitHub Copilot CLI — một công cụ họ sở hữu hoàn toàn. Sở hữu vendor cho phép Microsoft đàm phán kinh tế nội bộ, loại bỏ các công cụ trùng lặp và chuẩn hóa kiểm soát theo cách mà bất kỳ nhà cung cấp bên ngoài nào cũng không bao giờ cho phép. Có một khoản tiết kiệm thực sự ở đây, và nó có liên quan ít đến năng lực thuần túy của Copilot.
Cách Khắc Phục: Đối Xử Như Tiện Ích
Cách khắc phục không phải là giảm tốc độ adopt. Các engineer dựa quá nhiều vào AI sẽ không từ bỏ nó, và một CFO cố gắng lấy lại khoản chi này đang chống lại năng suất.
Một mô hình kiểm soát trưởng thành bao gồm:
- Cảnh báo mềm theo đội: Phát hiện ngân sách trôi dạt trước khi nó trở thành vượt ngân sách, không cắt cứng khi đang làm việc quan trọng
- Phát hiện bất thường: Cờ khi một phiên duy nhất tiêu tốn lượng token bất thường
- Chỉ số ROI song song với chi phí: Chi phí trên mỗi merged change, chi phí trên mỗi suggestion được chấp nhận, chi phí trên mỗi ticket được giải quyết
- Đàm phán lại hợp đồng: Cam kết volume để đổi lấy giá cap có thể dự đoán
Bài Học Văn Hóa Cho Engineering Leaders
Các mức trần cứng trên mỗi engineer là điểm khởi đầu nhưng là kết quả tồi. Những công ty mở rộng coding agentic mà không bị surprise ở Q2 sẽ là những công ty hiểu rằng tốc độ adopt và chi phí phát sinh giờ là một con số duy nhất — và ngừng đối xử với một trong hai mà không theo dõi cái còn lại.
Một văn hóa engineering được tối ưu hóa thuần túy cho việc sử dụng AI cũng đang tối ưu hóa cho một hóa đơn không giới hạn. Ban lãnh đạo cần biết điều đó.