Sự tàn lụi của subscription cố định và sự trỗi dậy của thanh toán theo tiêu thụ
Năm 2026, ngành B2B SaaS đang trong giai đoạn biến động địa tầng về pricing. Theo SaaS Benchmarks mà OpenView Partners công bố vào tháng 2 năm 2026, trong số các công ty SaaS có ARR trên 10 triệu USD, 61% trả lời rằng "đã thoát khỏi thanh toán seat thuần túy hoặc đang lên kế hoạch chuyển đổi". So với 34% cùng tỷ lệ vào năm 2023, cấu trúc ngành đã đảo ngược chỉ trong 3 năm. Có ba yếu tố cấu trúc đằng sau: Thứ nhất, chi phí tính toán cho mỗi người dùng biến động mạnh do nhúng tính năng AI. Thứ hai, ý thức chi phí từ phía người mua ngày càng mạnh khi yêu cầu "trả theo lượng dùng". Thứ ba, áp lực từ phía nhà đầu tư rằng Net Revenue Retention (NRR) không thể tăng bằng số lượng seat cố định.
Snowflake, đại diện tiêu biểu của thanh toán theo tiêu thụ (Usage-Based Pricing, sau đây là UBP), đã áp dụng "mô hình tín dụng tiêu thụ" ngay từ khi thành lập năm 2012. Cơ chế tính phí theo thời gian khởi động compute warehouse × kích thước tuy khó dự đoán ngân sách cho khách hàng, nhưng lại là thiết kế hiếm có mà doanh số tự nhiên tăng theo mức mở rộng workload. Tính đến cuối năm tài chính 2025, NRR của Snowflake duy trì ở mức 131%, và công ty đang cân bằng giữa khả năng dự đoán và tính đàn hồi bằng cấu trúc hybrid kết hợp Pay-As-You-Go với giảm giá commitment dài hạn cho đơn giá lưu trữ.
Datadog và Twilio: Pattern trưởng thành của UBP
Datadog thể hiện dạng trưởng thành khác của UBP. Công ty áp dụng "multi-dimensional UBP" kết hợp phí cơ bản theo "số host × module giám sát" với nhiều metric tiêu thụ như khối lượng nhập log (GB/tháng), số lượng APM span, số lần chạy Synthetic test. Theo tài liệu kết quả năm tài chính 2025, 83% khách hàng hiện có đăng ký 2 sản phẩm trở lên, và 31% khách hàng đăng ký 4 sản phẩm trở lên. Cấu trúc nhân multi-product × multi-dimensional là động lực thúc đẩy NRR.
Sự tiến hóa của Twilio còn thú vị hơn. Công ty từ lâu duy trì UBP thuần túy "tính phí theo đơn vị API call", nhưng từ năm 2024 trở đi đã tăng cường "Commitment-Based Pricing" cho Enterprise. Cơ chế là giảm đơn giá 15-40% đổi lấy cam kết trả trước số tiền hàng năm. Đây là câu trả lời cấu trúc cho sự bất mãn của phía người mua về "tính không thể đoán trước" của UBP, là thiết kế đáp ứng trực tiếp văn hóa doanh nghiệp muốn bộ phận mua sắm và CFO xác định con số. Tính đến năm 2026, tỷ lệ doanh số từ khách hàng cam kết hàng năm của Twilio đã vượt 78%, và sự hiểu biết cổ điển "UBP = biến động" đã là quá khứ.
"Token as unit of consumption" trong thời đại AI API
Luận điểm lớn nhất giai đoạn 2025-2026 là "cách tích hợp thanh toán theo token vào mô hình giá SaaS". API mô hình nền của OpenAI, Anthropic, Google đều tính phí theo ma trận input token × output token × đơn giá model. Nếu để nguyên đơn vị tiêu thụ thô này cho khách hàng, họ sẽ ức chế sử dụng vì sợ "ước tính bị sai khi dùng tính năng AI nhiều hơn". Kết quả là workflow có giá trị cao nhất lại không được sử dụng nhiều nhất — đây là nghịch đảo khuyến khích.
Notion AI, tính năng AI của Linear và Vercel v0 đã đưa ra giải pháp khác nhau cho vấn đề này. Notion AI áp dụng "AI add-on giá cố định hàng tháng + giới hạn sử dụng", khi vượt giới hạn tính năng bị hạn chế nhưng không phát sinh thêm phí. Đây là thiết kế ưu tiên tính dự đoán ngân sách cho người mua. Linear nhúng AI vào gói Plus trở lên và không phơi lộ trực tiếp lượng tiêu thụ token. Vercel giới thiệu đơn vị tiền tệ riêng là Vercel Credits, tiêu thụ theo độ phức tạp của tạo màn hình hay đầu ra code. Bằng cách trừu tượng hóa token thô, có thể dễ dàng hấp thụ biến động đơn giá khi chuyển đổi model.
Best practice đang định hình năm 2026 là cấu trúc 3 tầng gồm "hệ thống Credits + tier + giảm giá overage". Phân bổ credits trong tier, phần vượt mức được bán thêm với tỷ lệ giảm giá dần. Kế toán nội bộ của credits được liên kết với chi phí thực tế (token × đơn giá model + khấu hao hạ tầng suy luận + API call của hệ thống safety), nhưng trình bày cho khách hàng như một đơn vị tiền tệ duy nhất. Điều này đảm bảo trải nghiệm khách hàng và xử lý kế toán không bị phá vỡ dù thay model ở phía sau.
Impedance matching với chế độ ngân sách của doanh nghiệp Nhật Bản
Đây là luận điểm đặc thù cho thị trường nội địa. Bộ phận mua sắm và kế toán của các doanh nghiệp lớn Nhật Bản, đặc biệt công ty niêm yết, vận hành chuẩn "xác định phong bì cố định đầu năm tài chính, căn chỉnh kết quả thực tế cuối năm" dưới chế độ ngân sách năm tài chính. UBP thuần túy va chạm trực diện với văn hóa ngân sách này. Trạng thái hóa đơn hàng tháng không xác định là yếu tố ma sát cho tất cả quy trình xét duyệt, dự đoán thanh toán và xử lý kế toán hợp nhất.
Có ba giải pháp. Thứ nhất, phương thức Prepaid Credit. Mua một lần credits dự kiến tiêu thụ trong hợp đồng hàng năm, tự do tiêu thụ trong năm tài chính. Bằng cách không cho phép chuyển phần chưa dùng sang năm sau, phía SaaS có thể dồn ghi nhận doanh thu vào năm tài chính. Thứ hai, phương thức True-Up/True-Down. Thanh toán thực tế tiêu thụ theo quý, chỉ xuất hóa đơn thêm cho phần thiếu. Vì đơn giá vượt mức được cố định trong hợp đồng trước, dễ dàng nhất quán với quản lý ngân sách của CFO. Thứ ba, phương thức Commit + Flex. Thêm cam kết hàng năm kiểu Twilio, phần vượt cam kết được hóa đơn linh hoạt hàng tháng.
Các công ty SaaS trong nước như MoneyForward, freee, Sansan, SmartHR đang tiến vào hybrid "seat + tiêu thụ" theo cách tiếp cận khác nhau. Khi Sansan giới thiệu AI phân tích danh thiếp theo hệ thống credit năm 2025, phương án ban đầu là UBP thuần túy, nhưng đã được thiết kế lại thành "cam kết hàng năm + upsell tự động khi vượt" theo yêu cầu từ khách hàng Enterprise. Cần hiểu rằng người mua ở thị trường Nhật Bản cực kỳ coi trọng "hóa đơn không có bất ngờ".
Thứ tự thực thi dự án chuyển đổi
Dự án chuyển đổi SaaS thanh toán seat hiện có sang UBP hay hybrid có những cạm bẫy điển hình. Rủi ro lớn nhất là vấn đề "đơn giá thực tế của khách hàng hiện có giảm", và đã có nhiều báo cáo về trường hợp hóa đơn bình quân của tất cả khách hàng giảm 12-18% sau khi triển khai UBP. Để ngăn điều này, cần phân tích profile tiêu thụ theo từng khách hàng trước khi chuyển đổi, và tính ngược thiết kế tier để "số tiền cố định hiện tại ≈ lượng tiêu thụ dự kiến trong giá mới".
Thứ tự thực thi được khuyến nghị như sau. Phase 1: triển khai billing engine (một trong Stripe Billing, Metronome, Orb, m3ter) và thiết lập pipeline sự kiện đo lường. Phase 2: chỉ cung cấp gói UBP cho khách hàng mới, tích lũy dữ liệu vận hành thực tế trong 3-6 tháng. Phase 3: duy trì gói grandfathered cho khách hàng hiện có, đồng thời tại thời điểm gia hạn hợp đồng trình bày ưu đãi chuyển sang gói mới (giảm giá năm đầu, kèm báo cáo sử dụng). Nếu cố rút ngắn 3 giai đoạn này cùng một lúc, đội ngũ bán hàng sẽ mệt mỏi vì giải thích cho khách hàng và churn tăng đột biến.
Ngoài ra, khi chuyển đổi UBP, metric quan trọng nhất cần xem là sự kết hợp "Net Dollar Retention × Gross Margin" chứ không phải Gross Margin. Dù Gross Margin tạm thời giảm, nếu NDR vượt 130% thì tổng lượng cash flow trong 3 năm sẽ tăng ròng. Nếu không thể giải thích tính toán kinh tế này trong cuộc họp ban giám đốc, dự án chuyển đổi sẽ bị giết chết về mặt chính trị ở giữa chừng.
Kết: Giá cả là một phần của thiết kế sản phẩm
Kết luận mà thảo luận về pricing năm 2026 đã đạt được là nhận thức "giá cả không phải là chuyện đàm phán của bộ phận bán hàng, mà là một phần của sản phẩm và hạ tầng". Hệ thống billing, metering, usage dashboard, đề xuất tối ưu chi phí cho khách hàng — tất cả phải được thiết kế như sản phẩm hạng nhất; nếu không, UBP không thể duy trì. Lý do Snowflake và Datadog mạnh là vì họ đang mài giũa "trải nghiệm tài chính của khách hàng" bao gồm pricing như một sản phẩm.
Điều các công ty SaaS Nhật Bản cần để cạnh tranh trên thị trường toàn cầu trong tương lai không phải là nhập khẩu UBP thuần túy kiểu nước ngoài một cách nguyên xi. Mà là khả năng hiểu sâu sắc chế độ ngân sách của khách hàng và thiết kế cấu trúc hybrid một cách toán học. Giá cả là bộ mặt của sản phẩm, đồng thời là trái tim của tài chính. Kỹ thuật để cân bằng cả hai ràng buộc này chính là bản chất của chiến lược pricing năm 2026.