มีรายงานว่า Uber ใช้งบประมาณ AI Coding ทั้งปี 2026 หมดไปภายในแค่ 4 เดือน สาเหตุหลักมาจาก Developer ที่รัน Claude Code แบบ parallel worktrees มากกว่า 10 session พร้อมกัน โดยไม่มีระบบติดตามการใช้งานหรือ spend controls เลย ฟังดูน่าตกใจ แต่จริงๆ แล้วมันสะท้อนปัญหาที่ลึกกว่านั้น
ปัญหาคือเราวัดผิดตัว
"Tokens consumed" คือ effort metric — มันบอกแค่ว่า AI ทำงานมากแค่ไหน แต่ไม่ได้บอกเลยว่าสิ่งที่ทำนั้น "มีคุณค่า" จริงหรือเปล่า ลองนึกภาพ maturity funnel แบบนี้
Tokens → Lines of Code → PRs → Merges → Financial Impact
ในช่วงแรก การวัด Tokens อาจพอได้ แต่ถ้าองค์กรยังติดอยู่แค่นั้น สิ่งที่เกิดขึ้นคือเราจะ incentivize ปริมาณมากกว่าคุณค่า และกว่าจะรู้ตัว งบทั้งปีก็หายไปแล้วใน Q1
แล้วปัญหาจริงๆ อยู่ที่ไหน?
ถ้า AI ขององค์กรคุณผลิตงานออกมาแบบไม่มีคุณภาพ หรือใช้ทรัพยากรมากเกินจะ justify ได้ ปัญหาส่วนใหญ่ไม่ได้อยู่ที่ตัว model แต่อยู่ที่ configuration
สิ่งที่องค์กรส่วนใหญ่ยังขาดอยู่มี 4 อย่าง
-
Tool access ที่ให้ agent เข้าใจ context จริงๆ
-
Shared prompts ที่ช่วยให้ทีมทำงานได้แม่นยำขึ้น
-
Production data ที่วัดได้ว่าสิ่งที่ทำมีประโยชน์จริงไหม
-
Guardrails ที่ให้ agent ทำงานได้โดยไม่ต้องมีคนนั่งดูตลอดเวลา
องค์กรที่ทำครบทั้ง 4 อย่าง จะไม่มีวันช็อคกับบิล AI ของตัวเอง
บทเรียนนี้ใช้ได้กับการเรียนรู้ในองค์กรด้วยเช่นกัน
ชั่วโมงเรียน ≠ ความสามารถที่เพิ่มขึ้น เหมือนกับที่ Tokens ≠ ผลลัพธ์ที่มีคุณค่า
การลงทุนใน Learning ที่ดี ไม่ใช่แค่การวัดว่าคนเรียนไปกี่ชั่วโมง แต่คือการวัดว่าความรู้นั้นถูกนำไปใช้จริงในการทำงานได้มากแค่ไหน




