Domain-Specific Models and Small Language Models: โมเดลเฉพาะทางที่เล็กแต่ฉลาดกำลังมาแรง

ปี 2026 น่าจะเป็นปีที่องค์กรจำนวนมากเริ่มจริงจังกับการเอา Generative AI ไปใช้งานในระบบหลักแทนที่จะแค่ทดลองใช้ ทำให้โจทย์เปลี่ยนจากการดูว่าทำได้หรือไม่ เป็นการพิจารณาว่าโมเดลนั้นแม่นยำพอหรือไม่ ควบคุมความเสี่ยงได้อย่างไร คุ้มต้นทุนและทำงานได้เร็วพอในบริบทงานจริงหรือเปล่า?

ด้วยเหตุนี้ทำให้เกิด Domain-Specific Models และ Small Language Models ที่ถูกออกแบบให้เหมาะกับงานเฉพาะทางมากขึ้น แทนการพึ่งพาโมเดลใหญ่ทั่วไปเพียงอย่างเดียว Gartner จัด Domain-Specific Language Models เป็นหนึ่งในเทคโนโลยีที่มาแรง ซึ่งช่วยทำให้ความแม่นยำกับความน่าเชื่อถือดีขึ้นสำหรับงานเฉพาะทาง และ Gartner คาดการณ์ว่าภายในปี 2028 โมเดล GenAI ที่องค์กรใช้งานมากกว่าครึ่งจะเป็นโมเดลแบบ domain-specific

Domain-Specific Models (DSLM)

DSLM คือโมเดลที่ถูกฝึกมาให้เข้าใจภาษา ความรู้ กฎเกณฑ์ และรูปแบบของโดเมนนั้น ๆ เช่น แพทย์ การเงิน กฎหมาย ประกันภัย พลังงาน ฯลฯ จึงให้ผลลัพธ์ที่ตรงงานมากกว่าโมเดลทั่วไป โดย Gartner อธิบายว่า DSLM คือโมเดลที่ trained หรือ fine-tuned บนข้อมูลเฉพาะเพื่อให้แม่นกว่า ถูกต้องกว่า และสอดคล้อง compliance มากขึ้น

DSLM ไม่ได้เริ่มจากการสร้างโมเดลใหม่ตั้งแต่ศูนย์ ในทางปฏิบัติองค์กรนิยมออกแบบเป็น 3 ชั้น

ชั้นความรู้ (Knowledge): เอกสาร/ฐานความรู้/ระเบียบ/คู่มือ/นโยบายขององค์กรที่อัปเดตได้ตลอด
ชั้นโมเดล (Model): อาจเป็น LLM หรือ SLM ที่เหมาะกับงาน
ชั้นการคุมคุณภาพ (Governance & Evaluation): การทดสอบความถูกต้อง การตรวจอ้างอิง ความปลอดภัยและความเป็นส่วนตัว

Small Language Models (SLM)

SLM คือโมเดลภาษาที่มีขนาดเล็กกว่า LLM (พารามิเตอร์น้อยกว่า ใช้หน่วยความจำน้อยกว่า) โดย IBM นิยามว่าเป็นโมเดลที่สามารถประมวลผลและเข้าใจภาษาได้ แต่มีขนาดและขอบเขตเล็กกว่า LLM

ข้อดีของ SLM ที่ตอบโจทย์ขององค์กรคือ

คุมต้นทุน (Cost): ค่า inference ถูกลงมาก และโมเดลเล็กช่วยให้ยิ่งคุมงบง่ายขึ้น
คุมความหน่วง (Latency): งานองค์กรหลายอย่างต้องการคำตอบเร็ว (เช่น call center, internal search, workflow automation)
คุมข้อมูล (Confidentiality / Data locality): รันในระบบปิดได้

Stanford AI Index 2025 กล่าวว่าต้นทุนการทำ inference สำหรับระบบที่ทำได้ระดับ GPT-3.5 ลดลงมากกว่า 280 เท่า ระหว่างเดือนพฤศจิกายน 2022 ถึงตุลาคม 2024 และระบุสาเหตุว่ามาจากโมเดลเล็กที่เก่งขึ้น รวมถึงฮาร์ดแวร์ที่ถูกลงและประหยัดพลังงานขึ้น

ภาพที่พบในองค์กรคือ ใช้โมเดลใหญ่เป็นฐาน แล้วทำให้เฉพาะทางก่อน จากนั้นค่อยทำให้เล็กลงเท่าที่พอสำหรับการใช้งานจริง

RAG (Retrieval-Augmented Generation) คือการให้โมเดลค้นหาเอกสารที่เกี่ยวข้องก่อน แล้วค่อยตอบโดยอิงข้อมูลนั้น เพื่อเพิ่มความถูกต้องและลดการหลอน (hallucination)
PEFT (Parameter-Efficient Fine-Tuning) เป็นแนวทางปรับแต่งโมเดลใหญ่ให้เข้ากับงานเฉพาะ โดยปรับพารามิเตอร์ ลดต้นทุนและข้อจำกัดของฮาร์ดแวร์ PEFT เป็นแนวทางสำคัญสำหรับการปรับโมเดลไปสู่โดเมนต่าง ๆ โดยลดค่าใช้จ่ายลงอย่างมีนัยสำคัญ

ตัวอย่างการนำไปใช้งานจริง ได้แก่ สายสุขภาพ ใช้ RAG เพื่อช่วยให้ตอบบนไกด์ไลน์หรือเอกสารที่ตรวจสอบได้ ช่วยเพิ่มความน่าเชื่อถือ และแก้เรื่อง traceability/hallucination ทำให้นำโมเดลไปใช้ในรูปแบบงานประจำ เช่น สรุป discharge summary หรือสรุปผลแล็บตามฟอร์แมต

อีกตัวอย่างคืองานด้านการเงิน ที่ปรับใช้ DSLM ให้เข้าใจศัพท์เฉพาะและกฎภายใน เพื่อนำไปช่วยในงานตอบคำถามลูกค้า ช่วยอ่านสัญญา ตรวจนโยบาย และทำรายงานแบบฟอร์ม

ปี 2026 ไม่ใช่การแข่งกันว่าใครมีโมเดลใหญ่ที่สุดอีกต่อไป แต่สนใจว่าใครเอาไปใช้จริงได้คุ้มค่าและปลอดภัยที่สุด DSLM ทำให้ AI เข้าใจบริบทอุตสาหกรรม และทำงานได้เสถียรขึ้น ขณะที่ SLM ทำให้ทำงานได้ไว คุมงบง่าย และนำไปใช้งานได้หลากหลาย เมื่อจับคู่กับ RAG และการปรับแต่งแบบ PEFT จะได้ระบบที่ทั้งใช้ได้จริง และขยายได้ใน production