ในยุคแรกของ Conversation Design ผู้ใช้จะไม่สามารถตอบโต้ได้อย่างอิสระ ตัวอย่างเช่น การใช้โทรศัพท์ระบบอัตโนมัติ ซึ่ง user ไม่สามารถตอบโต้อะไรได้นอกจากกดตัวเลข เมื่อถึงทางตันก็อาจจะเป็นการวนกลับมาจุดเดิม หรือ กด 0 เพื่อติดต่อ Operator จนมายุค Chatbot ที่ user เริ่มพิมพ์ตอบโต้ได้ มีคำตอบที่หลากหลายขึ้น และเริ่มมีการคุยที่เป็นลำดับขั้นตอน เพื่อแก้ไขปัญหาที่ซับซ้อนขึ้นของ user
จนมาในยุคของ AI ที่ตัวบอทสามารถเรียนรู้และปรับตัวได้แบบ Dynamic สามารถจดจำบริบทในการคุยแบบยาวได้มากขึ้น จากการเป็นแต่บอทได้กลายไปเป็น Agent ที่สามารถตัดสินใจได้เอง รวมถึงเราสามารถกำหนดบทบาทของ Agent นั้นได้ด้วย ตัวอย่างเช่น การให้ AI ช่วยสรุปเนื้อหาการประชุม โดยใช้โทนภาษาที่เป็นทางการ หรือ ให้ AI ช่วยเขียน caption ลงบท Social media ด้วยโทนที่ดูขี้เล่น ก็สามารถทำได้
โดยหลักการสำคัญของ Conversation ที่ดี หรือ Grice’s Maxims จาก Paul Grice นักปราชญ์ชาวอังกฤษนั้น มี 4 ข้อจาก คือ
-
1. คุณภาพ (Quality) - การให้ข้อมูลที่เป็นจริง ไม่โกหก เดาสุ่ม หรือดูไม่มีที่มาไป เช่น
A: ไปห้างซื้ออะไรมาบ้าง ?
B: ซื้อเสื้อยืดกับกางเกงครับ (ตอบแบบตรงตัว แทนที่จะตอบว่า “ซื้อของครับ”)
-
2. ปริมาณ (Quantity) – ให้ปริมาณข้อมูลในปริมาณที่พอดี ไม่สั้นจนห้วน หรือเยอะจนล้น เช่น
A: ห้างในกรุงเทพฯ มีอะไรบ้าง
B: ก็มี เซ็นทรัล, เดอะมอลล์, พารากอน, บิ๊กซี โลตัสครับ
-
3. ความสัมพันธ์ (Relation) - การตอบให้อยู่ในประเด็น และต้องจดจำได้ว่าก่อนหน้านี้คุยอะไรไว้ เช่น
A: แล้วบิ๊กซีสาขาไหนมีกางเกงขายบ้าง
B: บิ๊กซีสาขาพระราม 2 และ …. ครับ (เลือกตอบแค่ในสาขาที่มีในกรงเทพฯ ไม่ยกของจังหวัดอื่นมา)
-
4. วิธีการ (Manner) - สื่อสารให้เข้าใจง่าย ชัดเจน ตรงประเด็น เป็นลำดับขั้นและมีความเป็นธรรมชาติ เช่น
A: แล้วไปสาขาพระราม 2 ได้ยังไง
B: ขับรถไปตามเส้นพระราม 2 ซึ่งจะมี Homepro เป็นจุดสังเกต หรือเรียกรถสาธารณะ เช่น รถเมล์สาย 68, 140, 141, 147 หรือรถสองแถวสีแดงก็ได้เช่นกัน (ไม่ตอบไปส่งๆ ว่า ด้วยรถยนต์ หรือ รถสาธารณะ แต่ให้คำตอบที่ดูเจาะจงมากขึ้น)
ดังนั้นหากเราจะออกแบบ Agent เราต้องคำนึงถึงบริบทมากมายที่อาจเกิดขึ้นจาก user ที่มีหลากหลาย เราคงหงุดหงิดถ้าเราได้คำตอบว่า ฉันไม่สามารถช่วยอะไรได้ หรือ ฉันไม่รู้ เราอาจเลือกคำตอบอื่นได้ อย่างเช่น ฉันไม่มีสิ่งที่คุณมองหา แต่ลองดูสิ่งที่ใกล้เคียงกันแทนไหม ? เพราะมันคือการเดาใจว่าคนจะชอบสิ่งนั้นมั้ย บางคนอาจชอบคำตอบที่สรุปมาสั้นๆ เข้าใจง่าย หรือ บางชอบคำตอบยาวๆ แล้วเอาไปวิเคราะห์เองที่หลัง
นักออกแบบยุค AI จึงไม่ได้วาดแค่ปุ่มกดอีกต่อไป แต่ต้องออกแบบ Persona และ Flow หรือลำดับของการพูดคุย
-
- Personality & Voice: AI ของคุณเป็นใคร? เป็นผู้ช่วยที่จริงจัง หรือเพื่อนที่สนุกสนาน? บุคลิกที่ชัดเจนจะช่วยสร้างความเชื่อมั่นให้กับผู้ใช้งาน
-
- Context Awareness: ในยุค AI เก่งๆ การออกแบบต้องรองรับความ "ไม่เป็นเส้นตรง" ผู้ใช้อาจจะถามเรื่อง A แล้วข้ามไป B แล้ววกกลับมา A ใหม่ นักออกแบบต้องวางโครงสร้างให้ AI เข้าใจบริบทเดิมเสมอ
-
- Multimodal Interaction: การออกแบบไม่ได้มีแค่ตัวอักษร แต่รวมถึงเสียง (Voice), ท่าทาง (Gesture) หรือแม้แต่การมองเห็น (Vision) เพื่อให้การคุยลื่นไหลที่สุด
ถ้า Design คือ "หน้าตาและท่าทาง" Tech ก็คือ "สมอง" ที่คอยประมวลผล ซึ่งมีคีย์เวิร์ดสำคัญ 3 อย่างคือ:
-
- LLMs (Large Language Models): เช่น เทคโนโลยีที่ขับเคลื่อน Gemini รุ่นล่าสุด ช่วยให้ AI เข้าใจภาษามนุษย์ที่ซับซ้อน ไม่ต้องคอยตั้งค่า Keywords แบบสมัยก่อนอีกต่อไป
-
- NLP & NLU:
-
- NLP (Natural Language Processing): การประมวลผลภาษา
-
- NLU (Natural Language Understanding): การตีความว่าผู้ใช้ "ต้องการอะไรจริงๆ" (Intent) แม้เขาจะพูดไม่ชัดเจนก็ตาม
-
- Real-time Adaptation: เทคโนโลยีปัจจุบันช่วยให้ AI ปรับเปลี่ยนคำตอบได้ตามอารมณ์ของผู้ใช้ ถ้าผู้ใช้เริ่มหงุดหงิด AI จะปรับระดับความสุภาพหรือรีบส่งต่อให้มนุษย์ทันที
ความท้าทายที่สุดคือการทำให้ "ความฉลาดของเทคโนโลยี" เข้าถึงได้ง่ายด้วย "การออกแบบที่เข้าใจมนุษย์"
- Error Handling: เมื่อ AI งง จะให้ตอบว่าอะไรที่ไม่ดูโง่? (ใช้เทคนิคการถามซ้ำหรือให้ตัวเลือก)
- Data Privacy: จะเก็บข้อมูลการคุยยังไงให้ปลอดภัยและโปร่งใส?
- Latency: จะทำยังไงให้ AI ตอบโต้ได้ทันทีโดยไม่ต้องรอโหลดนานจนเสียอารมณ์?
Conversation Design ในยุคนี้ไม่ใช่แค่เรื่องของ "แอปพลิเคชัน" แต่เป็นเรื่องของ "ความสัมพันธ์" ระหว่างคนกับคอมพิวเตอร์ เป้าหมายสูงสุดคือการทำให้เทคโนโลยีจางหายไปจนเหลือเพียง "การสนทนาที่เข้าใจกันจริงๆ"
อ้างอิง:


