บทความนี้อธิบายโมเดล Machine learning ว่าคืออะไร ทำงานอย่างไร นำไปใช้กับข้อมูลแบบไหน และตัวอย่างการนำไปใช้เชิงธุรกิจและการตลาดค่าา
Machine Learning (ML) เป็นสาขาหนึ่งของ Artificial Intelligence (AI) ที่เน้นการพัฒนาอัลกอริทึมและเทคนิคที่ทำให้คอมพิวเตอร์สามารถเรียนรู้ได้ด้วยตนเองจากข้อมูลที่ป้อนเข้าไป โดยไม่ต้องเขียนโปรแกรมอย่างชัดเจนค่ะ
Machine Learning; ML แบ่งออกเป็น 3 ประเภทหลัก ได้แก่

- Supervised Learning
- Unsupervised Learning
- Reinforcement Learning
ความเหมือน และ ความแตกต่าง
- Supervised learning และ unsupervised learning แตกต่างกันตรงที่ supervised มีข้อมูลป้ายกำกับมาให้ แต่ unsupervised ไม่มี ทำให้วัตถุประสงค์ใช้งานต่างกัน supervised เน้นทำนาย ส่วน unsupervised เน้นหาความสัมพันธ์หรือโครงสร้างซ่อนในข้อมูล
- Reinforcement learning แตกต่างจาก supervised/unsupervised ตรงที่มีการเรียนรู้แบบ trial and error โดยมีรางวัลและการลงโทษ ไม่ได้ใช้ข้อมูลตั้งต้น เน้นการหาวิธีการที่เหมาะสมที่สุดกับงาน
Supervised Learning
Linear Regression
คืออะไร
เป็นโมเดลพื้นฐานที่ใช้ในการทำนายค่าเชิงปริมาณ (Continuous value) เช่น ราคาบ้าน อายุ น้ำหนัก เป็นต้น
ทำงานอย่างไร
ทำงานโดยสร้างสมการเส้นตรงที่สามารถใช้ทำนายค่าเอาต์พุตที่สัมพันธ์กับค่าอินพุตได้ดีที่สุด
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับข้อมูลที่มีความสัมพันธ์แบบเชิงเส้น (Linear)
ตัวอย่างการนำไปใช้
นำไปใช้ในการทำนายยอดขายสินค้า ทำนายราคาสินค้าในอนาคต หรือทำนายจำนวนลูกค้าที่จะซื้อสินค้าตามงบประมาณโฆษณา เช่น ธุรกิจ e-commerce, ธุรกิจอสังหาริมทรัพย์
Logistic Regression
คืออะไร
เป็นโมเดลที่ใช้ทำนายโอกาสที่เหตุการณ์บางอย่างจะเกิดขึ้น เช่น ลูกค้าจะตัดสินใจซื้อสินค้าหรือไม่ อีเมลเป็นสแปมหรือไม่ ผู้ป่วยมีโรคหรือไม่
ทำงานอย่างไร
ทำงานโดยใช้ฟังก์ชัน Sigmoid หรือ Logistic function ในการแปลงผลรวมของค่าอินพุตคูณกับค่าถ่วงน้ำหนักให้อยู่ในช่วง 0-1 ซึ่งแทนค่าความน่าจะเป็น
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับข้อมูลที่มีค่าเป้าหมายเป็นประเภท (Binary classification)
ตัวอย่างการนำไปใช้
นำไปใช้คัดกรองลูกค้าที่มีแนวโน้มจะซื้อสินค้า, ทำนายว่าผู้ใช้จะคลิกโฆษณาหรือไม่ หรือช่วยตรวจจับรายการหรืออีเมลที่เป็นการฉ้อโกง เป็นต้น
Decision Tree & Random Forest
คืออะไร
เป็นโมเดลที่ใช้การตัดสินใจแบบลำดับขั้นตอน (Sequential) ผ่านโครงสร้างต้นไม้ โดย Decision Tree จะใช้ต้นไม้ต้นเดียวในการตัดสินใจ ส่วน Random Forest จะใช้ต้นไม้หลายต้นมาโหวตเพื่อให้ได้ผลลัพธ์สุดท้าย
ทำงานอย่างไร
ทำงานโดยแบ่งข้อมูลไปเรื่อยๆผ่านโหนดตัดสินใจ (Decision node) โดยเลือกแอตทริบิวต์ที่ดีที่สุดในการแยกข้อมูล ไปเรื่อยๆจนถึงใบไม้ (Leaf node) ซึ่งจะบอกผลลัพธ์สุดท้าย
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับข้อมูลที่มีทั้งตัวเลขและหมวดหมู่ และข้อมูลที่มีความซับซ้อนสูง
ตัวอย่างการนำไปใช้
ใช้ในการแบ่งกลุ่มลูกค้าตามพฤติกรรม, ระบบแนะนำสินค้า, ทำนายความน่าจะเป็นที่ลูกค้าจะเลิกใช้บริการหรือย้ายไปใช้ของคู่แข่ง เพื่อป้องกันหรือนำเสนอโปรโมชั่นให้ตรงจุด เป็นต้น
Support Vector Machine
คืออะไร
เป็นโมเดลที่ใช้หาเส้นแบ่งที่ดีที่สุดระหว่างคลาสต่างๆของข้อมูล
ทำงานอย่างไร
ทำงานโดยหาไฮเปอร์เพลนที่แบ่งข้อมูลได้ดีที่สุด โดยมีระยะห่างจากจุดข้อมูลทั้งสองฝั่งมากที่สุด และใช้ kernel function เพื่อแปลงข้อมูลให้อยู่ในมิติที่สูงขึ้น
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับข้อมูลที่มีมิติไม่มาก แต่มีตัวอย่างข้อมูลเยอะ และมีความซับซ้อนไม่มาก
ตัวอย่างการนำไปใช้
ใช้ในการประเมินความเสี่ยงด้านสินเชื่อของลูกค้า, ทำนายความพึงพอใจลูกค้าจากการแชท, แยกแยะสินค้าปลอมจากภาพถ่าย เป็นต้น
Naive Bayes
คืออะไร
เป็นโมเดลความน่าจะเป็นที่อาศัยทฤษฎีบทของเบย์ในการทำนาย
ทำงานอย่างไร
ทำงานโดยคำนวณความน่าจะเป็นของผลลัพธ์แต่ละอย่าง โดยสมมติว่าแต่ละแอตทริบิวต์มีความอิสระต่อกัน
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับข้อมูลที่แยกคลาสได้ง่าย และมีข้อมูลไม่เยอะ
ตัวอย่างการนำไปใช้
ใช้ทำนายความชอบของผู้ชม, คัดกรองอีเมลขยะ, แนะนำสินค้า, วิเคราะห์ความคิดเห็นลูกค้าว่าเป็นเชิงบวกหรือลบ
Unsupervised Learning
K-means Clustering
คืออะไร
เป็นโมเดลจัดกลุ่มข้อมูลที่ไม่มีป้ายกำกับ (Unlabeled data) ออกเป็น k กลุ่ม โดยให้ข้อมูลในกลุ่มเดียวกันมีความคล้ายคลึงกันมากที่สุด
ทำงานอย่างไร
ทำงานโดยคำนวณหาจุดศูนย์กลาง (Centroid) ของแต่ละกลุ่ม แล้วปรับตำแหน่งจุดศูนย์กลางไปเรื่อยๆ จนเข้าที่
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับข้อมูลที่ไม่มีความสัมพันธ์ซับซ้อน และระบุจำนวนกลุ่มที่ต้องการจัดได้อย่างชัดเจน
ตัวอย่างการนำไปใช้
ใช้จัดกลุ่มลูกค้าตามพฤติกรรมการซื้อ, แบ่งกลุ่มสินค้าจากความคล้ายคลึง, หาพื้นที่ที่เหมาะสมในการเปิดสาขาใหม่ เป็นต้น
Hierarchical Clustering
คืออะไร
เป็นโมเดลจัดกลุ่มข้อมูลแบบลำดับชั้น ที่จะรวมกลุ่มหรือแยกกลุ่มข้อมูลออกเป็นส่วนย่อยๆ
ทำงานอย่างไร
ทำงานแบบ Bottom-up โดยเริ่มจากจุดข้อมูลแต่ละจุด แล้วรวมกลุ่มย่อยไปเรื่อยๆจนกลายเป็นกลุ่มใหญ่ หรือแบบ Top-down โดยเริ่มจากกลุ่มใหญ่ก่อน แล้วแยกย่อยเป็นกลุ่มเล็กๆ
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับข้อมูลที่ไม่ทราบจำนวนกลุ่มที่ต้องการแน่นอน และต้องการเห็นความสัมพันธ์ระหว่างกลุ่มต่างๆ
ตัวอย่างการนำไปใช้
ใช้จัดกลุ่มผลิตภัณฑ์จากความสัมพันธ์การซื้อของลูกค้า, วิเคราะห์พฤติกรรมการใช้งานเว็บไซต์เพื่อแบ่งกลุ่ม เป็นต้น
Principal Component Analysis (PCA)
คืออะไร
เป็นเทคนิคการลดมิติของข้อมูล (Dimensionality reduction) โดยรวมแอตทริบิวต์หลายๆอันเข้าด้วยกันเป็นแอตทริบิวต์ใหม่ที่เรียกว่า Principal component
ทำงานอย่างไร
ทำงานโดยค้นหาทิศทางของข้อมูลที่มีความแปรปรวนมากที่สุด แล้วใช้ principal component ในทิศทางนั้นแทนแอตทริบิวต์ดั้งเดิม
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับข้อมูลที่มีมิติสูง มีความสัมพันธ์ระหว่างแอตทริบิวต์ และต้องการทำให้ข้อมูลเข้าใจง่ายขึ้น
ตัวอย่างการนำไปใช้
ใช้คัดเลือกคุณลักษณะลูกค้าที่สำคัญในการออกแบบผลิตภัณฑ์ใหม่, วิเคราะห์ข้อมูลเพื่อให้เห็นแนวโน้มทางการตลาดชัดขึ้น
Reinforcement Learning
Q-Learning
คืออะไร
เป็นโมเดลที่เรียนรู้จากการลองผิดลองถูก (Trial and error) โดยมีเอเจนต์ที่สามารถแสดงพฤติกรรม (Action) ต่อสภาพแวดล้อม (State) แล้วได้รับรางวัล (Reward) เป็นผลตอบกลับ
ทำงานอย่างไร
ทำงานโดยให้เอเจนต์เลือกการกระทำที่ทำให้ได้รางวัลมากที่สุด โดยอาศัยตารางค่า Q ซึ่งมีค่าคะแนนที่ประมาณขึ้นจากประสบการณ์เดิม
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับงานที่มีปัญหามีลักษณะเป็นขั้นตอนเชิงเวลา มีหลาย state และมี action ที่เป็นไปได้อย่างจำกัด
ตัวอย่างการนำไปใช้
ใช้ในระบบแนะนำสินค้าหรือเนื้อหา, หุ่นยนต์ดูแลลูกค้า, ระบบตั้งราคาแบบไดนามิก ปรับเปลี่ยนได้ตามปฏิกิริยาของลูกค้า เป็นต้น
Deep Q-Network
คืออะไร
เป็นการผสมผสานโมเดล Q-learning กับโครงข่ายประสาทเทียม (Neural network) ที่สามารถประมวลผลข้อมูลจำนวนมาก และ state ที่ซับซ้อนได้
ทำงานอย่างไร
ทำงานคล้าย Q-learning แต่ใช้โครงข่ายประสาทเทียมในการประมาณค่า Q มีการใช้ experience replay เพื่อสุ่มเลือกข้อมูลในอดีตมาเทรน ป้องกันการเรียนรู้แบบลำเอียง
นำไปใช้กับ
ข้อมูลแบบไหน
เหมาะกับงานที่มีขนาดใหญ่ มี state ที่หลากหลาย และต้องการให้เอเจนต์เรียนรู้จากประสบการณ์ในอดีตได้
ตัวอย่างการนำไปใช้
ใช้ในการสร้างระบบแนะนำสินค้าที่ซับซ้อน, หุ่นยนต์ดูแลลูกค้าแบบเรียลไทม์ที่สามารถปรับตัวได้, ระบบตั้งราคาแบบไดนามิกที่ปรับให้เหมาะสมกับลูกค้าแต่ละคน เป็นต้น
หวังว่าจะได้ความรู้ส่วนตัวอย่างการนำไปใช้กันนะคะ จะเห็นได้ว่า ถ้าเรามีข้อมูลในมืออยู่ เราก็สามารถนำมาทำนาย จัดกลุ่ม เรียนรู้ เพื่อที่จะทำธุรกิจหรือการตลาดอย่างเหมาะสมได้เสมอ





Leave a Reply