05 January 2005

Machine Learning ตอนที่ 1

ช่วงนี้ไม่ค่อยมีมุขเขียนบลอก เลยคิดว่าจะเขียนเรื่องหลายๆ ตอน เกี่ยวกับสิ่งที่ตัวเองสนใจและทำอยู่ดีกว่า (หุๆๆ เขียนเก็บไว้ก่อน เผื่อเอาไปรวมเล่มขาย) คงเขียนไปเรื่อยๆ ถ้ายังมีไฟอยู่ ขอเริ่มด้วยเรื่องเกี่ยวกับ Machine Learning หัวข้อหลักของงานวิจัยที่ทำอยู่

Machine Learning คืออะไร ?

Machine Learning นี้ใช้ภาษาไทยว่า "การเรียนรู้ของเครื่อง" (เห็นครั้งแรกในหนังสือของอ.บุญเสริม เข้าเว็บของราชบัณฑิตฯ แล้วก็ยังไม่มี คาดว่าอาจารย์อาจจะกำหนดขึ้นใช้เอง ส่วนตัวแล้วคิดว่าตรงกับความหมายดีนะ) ทีนี้การเรียนรู้ของเครื่องแปลว่าอะไรล่ะ การเรียนรู้ของเครื่องเป็นสาขาหนึ่งของปัญญาประดิษฐ์ หรือที่รู้จักกันในชื่อย่อว่า AI ถ้าจะนิยามแบบการตลาด การเรียนรู้ของเครื่อง ก็คือ งานวิจัยเพื่อหาวิธีการทำให้ระบบคอมพิวเตอร์สามารถเรียนรู้ ปรับปรุงตัวเองได้ เพราะเราถือว่าการเรียนรู้เป็นตัวแทนอย่างหนึ่งของปัญญา นิยามนี้คงดูเพ้อฝันไปหน่อย แต่มีความหมายที่คนทั่วไปเข้าใจได้ง่ายๆ ส่วนนิยามสำหรับนักวิจัย ก็คือ การศึกษาวิธีวิเคราะห์เพื่อจำแนก หรือแจกแจงข้อมูลจำนวนมาก โดยเป็นสาขาที่มีความเกี่ยวข้องกับวิชาสถิติค่อนข้างมาก ส่วนใหญ่การเรียนรู้ของเครื่องจะเป็นฝ่ายเอาความรู้จากวิชาสถิติมาประยุกต์ใช้

ทีนี้คงจะสงสัยกันแล้วสิว่า การเรียนรู้เกี่ยวข้องกับการวิเคราะห์ข้อมูลได้อย่างไร เนื่องจากการเรียนรู้ของมนุษย์ที่สังเกตได้ง่ายที่สุด ก็คือ การจำแนกและจัดกลุ่ม มนุษย์เราต้องจำแนกแยกแยะ สิ่งต่างๆ ตลอดเวลา เวลาอ่านหนังสือ ก็ต้องแยกตัวหนังสือแต่ละตัว ว่าคือตัวอะไร แล้วถึงจะนำมาประกอบกัน เป็นคำได้ สิ่งที่สังเกตได้จากตัวเองก็คือ ตอนที่เริ่มเรียนภาษาญี่ปุ่นใหม่ๆ จะไม่สามารถแยกแยะตัวคันจิได้ เพราะรู้สึกว่าแต่ละตัวเขียนด้วยเส้นหลายๆ เส้น ซับซ้อนมาก จนดูเหมือนกันไปหมด พอเรียนมาเรื่อยๆ เห็นบ่อยๆ ก็จะชินตา และสามารถแยกแยะได้ว่า แต่ละตัวไม่เหมือนกัน ทำให้รู้สึกได้ว่า สมองเราก็รู้จักแบ่งแยก และรู้จำตัวอักษรใหม่ๆ ได้เนอะ พอกลับมาที่คอมพิวเตอร์ เราก็อยากให้ทำแบบเดียวกันได้ เช่น ถ้ามีรูป ก.ไก่ อยู่ ก็อยากให้คอมพิวเตอร์บอกได้ ว่านี่คือตัวก.ไก่นะ รูปก.ไก่นั้น พออยู่ในคอมพิวเตอร์ มันก็คือข้อมูลชุดหนึ่ง เป็นกลุ่มของจุดสีขาวดำที่เรียงต่อกัน การเรียนรู้ก็เลยกลายเป็นการวิเคราะห์ข้อมูล แล้วสร้างโมเดลบางอย่างขึ้น เพื่อให้เครื่องสามารถแบ่งแยก หรือจัดกลุ่มชุดข้อมูลได้ ทำให้มีการแบ่งการเรียนรู้ออกเป็นสองประเภทใหญ่ๆ คือ แบบมีคนสอน กับ แบบไม่มีคนสอน การเรียนรู้แบบมีคนสอนก็คือ มีตัวอย่างมาให้ พร้อมกับบอกมาด้วยว่า ข้อมูลแต่ละตัวอยู่กลุ่มไหน เช่น ให้รูป ก.ไก่ มาพร้อมกับบอกมาด้วยว่า นี่คือก.ไก่ นะ ส่วนแบบไม่มีคนสอน ก็คือ ให้แต่ตัวอย่างมา แล้วให้ระบบแบ่งแยกเอาเอง โดยดูจากความคล้าย และการกระจายของตัวอย่าง

1 comment:

Krikamol said...

ตื่นเต้นมากครับเวลาที่มีคนเขียนบล็อกเกี่ยวกับ machine learning จะพยายามติดตามอ่านตอนต่อไปนะครับ

ส่วนเรื่องของการแปลคำศัพท์ภาษาอังกฤษเป็นภาษาไทย เช่น คำว่าการเรียนรู้ของเครื่อง ผมไม่แน่ใจว่ามีใครได้ทำเป็นฐานข้อมูลกลางไว้รึเปล่า ถ้าไม่มีผมคิดว่าน่าจะรวมกลุ่มช่วยกันทำไปเรื่อยๆ ก็ดีนะครับ จะได้รองรับการเติบโตของงานวิจัยทางด้านนี้ในประเทศไทย