0 of 16 lessons complete (0%)
Exit Course

Lesson 11 – AutoML

What is AutoML

AutoML เป็นเทรนด์ใหม่ที่กำลังมาแรงมากในสาย ML/ AI เป็นการเอาสองคำมารวมกันคือ

Automatic + Machine Learning = AutoML

AutoML คือการเทรนโมเดลแบบอัตโนมัติ ไม่ต้องใช้มนุษย์เข้าไปยุ่งเลย โดยหน้าที่ของเราคือการเตรียมข้อมูล (prepare/ clean data) และส่งให้กับ AutoML ไปจัดการต่อ โมเดลจะเทรนนานเท่าไหร่ขึ้นอยู่กับ budget ที่เราเตรียมไว้ เช่น ถ้าเรามี budget 5000 บาท ค่า training model ชั่วโมงละ 1000 บาท ก็จะเทรนได้ 5 ชั่วโมง เป็นต้น

AutoML ของ Google

ข้อดีของการใช้ AutoML คือเร็ว สะดวก ง่ายจนงง 555+ แต่ข้อเสียคือต้องใช้เงินในการเทรน ยิ่งข้อมูลเยอะขึ้น ต้องใช้คอม spec แรงขึ้น ราคาจะยิ่งสูงขึ้นไปด้วย

AutoML Interface บน Google Cloud Platform

AutoML in 4 Steps

เราสามารถเทรนโมเดลบน AutoML ได้ใน 4 ขั้นตอน ไม่ต้องเขียนโค้ดใดๆ

  1. เตรียมข้อมูล และเลือกว่าเป็นโจทย์ regression หรือ classification
  2. เลือกคอลัมน์ label หรือตัวแปรตามที่เราต้องการทำนาย
  3. เลือกคอลัมน์ features หรือตัวแปรต้นในโมเดล
  4. เลือก budget กำหนดเงินที่เรามี หรือจำนวนชั่วโมงที่อยากจะเทรนโมเดล

📝 ถ้าใครอยากศึกษาเพิ่มเติม หรือลองทำตาม tutorial (จะเสียเงินแล้วนะ 555+) ลองอ่านได้ที่ Google AutoML

Step 01 – Choose Data and Problem

อัพโหลด dataset ขึ้นไปเก็บไว้บน Google Cloud ไปที่ AutoML และเลือก objective ของโมเดล สำหรับ tabular data จะมีให้เลือกแค่ classification หรือ regression

Step 02 – Select Colunm to Predict

ขั้นตอนที่สอง เลือกคอลัมน์ label ตัวแปรตามที่เราต้องการทำนาย ในตัวอย่างนี้แอดสร้าง churn model (binary classification)

Step 03 – Select Features (X)

ขั้นตอนที่สาม คือการตั้งค่าต่างๆในการเทรน เช่น เลือกตัวแปรต้น (features, X) หรือกำหนดการทำ transformation รูปแบบต่างๆ AutoML สามารถทำพวก feature engineering หรือการสร้างคอลัมน์ใหม่ให้เราได้ด้วย สมัยก่อน process นี้คือใช้เวลาเยอะมากแต่ AutoML แก้ปัญหานี้ให้เราได้เลยง่ายๆ

Step 04 – Choose Budget

ขั้นตอนสุดท้ายคือการกำหนด budget ที่เราจะใช้เทรนโมเดล ในตัวอย่างนี้แอดกำหนดให้โมเดลเทรนประมาณ 3 ชั่วโมง

Google มี guideline ให้นิดหน่อย เช่น ถ้า sample size ไม่ถึง 100,000 แถว ใช้เวลาประมาณ 1-3 ชั่วโมงน่าจะได้ optimal model แล้วครับ

ถ้าเราตั้งค่าทั้งหมดเสร็จแล้ว กด Start Training แล้วก็นั่งรอได้เลย

พอครบกำหนด budget ที่เราเตรียมไว้ เราก็จะได้ final model กลับมาพร้อมกับค่า evaluation metrics ต่างๆ Google จะมี option ให้เราเลือกทำ deployment ต่อได้เลย เช่น การสร้าง Rest API ให้โปรแกรมอื่นๆเรียกใช้งานได้

Note – API ย่อมาจากคำว่า application programming interface เป็นเหมือนเส้นให้ applications พูดคุยรับส่งข้อมูลกัน

Formative Quiz

Hint: สแกนหาคำตอบในบทความนี้