สร้างโมเดล Simple Linear Regression ง่ายๆด้วย Excel

Regression Analysis คือเทคนิคทางสถิติที่ใช้ quantify ความสัมพันธ์ระหว่างตัวแปรต้น (x) และตัวแปรตาม (y) และเป็น algorithms สำคัญในการทำ prediction และ forecasting โดยคำว่า “Regression” ถูกนำมาใช้ครั้งแรกโดย Sir Francis Galton ในปี 1875 จากการค้นพบปรากฎการณ์ที่เรียกว่า Regression towards the mean ส่วน Regression ที่พวกเราต้องเรียนเป็นตัวแรกคือ Linear Regression นั่นเอง ทำไมต้องเรียนก่อน? เพราะว่ามันง่ายที่สุดแล้วฮะ 555+ (หลายคนคิดในใจ นี่ง่ายแล้วเหรอออออออ?) ง่ายจริงๆ!! ถ้าอ่านบทความวันนี้จบทำเป็นแน่นอน วันนี้เราจะสอนสร้าง Simple Linear Regression ง่ายๆด้วยโปรแกรม Excel ใช้แค่ 4 functions Simple Linear Regression (SLR) สำหรับสมการ SLR เบื้องต้น เขียนได้แบบนี้…

Read More

อธิบาย Confusion Matrix ฉบับเข้าใจง่าย (มาก)

พ.ค. เข้าสู่หน้าฝนแล้ว แอดนั่งกินข้าวเที่ยงอยู่กับเพื่อน เลยลองให้เค้าทายเล่นๆว่าเย็นนี้ฝนจะตกหรือไม่ตก? เพื่อนมองออกไปดูฟ้าครึ้มๆก็เลยตอบว่า “กูว่าเย็นนี้ฝนตกแน่ๆ” และนี่คือตัวอย่างง่ายๆของการทำ prediction ใช้ชีวิตประจำวัน เวลาที่เราพยายามจะทำนาย outcome ที่มีได้สองค่า (ฝนตก|ไม่ตก) นักสถิติเรียกปัญหานี้ว่า Binary Classification Problem พอเราสร้างโมเดลสถิติขึ้นมาทำนาย binary outcome แล้ว ขั้นตอนต่อไปคือการวัดความถูกต้อง (accuracy) ของผลการทำนาย ด้วยตาราง Confusion Matrix ซึ่งใช้กันอย่างแพร่หลายในงาน machine learning ทุกวันนี้ Confusion Matrix Explained ไอเดียของ confusion matrix นั้นเรียบง่าย จริงๆมันคือตาราง crosstabs ขนาด 2×2 ทั่วไป โดยแกนนอนคือ actual result ส่วนแกนตั้งคือ prediction result หน้าตาเหมือนรูปด้านล่าง สมมติเราพยากรณ์อากาศล่วงหน้าไป 10 วัน (ทายว่าฝนตก 6 วัน และฝนไม่ตกอีก 4 วัน) แล้วก็เทียบความจริงกับสิ่งที่เราพยากรณ์ไว้ว่าถูกทั้งหมดกี่ครั้งในสิบวันข้างหน้า?…

Read More