Author: Kasidis Satangmongkol
-
วิธีจัดการ Missing Value ง่ายๆด้วยโปรแกรม Excel

บทความที่แล้ว แอดอธิบายปัญหา outliers และการทำ outlier detection ไปแล้ว วันนี้เราจะมาลองดูการทำความสะอาด missing values ใน Excel กันบ้าง ดาวน์โหลดไฟล์ตัวอย่างได้ที่นี่ ฟังชั่นหลักที่ data analyst ใช้นับจำนวน/ ตรวจหา missing values ใน Excel คือ COUNTBLANK() และ ISBLANK() ตามลำดับ สังเกตในสูตรคำว่า “blank” หมายถึง cell ว่างใน worksheet นั้นๆ ตรวจสอบ Missing Value เปิดไฟล์ตัวอย่างขึ้นมา ข้อมูลที่มี missing values จะอยู่ที่ cell A3:E12 เราสามารถใช้ฟังชั่น COUNTBLANK() เพื่อนับจำนวน missing values ในแต่ละคอลัมน์ ลองดูสูตรที่แอดเขียนไว้ใน cell A15:E15 รู้จักกับค่า…
-
วิธีตรวจจับ Outliers ในข้อมูลง่ายๆด้วย Boxplot และ IQR

หน้าที่สำคัญของ data analyst คือการทำความสะอาดข้อมูลให้พร้อมสำหรับทำงาน โดยปัญหาหลักๆของ data ที่เราเจอบ่อยๆคือเรื่อง missing values และ outliers บทความนี้เราจะอธิบายว่า outliers คืออะไร และแนะนำเทคนิคในการ flag และ remove ค่า outliers ด้วยโปรแกรม Excel ง่ายๆใน 4 ขั้นตอน ดาวน์โหลดไฟล์ตัวอย่าง Excel สำหรับบทความนี้ได้ที่นี่ Outlier คืออะไร Outlier (มีหลายชื่อ เช่น anomaly, extreme value) คือ data points ที่มีค่าสูงหรือต่ำกว่า data points ส่วนใหญ่ในชุดข้อมูลหนึ่งๆอย่างมาก เช่น ส่วนสูง 210 cm คือค่า outlier สำหรับคนไทย เพราะเราแทบไม่เคยเห็นคนไทยสูงเกิน 2 เมตรเลย เป็นต้น อ้างอิงสถิติจากเว็บไซต์…
-
รีวิวสูตรคำนวณจำนวนตัวอย่างของ อ.Taro Yamane

วันก่อนแอดไปอ่านเจอบทความของอาจารย์ที่สอน Business Analytics NIDA ที่เล่าเรื่องการใช้สูตรยามาเน่ของนักศึกษาที่ใช้ตามๆกันมาแบบไม่เข้าใจสูตรนี้จริงๆ บทความนี้แอดจะเขียนอธิบายการใช้งานสูตรยามาเน่ และ master formula ที่บริษัท survey platform ระดับโลกเค้าใช้กันให้อ่านเอง สูตรคำนวณจำนวนตัวอย่าง (sample size) ยอดนิยมสำหรับการเก็บแบบสอบถามของงานวิจัยนักศึกษาปริญญาตรี/ โทในประเทศไทยคือสูตรของอาจารย์ Taro Yamane ใช้กันเกือบทุกเล่ม เคยไปนั่งเปิดๆดูในห้องสมุดมหิดล น่าจะมากกว่า 80% ของ IS/Thesis ทั้งหมดเลย โดยเฉพาะภาควิชาการตลาด 555+ The Formula สูตรยามาเน่มีตัวแปรที่เราต้องรู้ค่าสองตัวคือ N และ e โดยที่ N คือจำนวนประชากร และ e คือค่าความคลาดเคลื่อน (i.e. error) เวลาแทนค่า e ในสมการต้องเขียนเป็นทศนิยม เช่น e = .05 (error = 5% เป็นค่ามาตรฐานที่เราใช้ในสูตรยามาเน่ สามารถเปลี่ยนได้ตามความเหมาะสม)…
-
เทคนิคการวัด Brand Loyalty ตามหลัก Marketing Science
ปี 2014 สมัยแอดทำงานเป็น Research Executive ของบริษัทวิจัยตลาดเจ้าหนึ่ง ตอนนั้นตัดสินใจไปสมัครเรียนปริญญาโทใบที่สองที่วิทยาลัยการจัดการของมหิดล เรียกสั้นๆว่า CMMU สาขาการตลาดรุ่น MM17A เพราะรู้สึกว่าตัวเองยังไม่ค่อยมีความรู้ด้านนี้เท่าไร แต่งานประจำที่ทำต้องไปนำเสนอผลวิจัยให้กับทีมการตลาดของลูกค้าบ่อยๆ หลายครั้งมีระดับผู้บริหารเข้ามาฟังด้วย เลยคิดว่า เอาวะ! เรียนโทอีกใบละกัน 55+ มีอยู่คลาสเรียนนึงที่เปลี่ยนความคิดของแอดเกี่ยวกับการตลาดและการทำ market research ไปตลอดกาล และวิชานั้นคือ Consumer Behavior (CB) สอนโดย Dr. Randall Shannon บทความวันนี้แอดจะเขียนสรุปเนื้อหาสำคัญจากคลาสเรียนนี้ให้อ่านกัน Mind Blown! First Thing I Learned สิ่งแรก (และเป็นสิ่งที่สำคัญที่สุด) ที่แอดได้เรียนจากคลาส CB คือชื่อของศาสตราจารย์ Andrew Ehrenberg (1926-2010) ผู้ที่นำวิทยาศาสตร์มาอธิบายวิชาการตลาด และเป็นหนึ่งในผู้นำเรื่อง Marketing Science ได้รับเหรียญทองจากสมาคมวิจัยแห่งประเทศอังกฤษ (MRS) สองครั้งในปี 1969 และปี 1996…
-
สรุปคอร์สเรียน Analytics for Future Business โดยจุฬาฯ รุ่นที่ 1
สัปดาห์นี้แอดได้มีโอกาสไปเรียนคอร์ส Analytics for Future Business รุ่นที่ 1 ของคณะบัญชีฯ จุฬาฯ ระหว่างวันที่ 30 ก.ค. – 1 ส.ค. 2562 เรียนตอนเย็นหลังเลิกงานเวลา 18.00 – 21.15 น. ทั้งหมด 9 ชั่วโมง สนนราคาคอร์ส 7,200 บาท ใครสนใจลองดูรายละเอียดได้ที่เว็บ BizCube Disclaimer – ก่อนอื่นเลยต้องบอกนี่แอดออกเงินเรียนเอง ไม่ได้มีสปอนเซอร์จากจุฬาฯนะ 555+ รีวิวในบทความนี้เป็นความเห็นส่วนตัวของแอดล้วนๆ หวังว่าจะเป็นประโยชน์กับเพื่อนๆที่กำลังตัดสินใจ 😛 Instructors คอร์สนี้มีอาจารย์สอนสองท่านจากภาควิชาสถิติ คณะบัญชีฯ จุฬาฯ มากด้วยประสบการณ์ทั้งคู่ แต่ส่วนตัวแอดตั้งใจมาเรียนกับ ดร.โจ้ โดยเฉพาะเลย ผลงานล่าสุดของอาจารย์ เช่น elect.in.th แสดงผลการนับคะแนนเลือกตั้งรอบที่ผ่านมา ’62 ดู portfolio แบบเต็มๆของอาจารย์ได้ที่ Boonmee Lab…
-
อยากเขียนเป็นไวๆต้องอ่าน! สรุป 5 Concepts พื้นฐานของภาษา R
อยากเขียน R เป็นเร็วๆ ต้องเข้าใจเรื่องอะไรบ้าง? บทความนี้แอดเขียนสรุป 5 concepts สำคัญของภาษา R มาให้อ่าน พร้อมวีดีโอสอนติดตั้ง R และ RStudio Desktop ลุยเลยพี่ Getting Started Motto สำคัญของภาษา R คือ “Everything that exists in R is an object. Everything that happens in R is a function call.” – กล่าวโดย John Chambers หนึ่งในทีมผู้พัฒนา R ในยุคแรก (ตั้งแต่ยังเป็นภาษา S)ุ ทุกอย่างที่มีตัวตนอยู่ใน R คือ object และทุกสิ่งที่เกิดขึ้นใน R คือการเรียกใช้งาน…