Author: Kasidis Satangmongkol

  • วิธีจัดการ Missing Value ง่ายๆด้วยโปรแกรม Excel

    วิธีจัดการ Missing Value ง่ายๆด้วยโปรแกรม Excel

    บทความที่แล้ว แอดอธิบายปัญหา outliers และการทำ outlier detection ไปแล้ว วันนี้เราจะมาลองดูการทำความสะอาด missing values ใน Excel กันบ้าง ดาวน์โหลดไฟล์ตัวอย่างได้ที่นี่ ฟังชั่นหลักที่ data analyst ใช้นับจำนวน/ ตรวจหา missing values ใน Excel คือ COUNTBLANK() และ ISBLANK() ตามลำดับ สังเกตในสูตรคำว่า “blank” หมายถึง cell ว่างใน worksheet นั้นๆ ตรวจสอบ Missing Value เปิดไฟล์ตัวอย่างขึ้นมา ข้อมูลที่มี missing values จะอยู่ที่ cell A3:E12 เราสามารถใช้ฟังชั่น COUNTBLANK() เพื่อนับจำนวน missing values ในแต่ละคอลัมน์ ลองดูสูตรที่แอดเขียนไว้ใน cell A15:E15 รู้จักกับค่า…

  • วิธีตรวจจับ Outliers ในข้อมูลง่ายๆด้วย Boxplot และ IQR

    วิธีตรวจจับ Outliers ในข้อมูลง่ายๆด้วย Boxplot และ IQR

    หน้าที่สำคัญของ data analyst คือการทำความสะอาดข้อมูลให้พร้อมสำหรับทำงาน โดยปัญหาหลักๆของ data ที่เราเจอบ่อยๆคือเรื่อง missing values และ outliers บทความนี้เราจะอธิบายว่า outliers คืออะไร และแนะนำเทคนิคในการ flag และ remove ค่า outliers ด้วยโปรแกรม Excel ง่ายๆใน 4 ขั้นตอน ดาวน์โหลดไฟล์ตัวอย่าง Excel สำหรับบทความนี้ได้ที่นี่ Outlier คืออะไร Outlier (มีหลายชื่อ เช่น anomaly, extreme value) คือ data points ที่มีค่าสูงหรือต่ำกว่า data points ส่วนใหญ่ในชุดข้อมูลหนึ่งๆอย่างมาก เช่น ส่วนสูง 210 cm คือค่า outlier สำหรับคนไทย เพราะเราแทบไม่เคยเห็นคนไทยสูงเกิน 2 เมตรเลย เป็นต้น อ้างอิงสถิติจากเว็บไซต์…

  • รีวิวสูตรคำนวณจำนวนตัวอย่างของ อ.Taro Yamane

    รีวิวสูตรคำนวณจำนวนตัวอย่างของ อ.Taro Yamane

    วันก่อนแอดไปอ่านเจอบทความของอาจารย์ที่สอน Business Analytics NIDA ที่เล่าเรื่องการใช้สูตรยามาเน่ของนักศึกษาที่ใช้ตามๆกันมาแบบไม่เข้าใจสูตรนี้จริงๆ บทความนี้แอดจะเขียนอธิบายการใช้งานสูตรยามาเน่ และ master formula ที่บริษัท survey platform ระดับโลกเค้าใช้กันให้อ่านเอง สูตรคำนวณจำนวนตัวอย่าง (sample size) ยอดนิยมสำหรับการเก็บแบบสอบถามของงานวิจัยนักศึกษาปริญญาตรี/ โทในประเทศไทยคือสูตรของอาจารย์ Taro Yamane ใช้กันเกือบทุกเล่ม เคยไปนั่งเปิดๆดูในห้องสมุดมหิดล น่าจะมากกว่า 80% ของ IS/Thesis ทั้งหมดเลย โดยเฉพาะภาควิชาการตลาด 555+ The Formula สูตรยามาเน่มีตัวแปรที่เราต้องรู้ค่าสองตัวคือ N และ e โดยที่ N คือจำนวนประชากร และ e คือค่าความคลาดเคลื่อน (i.e. error) เวลาแทนค่า e ในสมการต้องเขียนเป็นทศนิยม เช่น e = .05 (error = 5% เป็นค่ามาตรฐานที่เราใช้ในสูตรยามาเน่ สามารถเปลี่ยนได้ตามความเหมาะสม)…

  • เทคนิคการวัด Brand Loyalty ตามหลัก Marketing Science

    ปี 2014 สมัยแอดทำงานเป็น Research Executive ของบริษัทวิจัยตลาดเจ้าหนึ่ง ตอนนั้นตัดสินใจไปสมัครเรียนปริญญาโทใบที่สองที่วิทยาลัยการจัดการของมหิดล เรียกสั้นๆว่า CMMU สาขาการตลาดรุ่น MM17A เพราะรู้สึกว่าตัวเองยังไม่ค่อยมีความรู้ด้านนี้เท่าไร แต่งานประจำที่ทำต้องไปนำเสนอผลวิจัยให้กับทีมการตลาดของลูกค้าบ่อยๆ หลายครั้งมีระดับผู้บริหารเข้ามาฟังด้วย เลยคิดว่า เอาวะ! เรียนโทอีกใบละกัน 55+ มีอยู่คลาสเรียนนึงที่เปลี่ยนความคิดของแอดเกี่ยวกับการตลาดและการทำ market research ไปตลอดกาล และวิชานั้นคือ Consumer Behavior (CB) สอนโดย Dr. Randall Shannon บทความวันนี้แอดจะเขียนสรุปเนื้อหาสำคัญจากคลาสเรียนนี้ให้อ่านกัน Mind Blown! First Thing I Learned สิ่งแรก (และเป็นสิ่งที่สำคัญที่สุด) ที่แอดได้เรียนจากคลาส CB คือชื่อของศาสตราจารย์ Andrew Ehrenberg (1926-2010) ผู้ที่นำวิทยาศาสตร์มาอธิบายวิชาการตลาด และเป็นหนึ่งในผู้นำเรื่อง Marketing Science ได้รับเหรียญทองจากสมาคมวิจัยแห่งประเทศอังกฤษ (MRS) สองครั้งในปี 1969 และปี 1996…

  • สรุปคอร์สเรียน Analytics for Future Business โดยจุฬาฯ รุ่นที่ 1

    สัปดาห์นี้แอดได้มีโอกาสไปเรียนคอร์ส Analytics for Future Business รุ่นที่ 1 ของคณะบัญชีฯ จุฬาฯ ระหว่างวันที่ 30 ก.ค. – 1 ส.ค. 2562 เรียนตอนเย็นหลังเลิกงานเวลา 18.00 – 21.15 น. ทั้งหมด 9 ชั่วโมง สนนราคาคอร์ส 7,200 บาท ใครสนใจลองดูรายละเอียดได้ที่เว็บ BizCube Disclaimer – ก่อนอื่นเลยต้องบอกนี่แอดออกเงินเรียนเอง ไม่ได้มีสปอนเซอร์จากจุฬาฯนะ 555+ รีวิวในบทความนี้เป็นความเห็นส่วนตัวของแอดล้วนๆ หวังว่าจะเป็นประโยชน์กับเพื่อนๆที่กำลังตัดสินใจ 😛 Instructors คอร์สนี้มีอาจารย์สอนสองท่านจากภาควิชาสถิติ คณะบัญชีฯ จุฬาฯ มากด้วยประสบการณ์ทั้งคู่ แต่ส่วนตัวแอดตั้งใจมาเรียนกับ ดร.โจ้ โดยเฉพาะเลย ผลงานล่าสุดของอาจารย์ เช่น elect.in.th แสดงผลการนับคะแนนเลือกตั้งรอบที่ผ่านมา ’62 ดู portfolio แบบเต็มๆของอาจารย์ได้ที่ Boonmee Lab…

  • อยากเขียนเป็นไวๆต้องอ่าน! สรุป 5 Concepts พื้นฐานของภาษา R

    อยากเขียน R เป็นเร็วๆ ต้องเข้าใจเรื่องอะไรบ้าง? บทความนี้แอดเขียนสรุป 5 concepts สำคัญของภาษา R มาให้อ่าน พร้อมวีดีโอสอนติดตั้ง R และ RStudio Desktop ลุยเลยพี่ Getting Started Motto สำคัญของภาษา R คือ “Everything that exists in R is an object. Everything that happens in R is a function call.” – กล่าวโดย John Chambers หนึ่งในทีมผู้พัฒนา R ในยุคแรก (ตั้งแต่ยังเป็นภาษา S)ุ ทุกอย่างที่มีตัวตนอยู่ใน R คือ object และทุกสิ่งที่เกิดขึ้นใน R คือการเรียกใช้งาน…