วิธีจัดการ Missing Value ง่ายๆด้วยโปรแกรม Excel

บทความที่แล้ว แอดอธิบายปัญหา outliers และการทำ outlier detection ไปแล้ว วันนี้เราจะมาลองดูการทำความสะอาด missing values ใน Excel กันบ้าง ดาวน์โหลดไฟล์ตัวอย่างได้ที่นี่ ฟังชั่นหลักที่ data analyst ใช้นับจำนวน/ ตรวจหา missing values ใน Excel คือ COUNTBLANK() และ ISBLANK() ตามลำดับ สังเกตในสูตรคำว่า “blank” หมายถึง cell ว่างใน worksheet นั้นๆ ตรวจสอบ Missing Value เปิดไฟล์ตัวอย่างขึ้นมา ข้อมูลที่มี missing values จะอยู่ที่ cell A3:E12 เราสามารถใช้ฟังชั่น COUNTBLANK() เพื่อนับจำนวน missing values ในแต่ละคอลัมน์ ลองดูสูตรที่แอดเขียนไว้ใน cell A15:E15 คอลัมน์…

Read More

Regular Expression สำหรับผู้เริ่มต้น

Regular Expression (re) คือการเขียน sequence of characters เพื่อ match pattern ที่อยู่ในข้อความ (text, string) ในตัวอย่างด้านล่างคือ ^H[a-z]{4} เพื่อใช้ match คำว่า “Hello” tutorial วันนี้เราจะมาสอนเขียน re ง่ายๆใน R และลองใช้ฟังชั่น str_view ของ package stringr เพื่อดู matched pattern ที่เราต้องการ Basic matches re แบบง่ายที่สุดคือเราเขียน characters ที่เราต้องการ match ได้เลย เช่น “cat” แบบนี้ RStudio จะแสดงผลการ match ให้เราดูในหน้าต่าง view (ขวาล่างของหน้าจอ) การเขียน re เป็นแบบ case sensitive…

Read More