Category: Data Science
-
Regular Expression สำหรับผู้เริ่มต้น
Regular Expression (re) คือการเขียน sequence of characters เพื่อ match pattern ที่อยู่ในข้อความ (text, string) ในตัวอย่างด้านล่างคือ ^H[a-z]{4} เพื่อใช้ match คำว่า “Hello” tutorial วันนี้เราจะมาสอนเขียน re ง่ายๆใน R และลองใช้ฟังชั่น str_view ของ package stringr เพื่อดู matched pattern ที่เราต้องการ Basic matches re แบบง่ายที่สุดคือเราเขียน characters ที่เราต้องการ match ได้เลย เช่น “cat” แบบนี้ RStudio จะแสดงผลการ match ให้เราดูในหน้าต่าง view (ขวาล่างของหน้าจอ) การเขียน re เป็นแบบ case sensitive…
-
EP3 – การทดสอบนัยสำคัญทางสถิติและ Inverse p-value

อธิบายการทดสอบสมมติฐานทางสถิติด้วยค่า p-value | alpha | beta | power และการหาความน่าจะเป็น p(H|D) ด้วย Bayes Theorem พร้อมโค้ดตัวอย่างใน R
-
EP2 – ทฤษฎี Bayes กับการตรวจโรคมะเร็ง

Statistics Mondee EP2 มาลองดูตัวอย่างการใช้ Bayes เพื่อหาความน่าจะเป็นของโรคมะเร็งถ้าตรวจเจอผล positive พร้อมโค้ดตัวอย่างใน R
-
EP1 – ทฤษฎี Bayes กับการหาค่า Inverse Probability
เฮลโหลลลลลลลลล สวัสดีผู้อ่าน แฟนเพจของเราทุกคน ยินดีต้อนรับสู่ซีรี่ล่าสุดของเรา Statistics Mondee (อ่านว่า มันส์ดี!) เป็นซีรี่บทความเกี่ยวกับเรื่องสถิติและความน่าจะเป็นเวอร์ชั่นเข้าใจง่าย บทความใหม่ออกทุกวันจันทร์ อ่านได้ทุกเพศทุกวัยโดยเฉพาะผู้อ่านที่สนใจด้าน data science โดย EP แรกของซีรี่จะอธิบายเรื่อง inverse probability หรืออีกชื่อที่หลายคนน่าจะผ่านหูผ่านตามาบ้างคือ Bayesian probability ซึ่งความรู้เรื่องนี้มีประโยชน์ต่อชีวิตอย่างมาก ประมาณว่าถ้าเรารู้ความน่าจะเป็นของ A|B เราสามารถหาความน่าจะเป็นของ B|A ได้เช่นกัน (ที่มาของคำว่า inverse) Probability 101 ถ้าคณิตศาสตร์คือศาสตร์แห่งความแน่นอน ในทางตรงกันข้าม ความน่าจะเป็นคือศาสตร์แห่งความไม่แน่นอน (uncertainty) เช่น ฝนจะตกหรือเปล่า? โอกาสที่จะได้เลื่อนตำแหน่ง? ความน่าจะเป็นที่เราจะได้เลือกตั้งในปี 2019? Trump จะได้เป็น ปธน. ต่อหรือเปล่า? คำถามพวกนี้ตอบได้ด้วยทฤษฏีความน่าจะเป็นทั้งหมดเลย โดยนิยามของความน่าจะเป็นที่ง่ายที่สุดคือ จำนวนเหตุการณ์ที่เราสนใจ / จำนวนเหตุการณ์ทั้งหมดที่เป็นไปได้ ลองดูตัวอย่างการโยนลูกเต๋า และการจั่วไพ่ด้านล่าง สมมติเราโยนลูกเต๋าแบบหกหน้าปกติ (a fair die)…
-
ดึงข้อมูลจากเว็บไซต์ IMDb ด้วย R
ฝึกเขียน web scraping ง่ายๆด้วย package rvest ใน RStudio พร้อมตัวอย่างการดึงรายชื่อหนังท๊อป 50 จากเว็บไซต์ imdb
-
สร้างโมเดล Tree Based ง่ายๆด้วย R
tutorial สอนสร้างและจูนโมเดล tree based ใน R พร้อมตัวอย่างโค้ด ใช้งานได้จริงสำหรับ decision tree และ random forest