Category: Data Science

  • Regular Expression สำหรับผู้เริ่มต้น

    Regular Expression (re) คือการเขียน sequence of characters เพื่อ match pattern ที่อยู่ในข้อความ (text, string) ในตัวอย่างด้านล่างคือ ^H[a-z]{4} เพื่อใช้ match คำว่า “Hello” tutorial วันนี้เราจะมาสอนเขียน re ง่ายๆใน R และลองใช้ฟังชั่น str_view ของ package stringr เพื่อดู matched pattern ที่เราต้องการ Basic matches re แบบง่ายที่สุดคือเราเขียน characters ที่เราต้องการ match ได้เลย เช่น “cat” แบบนี้ RStudio จะแสดงผลการ match ให้เราดูในหน้าต่าง view (ขวาล่างของหน้าจอ) การเขียน re เป็นแบบ case sensitive…

  • EP3 – การทดสอบนัยสำคัญทางสถิติและ Inverse p-value

    EP3 – การทดสอบนัยสำคัญทางสถิติและ Inverse p-value

    อธิบายการทดสอบสมมติฐานทางสถิติด้วยค่า p-value | alpha | beta | power และการหาความน่าจะเป็น p(H|D) ด้วย Bayes Theorem พร้อมโค้ดตัวอย่างใน R

  • EP2 – ทฤษฎี Bayes กับการตรวจโรคมะเร็ง

    EP2 – ทฤษฎี Bayes กับการตรวจโรคมะเร็ง

    Statistics Mondee EP2 มาลองดูตัวอย่างการใช้ Bayes เพื่อหาความน่าจะเป็นของโรคมะเร็งถ้าตรวจเจอผล positive พร้อมโค้ดตัวอย่างใน R

  • EP1 – ทฤษฎี Bayes กับการหาค่า Inverse Probability

    เฮลโหลลลลลลลลล สวัสดีผู้อ่าน แฟนเพจของเราทุกคน ยินดีต้อนรับสู่ซีรี่ล่าสุดของเรา Statistics Mondee (อ่านว่า มันส์ดี!) เป็นซีรี่บทความเกี่ยวกับเรื่องสถิติและความน่าจะเป็นเวอร์ชั่นเข้าใจง่าย บทความใหม่ออกทุกวันจันทร์ อ่านได้ทุกเพศทุกวัยโดยเฉพาะผู้อ่านที่สนใจด้าน data science โดย EP แรกของซีรี่จะอธิบายเรื่อง inverse probability หรืออีกชื่อที่หลายคนน่าจะผ่านหูผ่านตามาบ้างคือ Bayesian probability ซึ่งความรู้เรื่องนี้มีประโยชน์ต่อชีวิตอย่างมาก ประมาณว่าถ้าเรารู้ความน่าจะเป็นของ A|B เราสามารถหาความน่าจะเป็นของ B|A ได้เช่นกัน (ที่มาของคำว่า inverse) Probability 101 ถ้าคณิตศาสตร์คือศาสตร์แห่งความแน่นอน ในทางตรงกันข้าม ความน่าจะเป็นคือศาสตร์แห่งความไม่แน่นอน (uncertainty) เช่น ฝนจะตกหรือเปล่า? โอกาสที่จะได้เลื่อนตำแหน่ง? ความน่าจะเป็นที่เราจะได้เลือกตั้งในปี 2019? Trump จะได้เป็น ปธน. ต่อหรือเปล่า? คำถามพวกนี้ตอบได้ด้วยทฤษฏีความน่าจะเป็นทั้งหมดเลย โดยนิยามของความน่าจะเป็นที่ง่ายที่สุดคือ จำนวนเหตุการณ์ที่เราสนใจ / จำนวนเหตุการณ์ทั้งหมดที่เป็นไปได้ ลองดูตัวอย่างการโยนลูกเต๋า และการจั่วไพ่ด้านล่าง สมมติเราโยนลูกเต๋าแบบหกหน้าปกติ (a fair die)…

  • ดึงข้อมูลจากเว็บไซต์ IMDb ด้วย R

    ฝึกเขียน web scraping ง่ายๆด้วย package rvest ใน RStudio พร้อมตัวอย่างการดึงรายชื่อหนังท๊อป 50 จากเว็บไซต์ imdb

  • สร้างโมเดล Tree Based ง่ายๆด้วย R

    tutorial สอนสร้างและจูนโมเดล tree based ใน R พร้อมตัวอย่างโค้ด ใช้งานได้จริงสำหรับ decision tree และ random forest