Author: Kasidis Satangmongkol

  • EP3 – การทดสอบนัยสำคัญทางสถิติและ Inverse p-value

    EP3 – การทดสอบนัยสำคัญทางสถิติและ Inverse p-value

    อธิบายการทดสอบสมมติฐานทางสถิติด้วยค่า p-value | alpha | beta | power และการหาความน่าจะเป็น p(H|D) ด้วย Bayes Theorem พร้อมโค้ดตัวอย่างใน R

  • EP2 – ทฤษฎี Bayes กับการตรวจโรคมะเร็ง

    EP2 – ทฤษฎี Bayes กับการตรวจโรคมะเร็ง

    Statistics Mondee EP2 มาลองดูตัวอย่างการใช้ Bayes เพื่อหาความน่าจะเป็นของโรคมะเร็งถ้าตรวจเจอผล positive พร้อมโค้ดตัวอย่างใน R

  • EP1 – ทฤษฎี Bayes กับการหาค่า Inverse Probability

    เฮลโหลลลลลลลลล สวัสดีผู้อ่าน แฟนเพจของเราทุกคน ยินดีต้อนรับสู่ซีรี่ล่าสุดของเรา Statistics Mondee (อ่านว่า มันส์ดี!) เป็นซีรี่บทความเกี่ยวกับเรื่องสถิติและความน่าจะเป็นเวอร์ชั่นเข้าใจง่าย บทความใหม่ออกทุกวันจันทร์ อ่านได้ทุกเพศทุกวัยโดยเฉพาะผู้อ่านที่สนใจด้าน data science โดย EP แรกของซีรี่จะอธิบายเรื่อง inverse probability หรืออีกชื่อที่หลายคนน่าจะผ่านหูผ่านตามาบ้างคือ Bayesian probability ซึ่งความรู้เรื่องนี้มีประโยชน์ต่อชีวิตอย่างมาก ประมาณว่าถ้าเรารู้ความน่าจะเป็นของ A|B เราสามารถหาความน่าจะเป็นของ B|A ได้เช่นกัน (ที่มาของคำว่า inverse) Probability 101 ถ้าคณิตศาสตร์คือศาสตร์แห่งความแน่นอน ในทางตรงกันข้าม ความน่าจะเป็นคือศาสตร์แห่งความไม่แน่นอน (uncertainty) เช่น ฝนจะตกหรือเปล่า? โอกาสที่จะได้เลื่อนตำแหน่ง? ความน่าจะเป็นที่เราจะได้เลือกตั้งในปี 2019? Trump จะได้เป็น ปธน. ต่อหรือเปล่า? คำถามพวกนี้ตอบได้ด้วยทฤษฏีความน่าจะเป็นทั้งหมดเลย โดยนิยามของความน่าจะเป็นที่ง่ายที่สุดคือ จำนวนเหตุการณ์ที่เราสนใจ / จำนวนเหตุการณ์ทั้งหมดที่เป็นไปได้ ลองดูตัวอย่างการโยนลูกเต๋า และการจั่วไพ่ด้านล่าง สมมติเราโยนลูกเต๋าแบบหกหน้าปกติ (a fair die)…

  • ดึงข้อมูลจากเว็บไซต์ IMDb ด้วย R

    ฝึกเขียน web scraping ง่ายๆด้วย package rvest ใน RStudio พร้อมตัวอย่างการดึงรายชื่อหนังท๊อป 50 จากเว็บไซต์ imdb

  • สร้างโมเดล Tree Based ง่ายๆด้วย R

    tutorial สอนสร้างและจูนโมเดล tree based ใน R พร้อมตัวอย่างโค้ด ใช้งานได้จริงสำหรับ decision tree และ random forest

  • วิเคราะห์ข้อมูลเด็กทารกแรกเกิดใน US ด้วย Python

    tutorial นี้ เราสอนเขียนพื้นฐาน Python เพื่อวิเคราะห์ข้อมูลจำนวนเด็กทารกที่เกิดในประเทศอเมริการะหว่างปี 1994-2003 เพื่อนๆสามารถดาวน์โหลดไฟล์ US_births.csv ได้ที่นี่ ใน csv file จะมีทั้งหมด 5 columns year month date_of_month day_of_week births สำหรับโจทย์วันนี้คือการเขียนฟังชั่นเพื่อหาผลรวมคอลั่ม births → แยกตามคอลั่ม year, month, date_of_month และ day_of_week ตัวอย่าง output ที่เราต้องการจะออกมาเป็น dictionary หน้าตาแบบนี้ {“1994”: 500, “1995”: 1000, “1996”: 1500} โดยมี key เป็นปี (หรือคอลั่มอื่นๆ) ส่วน value คือผลรวมของคอลั่ม births Refresher สำหรับ tutorial นี้ assume ว่าเพื่อนๆเขียน Python ได้นิดหน่อย เข้าใจว่า dictionary…