ทำไมผล Poll ส่วนใหญ่ถึงผิด?

ดุสิตโพลเผยผลการสำรวจความคิดเห็นของผู้มีสิทธิเลือกตั้ง 350 เขตทั่วประเทศ จำนวน 79,521 คน เมื่อเย็นวันที่ 24 มีนาคม 2562 เราลองทำตารางเปรียบเทียบผลโพล vs. คะแนนจริงอย่างไม่เป็นทางการด้านล่าง [su_spoiler title=”Spoiler สาเหตุสำคัญที่ทำให้ผลโพลเพี้ยน”][1] ไม่ได้ใช้การสุ่มตัวอย่างแบบ random sampling ในการสำรวจความเห็น i.e. biased poll [2] กลุ่มตัวอย่าง 79,521 คน คิดเป็น 0.25% ของจำนวนผู้มีสิทธิเลือกตั้งทั้งหมด i.e. sample ยังน้อยเกินไปสำหรับปัญหาการเลือกตั้ง[/su_spoiler] คอลั่ม D คำนวณจาก [คะแนนจริง – ผลโพล] ดูแบบเร็วๆจะเห็นว่าผลโพลผิดไปจากความจริงเยอะมาก บทความนี้จะอธิบายเหตุผลสำคัญทางสถิติที่ทำให้ผล poll เพี้ยนได้ขนาดนี้ Biased Polls นักสถิติเรียกการสุ่มตัวอย่างที่ไม่ได้ใช้ probability sampling ว่า “Biased” แปลว่า มีอคติหรือความคิดเห็นเบี้ยวไปที่คนกลุ่มใดกลุ่มหนึ่ง สิ่งที่ดุสิตโพลไม่ได้บอกในโพลนี้คือเค้าเก็บข้อมูล 79,521 คนจากเขตไหน…

Read More

เมื่อ Statistical Significance ถูกตั้งคำถามอีกครั้งในศตวรรษที่ 21

เมื่อวันที่ 20 มีนาคมที่ผ่านมา มีหนึ่งบทความตีพิมพ์ในนิตยสาร Nature กล่าวถึงการทำ statistical significance ด้วยค่า p-value และกฎที่เราใช้กันมาเกือบร้อยปี P < .05 ใจความสำคัญของบทความนี้คือการเรียกร้องให้นักวิทยาศาสตร์หยุดใช้ P ทดสอบสมมติฐานเพื่อสรุปผลซิก/ ไม่ซิกของงานวิจัย [su_spoiler title=”Nature คืออะไร?”]Nature คือ academic journal ที่มีค่า impact factor อันดับต้นๆในโลก เรียกได้ว่าบทความที่ได้ตีพิมพ์ใน journal นี้คุณภาพระดับโคตรพรีเมียม ทำให้บทความ “Statisticians rise up against statistical significance” ถูกแชร์มากมายบน facebook เมื่อวานนี้[/su_spoiler] ผู้เขียนบทความนี้ทั้งสามคน {Amrhein, Greenland และ McShane} ไม่ได้มาตัวคนเดียว เพราะเค้าไปล่าลายชื่อของเพื่อนนักวิจัยอีกมากกว่า 800 คนจาก 50 ประเทศ ที่เห็นด้วยกับเนื้อหาในงานฉบับนี้ We agree,…

Read More

รู้จักกับ Analysis Toolpak เครื่องมือลับสำหรับงานสถิติใน Excel

ถ้าบอกว่า Excel มี add-in ที่ช่วยเราวิเคราะห์ผลสถิติได้ถึง 15 โมเดลแบบไม่ต้องเขียนสูตรแถมใช้งานฟรีด้วย มีอยู่จริงหรอเครื่องมือดีๆแบบนี้? ตอบเลยว่ามี รู้งี้ใช้นานแล้ว !! วันนี้เราจะแนะนำวิธีใช้งาน Analysis Toolpak เบื้องต้น ลองสร้าง correlation matrix และ linear regression ทำนายราคาบ้านง่ายๆ สำหรับเพื่อนๆที่อยากทำตาม tutorial สามารถโหลดไฟล์ตัวอย่างได้ที่นี่ Activate Add-in วิธีเรียกใช้งาน Analysis Toolpak ให้ไปที่ File -> Options แล้วเลือก Add-ins ตามรูปด้านล่าง เสร็จแล้วจะมีไอคอน <Data Analysis> โผล่ขึ้นมาที่แท๊บ Data พร้อมให้เราใช้งานทางด้านขวาสุดของหน้าจอ Know Your Dataset ขั้นตอนแรกก่อนที่เราจะเริ่มทำ data analysis คือการทำความเข้าใจข้อมูลของเราก่อน สิ่งที่เราควรรู้เกี่ยวกับ dataset มี 4 ข้อ…

Read More

เทคนิคการกำหนด Sample Size ง่ายๆ ใช้ได้ทุกงาน

กำลังทำวิจัย market research, survey, poll แต่ไม่รู้ว่าต้องเก็บ sample size เท่าไรดี? บทความนี้มีคำตอบ ชัดทุกประเด็น #พรรคพี่ไม่ได้มาเล่นๆ ตอบสั้นๆในทางสถิติคือ n ยิ่งเยอะ ยิ่งดี ตอบยาวๆคือขึ้นอยู่กับ confidence level และ margin of error ที่เรารับได้ ตอบเชิงธุรกิจคือ ขึ้นอยู่กับเงินและเวลาที่เรามีในการทำงานนั้นๆ โอ้โหว มีหลายมุมมอง งั้นเรามาเริ่มจากเชิง academic กันก่อน (แบบพวกงานวิจัยเด็กมหาลัย) Types of Research งานวิจัยทางสถิติหลักๆจะมีอยู่สองแบบ แต่ละแบบมีวิธีการ set up วิเคราะห์และสรุปผลแตกต่างกัน observational study อยากรู้พฤติกรรมหรือทัศนคติของประชากรที่เราสนใจ จะหนักไปที่การทำ estimation เช่น อยากรู้ว่าคนไทยชอบกินชานมไข่มุกกี่ %? i.e. unknown parameter experimental study ต้องการทดสอบพวก causality…

Read More