Category: Data Science
-
วิเคราะห์ข้อมูลเด็กทารกแรกเกิดใน US ด้วย Python
tutorial นี้ เราสอนเขียนพื้นฐาน Python เพื่อวิเคราะห์ข้อมูลจำนวนเด็กทารกที่เกิดในประเทศอเมริการะหว่างปี 1994-2003 เพื่อนๆสามารถดาวน์โหลดไฟล์ US_births.csv ได้ที่นี่ ใน csv file จะมีทั้งหมด 5 columns year month date_of_month day_of_week births สำหรับโจทย์วันนี้คือการเขียนฟังชั่นเพื่อหาผลรวมคอลั่ม births → แยกตามคอลั่ม year, month, date_of_month และ day_of_week ตัวอย่าง output ที่เราต้องการจะออกมาเป็น dictionary หน้าตาแบบนี้ {“1994”: 500, “1995”: 1000, “1996”: 1500} โดยมี key เป็นปี (หรือคอลั่มอื่นๆ) ส่วน value คือผลรวมของคอลั่ม births Refresher สำหรับ tutorial นี้ assume ว่าเพื่อนๆเขียน Python ได้นิดหน่อย เข้าใจว่า dictionary…
-
ฝึกเขียนฟังชั่นนับจำนวนไอเทมใน List ง่ายๆด้วย Python
tutorial นี้เราจะมาสอนเขียน Python function ง่ายๆเพื่อใช้วิเคราะห์ข้อมูล โดย input คือ list of items ส่วน output จะออกมาเป็น dictionary (key คือชื่อ item และ value คือจำนวน item นั้นๆ) สำหรับเพื่อนๆที่อยากทำตาม tutorial นี้ ต้องเข้าใจสองเรื่องนี้ก่อน list vs. dictionary control flow (if-else และ for loop) ถ้าใครยังใหม่กับ Python ลองดูคอร์สฟรีของเราก่อนที่ https://datarockie.com/p/python-for-non-programmer Count Animals โจทย์คือเราต้องการนับจำนวน dog, cat, hippo ที่อยู่ใน list animals วิธีการที่เราจะแก้ปัญหาใน Python จะเริ่มจากการสร้าง empty dictionary ขึ้นมาก่อน…
-
ฝึกเขียน SQL ใน 10 นาที – ตอนที่ 2
tutorial นี้มาลองดูวิธีการใช้งาน aggregate functions คู่กับ GROUP BY clause ซึ่งเป็นหัวใจสำคัญของการทำ data analysis ด้วย SQL
-
รีวิวคอร์สเรียน Programming for Data Science – Udacity

แชร์ประสบการณ์เรียนคอร์ส Programming for Data Science Nanodegree Program ของ Udacity ใช้เวลาเรียนสามเดือน ได้ครบทุก skill ตั้งแต่ SQL Python Git และ Command Line
-
ทำความสะอาดข้อมูลง่ายๆเพียงสองขั้นตอนใน R
80% of your data analysis is cleaning data จากงานวิจัยหลายๆงานที่เกี่ยวข้องกับการทำ data analysis พบว่าเวลาส่วนใหญ่ของ data analyst หมดไปกับการทำความสะอาดข้อมูล โดยปัญหาที่เจอเยอะสุดคือปัญหา missing values (NAs) นั่นเอง บทความนี้เรามาสอนวิธีการทำความสะอาดข้อมูล i.e. clean missing values ด้วย R ทำเสร็จง่ายๆภายในสองขั้นตอน โดย package หลักที่เราใช้ทำงานกับข้อมูลสำหรับ R Programmer คือ tidyverse (ของทีม RStudio นั่นเองครัช) Tidy Data สำหรับเพื่อนๆที่ลง R และ RStudio ไว้ในเครื่องแล้ว ให้ลง package tidyverse เพื่อทำตามโค้ดทั้งหมดในบทความวันนี้ เราสามารถ clean ข้อมูลง่ายๆในสองขั้นตอน ตรวจสอบว่าข้อมูลเรามี missing values (NAs) หรือเปล่า?…
-
AI คืออะไร – สรุปบทเรียนที่ได้จาก The Elements of AI

Helsinki University (พ.ค. 2018) เปิดสอนวิชา The Elements of AI ในระดับพื้นฐาน สำหรับผู้ที่สนใจ เรียนแบบ self-pace 6 สัปดาห์ ไม่จำเป็นต้องมีพื้นฐานการเขียนโปรแกรมมาก่อน สอนพวก concepts และ case study หลายๆแบบให้นักเรียนได้เข้าใจภาพกว้างของโลก AI สมัครเรียนฟรีได้ที่นี่ https://www.elementsofai.com/ วันนี้แอดมาสรุปเนื้อหาสัปดาห์แรก What is AI? ให้อ่านกันแบบสั้นๆ กระชับ สนุก Definition of AI ถึงแม้ว่าคนจะพูดเรื่อง AI กันเยอะมาก แต่นิยามของคำนี้ไม่ได้ถูกกำหนดไว้ชัดเจน ทำให้การตีความของแต่ละคนแตกต่างกันออกไป สาเหตุสำคัญอีกอย่างคือภาพยนตร์ Hollywood ที่ทำให้ความเข้าใจเรื่อง AI ของคนทั่วไปบิดเบือนไปจากความเป็นจริง ถ้าเรายังหานิยามให้ AI ไม่ได้ งั้นมาลองดูลักษณะสำคัญของ AI ก่อนละกัน ประกอบด้วย Autonomy – ทำงานได้ด้วยตัวเองในสภาพแวดล้อมที่ซับซ้อน ไม่ต้องรอคำสั่งจากมนุษย์ Adaptivity…