Author: Kasidis Satangmongkol
-
Hello World 01 – Google Sheets

23 ธ.ค. 2563 – เราเริ่มเรียนเวลา 20.30 น. นะครับ ใช้เวลาประมาณ 1.5-2.0 ชั่วโมง เปิดไฟล์ขึ้นมา คลิกที่ File > Make A Copy เพื่อเรียนตาม Live นี้นะครับ Note – ไม่มีพื้นฐานก็เข้าเรียนได้นะครับ : ) นักเรียนต้องมี Google Account ด้วยนะครับ Google Sheets Topics รีวิวสิ่งที่ควรรู้เกี่ยวกับ Google Sheets IF FILTER and SORT QUERY เขียน SQL like ใน Google Sheets VLOOKUP – join multiple datasets MATCH and INDEX…
-
สรุปเนื้อหาคอร์ส Data Engineering for Everyone ของ DataCamp

บทความนี้แอดสรุปเนื้อหาอย่างละเอียดจากคอร์ส Data Engineering for Everyone ของ DataCamp ถ้าอยากรู้ว่า data engineer ทำงานอะไรบ้าง และแตกต่างจาก data scientist และ data analyst ยังไง อ่านต่อได้เลยคร้าบ สำหรับเพื่อนๆที่สนใจ คอร์สเรียนนี้ใช้เวลาเรียนประมาณ 2 ชั่วโมง ประกอบด้วย 11 วีดีโอ 32 แบบฝึกหัด สอนโดย Hadrien Lacroix เนื้อหาแบ่งออกเป็นสามบท อธิบายคอนเซ็ปต์และคำศัพท์พื้นฐานของงาน data engineer Data Engineer คืออะไร Storing Data การเก็บข้อมูล Moving and Processing Data การย้ายและจัดการข้อมูล ส่วนตัวแอดคิดว่าคอร์สนี้สอน concept โอเคเลย ได้เห็นภาพรวมของงาน data engineer และเข้าใจศัพท์เทคนิคที่เราใช้กันเยอะมากในสายงาน data เช่น…
-
เทคนิคการเขียน Subqueries ง่ายๆใน SQLite

Meet Subquery Subquery คือการเขียน query ซ้อน query โดยตัวคิวรี่ที่อยู่ข้างในจะเรียกว่า “inner/ sub query” และคิวรี่ที่อยู่ด้านนอกจะเรียกว่า “outer query” วิธีสังเกตง่ายๆว่าคิวรี่ไหนเป็น subquery ให้มองหา select ที่อยู่ในวงเล็บแบบนี้ Subquery ช่วยให้เราเขียน query ที่มีความซับซ้อนขึ้น (ความคิดสร้างสรรค์กระฉูด 555+) โดยรวมหลายๆคิวรี่เข้าด้วยกันและรันทีเดียว ลำดับการรันจะเริ่มจาก inner most query ชั้นในสุดก่อนและค่อยๆไล่ออกมาชั้นนอก 👩💻 ถ้าใครยังไม่เคยเขียน SQL ลองอ่านบทความสอนพื้นฐานของเราได้ที่นี่ ดาวน์โหลดไฟล์ตัวอย่าง chinook.db Simple Example มาลองดูตัวอย่างแรกกันก่อน สมมติเราอยากจะรู้ชื่อเพลงที่มีขนาดใหญ่ที่สุด maximum bytes จากตาราง tracks เราต้องเขียนสอง queries โดยคิวรี่แรกใช้หา max(bytes) และนำผลลัพธ์ที่ได้ไปใส่ในคิวรี่ที่สองใน where clause เราสามารถรวมสองคิวรี่ด้านบนด้วยเทคนิค subquery ได้เลย…
-
ความล้มเหลวของตลาด ข้อมูลที่ลำเอียง มะนาว และลูกพีช

ทฤษฎีเศรษฐศาสตร์อธิบายความล้มเหลวของตลาดได้อย่างไร? บทความนี้แอดจะอธิบายปัญหา Asymmetric Information หนึ่งในสาเหตุของการเกิด Market Failure อ้างอิงจากเปเปอร์ต้นฉบับของ George Akerlof (1978) เป็นหนึ่งในงานวิจัยด้านเศรษฐศาสตร์ที่ได้รับการอ้างอิงถึงมากที่สุดตลอดกาล (อ้างอิงสถิติจาก Google Scholar 33629 ครั้ง) และช่วยให้ Akerlof ได้รับรางวัล Nobel Prize ร่วมกับ Michael Spence และ Joseph Stiglitz ในปี 2001 เกี่ยวกับเรื่อง Information Economics Asymmetric Information คือสถานการณ์ที่ผู้ซื้อและผู้ขายสินค้า (บริการ หรือ transaction) มีข้อมูลไม่เท่าเทียมกัน ทำให้ฝ่ายที่มีข้อมูลน้อยกว่าเสียเปรียบในการตกลงทำธุรกรรม ซึ่งแบ่งออกเป็นสามปัญหาย่อยๆ ดังนี้ Adverse Selection Moral Hazard Monopolies of Knowledge (เหมือนรัฐบาลที่เข้าควบคุมสื่อในประเทศ รู้สึกคุ้นๆ 55+) บทความนี้จะโฟกัสที่ปัญหา Adverse…
-
รีวิวเทคนิคการเขียน Aggregate Functions + CASE ด้วย SQL

Hello Friends! บทความนี้มาเรียนวิธีการเขียน Aggregate Functions (count, sum) ร่วมกับ CASE statement เพื่อนับหรือหาผลรวมของคอลัมน์แบบมีเงื่อนไข เขียนง่าย และมีโอกาสได้ใช้บ่อยเลยในชีวิตจริง Aggregate Functions คือฟังก์ชันคำนวณค่าสถิติง่ายๆของ SQL ตัวหลักๆที่เราใช้บ่อยๆมี 5 ตัวคือ AVG, SUM, MIN, MAX และ COUNT CASE คือการเขียนเงื่อนไขเหมือนฟังก์ชัน IF/ IFS ของ Excel Tip – เราเขียน CASE เพื่อสร้างคอลัมน์ใหม่ เช่น segments ลูกค้าเป็น high, medium, low values และใช้ SUM หรือ COUNT เพื่อหาผลรวมหรือนับจำนวน segments ในคอลัมน์นั้น Example Table สำหรับตัวอย่างในบทความนี้ เราใช้…
-
เปลี่ยนข้อมูล Long เป็น Wide Format ด้วย R Excel และ SQL

บทความแรกของปี 2020 วันนี้แอดมารีวิวเทคนิคการ transform ข้อมูลจาก long format เป็น wide format ง่ายๆด้วยเครื่องมือสามตัวเรียงจากง่ายสุดไปยากสุด ทั้งในด้านประสิทธิภาพและเวลาในการ execute ก่อนอื่นมาทำความรู้จักกับ long และ wide format กันก่อน ปกติเวลาเราทำงานกับข้อมูล (โดยเฉพาะ R และ Excel) เราจะนิยมข้อมูลแบบ long format มากกว่า เพราะเป็นรูปแบบที่เหมาะกับการทำงานวิเคราะห์ข้อมูล Long เหมาะสำหรับการทำ data analysis (raw data) Wide เหมาะสำหรับรายงาน สรุปผลนำเสนอข้อมูล โอเค! คราวนี้มาดูเทคนิคการเปลี่ยน long → wide format (หรือเปลี่ยนจาก wide → long) ง่ายๆด้วยภาษา R, Excel Pivot Table และ SQL…