ภาษา R พื้นฐานสำหรับ Excel Users

R เป็นหนึ่งในภาษาที่ได้รับความนิยมสูงมากสำหรับงาน data science เรียนรู้ง่าย ทำงานได้รวดเร็ว เกิดมาพร้อมกับความสามารถด้านสถิติ (ภาษาอังกฤษ เราเรียก R ว่า fast data crunching language) R เหมาะสำหรับคนที่ใช้ Excel ในการทำงานอยู่แล้ว ถ้าอยากจะเริ่มเขียนโปรแกรม แอดแนะนำ R เป็นภาษาแรกเพราะ logic ในการทำงานของเครื่องมือสองตัวนี้คล้ายกันมาก (การเรียกใช้งานฟังชั่นเหมือนกันเกือบ 100%) บทความนี้จะเปรียบเทียบความเหมือน/ แตกต่างของทั้งสองโปรแกรม และอธิบายการทำงานเบื้องต้นของ R ให้กับ Excel users ได้เข้าใจ ไม่ต้องเคยเขียนโปรแกรมมาก่อน ก็อ่านรู้เรื่อง ทำตามได้เลย 😛 Getting Software สำหรับเพื่อนๆที่อยากทำตาม tutorial วันนี้ต้องติดตั้งโปรแกรมฟรีสองตัวคือ R และ RStudio Desktop ติดตั้งเสร็จแล้วเปิดโปรแกรม RStudio ขึ้นมา และเริ่มเขียนโค้ดในหน้าต่าง console ตามตัวอย่างด้านล่างได้เลย นักเรียนสามารถดาวน์โหลดไฟล์…

Read More

อยากเขียนเป็นไวๆต้องอ่าน! สรุป 5 Concepts พื้นฐานของภาษา R

อยากเขียน R เป็นเร็วๆ ต้องเข้าใจเรื่องอะไรบ้าง? บทความนี้แอดเขียนสรุป 5 concepts สำคัญของภาษา R มาให้อ่าน พร้อมวีดีโอสอนติดตั้ง R และ RStudio Desktop ลุยเลยพี่ Getting Started Motto สำคัญของภาษา R คือ “Everything that exists in R is an object. Everything that happens in R is a function call.” – กล่าวโดย John Chambers หนึ่งในทีมผู้พัฒนา R ในยุคแรก (ตั้งแต่ยังเป็นภาษา S)ุ ทุกอย่างที่มีตัวตนอยู่ใน R คือ object และทุกสิ่งที่เกิดขึ้นใน R คือการเรียกใช้งาน…

Read More

รู้จักกับ Analysis Toolpak เครื่องมือลับสำหรับงานสถิติใน Excel

ถ้าบอกว่า Excel มี add-in ที่ช่วยเราวิเคราะห์ผลสถิติได้ถึง 15 โมเดลแบบไม่ต้องเขียนสูตรแถมใช้งานฟรีด้วย มีอยู่จริงหรอเครื่องมือดีๆแบบนี้? ตอบเลยว่ามี รู้งี้ใช้นานแล้ว !! วันนี้เราจะแนะนำวิธีใช้งาน Analysis Toolpak เบื้องต้น ลองสร้าง correlation matrix และ linear regression ทำนายราคาบ้านง่ายๆ สำหรับเพื่อนๆที่อยากทำตาม tutorial สามารถโหลดไฟล์ตัวอย่างได้ที่นี่ Activate Add-in วิธีเรียกใช้งาน Analysis Toolpak ให้ไปที่ File -> Options แล้วเลือก Add-ins ตามรูปด้านล่าง เสร็จแล้วจะมีไอคอน <Data Analysis> โผล่ขึ้นมาที่แท๊บ Data พร้อมให้เราใช้งานทางด้านขวาสุดของหน้าจอ Know Your Dataset ขั้นตอนแรกก่อนที่เราจะเริ่มทำ data analysis คือการทำความเข้าใจข้อมูลของเราก่อน สิ่งที่เราควรรู้เกี่ยวกับ dataset มี 4 ข้อ…

Read More

เทคนิคการวิเคราะห์ข้อมูลขนาดใหญ่ด้วย Excel

เราถูกสอนกันว่า Excel ไม่เหมาะจะใช้ทำงานด้าน Big Data เพราะข้อจำกัดเรื่องขนาดข้อมูลที่ไม่สามารถวิเคราะห์ข้อมูลเกิน 1.04 ล้าน rows ได้ [su_highlight background=”#DDFF99″ color=”#000000″]วันนี้เราจะแนะนำเทคนิค (ไม่ลับ) ให้ทุกคนวิเคราะห์ข้อมูล 10 ล้าน records ด้วย Excel ง่ายๆ[/su_highlight] ปล. จริงๆตามทฤษฏีสามารถรันได้ถึง 100 ล้าน records เลยด้วย จำนวน rows 1,048,576 จำนวน columns 16,384 โดยทั่วไปไฟล์ Excel นามสุกล .xlsx จะสามารถแสดงผลข้อมูลได้ที่ 1.04 ล้านแถวและ 16,384 คอลั่มตามลำดับ แต่ถ้าเราแค่สร้าง connection ต่อไปที่ data source ของเรา Excel สามารถวิเคราะห์ข้อมูลได้มากกว่า 1 ล้านแถวสบายๆด้วย Pivot Table ตัวอย่างไฟล์…

Read More

วิธีสร้าง Heatmap ด้วย Excel

Heatmap เป็นอีกหนึ่งเทคนิคการทำ data visualization ที่ต่อยอดมาจาก table ปกติ โดยเราสามารถไล่สี numeric values ใน table เช่น ค่าสูงขึ้น = สีน้ำเงิน และค่าต่ำลง = สีแดง บทความวันนี้เราจะมาสอนใช้ conditional formatting สำหรับสร้าง heatmap ง่ายๆด้วยโปรแกรม Excel Create Dataset ก่อนจะสร้าง heatmap มาเรียนวิธีสร้างข้อมูลกันก่อน Excel มีฟังชั่น RANDBETWEEN สำหรับสร้าง random numbers ที่มีค่าอยู่ในช่วง interval ที่เราต้องการ ลองพิมพ์ formula นี้ใน cell B2:M16 และใส่ชื่อ columns และ rows ตามตัวอย่างด้านล่าง Quick Heatmap พอเรามีข้อมูลเป็น table แบบนี้แล้ว…

Read More