เทคนิคการวิเคราะห์ข้อมูลขนาดใหญ่ด้วย Excel

เราถูกสอนกันว่า Excel ไม่เหมาะจะใช้ทำงานด้าน Big Data เพราะข้อจำกัดเรื่องขนาดข้อมูลที่ไม่สามารถวิเคราะห์ข้อมูลเกิน 1.04 ล้าน rows ได้ [su_highlight background=”#DDFF99″ color=”#000000″]วันนี้เราจะแนะนำเทคนิค (ไม่ลับ) ให้ทุกคนวิเคราะห์ข้อมูล 10 ล้าน records ด้วย Excel ง่ายๆ[/su_highlight] ปล. จริงๆตามทฤษฏีสามารถรันได้ถึง 100 ล้าน records เลยด้วย จำนวน rows 1,048,576 จำนวน columns 16,384 โดยทั่วไปไฟล์ Excel นามสุกล .xlsx จะสามารถแสดงผลข้อมูลได้ที่ 1.04 ล้านแถวและ 16,384 คอลั่มตามลำดับ แต่ถ้าเราแค่สร้าง connection ต่อไปที่ data source ของเรา Excel สามารถวิเคราะห์ข้อมูลได้มากกว่า 1 ล้านแถวสบายๆด้วย Pivot Table ตัวอย่างไฟล์…

Read More

วิธีสร้าง Heatmap ด้วย Excel

Heatmap เป็นอีกหนึ่งเทคนิคการทำ data visualization ที่ต่อยอดมาจาก table ปกติ โดยเราสามารถไล่สี numeric values ใน table เช่น ค่าสูงขึ้น = สีน้ำเงิน และค่าต่ำลง = สีแดง บทความวันนี้เราจะมาสอนใช้ conditional formatting สำหรับสร้าง heatmap ง่ายๆด้วยโปรแกรม Excel Create Dataset ก่อนจะสร้าง heatmap มาเรียนวิธีสร้างข้อมูลกันก่อน Excel มีฟังชั่น RANDBETWEEN สำหรับสร้าง random numbers ที่มีค่าอยู่ในช่วง interval ที่เราต้องการ ลองพิมพ์ formula นี้ใน cell B2:M16 และใส่ชื่อ columns และ rows ตามตัวอย่างด้านล่าง Quick Heatmap พอเรามีข้อมูลเป็น table แบบนี้แล้ว…

Read More

ฟังชั่น LINEST กับการสร้าง Linear Regression ใน Excel

อยากสร้าง Multiple Linear Regression ง่ายๆด้วยโปรแกรม Excel ภายในหนึ่งนาที? บทความวันนี้สอนใช้ฟังชั่น LINEST ฉบับรวบรัดแค่หนึ่งฟังชั่นได้ครบหมดทั้งค่า R-squared และ regression coefficients อ่านบทความตอนที่แล้วเรื่อง Simple Linear Regression ได้ที่นี่ General Form สำหรับสมการ Multiple Linear Regression (MLR) โดยทั่วไปเขียนได้แบบนี้ y = b0 + b1*x1 + b2*x2 + b3*x3 + … + bk*xk โดยที่ y คือตัวแปรตาม (dependent variable) และ x คือตัวแปรต้น (independent variable) ในสมการ MLR จะมีตัวแปรต้นได้มากกว่าหนึ่งตัว เงื่อนไขสำคัญที่สุดในการสร้าง Linear…

Read More

สร้างโมเดล Simple Linear Regression ง่ายๆด้วย Excel

Regression Analysis คือเทคนิคทางสถิติที่ใช้ quantify ความสัมพันธ์ระหว่างตัวแปรต้น (x) และตัวแปรตาม (y) และเป็น algorithms สำคัญในการทำ prediction และ forecasting โดยคำว่า “Regression” ถูกนำมาใช้ครั้งแรกโดย Sir Francis Galton ในปี 1875 จากการค้นพบปรากฎการณ์ที่เรียกว่า Regression towards the mean ส่วน Regression ที่พวกเราต้องเรียนเป็นตัวแรกคือ Linear Regression นั่นเอง ทำไมต้องเรียนก่อน? เพราะว่ามันง่ายที่สุดแล้วฮะ 555+ (หลายคนคิดในใจ นี่ง่ายแล้วเหรอออออออ?) ง่ายจริงๆ!! ถ้าอ่านบทความวันนี้จบทำเป็นแน่นอน วันนี้เราจะสอนสร้าง Simple Linear Regression ง่ายๆด้วยโปรแกรม Excel ใช้แค่ 4 functions Simple Linear Regression (SLR) สำหรับสมการ SLR เบื้องต้น เขียนได้แบบนี้…

Read More