คอร์ส การวิเคราะห์ข้อมูลโซเชียลมีเดียสำหรับผู้เริ่มต้น
โมดูลที่ 3 - Module 3 : เทคนิคการวิเคราะห์ข้อมูล
บทเรียนที่ 5 - เทคนิคการรวมกลุ่มแล้วนับข้อความในกลุ่ม (Data grouping and counting, or pivot table)
ในการวิเคราะห์ข้อมูล บ่อยครั้งเราจะต้องการรวมกลุ่มข้อมูลที่มีความคล้ายกัน และนับจำนวนข้อมูลในแต่ละกลุ่ม ตัวอย่างเช่น ในการวิเคราะห์ข้อความบนโซเชียลมีเดีย เราอาจอยากรู้ว่าในแต่ละเดือนมีกี่ข้อความ เพื่อหาการกระจุกหรือการกระจายตัว ว่าข้อความที่สนใจนั้นมักเกิดขึ้นเดือนใด
เทคนิคการรวมกลุ่มข้อมูลและนับจำนวนข้อมูลของแต่ละกลุ่มนี้ มีชื่อเรียกหลายชื่อ เช่น ในภาษาฐานข้อมูล เรียกว่า Group by ส่วนใน Excel เรียกว่า Pivot table
สมมุติว่าเราเก็บข้อมูลจากโซเชียลมีเดียมา โดยข้อมูลแต่ละรายการ มีวันที่ (Datetime) และข้อความ (Message) หากเราต้องการรวมข้อความตามเดือน จะมีขั้นตอนดังนี้
- แปลงข้อมูล Datetime ให้เป็นเดือน เพื่อให้ข้อมูลที่อยู่ในเดือนเดียวกันมีค่า Datetime เหมือนกัน เช่น ถ้าข้อมูลปรากฏในเดือนมกราคม 2023 ก็ใช้ Jan-23 เหมือนกันทั้งหมด หากข้อมูล Datetime มีวันที่ หรือเวลารวมมาด้วย ก็ให้ลบออก
- เลือกข้อมูลทั้งหมดที่ต้องการวิเคราะห์ แล้วกด Analyze Data จะทำให้ Excel แนะนำการวิเคราะห์ที่เหมาะสมกับข้อมูลที่เลือก ให้เลือก Insert PivotTable
- จะได้ตาราง Pivot table ที่แสดงจำนวนข้อความที่พบในแต่ละเดือน หากต้องการพล็อตชาร์ท ก็สามารถ Insert chart ที่เหมาะสมได้ เช่น Bar chart ที่แสดงจำนวนข้อมูลแต่ละเดือน
เราสามารถประยุกต์ใช้ Pivot table ได้หลายลักษณะ ตัวอย่างเช่น นับจำนวนข้อความที่มี Label เหมือนกัน เช่น ในข้อความ Dangerous speech เราอาจต้องการจำแนกว่าแต่ละข้อความเป็น Dangerous speech ประเภทไหน (กล่าวหา, ลดทอนความเป็นมนุษย์, โจมตีผู้หญิงและเด็ก ฯลฯ) ดังนั้นให้ตั้ง Column ใหม่สำหรับประเภทข้อความ อ่านและลงข้อมูลประเภทข้อความใน Column นั้น จากนั้นใช้ Pivot Table นับจำนวนข้อความตามประเภทของ Dangerous speech
กิจกรรม
หากท่านมีชุดข้อมูลที่เก็บมาได้ ลองรวมกลุ่มข้อมูลตาม Datetime โดยนับตามเดือน หากข้อมูลที่เก็บมามีความละเอียดมากกว่าเดือน เช่น วัน ชั่วโมง นาที ให้ลองหาวิธีแปลงให้ข้อมูลนั้นเป็นเดือน-ปี จากนั้นพิจารณาว่าข้อมูลกระจุกตัวในเดือนไหน เพราะอะไร อาจพล็อต Bar chart เพื่อช่วยพิจารณา
ยินดีด้วย คุณจบโมดูล 3: Module 3 : เทคนิคการวิเคราะห์ข้อมูล แล้ว โมดูลนี้เป็นโมดูลสุดท้ายของคอร์สนี้
กลับหน้าหลัก