< กลับหน้าโมดูล

คอร์ส การวิเคราะห์ข้อมูลโซเชียลมีเดียสำหรับผู้เริ่มต้น

โมดูลที่ 3 - Module 3 : เทคนิคการวิเคราะห์ข้อมูล

บทเรียนที่ 3 - เทคนิคการติดป้ายคำให้ข้อมูล (Data labelling)


การติดป้ายคำให้ข้อมูล คือการเพิ่ม Column ในโครงสร้างข้อมูล แล้วใส่ค่าลงไปใน Column นั้น เพื่อให้ข้อมูลแต่ละรายการมี Column ที่เพิ่มมิติให้กับการวิเคราะห์

ตัวอย่างเช่น ในข้อความ Dangerous speech เราอาจต้องการจำแนกว่าแต่ละข้อความเป็น Dangerous speech ประเภทไหน (กล่าวหา, ลดทอนความเป็นมนุษย์, โจมตีผู้หญิงและเด็ก ฯลฯ) ดังนั้น เราจึงตั้ง Column ใหม่สำหรับประเภทข้อความ อาจกำหนดชื่อ Column ว่า Type

จากนั้น ให้อ่านข้อความทีละข้อความ และลงข้อมูลประเภทข้อความใน Column นั้น โดยควรกำหนดคำที่จะลงไว้ล่วงหน้า ให้เป็นคำที่เป็นมาตรฐาน เพื่อให้ข้อมูลที่มีลักษณะเดียวกันใช้คำเดียวกันใน Column นี้ เช่น หากข้อความมีลักษณะเป็นการลดทอนความเป็นมนุษย์ กำหนดให้ใช้คำว่า Dehumanization ก็ให้ใช้คำนี้เสมอ โดยระวังการสะกด การใช้ตัวเล็กใหญ่ การเว้นวรรค ต้องให้เหมือนกันทั้งหมด เพื่อให้เวลาใช้เทคนิคการ Sort หรือ Pivot table ระบบจะเรียงหรือรวมกลุ่มข้อมูลที่มีค่าเดียวกันได้อย่างถูกต้อง

กิจกรรม

หากท่านมีชุดข้อมูลที่เก็บมาได้ ลองพิจารณาว่า เพื่อให้ข้อมูลที่เก็บมาสามารถนำไปวิเคราะห์ตามเป้าหมายได้ ท่านจะต้องติดป้ายคำเรื่องอะไรเพิ่มเติมในข้อมูล และมีตัวเลือกอะไรบ้าง ตัวอย่างเช่น ติดป้ายคำว่าข้อความนี้เป็นหรือไม่เป็นข้อความอันตราย โดยตั้ง Column "dangerous_speech" ซึ่งมีตัวเลือก "true" หรือ "false" จากนั้นอ่านข้อความทีละข้อความแล้วติดป้ายโดยใช้ตัวเลือกที่กำหนด ในระหว่างติดป้าย ลองพิจารณาว่าพบปัญหาหรือความท้าทายอะไรบ้าง ท่านอาจพบว่า บางข้อความไม่แน่ใจว่าควรติดป้ายไหน หรือต้องใช้เวลาอ่านข้อความมากเกินไป เป็นต้น แล้วลองคิดว่าจะแก้ปัญหานั้นอย่างไร


สารบัญ

การวิเคราะห์ข้อมูลโซเชียลมีเดียสำหรับผู้เริ่มต้น Module 1 : พื้นฐาน ขั้นตอนการเก็บและวิเคราะห์ข้อมูลโซเชียลมีเดีย ตัวอย่างโครงการวิเคราะห์ข้อมูล Module 2 : รายละเอียดของแต่ละขั้นตอนในการเก็บและวิเคราะห์ข้อมูล กำหนดเป้าหมายการวิเคราะห์ (Goal setting) เก็บข้อมูล (Data collection) เครื่องมือเก็บข้อมูล (Data collection tools) ทางเลือกอื่นในการเก็บข้อมูล (Alternative methods to collect data) วิเคราะห์ข้อมูล (Data analysis) ดำเนินการตามผลการวิเคราะห์ (Taking actions) Module 3 : เทคนิคการวิเคราะห์ข้อมูล เทคนิคการเรียงลำดับข้อมูลแบบพื้นฐาน (Basic sorting) เทคนิคการเรียงลำดับข้อมูลแบบกำหนดเอง (Custom sorting) เทคนิคการติดป้ายคำให้ข้อมูล (Data labelling) หากข้อมูลมีจำนวนมาก อ่านไม่ไหว จะทำอย่างไร? เทคนิคการรวมกลุ่มแล้วนับข้อความในกลุ่ม (Data grouping and counting, or pivot table)