คอร์ส การวิเคราะห์ข้อมูลโซเชียลมีเดียสำหรับผู้เริ่มต้น
โมดูลที่ 3 - Module 3 : เทคนิคการวิเคราะห์ข้อมูล
บทเรียนที่ 3 - เทคนิคการติดป้ายคำให้ข้อมูล (Data labelling)
การติดป้ายคำให้ข้อมูล คือการเพิ่ม Column ในโครงสร้างข้อมูล แล้วใส่ค่าลงไปใน Column นั้น เพื่อให้ข้อมูลแต่ละรายการมี Column ที่เพิ่มมิติให้กับการวิเคราะห์
ตัวอย่างเช่น ในข้อความ Dangerous speech เราอาจต้องการจำแนกว่าแต่ละข้อความเป็น Dangerous speech ประเภทไหน (กล่าวหา, ลดทอนความเป็นมนุษย์, โจมตีผู้หญิงและเด็ก ฯลฯ) ดังนั้น เราจึงตั้ง Column ใหม่สำหรับประเภทข้อความ อาจกำหนดชื่อ Column ว่า Type
จากนั้น ให้อ่านข้อความทีละข้อความ และลงข้อมูลประเภทข้อความใน Column นั้น โดยควรกำหนดคำที่จะลงไว้ล่วงหน้า ให้เป็นคำที่เป็นมาตรฐาน เพื่อให้ข้อมูลที่มีลักษณะเดียวกันใช้คำเดียวกันใน Column นี้ เช่น หากข้อความมีลักษณะเป็นการลดทอนความเป็นมนุษย์ กำหนดให้ใช้คำว่า Dehumanization ก็ให้ใช้คำนี้เสมอ โดยระวังการสะกด การใช้ตัวเล็กใหญ่ การเว้นวรรค ต้องให้เหมือนกันทั้งหมด เพื่อให้เวลาใช้เทคนิคการ Sort หรือ Pivot table ระบบจะเรียงหรือรวมกลุ่มข้อมูลที่มีค่าเดียวกันได้อย่างถูกต้อง
กิจกรรม
หากท่านมีชุดข้อมูลที่เก็บมาได้ ลองพิจารณาว่า เพื่อให้ข้อมูลที่เก็บมาสามารถนำไปวิเคราะห์ตามเป้าหมายได้ ท่านจะต้องติดป้ายคำเรื่องอะไรเพิ่มเติมในข้อมูล และมีตัวเลือกอะไรบ้าง ตัวอย่างเช่น ติดป้ายคำว่าข้อความนี้เป็นหรือไม่เป็นข้อความอันตราย โดยตั้ง Column "dangerous_speech" ซึ่งมีตัวเลือก "true" หรือ "false" จากนั้นอ่านข้อความทีละข้อความแล้วติดป้ายโดยใช้ตัวเลือกที่กำหนด ในระหว่างติดป้าย ลองพิจารณาว่าพบปัญหาหรือความท้าทายอะไรบ้าง ท่านอาจพบว่า บางข้อความไม่แน่ใจว่าควรติดป้ายไหน หรือต้องใช้เวลาอ่านข้อความมากเกินไป เป็นต้น แล้วลองคิดว่าจะแก้ปัญหานั้นอย่างไร