Menu

5 เช็กลิสต์ที่ควรรู้ ! ก่อนลงมือวิเคราะห์ Data

อย่างที่หลายคนทราบดีว่างานหลัก ๆ ของคนทำข้อมูลนั้น นอกจากจะเป็นการวิเคราะห์เพื่อหา insight หลายครั้งดาต้ามันก็ไม่ได้พร้อมใช้ขนาดนั้น และนี่คือ Checklist หลัก ๆ ที่ทุกคนควรจัดการก่อนเริ่มลงมือวิเคราะห์ข้อมูล

1. Duplicate Data

เช็กก่อนว่ามีข้อมูลที่ซ้ำกันหรือไม่ ให้จัดการลบออกให้เรียบร้อยก่อน เพราะถ้าพลาดไปมันอาจจะผิดไปไกล ลองนึกถึงยอดขายวันละ 100 ล้านที่ซ้ำกัน อยู่ดี ๆ ยอดขายก้โตเป็น 100% ซะอย่างนั้น !

2. Misspellings and Typos

เช็กดูการสะกดคำว่ามีข้อมูลชุดไหนที่ควรจะเขียนเหมือนกัน แต่มันไม่เหมือนกันไหม เช่น กรุงเทพมหานคร อาจจะมีทั้ง กรุงเทพ, กทม, ก.ท.ม ถ้ามีก็ควรแก้ไขให้เหมือนกันก่อน หรือถ้าอันไหนเขียนผิดก็ควรปรับให้ถูกต้อง

3. Missing Value

เช็กดูว่ามีข้อมูลหายไปไหม อยู่ดี ๆ ก็มีเว้นว่างไปช่องนึงหรือหลายช่อง เช็กดูว่าเราไปหาข้อมูลมาใส่เติมได้ไหม ทั้งค่าจริง ๆ หรือค่าประเมิน หรือควรจะต้องลบออก เพราะทำให้การวิเคราะห์ผิดเพี้ยนไป

4. Standardize Data Formats

เช็กให้ดีว่าข้อมูลในคอลัมน์เดียวกัน มันควรจะมี format เหมือนกันแล้วหรือยัง จะตัวเลขก็ตัวเลข จะข้อความก็ข้อความ โดยเฉพาะข้อมูลประเภทวันที่ เช็กให้ดี ๆ ว่ามันอยู่ในรูปแบบเดือนกัน ไม่สลับเดือน สลับวัน กันไปมา เพราะถ้าไม่ตรงเมื่อไหร่ อาจจะ Error ตอนประมวลผลได้

5. Outliers

แวะดูซักหน่อยว่าชุดข้อมูลเรามีข้อมูลที่เป็น Outliers หรือค่าที่มันกระโดดแตกต่างจากเพื่อนอย่างมากไหม ถ้าหากว่ามีก็ควรจะลบออกกันเพื่อให้การวิเคราะห์ข้อมูลถูกต้องมากขึ้น แต่ในบางกรณีก็อาจจะไม่ได้ลบออก แต่ผู้วิเคราะห์ก็ต้องรับทราบให้ชัดเจนว่าการกระจายตัวของข้อมูลเป็นอย่างไร เพื่อการแปรผลที่ถูกต้องนั่นเอง

และนี่ก็เป็น 5 Checklists หลัก ๆ ที่ DATAHOLIC ขอแนะนำให้เพื่อน ๆ ควรทำทุกครั้งก่อนลงมือวิเคราะห์ข้อมูลนะฮะ…อะโฮ

Author

RELATED ARTICLES

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

Allow All
Manage Consent Preferences
  • Always Active

Save