مصورسازی داده ها


یکی از مهارت های مهم تحلیل گران داده مصور سازی داده ها یا Data visualization هست.

راستش همیشه برای من سوال بود که چه نموداری کجا استفاده میشه؟

از هرکسی هم می پرسیدم می گفتند: به مرور زمان که با داده ها کار کنم متوجه خواهم شد!

نوشته امروز برداشت های من از صحبت های آقای Graham Malcolm در همین رابطه است.





هدف از مصورسازی داده ها یا Data visualization چیست؟

  • درک بهتر داده ها
  • ارزیابی داده ها

چند نمونه از مهم ترین نمودار ها

یک : Bar chart ها

نمودار های Bar chart به منظور مقایسه دسته ها (کتگوری ها) می‌باشد. به عنوان مثال نمودار زیر به ما می گوید چه کلاسی چه تعداد دانش آموز دارد؟


دو : histogram ها

همان Bar chart است با این تفاوت که به منظور مقایسه bin ها استفاده می‌گردد. (bin ها همان بازه های عددی در نمودار زیر هستند. کتگوری نیستند!) به عنوان مثال نمودار زیر نحوه توزیع نمرات دانش آموزان را نشان می دهد. بیشترین تعداد نمرات بین 43 تا 54 می‌باشد.


سه : Pie chart ها

محبوب ترین نمودار در بین مدیران بیزینس ها است و روشی برای مقایسه دسته ها (کتگوری ها) به صورت درصدی (نسبی) می باشد. به عنوان مثال در نمودار زیر 60 درصد دانش آموزان جنسیت مرد و مابقی جنسیت زن می‌باشند.


چهار : Scatterplot ها

این نمودارها به منظور یافتن ارتباط بین فیلد ها است. به عنوان مثال نمودار زیر نشان دهنده ارتباط بین ساعت مطالعه و نمره دانش آموز است. براساس نمودار چنانچه دانش آموزان زمان مطالعه بیشتری صرف نمایند، نمره خوبی خواهند گرفت.


پنج : Line chart ها

این نمودارها برای نمایش و ارزیابی روند یک فعالیت در بازه های زمانی مختلف است. به عنوان مثال در نمودار زیر روند ثبت نام دانش آموزان به صورت ماهانه را نمایش می دهد.

براساس نمودار زیر می فهمیم میزان ثبت نام دانش آموزان در ماه دوم کم تر از ماه اول است و بیشترین میزان ثبت نام مربوط به ماه 4 می‌باشد.


امیدوارم نوشته امروز همانطور که برای من مفید بود برای نیز مفید بوده باشد.

از همراهیتان صمیمانه سپاسگزارم ...