پرستو هدایتی
پرستو هدایتی
خواندن ۳ دقیقه·۳ سال پیش

گپی در مورد تحلیل داده ها

دوستان سلام

امروز میخوام راجع به موضوعی صحبت کنم که تا به حال کمتر ازش شنیده باشین ، " تحلیل داده ها " .

تحلیل داده به فرآیند جمع آوری و تجزیه و تحلیل داده ها، مدلسازی و بهینه سازی هستش که برای پیدا کردن اطلاعات سودمند و مفید برای تصمیم گیری درست ، گفته میشه. و اهمیت بسیار زیادی داره. امروزه در علوم مختلفی مثل اقتصاد ، علوم پزشکی ، بازاریابی و ... استفاده میشه.

در حقیقت کار به صورت جمع آوری داده ها و مدلسازی برای اونهاست.


باهم یک مثال کوچیک از یکی از کاربرد های تحلیل داده در کسب و کار ها میزنیم تا با فرآيند کار آشنا بشید.

یک فروشگاه اینترنتی در نظر بگیرید که تازه شروع به کار کرده و تعدادی محصول برای فروش داخل سایت قرار داده. حالا به دنبال پرفروش ترین و محبوب ترین کالاها برای کاربرهای اینترنت میگرده تا محصولات جدیدی که قراره به لیست فروشش اضافه بشه ، سود خوبی برای کارش داشته باشه.

اینترنت بسیار فضای گسترده و بزرگیه و هرچقدر جلو تر میریم تعداد کاربر ها هرروز بیشتر از قبل میشه، پس اگر بخوایم به صورت دستی در اینترنت و فروشگاه ها بچرخیم تا پیدا کنیم چه محصولی با چه برندی میتونه محصول محبوب فروشگاه بشه ، تقریبا روز ها و ماه ها و ساعتها از ما زمان میگیره. درصد خطا بالاست و در تمام مدتی که مشغول جمع کردن اطلاعات هستیم تغییرات زیادی تو داده های قبلی اتفاق افتاده باشه.

راه حل چیه؟

استفاده از ابزار های تحلیل داده ، به این صورت که برنامه ی ما اول در سطح اینترنت اطلاعات رو جمع آوری میکنه. در مراحل بعدی داده های جمع آوری شده پاکسازی، ساماندهی شده و آماده برای تحلیل و بهینه سازی هستن.

پاکسازی داده ها یعنی بیایم اطلاعاتی که با توجه به هدفمون جمع کردیم رو از اطلاعاتی که ممکنه به کارمون نیاد و بدردمون نخوره رو پاک کنیم. مثلا یک لیستی از افراد جمع کردیم که شامل اسم و فامیلی و سن و شماره تماس و شغل و حقوق ، محل زندگی ، تعداد خواهر و برادر ها ، تعداد فرزندان و ... هستش و ما میخوایم نموداری بسازیم از افراد که نشون بده درآمد هر شغل در ماه و سال چقدره و باهم مقایسه کنیم.

میبینید که یک سری اطلاعات داریم که به درد ما نمیخوره مثل تعداد خواهر و برادر ها و یا تعداد فرزند ها پس میایم این بخش هارو از دیتامون پاک میکنیم. در واقع داده ای که داریم رو پاکسازی میکنیم.

ساماندهی شدن داده ها هم یعنی مرتب کردن و لیست کردن داده ها در یک فرمت مشخص.

برگردیم سر مثال اصلیمون!

حالا داده ی ما آمادست! باید نشون بدیم که در اینترنت برای هر نوع کالا با هر برندی چقدر فروش داشتیم، چند نفر راضی و چند نفر ناراضی بودند ، محبوب ترین، پر فروش ترین، گرون ترین ، ارزون ترین کالا در فروشگاه های اینترنتی رو روی یک نمودار مصور سازی میکنیم.

حالا کسی که مسئول یا رئیس فروشگاهمون بود ، با دیدن نمودار و نتای مدل ساخته شده متوجه میشه که با فروش کدوم محصول میتونه سود بهتری داشته باشه.

متوجه مسیر کارمون شدین؟

مرحله اول : "انتخاب هدف" یعنی مشخص کنیم که دقیقا کجا به دنبال چه چیزی هستیم.

مرحله دوم : "جمع آوری داده ها "

مرحله سوم : "ساماندهی داده ها"

مرحله چهارم : "پاکسازی داده ها"

مرحله پنجم : " تجزیه و تحلیل" برای درک کردن داده هاست و با اعمالی مثل مصور سازی گرافیکی یا رسم نمودار انجام میشه.

مرحله ششم‌ : " مدلسازی " برای داده ها مدلی ساخته می شه تا بهینه ترین حالت ممکن رو مشخص کنه.

مرحله هفتم : " مشخص کردن و اعلام نتایج مدلسازی "


ما باهم یک مثال خیلی ساده و کوچیک بررسی کردیم. اما تحلیل داده کاربرد های بیشتر و بزرگتری در یادگیری ماشین و هوش مصنوعی داره.

اگر مطلب رو دوست داشتید علاقه داشتید بیشتر در مورد خود تحلیل داده و ماشین لرنینگ و نحوه یادگیریشون صحبت کنیم برام توی نظرات بنویسید.

خیلی خوشحال میشم از اینکه نظراتتونو درباره ی این موضوع بدونم. پس حتما برام به اشتراک بزارید.


روزتون بخیر رفقا خوش باشین.


برنامه نویسیتحلیل دادهdata analysisکسب و کارهوش مصنوعی
مدتیه که برنامه نویسی میکنم و نظرم اینه هر روز باید بیشتر از دیروز یاد گرفت تا بشه پیشرفت کرد.
شاید از این پست‌ها خوشتان بیاید