دوستان سلام
امروز میخوام راجع به موضوعی صحبت کنم که تا به حال کمتر ازش شنیده باشین ، " تحلیل داده ها " .
تحلیل داده به فرآیند جمع آوری و تجزیه و تحلیل داده ها، مدلسازی و بهینه سازی هستش که برای پیدا کردن اطلاعات سودمند و مفید برای تصمیم گیری درست ، گفته میشه. و اهمیت بسیار زیادی داره. امروزه در علوم مختلفی مثل اقتصاد ، علوم پزشکی ، بازاریابی و ... استفاده میشه.
در حقیقت کار به صورت جمع آوری داده ها و مدلسازی برای اونهاست.
باهم یک مثال کوچیک از یکی از کاربرد های تحلیل داده در کسب و کار ها میزنیم تا با فرآيند کار آشنا بشید.
یک فروشگاه اینترنتی در نظر بگیرید که تازه شروع به کار کرده و تعدادی محصول برای فروش داخل سایت قرار داده. حالا به دنبال پرفروش ترین و محبوب ترین کالاها برای کاربرهای اینترنت میگرده تا محصولات جدیدی که قراره به لیست فروشش اضافه بشه ، سود خوبی برای کارش داشته باشه.
اینترنت بسیار فضای گسترده و بزرگیه و هرچقدر جلو تر میریم تعداد کاربر ها هرروز بیشتر از قبل میشه، پس اگر بخوایم به صورت دستی در اینترنت و فروشگاه ها بچرخیم تا پیدا کنیم چه محصولی با چه برندی میتونه محصول محبوب فروشگاه بشه ، تقریبا روز ها و ماه ها و ساعتها از ما زمان میگیره. درصد خطا بالاست و در تمام مدتی که مشغول جمع کردن اطلاعات هستیم تغییرات زیادی تو داده های قبلی اتفاق افتاده باشه.
راه حل چیه؟
استفاده از ابزار های تحلیل داده ، به این صورت که برنامه ی ما اول در سطح اینترنت اطلاعات رو جمع آوری میکنه. در مراحل بعدی داده های جمع آوری شده پاکسازی، ساماندهی شده و آماده برای تحلیل و بهینه سازی هستن.
پاکسازی داده ها یعنی بیایم اطلاعاتی که با توجه به هدفمون جمع کردیم رو از اطلاعاتی که ممکنه به کارمون نیاد و بدردمون نخوره رو پاک کنیم. مثلا یک لیستی از افراد جمع کردیم که شامل اسم و فامیلی و سن و شماره تماس و شغل و حقوق ، محل زندگی ، تعداد خواهر و برادر ها ، تعداد فرزندان و ... هستش و ما میخوایم نموداری بسازیم از افراد که نشون بده درآمد هر شغل در ماه و سال چقدره و باهم مقایسه کنیم.
میبینید که یک سری اطلاعات داریم که به درد ما نمیخوره مثل تعداد خواهر و برادر ها و یا تعداد فرزند ها پس میایم این بخش هارو از دیتامون پاک میکنیم. در واقع داده ای که داریم رو پاکسازی میکنیم.
ساماندهی شدن داده ها هم یعنی مرتب کردن و لیست کردن داده ها در یک فرمت مشخص.
برگردیم سر مثال اصلیمون!
حالا داده ی ما آمادست! باید نشون بدیم که در اینترنت برای هر نوع کالا با هر برندی چقدر فروش داشتیم، چند نفر راضی و چند نفر ناراضی بودند ، محبوب ترین، پر فروش ترین، گرون ترین ، ارزون ترین کالا در فروشگاه های اینترنتی رو روی یک نمودار مصور سازی میکنیم.
حالا کسی که مسئول یا رئیس فروشگاهمون بود ، با دیدن نمودار و نتای مدل ساخته شده متوجه میشه که با فروش کدوم محصول میتونه سود بهتری داشته باشه.
متوجه مسیر کارمون شدین؟
مرحله اول : "انتخاب هدف" یعنی مشخص کنیم که دقیقا کجا به دنبال چه چیزی هستیم.
مرحله دوم : "جمع آوری داده ها "
مرحله سوم : "ساماندهی داده ها"
مرحله چهارم : "پاکسازی داده ها"
مرحله پنجم : " تجزیه و تحلیل" برای درک کردن داده هاست و با اعمالی مثل مصور سازی گرافیکی یا رسم نمودار انجام میشه.
مرحله ششم : " مدلسازی " برای داده ها مدلی ساخته می شه تا بهینه ترین حالت ممکن رو مشخص کنه.
مرحله هفتم : " مشخص کردن و اعلام نتایج مدلسازی "
ما باهم یک مثال خیلی ساده و کوچیک بررسی کردیم. اما تحلیل داده کاربرد های بیشتر و بزرگتری در یادگیری ماشین و هوش مصنوعی داره.
اگر مطلب رو دوست داشتید علاقه داشتید بیشتر در مورد خود تحلیل داده و ماشین لرنینگ و نحوه یادگیریشون صحبت کنیم برام توی نظرات بنویسید.
خیلی خوشحال میشم از اینکه نظراتتونو درباره ی این موضوع بدونم. پس حتما برام به اشتراک بزارید.
روزتون بخیر رفقا خوش باشین.