تصور شما از یک شخص با عنوان شغلی "دانشمند داده " چیست؟ احتمالاً آدمی با پیراهن یقه سفید و ظاهری خشن و سخت گیر در ذهنتان میآید. درسته؟ شاید به همین دلیل است که Harvard Business Review "دانشمند داده" را "جذابترین شغل قرن 21" نامیده است. آنها اینگونه نوشتهاند، "اگر "جذاب" به معنای داشتن ویژگی های کمیاب اما پر تقاضا باشد، دانشمند داده یکی از آنها است. استخدام آنها سخت و پرهزینه است و با توجه به بازار بسیار رقابتی برای جذب آنها، نگهداریشان دشوار است.
دانشمندان داده افرادی هستند با دانش فنی بالا که توانایی جستجو و اکتشاف در دنیای دادهها را دارند. اگرچه واژه "دانشمند داده" اخیرا یکی از محبوبترین گزینههای مورد جستجو در لینکدین برای کسانی که با داده کار می کنند بوده است؛ اما شغل جدیدی نیست. زمانی که HBR مقالهاش را منتشر کرد، هزاران دانشمند داده در استارتاپها و شرکتها مشغول به کار بودند. علاوه بر این، هوشمند سازی کامپیوترها در حد انسان، هدفی است که نزدیک به یک چهارم قرن روی آن کار شده است. دلایل مختلفی برای این که چرا اخیراً دانشمندان داده بسیار محبوب شدهاند، وجود دارد. دلیل اول این است که شرکتها سالهای زیادیست که به طور فزایندهای در حال جمعآوری داده هستند. این کار عمدتا برای شرکتهای بزرگ در زمینه تکنولوژی بسیار سودمند است. دلیل دوم به خاطر پیشرفت تکنولوژی است که جمعآوری داده را به اقتصاد پیوند زده است.
مقادیر زیادی از دادهها هم اکنون به راحتی در دسترس بوده و فقط در انتظار تحلیل هستند:
در حال حاضر، حجم عظیمی از دادهها در دسترس اکثر شرکتهای بزرگ در تمام صنایع است؛ اما بسیاری از آنها از دادهها به طور موثری استفاده نمیکنند. شرکت ها اکنون متوجه شدهاند که باید از این حجم عظیم از دادهها که از طریق پایگاه دادهایشان در دسترس است، استفاده کنند. چه مقدار داده؟ 44 تریلیون گیگابایت تا سال 2020 نسبت به تنها 4.4 تریلیون در سال 2013.
حجم و تنوع دادهها فرصتی را هم برای افرادی که مهارت استفاده از آنها را دارند و هم برای مشاغلی که میتوانند این دادهها را جمعآوری کنند ایجاد کرده است. با این حال، این صنعت با کمبود مهارت و تخصص برای برآورده کردن تقاضای فزاینده شرکتهایی که به دنبال استفاده موثر از دادههای خود هستند، مواجه است. به حدی که حتی افرادی که علوم کامپیوتر و رشتههای فنی را در دانشگاه گذراندهاند، مجبور به تحلیل دادههای مورد نیاز در محل کار می شوند.
کمبود ساختاری افراد با مهارتهای علم داده:
طبق آمار دانشگاه کالیفرنیا، ریورساید، یک سوم از صد دانشگاه برتر طبق گزارشات US News & World ، در زمینه علم داده مدرک ارائه میدهند. از میان 29 دانشگاه، تنها شش عدد دورههای کارشناسی در این زمینه را دارند، بقیه دانشگاهها فقط دارای تحصیلات تکمیلی هستند. میانگین تعداد دانشجو در یک کلاس علم داده، فقط 23 نفر است. طبق پیش بینی دانشگاه کالیفرنیا، بعید به نظر میرسد که این تعداد کم دانشجویان و این تعداد محدود از دانشگاههایی که برنامههای علم داده را ارائه می دهند بتوانند پاسخگوی نیاز به افراد متخصص در علم داده باشد. به عبارت ساده اقتصادی، تقاضا از عرضه پیشی میگیرد و در این مورد با یک حاشیه معنی دار پیشی خواهد گرفت . IBM در سال 2017 پیش بینی کرده بود که تقاضای سالانه برای دانشمندان داده، توسعهدهندگان داده (data developers) و مهندسان داده تا سال 2020 به 700،000 مورد خواهد رسید. بنابراین، یک کلاس 23 نفره و تقریباً 700 دانشجوی فارغ التحصیل از همه آن دانشگاههایی که رشته علم داده را دارند، نمیتواند پاسخگوی نیاز روزافزون برای متخصصان علم داده باشد.
در سال 2018 متوسط حقوق برای دانشمند داده سطح پایه 115000 دلار بوده است و افرادی که تیمی متشکل از 10-15 عضو را مدیریت می کردند، حقوقهایی بالغ بر 350،000 دلار دریافت کردهاند. در همین حال، متوسط تجربه کاری یک دانشمند داده از نه سال در سال 2014 به شش سال در سال 2015 کاهش یافته است. پیش بینی شده است تا سال 2019، تقاضا برای دانشمندان داده 50 درصد بیشتر از عرضه باشد. با توجه به اینکه بیشتر از 40 درصد شرکت ها اعتقاد دارند که ناتوانی آنها در جذب دانشمندان داده باعث عدم موفقیتشان در صحنه رقابت میشود، جای تعجب نیست كه بیش از 60٪ مشاغل كارمندانشان را خود آموزش دهند.
دو راه حل برای پر کردن خلاء:
دو روش اصلی برای کاهش این کمبود مهارت وجود دارد.
· راه حل اول که توسط یکی از بزرگان هوش مصنوعی به نام Andrew NG مطرح شده است، تربیت متخصصان علم داده با استفاده از روش های غیر سنتی مانندMOOCs (Massive Open Online Courses) است. اگرچه این روش برای data developers فعلی و سایر کارمندان داده محور، روش موثری برای افزایش مهارت در این زمینه است؛ اما هنوز راه حل مشکل بزرگتر نیست. من می گویم "هنوز" زیرا این اساساً نیاز به تغییر رفتار دارد. کارفرمایان هنوز برای این نوع آموزش به اندازه کافی ارزش قائل نیستند. هنوز بسیاری از کارفرمایان هنگام استخدام فقط به نام دانشگاهها نگاه میکنند. در حالی که این ذهنیت به آرامی در حال تغییر است ، اما به اندازه کافی سریع حل نخواهد شد تا بتواند این مشکل را در کوتاه مدت و میان مدت حل کند.
· راه حل دوم این است که تعداد بیشتری از افراد بدون مهارت علمی در علم داده بتوانند به راحتی از تکنیکهای پیچیده در تحلیل دادههای شرکت استفاده کنند. در حقیقت، اجازه دهید هوش مصنوعی و یادگیری ماشین خودشان، مشکلات خود را حل کنند. با استفاده از تکنیکهای توسعه یافته میتوان دانشمند داده را تقلید کرد، به طوری که حتی یک فرد غیر فنی می تواند تحلیل داده را فقط با چند خط کد یا چند کلیک انجام دهد .
این دو راه حل منحصر به فرد نیستند و به طور همزمان به شرکتها کمک میکنند تا از دادههای خود به طور موثرتری استفاده کنند. باعث صرفهجویی در هزینهها و یا باعث رشد و افزایش درآمد میشوند. برای اینكه این امر به طور موثر اتفاق بیفتد، باید تغییرات فرهنگی در سازمانها ایجاد شود که در نهایت باعث ایجاد سیاستگذاری بهتر در روند استخدام و همچنین باعث استفاده بهتر از ابزارها و نرم افزارهایی كه موجب حل بسیاری از مشكلات داده بدون نیاز به استخدام دانشمند داده میشود، خواهد گردید.