چرا شما احتمالا (هنوز) نیازی به استخدام یک دانشمند داده ندارید

منتشر‌شده در towardsdatascience به تاریخ ۲۴ آگوست ۲۰۲۱
لینک منبع Why you probably don’t need to hire a Data Scientist (yet)

مقدمه

به عنوان یک مهندس یادگیری ماشینی، متوجه شدم که مسئولیت‌های دقیق در میان عناوین داده‌ها به طور مداوم در طول چند سال گذشته در حال تغییر بوده‌است. این به این معنی است که هر شرکتی دیگر در مورد تفاوت بین تمام نقش‌های داده مطمئن نیست، که می‌تواند منجر به تناسب اشتباه برای این نقش شود، به خصوص در شرکت‌های نوپا یا شرکت‌های مرحله اولیه. در این مقاله ما بررسی خواهیم کرد که چرا، مگر این که شما یک علم داده دقیق یا پروژه یادگیری ماشینی در ذهن داشته باشید، ممکن است درست نباشد که دانشمندان داده را در ابتدا استخدام کنید.

بنابراین به این نتیجه رسیده‌اید که باید برگرفته از داده باشید، اگر تنها برای باز کردن تابع‌های چندگانه در میان سوالات کسب‌وکار که تنها می‌تواند توسط تحلیلگران (یا یک تیم کامل از آن‌ها) پاسخ داده شود.

این نقطه‌ای است که کسب‌وکار تصمیم می‌گیرد گروهی از دانشمندان داده را برای حل تمام نیازهای کسب‌وکار استخدام کند. به هر حال، دانشمندان داده جذاب‌ترین محصولات داده در بازار هستند، که قادر به حل مشکلات با استفاده از آمار و یادگیری ماشینی هستند. آن‌ها قادر خواهند بود به تمام سوالات کسب‌وکار پاسخ دهند و شرکت را به یک شرکت داده محور تبدیل کنند … درست است؟

بله و نه.

نقشه راه داده

مساله کلیدی با استخدام دانشمندان داده برای حل همه مشکلات داده شما این است که «داده» شامل طیف گسترده‌ای از مهارت‌ها، از پرس و جو داده، تا ایجاد پایپ‌لاین و ساخت مدل‌های یادگیری ماشینی است. بعید است که یک دانشمند داده واحد تمام این مهارت‌ها را داشته باشد، و اگر این کار را انجام دهد، قطعا فرصت توسعه مهارت‌ها به عمق یک متخصص را نخواهد داشت (البته مگر این که شما یک دانشمند داده افسانه‌ای تک‌شاخ پیدا کرده باشید).

مگر اینکه محصولی با محوریت هوش مصنوعی داشته باشید، برای اکثر شرکت‌ها توانایی تصمیم‌گیری تجاری با سرعت بالا با جمع آوری اعداد و پاسخ به سوالات علت و معلولی بسیار مهم‌تر از صرف ماه‌ها برای توسعه یک مدل یادگیری ماشینی است. بنابراین، یک نقشه راه داده محور سطح بالا در سطح سازمانی می‌تواند به سه مرحله اصلی تقسیم شود:

  1. داشبوربورد و KPI ها (تصمیم‌گیری واکنشی)-سهام‌داران کسب‌وکار را قادر می‌سازد تا براساس داده‌ها تصمیم‌گیری کنند.
  2. توصیه‌های استراتژی (تصمیم‌گیری فعال)-محرک ارزش با ارائه توصیه‌های کسب‌وکار براساس تجزیه و تحلیل فعال داده‌ها
  3. یادگیری ماشینی و اتوماسیون-فرآیندهای خودکار و ارائه توصیه‌های تجاری براساس پیش‌بینی‌های مدل

این عناوین شغلی معمول مورد نیاز برای هر مرحله است (در سال ۲۰۲۱) ، توجه داشته باشید که مهارت‌های یادگیری ماشینی / علم داده تنها در مرحله ۳ مورد نیاز است:

  1. مهندس داده (پایپ‌لاین داده)، مهندس تحلیل (جداول تبدیل‌شده)، تحلیلگر داده (داشبورد)
  2. تحلیلگر داده / دانشمند داده (کار با ذینفعان)
  3. دانشمند داده / مهندس یادگیری ماشینی (یادگیری ماشینی / توسعه مدل آماری)

مجموعه مهارت مناسب

بنابراین آیا تنها استخدام دانشمندان داده می‌تواند به همه سوالات کسب‌وکار پاسخ دهد و شرکت را به یک شرکت داده محور تبدیل کند؟

تا حدی، بسیاری از دانشمندان داده این توانایی را دارند که چندین نقش را در جعبه‌ابزار خود پوشش دهند. تکنیک‌های پاک‌سازی داده‌ها، تحولات جدول، و تجزیه و تحلیل‌ها می‌دانند که چگونه هم استراتژی و هم داشبورد را انجام دهند، تنها چند نمونه از این موارد هستند. با این حال، آن‌ها ممکن است تجربه زیادی از سازماندهی پایپ‌لاین داده‌ها به عنوان یک مهندس داده، طراحی جداول عادی به عنوان یک مهندس تجزیه و تحلیل، یا کار با ذینفعان به عنوان یک تحلیلگر داده نداشته باشند. همه چیز در مورد پیدا کردن مهارت مناسب برای آنچه که نقش نیاز دارد است، به جای پیدا کردن کسی که بتواند تمام نقش‌ها را پوشش دهد (اما قادر نخواهد بود در یک زمان در ۳ مکان باشد).

این بدان معنا نیست که دانشمندان داده را قبل از مرحله ۲ نقشه راه استخدام نکنید، بسیاری از آن‌ها بسیار با استعداد هستند و قادر خواهند بود تا پروژه‌ها را با ارزش زیاد پیش ببرند. فقط اگر شما یک دانشمند داده را استخدام کنید تا به تنهایی کار یک مهندس داده یا یک تحلیلگر داده را انجام دهد، احتمالا متوجه خواهید شد که آن‌ها به سرعت ناراضی می‌شوند. آن‌ها ممکن است نخواهند روی پرس‌وجوهای SQL تک کاره یا بهبود قابلیت اطمینان داده‌ها کار کنند. ناگفته نماند، دانشمندان داده‌ای که می شناسم دوست دارند قابلیت‌های آماری و یادگیری ماشینی خود را در کار خود تقویت کنند، زیرا این چیزی است که آنها بیشتر در این زمینه از آن لذت می‌برند.

نتیجه‌گیری

ظهور علم داده و افزایش مداوم عناوین داده در چند سال گذشته باعث شده است که شرکت‌ها مشتاق شوند تا دانشمندان داده را برای پوشش تمام نیازهای داده خود استخدام کنند. شرکت‌ها (به ویژه آنهایی که در مراحل اولیه هستند) ارزش بیشتری را برای تعیین مرحله نقشه راه مبتنی بر داده که در حال حاضر در آن قرار دارند پیدا می‌کنند، سپس به نقش‌های مختلف داده‌ها عمیق‌تر می‌پردازند تا دریابند که به چه مهارت‌هایی نیاز دارند. هنگامی که پروژه‌های علم داده و یادگیری ماشینی ۲ سال در آینده هستند، یک دانشمند داده را استخدام نکنید تا نقش مهندس داده را بر عهده بگیرد.

این متن با استفاده از ربات ترجمه مقالات علم داده ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.