دانشمندان داده‌ها در عرض ۱۰ سال آینده منقرض خواهند شد.

شکل ۱. انقراض دانشمندان علم داده
شکل ۱. انقراض دانشمندان علم داده
منتشر شده در towardsdatascienceبه ‌تاریخ ۱۰ می ۲۰۲۱
لینک منبع: Data Scientists Will be Extinct in 10 Years

همانطور که پیشرفت در هوش مصنوعی به پیشرفت در جهت‌ها و کران‌ها ادامه می‌دهد، دسترسی به علم داده در پایه ۱ evel به طور فزاینده‌ای دموکراتیک شده‌است. موانع ورود سنتی به این زمینه مانند کمبود داده و قدرت محاسبات با عرضه مداوم استارت آپ های جدید داده (برخی از آنها دسترسی به اندازه یک فنجان قهوه در روز را فراهم می کنند) و تمام محاسبات ابری قدرتمند نیاز به سخت‌افزار گران‌قیمت در محل را از بین می‌برند. درک سه‌گانه پیش‌نیازها، مهارت و دانش برای پیاده‌سازی مسلما تبدیل به فراگیرترین جنبه علم داده شده‌است. برای پیدا کردن آموزش‌های آنلاین مانند «اجرای مدل X در عرض چند ثانیه»، و «استفاده از روش Z برای داده‌های خود تنها در چند خط از کد»، نیازی نیست به دور نگاه کنید.

در دنیای دیجیتال، لذت آنی به عنوان نام بازی تبدیل شده‌است. در حالی که بهبود دسترسی بر ارزش صوری مضر نیست، در زیر آرایه خیره‌کننده کتابخانه‌های نرم‌افزاری و مدل‌های جدید درخشان، هدف واقعی علم داده مبهم شده و گاهی حتی فراموش شده‌است. چرا که اجرای مدل‌های پیچیده به منظور انجام این کار و یا بهینه‌سازی یک معیار عملکرد دلخواه نیست، بلکه به عنوان ابزاری برای حل مشکلات دنیای واقعی استفاده می‌شود.

یک مثال ساده اما قابل‌اتکا، مجموعه داده Iris است. چند نفر از آن برای نشان دادن یک الگوریتم استفاده کرده‌اند بدون این که از فکر کردن به این که یک دیواره چیست صرف‌نظر از این که چرا ما طول آن را اندازه می‌گیریم؟ در حالی که این موارد ممکن است به عنوان ملاحظات جزئی برای پزشک در حال شکوفایی که ممکن است بیشتر به اضافه کردن یک مدل جدید به مجموعه خود علاقه‌مند باشد، به نظر برسد، برای ادگار اندرسون، گیاه‌شناس، که ویژگی‌های مورد نظر را برای درک تغییرات در گل‌های Iris فهرست کرده بود، کم‌تر بی‌اهمیت بود.

با وجود این که این یک مثال ساختگی است، یک نقطه ساده را نشان می‌دهد؛ جریان اصلی بیشتر بر «انجام» علم داده تمرکز کرده‌است تا «استفاده» از علم داده. با این حال، این عدم همترازی علت کاهش تعداد دانشمند داده نیست بلکه یک نشانه است. برای درک منشا مشکل، ما باید به عقب گام برداریم و یک دید کلی داشته باشیم.

مطالعه مقاله برنامه راهنما برای یادگیری علوم داده در ۲۰۲۱ توصیه می‌شود.

علم داده این تمایز عجیب را دارد که یکی از معدود زمینه‌های مطالعاتی است که پزشک را بدون دامنه باقی می‌گذارد. دانشجویان داروسازی تبدیل به داروساز می‌شوند، دانشجویان حقوق تبدیل به وکیل می‌شوند، دانشجویان حسابداری تبدیل به حسابدار می‌شوند. بنابراین دانشجویان علم داده باید تبدیل به دانشمندان داده شوند؟ اما دانشمندان داده چه چیزی؟

کاربرد گسترده علم داده یک شمشیر دولبه است. از یک طرف، این یک جعبه‌ابزار قدرتمند است که می‌تواند در هر صنعتی که در آن داده‌ها تولید و ثبت می‌شوند، به کار گرفته شود. از سوی دیگر، کاربرد کلی این ابزارها به این معنی است که به ندرت کاربر دانش دامنه واقعی از صنایع مذکور را قبل از حقیقت خواهد داشت. با این وجود، این مشکل در طول ظهور علم داده ناچیز بود، چرا که کارفرمایان برای مهار این فناوری نوظهور بدون درک کامل اینکه چه بوده و چگونه می‌توان آن را به طور کامل در شرکت آن‌ها ادغام کرد، هجوم آوردند.

با این حال، تقریبا یک دهه بعد، هم کسب‌و‌کارها و هم محیطی که در آن فعالیت می‌کنند، تکامل‌یافته‌اند. آن‌ها اکنون در تلاش برای بلوغ علم داده با تیم‌های بزرگی هستند که با استانداردهای صنعتی تایید شده جایگزین شده‌اند. تقاضای استخدام فوری به سمت حل‌کنندگان مشکل و متفکران انتقادی تغییر کرده‌است که کسب‌وکار، صنعت مربوطه و همچنین سهامداران آن را درک می‌کنند.

دیگر توانایی پیمایش در چند بسته نرم‌افزاری یا جابجایی چند خط کد کافی نخواهد بود و همچنین یک کارشناس علم داده با توانایی کدگذاری تعریف نخواهد شد. این امر با افزایش محبوبیت هیچ کد، راه‌حل‌های اتوML مانند Data Robot، سریع مینر و آلترکس نشان داده می‌شود.

ممکن است علاقه‌مند به مطالعه ۲۰ تارنمای برتر برای علم داده و یادگیری ماشینی در سال ۲۰۲۰ باشید.

این چه معنایی دارد؟

دانشمندان داده در طی ۱۰ سال منقرض خواهند شد (دادن یا گرفتن)، یا حداقل عنوان نقش خواهد بود. با حرکت رو به جلو، مجموعه مهارتی که در مجموع به عنوان علم داده شناخته می‌شود، توسط نسل جدیدی از متخصصان کسب‌وکار آگاه به داده و متخصصان موضوعی که قادر به تحلیل با دانش دامنه عمیق خود، صرف‌نظر از اینکه آیا می‌توانند کد بنویسند یا خیر، هستند، شناخته می‌شود.. عناوین آن‌ها تخصص آن‌ها را منعکس خواهد کرد به جای اینکه به وسیله آن نشان دهند، متخصصان، مدیران محصول یا تحلیلگران سرمایه‌گذاری باشند.

نیازی نیست به گذشته نگاه کنیم تا سوابق تاریخی را بیابیم. در طول ظهور این صفحه گسترده، متخصصان ورودی داده بسیار مشتاق بودند، اما امروزه، همان طور که کول ناسبومر کنفلیک (نویسنده کتاب «Storytelling With Data») به خوبی مشاهده می‌کند، مهارت در مجموعه مایکروسافت آفیس یک حداقل است. قبل از آن، توانایی تایپ با ماشین تحریر یک مهارت تخصصی در نظر گرفته می‌شد، با این حال با در دسترس بودن محاسبات شخصی نیز در نظر گرفته‌شده‌است.

در نهایت، برای کسانی که یک شغل را در علم داده‌ها در نظر می‌گیرند و یا شروع به مطالعه خود می‌کنند، ممکن است به خوبی به شما کمک کند که به طور مداوم به نمودار Venn که بدون شک با آن روبرو خواهید شد، مراجعه کنید. علم داده را به عنوان تلاقی آمار، برنامه‌نویسی و دانش دامنه توصیف می‌کند. علی‌رغم اینکه هر کدام سهم برابری از منطقه متقاطع را اشغال می‌کنند، برخی ممکن است وزن بالاتری نسبت به دیگران داشته باشند.

تذکر: دیدگاه‌ها براساس مشاهدات و تجربیات شخصی من هستند.

این متن با استفاده از ربات ترجمه مقالات علم داده ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.