دانشمندان داده‌ها در عرض ۱۰ سال منقرض خواهند شد.

شکل۱. کاربرد گسترده علم داده یک شمشیر دولبه است
شکل۱. کاربرد گسترده علم داده یک شمشیر دولبه است

همانطور که پیشرفت در هوش مصنوعی به پیشرفتی سریع و چشم‌گیر ادامه می‌دهد، دسترسی به علم داده در سطح پایه به طور فزاینده‌ای دموکراتیک شده‌است. موانع ورودی سنتی در این زمینه مانند کمبود داده و قدرت محاسبه با عرضه مداوم شرکت‌های نوبنیان داده جدید کنار گذاشته شده‌اند (برخی از آنها دسترسی به اندازه یک فنجان قهوه در روز را فراهم می‌کنند) و تمام محاسبات ابری قدرتمند نیاز به سخت‌افزار گران‌قیمت در محل را از بین می‌برند. گردآوری درک سه‌گانه پیش‌نیازها، مهارت و دانش برای پیاده‌سازی است، که مسلما تبدیل به فراگیرترین جنبه علم داده شده‌است. برای پیدا کردن آموزش‌های آنلاین مانند «اجرای مدل X در عرض چند ثانیه»، «استفاده از روش Z برای داده‌های خود تنها در چند خط از کد»، نیازی نیست به دور نگاه کنید. در دنیای دیجیتالی، لذت آنی به نام بازی تبدیل شده‌است. در حالی که بهبود دسترسی بر ارزش صوری مضر نیست، در زیر آرایه خیره‌کننده کتابخانه‌های نرم‌افزاری و مدل‌های جدید درخشان، هدف واقعی علم داده مبهم شده و گاهی حتی فراموش شده‌است. چرا که اجرای مدل‌های پیچیده به منظور انجام این کار و یا بهینه‌سازی یک معیار عملکرد دلخواه نیست، بلکه به عنوان ابزاری برای حل مشکلات دنیای واقعی استفاده می‌شود.

یک مثال ساده اما قابل‌اتکا، مجموعه داده Iris است. چند نفر از آن برای نشان دادن یک الگوریتم استفاده کرده‌اند بدون فکر کردن به این که یک دیواره چیست صرف‌نظر از این که چرا ما طول آن را اندازه می‌گیریم؟ در حالی که این موارد ممکن است به عنوان ملاحظات جزئی برای پزشک تازه واردی که ممکن است بیشتر به اضافه کردن یک مدل جدید به مجموعه خود علاقه‌مند باشد، به نظر برسد، برای ادگار اندرسون، گیاه‌شناس، که ویژگی‌های مورد نظر را برای درک تغییرات در گل‌هایIris فهرست کرده بود، کم‌تر بی‌اهمیت بود. با وجود این که این یک مثال ساختگی است، یک نقطه ساده را نشان می‌دهد؛ جریان اصلی بیشتر بر «انجام» علم داده تمرکز کرده‌است تا «استفاده» از علم داده. با این حال، این عدم همترازی علت کاهش دانشمند داده نیست بلکه یک نشانه است. برای درک منشا مشکل، ما باید به عقب گام برداریم و یک نمای چشم پرنده داشته باشیم.

علم داده این تمایز عجیب را دارد که یکی از معدود زمینه‌های مطالعاتی است که پزشک را بدون دامنه باقی می‌گذارد. دانشجویان داروسازی تبدیل به داروساز می‌شوند، دانشجویان حقوق تبدیل به وکیل می‌شوند، دانشجویان حسابداری تبدیل به حسابدار می‌شوند. بنابراین دانشجویان علم داده باید تبدیل به دانشمندان داده شوند؟ اما دانشمندان داده چه چیزی؟ کاربرد گسترده علم داده یک شمشیر دولبه است. از یک طرف، این یک جعبه‌ابزار قدرتمند است که می‌تواند در هر صنعتی که در آن داده‌ها تولید و ثبت می‌شوند، به کار گرفته شود. از سوی دیگر، کاربرد کلی این ابزارها به این معنی است که به ندرت کاربر دانش دامنه واقعی از صنایع مذکور را قبل از حقیقت خواهد داشت. با این وجود، این مشکل در طول ظهور علم داده ناچیز بود، چرا که کارفرمایان برای مهار این فن‌آوری نوظهور بدون درک کامل اینکه چه بوده و چگونه می‌توان آن را به طور کامل در شرکت آن‌ها ادغام کرد، هجوم آوردند.

با این حال، تقریبا یک دهه بعد، هم کسب و کارها و هم محیطی که در آن فعالیت می‌کنند، تکامل‌یافته‌اند. آن‌ها اکنون در تلاش برای بلوغ علم داده با تیم‌های بزرگی هستند که با استانداردهای صنعتی تایید شده جایگزین شده‌اند.

تقاضای فوری استخدام‌ها به سمت حل‌کنندگان مشکلات و متفکران مهم منتقل شده‌است که تجارت، صنعت مربوطه و همچنین سهامداران آن را درک می‌کنند.

دیگر توانایی مرور چند بسته نرم‌افزاری یا بازیابی چند خط کد کافی نیست و یک متخصص دانش داده با توانایی کدگذاری تعریف نمی‌شود.

این امر با افزایش محبوبیت بدون کد، راه‌حل‌های AutoML مانند DataRobot، RapidMiner و Alteryx مشهود است.

این چه معنایی دارد؟

دانشمندان داده در طی ۱۰ سال منقرض خواهند شد (دادن یا گرفتن)، یا حداقل عنوان نقش خواهد بود. با حرکت رو به جلو، مجموعه مهارتی که در مجموع به عنوان علم داده شناخته می‌شود، توسط نسل جدیدی از متخصصان کسب‌وکار آگاه به داده و متخصصان موضوعی که قادر به تحلیل با دانش دامنه عمیق خود، صرف‌نظر از اینکه آیا می‌توانند کد بنویسند یا خیر، هستند. عناوین آن‌ها تخصص آن‌ها را منعکس خواهد کرد به جای اینکه به وسیله آن نشان دهند، متخصصان، مدیران محصول یا تحلیلگران سرمایه‌گذاری هستند. نیازی نیست به گذشته نگاه کنیم تا سوابق تاریخی را بیابیم. در طول ظهور این صفحه گسترده، متخصصان ورودی داده بسیار مشتاق بودند، اما امروزه، همان‌طور که کول ناسبومر نفلیک (نویسنده کتاب «داستان‌سرایی با داده») به خوبی مشاهده می‌کند، مهارت در مجموعه مایکروسافت آفیس یک حداقل است. قبل از آن، توانایی دست زدن به تایپ با ماشین تحریر یک مهارت تخصصی در نظر گرفته می‌شد، با این حال با در دسترس بودن محاسبات شخصی نیز فرض شده‌است.

در نهایت، برای کسانی که یک شغل را در علم داده‌ها در نظر می‌گیرند و یا شروع به مطالعه خود می‌کنند، ممکن است به خوبی به شما کمک کند که به طور مداوم به نمودار ون که بدون شک با آن روبرو خواهید شد، مراجعه کنید. علم داده را به عنوان تلاقی آمار، برنامه‌نویسی و دانش دامنه توصیف می‌کند. علی‌رغم اینکه هر کدام سهم برابری از منطقه متقاطع را اشغال می‌کنند، برخی ممکن است وزن بالاتری نسبت به دیگران داشته باشند.

این متن با استفاده از ربات مترجم مقالات علوم داده ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.