این مطلب، ترجمۀ مقاله معروف Data Scientist: The Sexiest Job of the 21st Century است که در سال 2012 در سایت مجلۀ مشهور Harvard Business Review توسط دی.جی.پاتیل و توماس اچ.داونپورت منتشر شده. با گذشت 8 سال از انتشار، این مقاله همچنان به عنوان یک مقالۀ مرجع شناخته میشه. هر چند ممکن هست که آمارها قدیمی باشه، اما به کلیت متن آسیبی نمیزنه.
خواندن این مقاله برای چه کسانی مفید است؟
حتماً برای شما هم پیش اومده که واژۀ دیتا ساینتیست رو شنیدید، اما هیچوقت دقیقاً متوجه نشدید که دیتا ساینس چیست یا دیتا ساینتیست کیست. و از طرفی شما علاقه دارید که با دیتا ساینتیست و نقشش در یک سازمان آشنا بشید، اما نمیدونید که از کجا باید شروع کنید. یا شاید شما مدیری باشید که به دنبال استخدام یک دیتا ساینتیست هستید، اما نمیدونید که سازمان شما آیا واقعاً به همچین فردی نیاز داره یا خیر. در این مقاله که توسط دو فرد مطرح این حوزه نوشته شده، شغل داغ این دهه، کامل بررسی شده و به جواب تمام سوالاتتون میرسید. از طرف دیگه، اگر هم تابحال با دیتا ساینس آشنا نبودید، این مقاله؛ به شما دید کلی از این شغل جالب و جذاب میده.
مقاله با لحن داستانی جلو میره. پس نگران خسته شدن بخاطر طولانی بودنش نباشید. :)
امیدوارم از وقتی که برای مطالعه این مقاله میذارید، لذت و استفاده کافی رو ببرید.
زمانی که جاناتان گلدمن در ژوئن سال 2006 برای پیدا کردن کار در لینکدین، وارد این شبکه اجتماعی شد؛ این سایت همانند یک استارتاپ، تازه در شروع کار خود بود. سایت لینکدین کمتر از 8 میلیون کاربر داشت و البته تعداد کاربران این شبکه اجتماعی به سرعت در حال افزایش بود؛ زیرا کاربران عضو شده، دوستان و همکاران خود را به فعالیت در این شبکه اجتماعی دعوت میکردند. با این حال، کاربران نمیخواستند با افرادی که قبلاً در سایت عضو بودند، ارتباط برقرار کنند. ظاهراً چیزی در تجربۀ اجتماعی از دست رفته بود. همانطور که یکی از مدیران لینکدین اظهار داشت: «اینگونه بود که به یک کنفرانس بروید و متوجه شوید که کسی را نمیشناسید. بنابراین شما فقط در گوشهای میایستید، در حالی که نوشیدنیتان را مینوشید و احتمالاً، کنفرانس را زود ترک میکنید.»
گلدمن، که دکترای فیزیک از دانشگاه استنفورد را در رزومه تحصیلی خود دارد، به مرور علاقهمند به پروفایلهای حرفهای کاربران شد که او را متعجب کرد. همۀ پروفایلها با دادههای کثیف و تجزیه و تحلیل نامناسب انجام میشد؛ اما با شروع جستجو در بین ارتباطات افراد با یکدیگر، او پتانسیل و امکانات این شبکه اجتماعی را دید.
او شروع به تئوریسازی، حدس زدن و یافتن الگوهایی کرد که به او امکان پیشبینی پروفایلهای مشخص در شبکه را بدهد. او تصور میکرد که ویژگیهای جدید با بهرهگیری از اکتشافاتی که در حال توسعه بود، ممکن است که برای کاربران، ارزش ایجاد کند. اما تیم مهندسی لینکدین، علاقهای به طراحی مقیاسهای چالشبرانگیز سایت نشان نداد. برخی از همکاران، آشکارا عقاید گلدمن را رد کردند.
خوشبختانه، رید هافمن، بنیانگذار و مدیرعامل لینکدین در آن زمان (که اکنون رئیس اجرایی آن است)، به دلیل تجربیات خود در سرویس پیپال (سامانه پرداخت آنلاین)، به قدرت تحلیل باور داشت و استقلال بالایی را به گلدمن داد. از طرفی، او به گلدمن ماژولهایی برای تبلیغات آنلاین کوچک بر روی صفحات وبسایتهای پرطرفدار، برای دور زدن روشهای تبلیغاتی سنتی، ارائه داد.
از طریق یکی از این ماژولها، گلدمن شروع به آزمایش کرد که چه اتفاقی میافتد؛ اگر به کاربرانی که یکدیگر را نمیشناسند، پیشنهاد ایجاد یک ارتباط باتوجه به علایق مشترکشان میکرد؛ به عنوان مثال، افرادی که در دورهای از زندگی، محل کار یکسان و یا مدرسه مشترک داشتهاند. او این کار را، با طراحی یک تبلیغ با موضوع «بهترین سه نفری که با شما بیشتر هماهنگ هستند» در پیشزمینۀ پروفایل هر کاربر لینکدین شروع کرد. طی چند روز، واضح بود که اتفاق قابل توجهی در حال وقوع است. نرخ کلیک در آن تبلیغات، بالاترین میزان دیده شده تاکنون بود! گلدمن در ادامه تصریح کرد که چگونه، پیشنهادات ایجاد شده و ایده شبکهای «رابطه متعدی» در این کار، صورت گرفته است. برای مثال، اگر شما لری و سو را میشناسید، شانس بالایی وجود دارد که لری و سو نیز با یکدیگر آشنا باشند. گلدمن و تیمش، این اقدامات، برای پاسخ به یک پیشنهاد را با یک کلیک انجام دادند.
«کمبود دیتا ساینتیستها در برخی بخشها، به یک محدودیت جدی تبدیل شده است.»
طولی نکشید که مدیران ارشد لینکدین، یک ایده خوب را شناسایی کنند و آن را تبدیل به یک ویژگی استاندارد کنند. تبلیغات «افرادی که ممکن است بشناسید»، 30% بیشتر از نرخ کلیک توسط کاربران در مقایسه با دیگر آگهیها و ویژگیهای این شرکت، کلیک شد. صفحات جدید، میلیونها بازدید برای لینکدین به ارمغان آورد. به لطف این ویژگی جدید، مسیر رشد لینکدین به طور قابل توجهی به سمت بالا تغییر کرد.
گلدمن، مثال خوبی از بازیگر اصلی و البته جدید سازمانهاست: شخصی که امروزه از آن به عنوان «دیتا ساینتیست» یا دانشمند داده نام برده میشود. دیتا ساینس، یک تخصص حرفهای همراه با کشف و کنجکاوی در دنیای دادههای بزرگ یا همان Big Data است. شاید جالب باشد که بدانید دیتا ساینتیست، تنها یک عنوان چند ساله است و قدمت آن به بیش از 12 سال حتی نمیرسد. (برای اولین بار در سال 2008 توسط دی.جی.پاتیل و جف همربارکر نامگذاری شد.) اما هزاران دیتا ساینتیست در حال حاضر مشغول به کار در استارتاپها و شرکتهای بزرگ هستند. ظهور ناگهانی آنها در صحنۀ کسبوکار، نشاندهندۀ این واقعیت است که شرکتها، اکنون در حال جنگ با اطلاعاتی هستند که در انواع و حجمهای مختلف، قبلاً با آنها روبهرو نبودهاند. اگر سازمان شما، چندین پتابایت داده را ذخیره میکند، اگر اطلاعاتی که برای تجارت شما بسیار مهم است به اشکال دیگری غیر از ردیفها و ستونهای اعداد دستهبندی میشود، یا اگر پاسخ به بزرگترین سوالات شما منجر به ترکیبشدن چندین تلاش تحلیلی میشود، شما فرصت استفاده از دادههای بزرگ را دارید!
بخش عمدهای از اشتیاق فعلی به دادههای بزرگ مبتنی بر فناوریهایی است که امکان تنظیم آنها را فراهم میسازد. از جمله آپاچی هدوپ (یک چارچوب نرمافزاری برای ذخیره و پردازش کلان دادهها) و ابزارهای نرمافزار متنباز، محاسبات ابری و مصورسازی داده. در حالیکه این پیشرفتها بسیار مهم هستند، به همان اندازه افراد با مهارت و ذهنآگاه باید وجود داشته باشد، تا از این ابزارها بتوانند استفاده کنند. در اینجا، تقاضا بالاتر از عرضه قرار دارد. در واقع، کمبود دیتا ساینتیستها در برخی بخشها، به یک محدودیت جدی تبدیل شده است. سازمان گریلاک، که یک شرکت سرمایهگذاری در مراحل اولیه و پشتیبانی شرکتهایی مانند فیسبوک، لینکدین، پالوآلتو نتورک، و ورکدی است، به اندازه کافی نگران کمبود متخصصان دیتا ساینتیست است. دن پورتیلو، میگوید: «وقتی داده داشته باشند.» او که هدایت تیم را بر عهده دارد، نظرش این است: «آنها واقعاً به افرادی احتیاج دارند که بتوانند دیتا را مدیریت کنند و درکی از آن پیدا کنند.»
اگر سرمایهگذاری در دادههای بزرگ به استخدام دیتا ساینتیستهای کمیاب بستگی دارد، پس چالش مدیران این است که یاد بگیرند؛ چگونه استعداد را شناسایی کنند، او را به سمت شرکت بکشند و از آن محصول بسازند. هیچکدام از این وظایف به اندازهای ساده نیست که با سایر نقشهای سازمانی انجام شود. با این واقعیت باید شروع کرد که هیچ مقطع تحصیلی وجود ندارد که دارای دورۀ دیتا ساینس باشد. همچنین سازمانهای کمی وجود دارند که نقش دقیق دیتا ساینتیست را در یک سازمان مشخص کند، که چگونه آنها بیشترین ارزش را خلق میکنند، و چگونه باید عملکرد آنها سنجیده شود.
بنابراین، اولین مرحله که احساس نیاز به دیتا ساینتیست دارید، درک کارکرد آنها در تجارت است. سپس بپرسید، آنها به چه مهارتهایی نیاز دارند؟ و این مهارتها در چه زمینهای یافت میشود؟
آنچه بیش از هرچیز دیتا ساینتیستها انجام میدهند، اکتشاف در هنگام شنا در دادهها است. این روش ترجیحی آنها برای پیمایش در دنیای اطراف آنها است. با سهولت در قلمرو دیجیتال، آنها قادر به شکل دادن ساختاری به دادههای بیساختار (کثیف) هستند که تجزیه و تحلیل دادهها را ممکن میسازد. دیتا ساینتیستها، منابع اطلاعاتی غنی را شناسایی میکنند، آنها را با دیگر دادههای ناقص ترکیب میکنند، و مجموعه حاصل را تمیز میکنند. در منظر رقابتی که چالشها تغییر میکند و البته دادهها هرگز متوقف نمیشوند، دیتا ساینتیستها به تصمیمگیرندگان کمک میکنند تا از تجزیه و تحلیل موقت برای یک سوال مشخص، به مکالمۀ مستقیم و مداوم با دادهها روی بیاورند.
دیتا ساینتیستها متوجه میشوند که آنها با محدودیتهای فنی روبهرو هستند، اما اجازه نمیدهند که این امر به جستجوی راه حلهای جدید پرداخته نشود. آنها وقتی کشف میکنند، با آنچه که آموختهاند؛ ارتباط برقرار میکنند و پیامدهای آن را برای مسیرهای جدید تجاری ارائه میدهند. غالباً آنها در نمایش اطلاعات بصری و ایجاد الگویی که به نظر آنها واضح و قانعکننده است، خلاق هستند. آنها به مدیریت و مدیران محصول در مورد نتایج دادهها برای محصولات، فرایندها و تصمیمگیریها مشاوره میدهند.
با توجه به وضعیت تازه تجارت آنها، اغلب به دیتا ساینتیستها پیشنهاد میشود تا ابزارهای خود را بسازند و حتی تحقیقاتی به سبک دانشگاهی انجام دهند. یاهو، یکی از شرکتهایی است که اوایل، گروهی از دیتا ساینتیستها را استخدام کرد که در توسعۀ آپاچی هدوپ نقش مهمی داشت. تیم دادۀ فیسبوک، زبان هایو را برای برنامهنویسی پروژههای هدوپ ایجاد کرد. بسیاری از دیتا ساینتیستهای دیگر، به ویژه در شرکتهای داده محور مانند گوگل، آمازون، مایکروسافت، والمارت، ایبی، لینکدین و توییتر، مجموعهای از ابزارها به آن اضافه کرده و یا بهبود بخشیدهاند.
چه شخصی، همۀ این کارها را انجام میدهد؟ چه توانایی هایی باعث موفقیت یک دیتا ساینتیست میشود؟ به او به عنوان ترکیبی از هکر داده، تحلیلگر، ارائهدهنده و یک مشاور قابل اطمینان فکر کنید. بدست آوردن این ترکیب، بسیار قدرتمند و نادر است.
اساسیترین و اصلیترین مهارت جهانی دیتا ساینتیست، توانایی نوشتن کد است. و البته ممکن است در مدت زمان کمتر از پنج سال، رسیدن به آن دستیافتنی باشد، همانطور که بسیاری از افراد عنوان «دیتا ساینتیست» را بر روی کارت ویزیتشان دارند. مهمتر از آن، نیاز دیتا ساینتیستها برای برقراری ارتباط زبانی است تا همۀ افراد، بتوانند توضیحات آنها را درک کنند - و مهارتهای ویژهای را که داستانگویی با دادهها وجود دارد، چه به صورت کلامی، بصری داشته باشند که هر دوی آنها را داشتن اگر بخواهیم ایدهآل گرایانه فکر کنیم، فوقالعاده است.
اما ما میگوییم ویژگی غالب دیتا ساینتیستها، یک کنجکاوی شدید است. تمایل رفتن به لایههای زیرین یک مشکل، یافتن سوالات در قلب مسئله، و کنار یکدیگر گذاشتن آنها در مجموعهای کاملاً واضح از فرضیههایی که بتوان آزمایش کرد. این تفکرات، اغلب نیازمند تفکر ترکیبی است که از خلاقیت دیتا ساینتیستها نشات میگیرد. به عنوان مثال، ما گروهی از دیتا ساینتیستها را میشناسیم که دربارۀ یک کلاهبرداری مطالعه میکردند و متوجه شدند که این مشکل، شبیه به توالییابی دیانای است. تیم دیتا ساینتیست، با گردهمآوردن دو دنیای کاملاً متفاوت از هم، توانستند راهحلی را تهیه کنند که بهطور چشمگیری جلوی کلاهبرداری را بگیرد.
شاید مشخص شود که چرا کلمۀ ساینتیست (دانشمند) متناسب با این نقش نوظهور است. به عنوان مثال، فیزیکدانان تجربی نیز باید تجهیزات را طراحی، دادهها را جمعآوری کنند و آزمایشهای متعددی انجام دهند و نتایج خود را توضیح دهند. بنابراین، شرکتها به دنبال استخدام افرادی هستند که میتوانند با دادههای پیچیده کار کنند، افرادی که سابقۀ تحصیلی و کاری در علوم فیزیکی یا علوم اجتماعی دارند. برخی از بهترین و قویترین دیتا ساینتیستها دارای دکترای در زمینههای اکولوژی و بیولوژی هستند. جورج روملیوتیس، رئیس یک تیم علوم داده در شرکت اینتویت واقع در سیلیکونولی است که دارای مدرک دکترای اخترفیزیک است. خیلی تعجب نمیکنیم، اگر بدانیم که بسیاری از دادههایی که امروزه دیتا ساینتیستها در آن کار میکنند به طور رسمی در علوم رایانه، ریاضیات یا اقتصاد دیده میشود. آنها میتوانند در هر زمینهای که دارای دادههای قوی و تمرکز محاسباتی باشد، بیرون بیایند.
مهم است که تصویر دیتا ساینتیست را در ذهن خود بسپارید، بخاطر اینکه کلمۀ «داده» میتواند به راحتی شما را از مسیر اصلی گمراه کند. همانطور که مایکل پورتیو گفت: «پیشینۀ سنتی مردمی که شما 10 تا 15 سال پیش دیدهاید، این روزها دیگر کافی نیست.» یک تحلیلگر کمی میتواند در تجزیه و تحلیل دادهها بسیار عالی باشد اما در جمع کردن دادههای بدون ساختار و تبدیل آن به شکلی که بتوان آن را تجزیه و تحلیل کرد، نمیتواند به همان اندازه در کارش موفق باشد. یک متخصص مدیریت داده ممکن است در تولید و سازماندهی دادهها به شکل ساختیافته بسیار عالی باشد، اما در تبدیل دادههای ساختاری به دادههای ساختیافته و همچنین تجزیه و تحلیل آنها به اندازه کافی خوب نباشد. و در حالی که افراد فاقد مهارتهای اجتماعی قوی ممکن است در حرفه دادههای سنتی شکوفا شوند، دیتا ساینتیستها باید چنین مهارتهایی را داشته باشند تا موثر واقع شوند.
روملیوتیس به واضحی گفت که او بر اساس قابلیتهای آماری یا تحلیلی، استخدام نمیشود. او برای استخدام دیتا ساینتیستها، با این سوال شروع کرد که آیا آنها میتوانند نمونههای اولیه را با یک زبان برنامهنویسی مانند جاوا توسعه دهند یا خیر. روملیوتیس به دنبال یک مجموعهای از مهارتها است. یک پایۀ قوی در ریاضی، آمار، احتمالات، علوم کامپیوتر و عادات خاصی از ذهن. او افرادی را میخواهد که نسبت به مسائل تجاری و همدلی با مشتریان احساس نگرانی کنند. او میگوید، با آموزشهای دورهای در کار و کورسهای آموزشی، همهچیز ممکن است.
چندین دانشگاه در حال برنامهریزی برای راهاندازی برنامههای تحصیلی دیتا ساینس (علوم داده) هستند و برنامههای موجود در زمینه تجزیه و تحلیل، مانند کارشناسی ارشد Science in Analytics در ایالت کارولینای شمالی، مشغول اضافه کردن تمریناتی برای کار با دادههای بزرگ هستند. برخی از شرکتها در تلاش هستند تا دیتا ساینتیستهای خود را توسعه دهند. شرکت ایامسی، پس از خرید شرکت گرینپلام؛ تصمیم گرفت که به دیتا ساینتیستهای خود اجازه دهد که از دادههای بزرگ در رابطه با مشتریان، بهره ببرند. بنابراین بخش آموزش و پرورش خود را در یک برنامۀ آموزش و صدور گواهینامه در زمینه دیتا ساینس و تجزیه تحلیل بیگ دیتا راهاندازی کرد. ایامسی، این برنامه را هم برای مشتریان و هم برای کارکنان خود در دسترس قرار داد، و برخی از فارغالتحصیلان آن در حال حاضر روی ابتکار عمل دادههای بزرگ داخلی کار میکنند.
دیتا ساینتیستها میخواهند چیزهای جدیدی بسازند، نه اینکه فقط توصیه کنند. یه بار یکی گفت که مشاور بودن، منطقۀ مرگ دیتا ساینتیستها است.
هر چه دورههای آموزشی بیشتر، راه برای کشف استعدادهای جدید نیز پیدا میشود. فروشندگان دادههای بزرگ هم در تلاش هستند تا استفاده از آنها را سادهتر کنند. در این میان، یک دیتا ساینتیست با رویکرد خلاقانهای این فاصله را کاهش داده است. برنامه دیتا ساینس، که یک دورۀ پستدکترا توسط جیک کلامکا (فیزیکدان) طراحی شده، دانشمندان را از محیط آکادمی به یک دورۀ شش هفتهای برای تبدیل شدن به یک دیتا ساینتیست موفق میبرد. این برنامه شامل مشاوره توسط کارشناسان داده از شرکتهای محلی (مانند فیسبوک، توییتر، گوگل و لینکدین) با قرار گرفتن در معرض چالشهای بزرگ دادههای واقعی است. در ابتدا، کار با 10 نفر شروع شد و در ادامه 30 نفر از 200 متقاضی برنامۀ کلامکا پذیرفته شدند. اکنون سازمانهای بیشتری نیز مشارکت دارند. کلامکا در این باره گفت: «تقاضای شرکتها شگفتانگیز بود.»، او در ادامه توضیح داد: «شرکتها فقط نمیدانند چگونه از این استعدادهای باکیفیت میتوانند استفاده کنند.»
در حالی که تقاضای برای دیتا ساینتیستها برجسته است، رقابت برای یافتن استعدادهای برتر همچنان شدید است. از داوطلبان انتظار داشته باشید که فرصتهای شغلی را بر اساس چگونگی جالب بودن چالشهای دادههای بزرگ بررسی کنند. همانطور که یکی از آنها گفت: «اگر میخواستیم با دادههای ساختاریافته کار کنیم، الان در وال استریت بودیم!» با توجه به اینکه واجدین شرایط، فرصتهای شغلی جدید را بدون پیشینه از آن فرصت شغلی بدست میآورند، ممکن است مدیران استخدام، این موضوع را مدنظر قرار دهند که چگونه تصویری هیجانانگیز میتوانند از پتانسیلهای پیشرفت مشکلات شرکت، بدست بیاورند.
دستمزد، یکی از فاکتورهاست. یک دیتا ساینتیست خوب، خیلی از درها را به روی خود باز میکند و حقوق و دستمزد رو به افزایشی دارد. چندین دیتا ساینتیست که مشغول به کار در استارتاپها هستند، اظهار داشتند که خواستار سهام شرکت هستند. حتی برای شخصی که به دلایل دیگر این شغل را انتخاب میکند، سطح احترام بالا و ارزشی که به شرکت میدهد، نشان از نقش مهم او در نقشههای تجاری شرکت است. اما بررسی غیررسمی ما از اولویت دیتا ساینتیستها چیزی مهمتر از همه را به ما نشان میدهد. آنها میخواهند «مرکز توجه» باشند.
با توجه به دشواری یافتن و نگه داشتن دیتا ساینتیستها، میتوان تصور کرد که یک استراتژی خوب، استخدام آنها به عنوان مشاور است. حتی بزرگترین شرکتها نظیر اکسنچر، دیلویت، سرویس جهانی آیبیام، در مراحل اولیه هدایت پروژههایی با دادههای بزرگ برای مشتریان هستند. مو سیگما، یکی از اولین شرکتهایی است که در رابطه با تجزیه و تحلیل شرکتها عمل میکند.
اما با دیتا ساینتیستهایی که صحبت کردیم، آنها نظرشان این است که میخواهند چیزی بسازند، نه این که فقط به تصمیمگیرنده مشاوره دهند. یکی از مشاوران، منطقۀ مرگ را اینگونه توصیف کرده است: «تمام کاری که باید بکنید این است که به بقیه بگویید تجزیه تحلیلها میگویند که چکار کنید.» با ساخت راهحلهایی که کار میکنند، آنها میتوانند تاثیرگذار باشند و میتوانند به عنوان افراد حرفهای و پیشگام این عرصه لقب بگیرند.
دیتا ساینتیستها در زمان کوتاه خوب عمل نمیکنند. آنها باید آزادی عمل برای تجربه و کشف فرصتها را داشته باشند. به روایت دیگر، آنها نیاز دارند تا یک ارتباط نزدیک با تمام بخشهای شرکت داشته باشند. مهمترین روابط و ارزش برای کارشون، کار کردن با مدیران محصول و مدیران سرویسها است تا اینکه با آدمهایی سر و کله بزنند که بر عملکردهای شرکت نظارت میکنند. همانطور که داستان جاناتان گلدمن به ما نشان داد، بزرگترین فرصت آنها برای خلق ارزش در تهیۀ گزارش یا ارائه برای مدیران ارشد نیست، بلکه در نوآوری با محصولات و فرآیندهای مشتری مداری است.
لینکدین تنها شرکتی نیست که از دیتا ساینتیستها استفاده میکند تا ایدههایی برای محصولات، ویژگیها و خدمات ارزش افزودهاش ایجاد کند. در شرکت اینتویت از دیتا ساینتیستها خواسته شد تا شروع به توسعۀ کسبوکارهای کوچک با درک مدل رفتاری مشتریان و مصرفکنندگان کنند و به معاون ارشد دادههای بزرگ، طراحی اجتماعی و بازاریابی گزارش دهند. شرکت جنرالالکتریک از قبلتر با استفاده از دیتا ساینس برای بهینهسازی قراردادهای خدماتی و نگهداری محصولات صنعتی استفاده میکند. گوگل البته، از دیتا ساینتیستها برای اصلاح اصول هستۀ جستجو و الگوریتمهای ارائهدهنده تبلیغات خود استفاده میکند. شرکت زینگا، از دیتا ساینتیستها برای بهبود تجربۀ بازی برای طولانی شدن نرخ درگیری کاربران و درآمد استفاده میکند. شرکت نتفلیکس، جایزۀ شناختهشدۀ نتفلیکس را بخاطر طراحی بهترین «سیستم توصیۀ تماشای فیلم به کاربران» را به دیتا ساینتیستها اهدا کرده است. شرکت آمادهسازی آزمون کاپلن از دیتا ساینتیستهای خود برای کشف استراتژیهای موثر یادگیری استفاده میکنند.
دیتا ساینتیستهای امروز، شبیه «تحلیلگر های کمی» وال استریت در دهه 1980 و 1990 هستند.
اگر چه، یک پتانسیل منفی در رابطه با داشتن افرادی با مهارتهایی در سطح بالا در زمینهای که به سرعت در حال تحول است، و زمانشان را با مدیران عمومی میگذارنند، وجود دارد. به علت اینکه آنها با متخصصان کمتری ارتباط خواهند داشت و از طرفی باید همیشه مهارتهای خود را به روز نگه دارند و از پیشرفتهترین مجموعه ابزارها استفاده کنند. دیتا ساینتیستها باید چه در شرکتهای بزرگ و چه در خارج از شرکت، با انجمنهای عملی ارتباط برقرار کنند. کنفرانسهای جدید و انجمنهای غیررسمی برای حمایت از همکاران و به اشتراکگذاری فناوریهای جدید در حال پیشرفت هستند و شرکتها باید دیتا ساینتیستها را ترغیب کنند که با آنها بیشتر درگیر باشند با این درک که «آب بیشتر در بندر، تمام شناورها را شناور میکند.»
وقتی از دیتا ساینتیستها انتظار بیشری دارید، آنها انگیزۀ بیشتری پیدا میکنند. چالشهای دسترسی و ساختاردهی دادههای بزرگ در بعضی اوقات، وقت و انرژی کمی را برای تجزیه و تحلیل پیشرفته شامل پیشبینی یا بهینهسازی باقی میگذارد. با این وجود، اگر مدیران اظهار کنند که گزارشهای اولیه کافی نیستند، دیتا ساینتیستها تلاش بیشتری را برای تجزیه و تحلیل پیشرفته خواهند کرد. دادهها بزرگ مساوی با مسائل سادۀ ریاضی نیستند.
معروف است که هال واریان، اقتصاددان ارشد گوگل، گفته: «شغل جذاب 10 سال آینده، آمار خواهد بود. مردم فکر میکنند که من شوخی میکنم؛ اما چه کسی فکر میکرد که مهندسی کامپیوتر شغل جذاب دهه 1990 بود؟»
اگه «جذابیت» به معنای برخورداری از خصوصیات نادری که تقاضای زیادی دارند باشد، دیتا ساینتیستها در حال حاضر همان افراد هستند. استخدام آنها دشوار و گران است و با توجه به بازار بسیار رقابتی برای خدماتشان، نگه داشتن آنها بسیار سخت است. افراد زیادی با ترکیبی از سوابق علمی و مهارتهای محاسباتی و تحلیلی وجود ندارد.
دیتا ساینتیستهای امروز، شبیه «تحلیلگر های کمی» وال استریت در دهه 1980 و 1990 هستند. در آن روزها، افراد با پیشزمینۀ فیزیک و ریاضی به فعالیت در بانکهای سرمایهگذاری و صندوقهای مالی میپرداختند؛ جایی که میتوانستند الگوریتمها و استراتژیهای کاملاً جدیدی را ابداع کنند. سپس دانشگاههای مختلف؛ دورههای کارشناسی ارشد مهندسی مالی که نسل دوم استعدادهایی که بیشتر در دسترس شرکتها بودند را توسعه داد.
در اینجا یک سوال پیش میآید. آیا برخی از شرکتها میتوانند صبر کنند تا نسل دوم دیتا ساینتیستها ظهور کنند و نامزدهای بیشمار، ارزانتر و آسانتر در یک موقعیت تجاری را پیدا کنند. چرا کارآفرینان بزرگ و شرکتهای مطرحی چون والمارت و جنرالالکتریک، برای یافتن استعدادهای دادههای بزرگ، هیچچیز جلودارشان نیست؟
مشکلی که در این استدلال وجود دارد، این است که دادهها بزرگ (بیگ دیتا)، نشانهای از کند شدن خود بروز نمیدهد. اگر شرکتها در این روزهای ابتدایی، این روند را فقط به علت کمبود استعداد متوقف کنند، خطر سقوط را میپذیرند؛ زیرا رقبا و شرکای آنها، مزایای تقریباً غیرقابل جبرانی را به دست خواهند آورد. به دادههای بزرگ (بیگ دیتا)، به عنوان یک موج خروشان نگاه کنید، که تبدیل به یک موج عظیم خواهد شد. اگر میخواهید همراه این موج باشید، به افرادی نیاز دارید که موجسواری بلد باشند.
با حمایتتون از این مقاله، دلگرمی من باشید برای ترجمههای بیشتر و خفنتر در این حوزه :) اگه میتونید جایی به اشتراک بذارید، حتماً شیر کنید و اگر کسی رو میشناسید که دنبال همچین مقالهای هست، الان وقتشه که بهش بگید اون مقالۀ خفن رو براش پیدا کردید. با لایک کردن، به هرچه بیشتر دیده شدن این پست کمک کنید. :) و در آخر، مرسی از شما که این مقاله رو به پایان رسوندید. حتماً نظرتون رو دربارۀ کموکیف ترجمه باهام در میون بذارید.