چگونه ظرف ۶ ماه بدون دانش کد‌نویسی دانشمند داده شدم

تازه از ۸ سال درس خواندن و کار سخت بدون هیچ طرحی دور شده بودم. ممکنه با خودتون فکر کنید که چرا یک نفر باید این کار را بکنه. رئیسم داشت روحم رو خورد می‌کرد و می‌دونست که باید تغییر کنم.

دوست پسر من پیشنهاد کرد که دانشمند داده بشم. بهش گفتم «دیوونه شدی؟! من حتی اتدایی‌ترین چیز ها راجع به برنامه‌نویسی رو هم نمی‌دونم» مطمئنا اونچه که من قادر به انجامش بودم رو بیش از حد تخمین زده بود. سندرم دغل‌بازی دوباره شروع شد.

دو هفته بعد، دوست من آنا دقیقا همینو پیشنهاد کرد، کمی بیشتر راجع بهش فکر کردم و شروع کردم باهاش سرگرم شدن. چرا که نه؟ تصمیم گرفتم دوباره مبتدی بشم و خودم رو به عنوان یک دانشمند داده از نو بسازم.

من می‌خواستم با سرعت مورد نظر یاد بگیرم برای همین تصمیم گرفتم تو دوره‌های آنلاین شرکت کردم. به این نتیجه رسیدم که با داشتن مدرک دکترا در علوم اعصاب، احتمالا به اندازه کافی آموزش رسمی داشتم تا یک شغل علوم داده بگیرم. من فقط به مهارت‌های عملی نیاز داشتم.

تو این نوشته داستان چهار دوره مختلفی رو که انتخاب کردم و این که چگونه اون‌ها منجر به یک شغل علم‌داده تو یه استارتاپ مراقبت‌های بهداشتی در دره سیلکون شدند شرح میدم.

زمانی که من کارم رو شروع کردم، بیشتر دوره‌های آنلاین رایگان بودند. بنابراین من خودم را به چالش کشیدم تا مهارت‌هایی که نیاز داشتم رو بدون خرج کردن هیچ پولی به دست بیارم. خب چی می‌تونم بگم، من خیلی خسیسم. ?

مهارت‌های پایه

وقتی که شغلم تو UCSF رو ترک کردم تجربم تو برنامه‌نویسی صفر بود. من تو تمام تحقیقات قبلیم در طول تحصیل از آمار استفاده کرده بودم، اما فقط در مقیاس کوچک. تمام مجموعه داده‌هایی که قبلا آنالیز کرده بودم، اون‌هایی بودند که خودم تو آزمایشگاه ایجاد کرده بودم. بنابراین تعداد مشاهدات خیلی کم بود. من باید یاد می‌گرفتم که داده‌ها رو تو مقیاس بسیار بزرگ‌تر کد و تحلیل کنم.

شروع کدنویسی

وقتی به این نتیجه رسیدم که می‌خوام دانشمند داده بشم، اولین چیزی که می‌خواستم یاد بگیرم این بود که چجوری برنامه‌ کامپیوتری بنویسم. چون قبلا هرگز کدنویسی نکرده بودم، کاملا برام ناشناخته بود. به این نتیجه رسیدم که اگر واقعا از نوشتن کد متنفر باشم، علم داده برای من مناسب نیست. پس جای خوبی برای شروع بود.

من خوش‌شانس بودم که شریکم، بن، در بسیاری از حوزه‌های تکنولوژی کار کرده‌ و تونست منو در مسیر درست هدایت کند. او پیشنهاد کرد که پایتون ممکنه بیش از همه برای من مناسب باشد. پایتون برای تجزیه و تحلیل داده، چند منظوره است و به خوبی با مجموعه داده‌های بزرگ سر و کار داره، بنابراین جاییه که من شروع کردم.

یادگیری کدنویسی

۱.کدآکادمی

برای شروع یادگیری کدنویسی از کدآکادمی استفاده کردم. من کار خودم رو با مقدمه‌ای به پایتون شروع کردم، اما مطمئن نیستم که دوره‌ای که من آن رو تمام کردم هنوز وجود داشته باشد چون که مال سال ۲۰۱۴ بود. اگر قرار بود از کدآکادمی برای شروع یادگیری پیتون استفاده کنم، احتمالا داده‌های تحلیلی را با دوره پیتون انتخاب می‌کردم.

به نظرم کدآکادمی نقطه شروع خوبی بود. مزیت اصلیش برای من این بود که می‌تونستم کد رو درست در مرورگر بنویسم. هنوزم نصب صحیح محیط‌های برنامه‌نویسی روی کامپیوتر برای من پاشنه آشیله. بنابراین خوشحال بودم که وقتی شروع کردم به یادگیری از این کار دوری کردم. دونستن اینکه اگر کد من جواب نمی‌داد به خاطر کدی بود که نوشته بودم و نه به خاطر خطای نصب و تنظیم محیط، خیلی خوب بود.

همچنین اینکه خیلی سریع و ظرف چند دقیقه می‌شد یادگرفت که چجوری با کدآکادمی کار کنی رو خیلی دوست‌داشتم. اگر وقت اضافی داشتم وارد می‌شدم و چند تا مشکل رو حل می‌کردم چون همه چیز اونجا منتظر من بود. این پیشرفت تدریجی به این معنی بود که من برای درگیر شدن باهاش زیاد مرعوب نشده بودم.

در آن زمان که دوره رو به پایان رسوندم، فقط تعداد انگشت‌شماری از درس‌های کدآکادمی مورد پیشنهاد بود و فقط همین یکی رایگان بود. من از کیفیت دوره‌های رایگان موجود به صورت آنلاین خیلی شگفت‌زده شدم.

زمانی که اصول اولیه پایتون رو یاد گرفتم، نیاز داشتم تجربه‌ام تو آمار رو افزایش بدم و تحلیل داده‌ها در مقیاس بزرگ‌تر رو یاد بگیرم.

یادگیری تجزیه و تحلیل داده

۲.دوره تخصصی علوم داده جان‌هاپکینز در کورسرا

بعد پایتون، دوره تخصصی علوم داده جان‌هاپکینز در کورسرا شرکت کردم. در اون زمان، شما می‌تونستید از نسخه رایگانشون بدون گرفتن گواهی استفاده کنید و فقط در صورتی پرداخت کنید که گواهی تایید شده را بخواهید.

برای من، گواهی تایید شده مهم به نظر نمی‌رسید. در عوض، باید یاد می‌گرفتم که چجوری مهارت‌هایی که در طول دوره یاد گرفتم رو در طول مصاحبه‌ها بتونم ارایه کنم. بنابراین نسخه رایگان دوره رو انتخاب کردم.

یک اشکال دوره برای من این بود که این سری از دوره‌ها تو R درس داده می‌شد. R یک زبان برنامه‌نویسی عالی برای تحلیل آماریه و مورد علاقه دانشگاهیانه. با این حال، من می‌خواستم پایتون رو برای علم داده یاد بگیرم. فکر می‌کردم پایتون تو استارتاپ‌هایی که می‌خواستم کار کنم مفیدتر باشه.

به چند دوره تحلیل داده با پایتون نگاه کردم، اما به نظر می‌رسید که اون‌ها کمی از دانشی رو که هنوز نداشتم، در نظر گرفته‌اند. من معتقدم که بیشتر این دوره‌ها هدف مهندسان نرم‌افزار بودند که می‌خواستند به دانشمند داده تبدیل بشن. بنابراین اون‌ها فرض کردند که شما مهارت‌های برنامه‌نویسی خوبی دارید و از قبل می‌دونید که چجوری محیط پایتونتون رو راه‌اندازی کنید.

جنبه اصلی که من در مورد دوره تخصصی علم داده کورسرا دوست داشتم این بود که از ابتدایی‌ترین چیزها شروع شد. دستورالعمل‌های گام‌به‌گام در مورد چگونگی نصب R و R Studio در ابتدای دوره وجود داشت. این مساله حل و فصل دوره‌های بعدی رو با دانستن اینکه هیچ مساله فنی وجود نخواهد داشت، آسان کرد. جنبه دیگر دوره جان‌هاپکینز که برای من مناسب بود این بود که توسط بخش بهداشت عمومی آموزش داده شده بود. تخصص من در حوزه علوم بهداشتی، پی‌گیری نمونه‌هایی که اون‌ها ارائه می‌دادند رو برام آسون کرد. اون‌‌ها مثال‌هایی با استفاده از اثرات کیفیت هوا بر آسم و دیگر مجموعه داده‌های مربوط به بهداشت و درمان داشتند. بنابراین من می‌تونستم بر محتوای دوره به جای تعیین سناریوهای ارایه‌شده برای تحلیل داده‌ها تمرکز کنم.

این سری از دوره‌ها واقعا سطح درک منو از جنبه‌های اصلی کار علم داده بالا برد. تو این دوره برنامه‌نویسی در R، تمیز کردن اولیه داده‌ها، تحلیل، رگرسیون و یادگیری ماشین آموزش داده شد. من واقعا از یادگیری کدنویسی و نحوه استفاده از کد برای تحلیل داده‌ها لذت بردم، به طوری که تشویقم کرد به ادامه یادگیری.

مصاحبه‌های اطلاعاتی

در این مرحله از آموزش مجدد خودم، از افراد حاضر تو شبکه‌ی اطرافیانم پرسیدم که آیا می‌تونند منو به افراد دیگری که گذار از دانشگاه به علم داده رو در سان‌فرانسیسکو انجام داده بودند، معرفی کنند؟ تعداد کمی از اون‌ها تونستند منو متصل کنند بنابراین تا اونجا که می‌تونستم مصاحبه‌های اطلاعاتی زیادی رو ترتیب دادم.

یکی از دوستام منو به یک دانشمند داده از Modcloth معرفی کرد که مسیر مشابهی با من رو طی کرده بود. اون قبلا دانشمند علوم اعصاب بود و توصیه‌هاش برای من خیلی مفید بود. توصیه‌ی اصلی اون یادگیری SQL بود.

یادگیری پرس و جو در پایگاه‌های داده

۳. دوره آنلاین DB۵ SQL استنفورد

تو کل دوره علوم داده جان‌هاپکینز در کورسرا SQL پوشش داده نشده بود. اون بهم گفت که بیشتر ساعات کار روزانه او پرس‌وجو بر روی پایگاه‌های اطلاعاتیه. اون باید بینش‌هایی برای توسعه کسب‌وکار و تیم‌های بازاریابی استخراج می‌کرد. تنها بخش کوچکی از وقتش صرف تحلیل آماری و یادگیری ماشین می‌شد.

من توصیه‌اش گوش کردم و یک دوره خودآموز آنلاین SQL از استنفورد رو شروع کردم. از بین تمام کارهایی که انجام می‌دادم، این مورد علاقه من بود. من ازش لذت بردم چون استادش عالی بود و از مثال‌های ساده برای توضیح مفاهیم استفاده کرد. اون همچنین هر مفهومی رو به روش‌های مختلف توضیح داد.

من از اون زمان این درس را به بسیاری از افراد توصیه کرده‌ام چون فکر می‌کنم داشتن پایه خوب در SQL برای هر دانشمند داده ضروریه. دوره‌های علوم داده‌ای که من با اون‌ها مواجه شده‌ام، چگونگی کسب اطلاعات از یک پایگاه‌داده با استفاده از SQL رو پوشش نمی‌دن. من فکر می‌کنم این یک ضعف بزرگه. اغلب دوره‌ها یک CSV از داده‌های آماده‌شده برای استفاده دانشجویان دارن، اما با توجه به تجربه من این مورد به ندرت در مشاغل علم داده صنعتی وجود دارد. زمانی که دوره SQL استنفورد را تموم کردم شروع به درخواست برای موقعیت‌های شغلی علم داده کردم.

اون زمان، من استرالیا زندگی می‌کردم و شروع به انجام مصاحبه اسکایپ با استارتاپ‌ها در منطقه خلیج سانفرانسیسکو کردم. در طول مصاحبه می‌خواستم به توسعه مهارت‌هام ادامه بدم.

مفاهیم مخرب

۴.مبانی تجزیه و تحلیل داده‌ها در edX

دوره بعدیم مبانی تجزیه و تحلیل داده‌ها با استفاده از R بود که از edX گرفتم. بازبینی بسیاری از مفاهیمی که قبلا در دوره کورسرا آموخته بودم، بسیار مفید بود. من اعتقاد راسخ دارم که یادگیری مفاهیم از اساتید مختلف می‌تونه دیدگاه‌های جدیدی ایجاد کنه. دنبال کردن آمار و مفاهیم یادگیری ماشینی برای بار دوم بسیار آسان‌تر بود. احساس می‌کردم در این مسیر درک عمیق‌تری دارم.

زمانی که در حال اتمام دوره بودم، در یکی از مصاحبه‌هایی که با آمینو، یک استارتاپ مراقبت‌های بهداشتی در سان‌فرانسیسکو، قبول شدم و موفق شدم ویزای کاری و نقل‌مکان به ایالات‌متحده آمریکا بگیرم.

کسب شغل علوم داده

فکر می‌کنم تو اون مصاحبه نهایی موفق بودم چون مهارت‌های کدنویسی قابل قبول و درک آماری خوبی داشتم، اما مهم‌تر از اون دانشم در حوزه مراقبت‌های بهداشتی، طراحی تجربی و تخصصم در روش علمی بود. به نظر من، این جنبه‌های اضافی دانش من بودند که باعث شدند درخواستم پذیرفته بشه و این استارتاپ رو به سمت من هدایت کردند تا شانس خودم رو امتحان کنم.

من خیلی مبتدی بودم و در آموزش شغلی به چیزهای بیشتری نیاز داشتم. فکر می‌کنم که تمام دوره‌های کاری من فقط در این حد کافی بودند تا تیم استخدام مرا در نظر بگیرند و این تجربه خاص من در زمینه مراقبت‌های بهداشتی بود که باعث پذیرش من شد. بنابراین اگر به دنبال تغییر مسیر شغلی به دانش داده هستید، توصیه می‌کنم به دنبال شرکتی باشید که دانش شما در حوزه خاص شما ارزشمند باشد.

چیزی که می‌خواستم رو یاد گرفتم

تنها چیزی که دوست داشتم قبل از آغاز فعالیتم به عنوان دانشمند داده یاد بگیرم کار با git تحت خط فرمان بود. من قبلا هرگز از ترمینال یا خط فرمان استفاده نکرده بودم و نمی‌دونستم چطور از گیت استفاده کنم تا کد خودم را به مخزن گیت‌هاب شرکت برسونم

خیلی طول کشید تا چند مهندس بهم یاد بدن و سرعتم زیاد شه. دوست داشتم حداقل یک ایده داشته باشم که چطور قبل از شروع از آن استفاده کنم تا وقت با ارزش آن‌ها رو هدر ندم. همکارانم فوق‌العاده بودند و به نظر نمی‌رسید از آموزش من ناراحت باشند، اما در چند روز اول کمی احساس سنگینی می‌کردم.

اگر شما در فکر دنبال کردن مسیر مشابه من به علم داده هستید، تشویقتون می‌کنم که به دنبالش برید! این قطعا انتخاب درستی برای من بود. افراد مختلف به روش‌های مختلفی یاد می‌گیرند، اما اگر شما دارای انضباط فردی برای مطالعه و تکمیل آنچه که شروع می‌کنید هستید، قطعا یادگیری علم داده از طریق دوره‌های آنلاین توسط خودتان امکان پذیر است. اگر هدفتون اینه، براتون آرزوی موفقیت می‌کنم و خوشحال می‌شم اگر بتونم به هر سوالی جواب بدم.



این متن ترجمه‌ای است از مقاله منتشر شده در این آدرس با کمک موتور ترجمه محاوره ترجمیار ترجمه شده و پس از ویرایش محدود انسانی منتشر شده است