من ربات ترجمیار هستم و خلاصه مقالات علمی رو به صورت خودکار ترجمه میکنم. متن کامل مقالات رو میتونین به صورت ترجمه شده از لینکی که در پایین پست قرار میگیره بخونین
چگونه ظرف ۶ ماه بدون دانش کدنویسی دانشمند داده شدم
تازه از ۸ سال درس خواندن و کار سخت بدون هیچ طرحی دور شده بودم. ممکنه با خودتون فکر کنید که چرا یک نفر باید این کار را بکنه. رئیسم داشت روحم رو خورد میکرد و میدونست که باید تغییر کنم.
دوست پسر من پیشنهاد کرد که دانشمند داده بشم. بهش گفتم «دیوونه شدی؟! من حتی اتداییترین چیز ها راجع به برنامهنویسی رو هم نمیدونم» مطمئنا اونچه که من قادر به انجامش بودم رو بیش از حد تخمین زده بود. سندرم دغلبازی دوباره شروع شد.
دو هفته بعد، دوست من آنا دقیقا همینو پیشنهاد کرد، کمی بیشتر راجع بهش فکر کردم و شروع کردم باهاش سرگرم شدن. چرا که نه؟ تصمیم گرفتم دوباره مبتدی بشم و خودم رو به عنوان یک دانشمند داده از نو بسازم.
من میخواستم با سرعت مورد نظر یاد بگیرم برای همین تصمیم گرفتم تو دورههای آنلاین شرکت کردم. به این نتیجه رسیدم که با داشتن مدرک دکترا در علوم اعصاب، احتمالا به اندازه کافی آموزش رسمی داشتم تا یک شغل علوم داده بگیرم. من فقط به مهارتهای عملی نیاز داشتم.
تو این نوشته داستان چهار دوره مختلفی رو که انتخاب کردم و این که چگونه اونها منجر به یک شغل علمداده تو یه استارتاپ مراقبتهای بهداشتی در دره سیلکون شدند شرح میدم.
زمانی که من کارم رو شروع کردم، بیشتر دورههای آنلاین رایگان بودند. بنابراین من خودم را به چالش کشیدم تا مهارتهایی که نیاز داشتم رو بدون خرج کردن هیچ پولی به دست بیارم. خب چی میتونم بگم، من خیلی خسیسم. ?
مهارتهای پایه
وقتی که شغلم تو UCSF رو ترک کردم تجربم تو برنامهنویسی صفر بود. من تو تمام تحقیقات قبلیم در طول تحصیل از آمار استفاده کرده بودم، اما فقط در مقیاس کوچک. تمام مجموعه دادههایی که قبلا آنالیز کرده بودم، اونهایی بودند که خودم تو آزمایشگاه ایجاد کرده بودم. بنابراین تعداد مشاهدات خیلی کم بود. من باید یاد میگرفتم که دادهها رو تو مقیاس بسیار بزرگتر کد و تحلیل کنم.
شروع کدنویسی
وقتی به این نتیجه رسیدم که میخوام دانشمند داده بشم، اولین چیزی که میخواستم یاد بگیرم این بود که چجوری برنامه کامپیوتری بنویسم. چون قبلا هرگز کدنویسی نکرده بودم، کاملا برام ناشناخته بود. به این نتیجه رسیدم که اگر واقعا از نوشتن کد متنفر باشم، علم داده برای من مناسب نیست. پس جای خوبی برای شروع بود.
من خوششانس بودم که شریکم، بن، در بسیاری از حوزههای تکنولوژی کار کرده و تونست منو در مسیر درست هدایت کند. او پیشنهاد کرد که پایتون ممکنه بیش از همه برای من مناسب باشد. پایتون برای تجزیه و تحلیل داده، چند منظوره است و به خوبی با مجموعه دادههای بزرگ سر و کار داره، بنابراین جاییه که من شروع کردم.
یادگیری کدنویسی
۱.کدآکادمی
برای شروع یادگیری کدنویسی از کدآکادمی استفاده کردم. من کار خودم رو با مقدمهای به پایتون شروع کردم، اما مطمئن نیستم که دورهای که من آن رو تمام کردم هنوز وجود داشته باشد چون که مال سال ۲۰۱۴ بود. اگر قرار بود از کدآکادمی برای شروع یادگیری پیتون استفاده کنم، احتمالا دادههای تحلیلی را با دوره پیتون انتخاب میکردم.
به نظرم کدآکادمی نقطه شروع خوبی بود. مزیت اصلیش برای من این بود که میتونستم کد رو درست در مرورگر بنویسم. هنوزم نصب صحیح محیطهای برنامهنویسی روی کامپیوتر برای من پاشنه آشیله. بنابراین خوشحال بودم که وقتی شروع کردم به یادگیری از این کار دوری کردم. دونستن اینکه اگر کد من جواب نمیداد به خاطر کدی بود که نوشته بودم و نه به خاطر خطای نصب و تنظیم محیط، خیلی خوب بود.
همچنین اینکه خیلی سریع و ظرف چند دقیقه میشد یادگرفت که چجوری با کدآکادمی کار کنی رو خیلی دوستداشتم. اگر وقت اضافی داشتم وارد میشدم و چند تا مشکل رو حل میکردم چون همه چیز اونجا منتظر من بود. این پیشرفت تدریجی به این معنی بود که من برای درگیر شدن باهاش زیاد مرعوب نشده بودم.
در آن زمان که دوره رو به پایان رسوندم، فقط تعداد انگشتشماری از درسهای کدآکادمی مورد پیشنهاد بود و فقط همین یکی رایگان بود. من از کیفیت دورههای رایگان موجود به صورت آنلاین خیلی شگفتزده شدم.
زمانی که اصول اولیه پایتون رو یاد گرفتم، نیاز داشتم تجربهام تو آمار رو افزایش بدم و تحلیل دادهها در مقیاس بزرگتر رو یاد بگیرم.
یادگیری تجزیه و تحلیل داده
۲.دوره تخصصی علوم داده جانهاپکینز در کورسرا
بعد پایتون، دوره تخصصی علوم داده جانهاپکینز در کورسرا شرکت کردم. در اون زمان، شما میتونستید از نسخه رایگانشون بدون گرفتن گواهی استفاده کنید و فقط در صورتی پرداخت کنید که گواهی تایید شده را بخواهید.
برای من، گواهی تایید شده مهم به نظر نمیرسید. در عوض، باید یاد میگرفتم که چجوری مهارتهایی که در طول دوره یاد گرفتم رو در طول مصاحبهها بتونم ارایه کنم. بنابراین نسخه رایگان دوره رو انتخاب کردم.
یک اشکال دوره برای من این بود که این سری از دورهها تو R درس داده میشد. R یک زبان برنامهنویسی عالی برای تحلیل آماریه و مورد علاقه دانشگاهیانه. با این حال، من میخواستم پایتون رو برای علم داده یاد بگیرم. فکر میکردم پایتون تو استارتاپهایی که میخواستم کار کنم مفیدتر باشه.
به چند دوره تحلیل داده با پایتون نگاه کردم، اما به نظر میرسید که اونها کمی از دانشی رو که هنوز نداشتم، در نظر گرفتهاند. من معتقدم که بیشتر این دورهها هدف مهندسان نرمافزار بودند که میخواستند به دانشمند داده تبدیل بشن. بنابراین اونها فرض کردند که شما مهارتهای برنامهنویسی خوبی دارید و از قبل میدونید که چجوری محیط پایتونتون رو راهاندازی کنید.
جنبه اصلی که من در مورد دوره تخصصی علم داده کورسرا دوست داشتم این بود که از ابتداییترین چیزها شروع شد. دستورالعملهای گامبهگام در مورد چگونگی نصب R و R Studio در ابتدای دوره وجود داشت. این مساله حل و فصل دورههای بعدی رو با دانستن اینکه هیچ مساله فنی وجود نخواهد داشت، آسان کرد. جنبه دیگر دوره جانهاپکینز که برای من مناسب بود این بود که توسط بخش بهداشت عمومی آموزش داده شده بود. تخصص من در حوزه علوم بهداشتی، پیگیری نمونههایی که اونها ارائه میدادند رو برام آسون کرد. اونها مثالهایی با استفاده از اثرات کیفیت هوا بر آسم و دیگر مجموعه دادههای مربوط به بهداشت و درمان داشتند. بنابراین من میتونستم بر محتوای دوره به جای تعیین سناریوهای ارایهشده برای تحلیل دادهها تمرکز کنم.
این سری از دورهها واقعا سطح درک منو از جنبههای اصلی کار علم داده بالا برد. تو این دوره برنامهنویسی در R، تمیز کردن اولیه دادهها، تحلیل، رگرسیون و یادگیری ماشین آموزش داده شد. من واقعا از یادگیری کدنویسی و نحوه استفاده از کد برای تحلیل دادهها لذت بردم، به طوری که تشویقم کرد به ادامه یادگیری.
مصاحبههای اطلاعاتی
در این مرحله از آموزش مجدد خودم، از افراد حاضر تو شبکهی اطرافیانم پرسیدم که آیا میتونند منو به افراد دیگری که گذار از دانشگاه به علم داده رو در سانفرانسیسکو انجام داده بودند، معرفی کنند؟ تعداد کمی از اونها تونستند منو متصل کنند بنابراین تا اونجا که میتونستم مصاحبههای اطلاعاتی زیادی رو ترتیب دادم.
یکی از دوستام منو به یک دانشمند داده از Modcloth معرفی کرد که مسیر مشابهی با من رو طی کرده بود. اون قبلا دانشمند علوم اعصاب بود و توصیههاش برای من خیلی مفید بود. توصیهی اصلی اون یادگیری SQL بود.
یادگیری پرس و جو در پایگاههای داده
۳. دوره آنلاین DB۵ SQL استنفورد
تو کل دوره علوم داده جانهاپکینز در کورسرا SQL پوشش داده نشده بود. اون بهم گفت که بیشتر ساعات کار روزانه او پرسوجو بر روی پایگاههای اطلاعاتیه. اون باید بینشهایی برای توسعه کسبوکار و تیمهای بازاریابی استخراج میکرد. تنها بخش کوچکی از وقتش صرف تحلیل آماری و یادگیری ماشین میشد.
من توصیهاش گوش کردم و یک دوره خودآموز آنلاین SQL از استنفورد رو شروع کردم. از بین تمام کارهایی که انجام میدادم، این مورد علاقه من بود. من ازش لذت بردم چون استادش عالی بود و از مثالهای ساده برای توضیح مفاهیم استفاده کرد. اون همچنین هر مفهومی رو به روشهای مختلف توضیح داد.
من از اون زمان این درس را به بسیاری از افراد توصیه کردهام چون فکر میکنم داشتن پایه خوب در SQL برای هر دانشمند داده ضروریه. دورههای علوم دادهای که من با اونها مواجه شدهام، چگونگی کسب اطلاعات از یک پایگاهداده با استفاده از SQL رو پوشش نمیدن. من فکر میکنم این یک ضعف بزرگه. اغلب دورهها یک CSV از دادههای آمادهشده برای استفاده دانشجویان دارن، اما با توجه به تجربه من این مورد به ندرت در مشاغل علم داده صنعتی وجود دارد. زمانی که دوره SQL استنفورد را تموم کردم شروع به درخواست برای موقعیتهای شغلی علم داده کردم.
اون زمان، من استرالیا زندگی میکردم و شروع به انجام مصاحبه اسکایپ با استارتاپها در منطقه خلیج سانفرانسیسکو کردم. در طول مصاحبه میخواستم به توسعه مهارتهام ادامه بدم.
مفاهیم مخرب
۴.مبانی تجزیه و تحلیل دادهها در edX
دوره بعدیم مبانی تجزیه و تحلیل دادهها با استفاده از R بود که از edX گرفتم. بازبینی بسیاری از مفاهیمی که قبلا در دوره کورسرا آموخته بودم، بسیار مفید بود. من اعتقاد راسخ دارم که یادگیری مفاهیم از اساتید مختلف میتونه دیدگاههای جدیدی ایجاد کنه. دنبال کردن آمار و مفاهیم یادگیری ماشینی برای بار دوم بسیار آسانتر بود. احساس میکردم در این مسیر درک عمیقتری دارم.
زمانی که در حال اتمام دوره بودم، در یکی از مصاحبههایی که با آمینو، یک استارتاپ مراقبتهای بهداشتی در سانفرانسیسکو، قبول شدم و موفق شدم ویزای کاری و نقلمکان به ایالاتمتحده آمریکا بگیرم.
کسب شغل علوم داده
فکر میکنم تو اون مصاحبه نهایی موفق بودم چون مهارتهای کدنویسی قابل قبول و درک آماری خوبی داشتم، اما مهمتر از اون دانشم در حوزه مراقبتهای بهداشتی، طراحی تجربی و تخصصم در روش علمی بود. به نظر من، این جنبههای اضافی دانش من بودند که باعث شدند درخواستم پذیرفته بشه و این استارتاپ رو به سمت من هدایت کردند تا شانس خودم رو امتحان کنم.
من خیلی مبتدی بودم و در آموزش شغلی به چیزهای بیشتری نیاز داشتم. فکر میکنم که تمام دورههای کاری من فقط در این حد کافی بودند تا تیم استخدام مرا در نظر بگیرند و این تجربه خاص من در زمینه مراقبتهای بهداشتی بود که باعث پذیرش من شد. بنابراین اگر به دنبال تغییر مسیر شغلی به دانش داده هستید، توصیه میکنم به دنبال شرکتی باشید که دانش شما در حوزه خاص شما ارزشمند باشد.
چیزی که میخواستم رو یاد گرفتم
تنها چیزی که دوست داشتم قبل از آغاز فعالیتم به عنوان دانشمند داده یاد بگیرم کار با git تحت خط فرمان بود. من قبلا هرگز از ترمینال یا خط فرمان استفاده نکرده بودم و نمیدونستم چطور از گیت استفاده کنم تا کد خودم را به مخزن گیتهاب شرکت برسونم
خیلی طول کشید تا چند مهندس بهم یاد بدن و سرعتم زیاد شه. دوست داشتم حداقل یک ایده داشته باشم که چطور قبل از شروع از آن استفاده کنم تا وقت با ارزش آنها رو هدر ندم. همکارانم فوقالعاده بودند و به نظر نمیرسید از آموزش من ناراحت باشند، اما در چند روز اول کمی احساس سنگینی میکردم.
اگر شما در فکر دنبال کردن مسیر مشابه من به علم داده هستید، تشویقتون میکنم که به دنبالش برید! این قطعا انتخاب درستی برای من بود. افراد مختلف به روشهای مختلفی یاد میگیرند، اما اگر شما دارای انضباط فردی برای مطالعه و تکمیل آنچه که شروع میکنید هستید، قطعا یادگیری علم داده از طریق دورههای آنلاین توسط خودتان امکان پذیر است. اگر هدفتون اینه، براتون آرزوی موفقیت میکنم و خوشحال میشم اگر بتونم به هر سوالی جواب بدم.
این متن ترجمهای است از مقاله منتشر شده در این آدرس با کمک موتور ترجمه محاوره ترجمیار ترجمه شده و پس از ویرایش محدود انسانی منتشر شده است
مطلبی دیگر از این انتشارات
چگونه یک مقیاس رنگ را براساس مقادیر در مایکروسافت اکسل اعمال کنیم
مطلبی دیگر از این انتشارات
اصول اخلاقی NFT : چرا باید مجدد به فروش آنلاین عکسبرداری فکر کنید؟
مطلبی دیگر از این انتشارات
آیا انسانها و میمونها رنگها را یکسان میبینند؟