بهترین راه برای آماده‌سازی شغلی در علم داده / یادگیری ماشینی چیست؟


منتشر‌شده در: towardsdatascience.com به تاریخ ۲۷ دسامبر ۲۰۲۰
لینک منبع: What’s the Best Way to Prepare for a Career in Data Science/Machine Learning

شما می‌توانید با استفاده از بسیاری از مسیرها، به دنبال یادگیری علم داده و یادگیری ماشینی باشید (تحصیلات دانشگاهی، MOOC، اردوگاه‌های بوت، خود آموزی و غیره …) ، کدام یک ممکن است برای شما مناسب باشد؟

من اخیرا این ترم تحصیلی را با هدف توسعه مهارت‌هایی که مورد تقاضا و انتظار مهندسان در آینده‌ای بسیار نزدیک است، آغاز کردم. من برای یک شرکت بین‌المللی بزرگ کار می‌کنم و اخیرا به عنوان یک دانشجوی تمام‌وقت در یک برنامه تسریع شده کارشناسی‌ارشد با هدف کمک به پل زدن بر روی تخصص کاربردی انتخاب شدم (یعنی مهارت‌های مهندسی و دانش کسب‌وکار) با مهارت‌هایی که تا حد زیادی با کامپیوتر و علم داده در ارتباط است. وقتی برای اولین بار در مورد این فرصت شنیدم، فکر کردم این یک فرصت عالی برای کمک به یادگیری تمام این مهارت‌ها به شیوه‌ای ساختاریافته‌تر است.

در سال‌های اخیر، من تا حد زیادی به عنوان مالک محصول پروژه‌های دیجیتال و تحلیلی، با سهامداران (کاربران نهایی پروژه‌های مذکور) و تیم توسعه (عمدتا متشکل از متخصصان IT مختلف در شرکت من) کار کرده‌ام. من به هدایت پروژه‌ها و کار با تیم‌های توسعه کمک کردم، اما به ندرت با پیچ و مهره‌های توسعه درگیر شدم. رابطه کاری ما حول انتقال دانش و الزامات برای توسعه یک محصول بود همانطور که شروع شد و سپس به آرامی به سمت یکی از تست‌ها، تنظیم دموها، و رسیدن به یک برنامه برای انتقال آن به سمت تولید حرکت کرد. در این نقش، من همیشه مشتاق یادگیری این موضوع بودم که دقیقا چه چیزی پشت پرده فن‌آوری اطلاعات با دانشمند داده و مهندس نرم‌افزار ما اتفاق افتاد اما به راحتی در بالای سر من بود وقتی که آن‌ها شروع به ورود به علف‌های هرز کد، فرآیندها، و غیره کردند. می‌دانم که اگر می‌خواستم در این فضای ترکیبی جدید مدیر یا رهبر بهتری باشم، باید بیشتر یاد می‌گرفتم.

من می‌خواستم این پس‌زمینه را با خودم به اشتراک بگذارم تا بتوانم آن را به اشتراک بگذارم:

  • تجربیات من و اینکه چگونه مرا به جایی که در کارم هستم هدایت می‌کنند
  • برخی از جوانب مثبت و منفی را که با برخی از گزینه ها / مسیرهایی که می توانید دنبال کنید ، برجسته کنید
  • بینش فراهم کنید و در صورت امکان کمک ارائه دهید.

ثبت‌نام دانشگاه (مدرک کارشناسی / کارشناسی‌ارشد، دوره‌های کوتاه، و مقاطع راه‌اندازی)

روش یادگیری سنتی برای افراد برای کسب مهارت‌های جدید و محور قرار دادن شغل آن‌ها شرکت در یک دانشگاه کلاسیک و ثبت‌نام برای گرفتن مدرک است. این درجه معمولا یک نقطه عطف فردی است که شرکت‌ها و سازمان‌ها آن را به عنوان تایید این موضوع می‌پذیرند که کسی به مهارت‌هایی دست یافته‌است که باید موفق باشد. به همین دلیل، این نوع برنامه‌ها هنوز هم به شدت مورد علاقه کسانی هستند که می‌توانند هزینه و زمان لازم برای تکمیل آن‌ها را بپردازند. من در حال حاضر در یک برنامه تسریع شده علوم کامپیوتر با تمرکز در علم داده هستم. من بسیار خوش‌شانس بوده‌ام که شرکتی که برای آن کار می‌کنم مرا برای این نقش انتخاب کرده‌است و هزینه برنامه را پوشش می‌دهد و به من اجازه می‌دهد تا زمانی که برنامه را به اتمام نرسانم در یک فرصت مطالعاتی باشم. من می‌گویم یکی از بزرگ‌ترین مزایای این شیوه یادگیری داشتن بحث‌های تعاملی با اساتید و همکلاسی‌ها و همچنین بحث در مورد تله‌های خطای رایج، نکات مفید و ایجاد ارتباط است. یک مثال خوب از این موضوع قبل از شروع برنامه‌ام است، من به شدت به سایت‌هایی مانند stackoverflow.com، Githb، و همچنین مقالات متوسط برای تلاش و حل کدگذاری و یا مسائل با چیزهایی که یاد می‌گرفتم متکی خواهم بود. یک چیزی که یک تازه‌کار (که از این منابع به عنوان حقایق مسلم استفاده می‌کند) ممکن است در ابتدا درک نکند این است که همه محتوا به طور یک‌سان ایجاد نمی‌شوند، به این معنی که چیزهای اشتباه و کم‌تر ایده‌آل زیادی در این سایت‌ها قرار داده می‌شوند زیرا جمع سپاری برای یک راه‌حل است. یادگیری از منابع قابل‌اعتماد و قابل‌اعتماد مانند اساتید و دفتر راهنما به من کمک کرد تا جستجو گر (و مفسر) بهتری از این سایت‌ها باشم و اینکه چطور بفهمم آیا منطقی است یا نه و در واقع به من در حل مشکلم کمک می‌کند. مثال دیگر این است که چگونه با گرفتن یک دوره آنلاین و یا کدگذاری یادگیری خود، ممکن است کمی بیش از حد به صلاحیت واقعی خود اعتماد به نفس داشته باشید. برای مدتی طولانی احساس کردم که در حال برداشتن گام‌های بزرگ هستم، اما واقعا بسیاری از نکات اصلی در مورد زبان پایتون پایه را نفهمیدم، در عوض واقعا در وارد کردن بسته‌ها و توابع تماس خوب بودم. زمانی که من در یک کلاس درس سنتی با تکالیف قرار گرفتم، به سرعت متوجه شدم که باید روی چیزهای پایه تمرکز کنم تا به شیوه‌ای کارآمدتر به نوشتن و کد نوشتن بپردازم. اینها تنها چند نمونه از این هستند که من احساس می‌کنم مسیر دانشگاه سنتی می‌تواند مفید باشد، اما با یک قیمت گزاف برای پول و زمان مورد نیاز برای تکمیل می‌آید. گزینه‌های دیگری مانند مدارک تحصیلی وجود دارد اگر شما در حال حاضر دارای مدرک کارشناسی هستید (و هنوز هم مقدار قابل‌توجهی پول اما زمان کمتری نسبت به مدرک کارشناسی هزینه دارد). علاوه بر این، برنامه‌های بدون مدرک مانند اردوگاه‌های بوت و دیگر دوره‌های گواهی کوتاه که می‌توانید ثبت و دریافت کنید، شتاب می‌گیرند. اینها گزینه‌های مختلفی را به همراه دارند تا در این مسیر حرکت کنند. بسیاری از دانشگاه‌های مشهور مانند دانشگاه هاروارد، دانشگاه برکلی، و دانشگاه MIT همگی نوعی برنامه راه‌اندازی و یا درجه آنلاین را ارائه می‌دهند که شما می‌توانید از آن استفاده کنید. با توجه به تجربه خود، من می‌خواهم باور کنم که این موثرترین روش یادگیری به دلیل تعامل اضافه‌شده شما با مردم و فرصت‌های ایجاد شبکه است، اما این کار با هزینه انجام می‌شود.

دوره‌های آنلاین گسترده (MOOC)

این روزها گزینه‌های مختلفی برای پیشنهادها MOOC وجود دارد که برخی از آن‌ها گواهی‌نامه‌هایی را برای تایید یادگیری شما فراهم می‌کنند. نکته کلیدی که من می‌خواهم در مورد MOOCs تاکید کنم این است که با ظهور و تصدیق آن‌ها توسط شرکت‌ها، این کار بار مسئولیت انجام یک برنامه درجه-محور برای ایجاد تغییر شغلی را کاهش می‌دهد. در حالی که شرکت‌ها ممکن است به گواهی‌نامه MOOC مانند یک مدرک چهار یا دو ساله نگاه نکنند، اگر یک کاربر بتواند دانش خود را نشان دهد که از طریق یک مجموعه کار و از طریق رزومه خود به دست آورده‌اند، این برای یاد گیرنده بسیار زیاد است. راهی موثر و ارزان‌تر برای یادگیری مهارت‌های جدید برای پیشرفت شغلی

دوره‌های آنلاین گسترده که بر روی آن تمرکز خواهم کرد و MOOC که به طور گسترده از آن استفاده کرده‌ام، Coursera هستند. من از چند شرکت دیگر استفاده کرده‌ام، اما واقعا بیشتر از همه از Coursera لذت برده‌ام. آن‌ها هزاران کلاس، موضوع، و تخصص در دسترس دارند (مجموعه‌ای از دوره‌هایی که موضوع خاصی دارند). نکته جالب در مورد Coursera این است که این دوره‌ها توسط موسسات دانشگاهی و دانشگاه‌ها، سازمان‌ها / موسسات حرفه‌ای، و همچنین شرکت‌ها (مانند گوگل) ارائه می‌شوند. چیزی که من متوجه شدم این است که اگر شما می‌خواهید شروع به ساختن دانش ریاضی خود برای آماده‌سازی حرفه علم داده خود کنید، سازمان‌ها و موسسات مختلفی وجود دارند که مطالب مشترک را تدریس می‌کنند، به این معنی که اگر روش‌های تدریس برای شما مناسب نیستند، می‌توانید دوره‌های دیگری در همان موضوع پیدا کنید که با سبک یادگیری شما مطابقت دارد. از طریق MOOC می‌توانید به آرامی درک خود را در هر جهتی که می‌خواهید در این زمینه جدید قرار دهید (مهندسی داده، علم داده و غیره …). همچنین می‌توانید به خودتان کمک کنید تا یک برنامه یادگیری بسازید و ترتیبی از دوره‌ها را برنامه‌ریزی کنید تا یا یک تعمیم دهنده باشید و یا به یک تخصص در یک زمینه خاص محدود شوید. واقعا گزینه‌های عالی زیادی وجود دارند که به همین دلیل است که من پیشنهاد می‌کنم اگر می‌توانید از MOOCs استفاده کنید. آن‌ها زمان زیادی را صرف مرور کردن سخنرانی‌ها، تکالیف و غیره می‌کنند … بنابراین بر روی آنچه که می‌خواهید یاد بگیرید و یک برنامه برای انجام دادن آن در مدت‌زمان مشخصی تنظیم کنید، تمرکز کنید.

خود آموزی

من تا حد زیادی این مقوله را «آموزش آفلاین» نیز می‌نامم، چون از هر کار دادگاهی ساختار یافته جدا است و واقعا بر مفاهیم، تم‌ها، و ایده‌های خاص تمرکز می‌کند. این راه و مسیر دیگری است که می‌توانید در آن شرکت کنید، اما با فرضیات زیادی از طرف کسی که سعی در یادگیری مهارت‌های جدید دارد، همراه است. جنبه‌های مثبت این کار این است که آن ارزان‌ترین گزینه است، اما با بیش‌ترین سوالات در مورد این که چطور به سمت هدفی که واقعا نمی‌دانید خط پایان کجاست یا کجاست، پیش بروید. من می‌گویم که شما می‌توانید خودآموزی را همراه با روش‌های دیگری که می‌توانند کمک کنند، انجام دهید. در واقع متون خوب زیادی وجود دارد و من تعداد کمی از آن‌ها را دارم که می‌توانم بگویم در یادگیری در مورد علم داده بسیار مفید هستند. من می‌توانم توصیه کنم که هر کتابی از O’Reilly واقعا خوب انجام شده است، من شخصا چندتایی را بصورت چاپی دارم و همچنین دسترسی (از طریق شرکت من) به پورتال آنلاین آن‌ها تقریبا به تمام متون آن‌ها دارم و می‌توانم بگویم که آن‌ها عموما بسیار خوب کنار هم قرار گرفته‌اند. ناشران و نویسندگان دیگری نیز وجود دارند که کتاب‌های بسیار خوبی در مورد موضوعات دارند. من پیشنهاد می‌کنم کتاب‌های Andriy Burkov را بخوانید. آن‌ها دیدگاه‌های بسیار خوبی در مورد یادگیری ماشین و عملیات دارند. فهرست کوتاهی از کتاب‌هایی که من دارم و توصیه می‌کنم (می‌توانید ببینید که من تمایل به موضوعات یادگیری ماشینی دارم):

  • کتاب صد صفحه‌ای فراگیری ماشینی نوشته Andriy Burkov
  • یادگیری ماشینی دست به دست با Scikit-Learn, Keras و TensorFlow اثر Aurelien Geron
  • «یادگیری ماشینی با TensorFlow» اثر  Chris Mattmann
  • «مهندسی یادگیری ماشینی» اثر Andriy Burkov

مسیر دیگری که در ادامه یادگیری خود شما مفید است، از طریق ویدئو در یوتیوب است. اگر چه دوباره، شما باید مراقب مشروعیت کانال یوتیوب و ویدئوها باشید، اما هنوز هم هزاران کانال عالی وجود دارد که می‌تواند به شما کمک کند تا برخی از مفاهیم دشوار آن بیرون را بهتر درک کنید. برخی از کانال‌هایی که من دوست دارم عبارتند از:

  • دوره‌های سخنرانی MIT — چند دوره متفاوت وجود دارد که کل سخنرانی آن‌ها برای ترم به صورت رایگان در دسترس است. مطالب کیفی که از یک دانشگاه بسیار مورد توجه ایالات‌متحده آورده شده‌است (توجه داشته باشید که لینک به کانال الکساندر امینی است، اگرچه یک جستجوی سریع در یوتیوب گزینه‌های دیگری را نتیجه می‌دهد).
  • کانال 3Brown1Blue — یک منبع عالی در بسیاری از اصول ریاضی انتزاعی که به عنوان ستون فقرات علم داده / یادگیری ماشینی/ هوش مصنوعی عمل می‌کند. ویدئوها به خوبی کنار هم قرار داده شده‌اند و از جلوه‌های بصری برای توضیح برخی از آن مفاهیم دشوار استفاده می‌کنند.
  • کانال GeeksforGeeks — اگرچه این امر تا حد زیادی به سمت کار با علم کامپیوتر هدایت می‌شود، اما GeeksforGeeks کار فوق‌العاده‌ای برای توضیح برخی از سوالات مبتنی بر کدگذاری انجام می‌دهد.

من این ادعا را مطرح می‌کنم که خودآموزی از کتاب‌های کاغذی / دیجیتال و ویدئوها احتمالا راه ایده‌آلی برای ایجاد مهارت‌های مورد نیاز برای ایجاد و توسعه یک شغل در علم داده نیست. من معتقدم که این روش بسیار خوبی برای تکمیل یکی از روش‌های دیگر بالا است.

خلاصه

در بالا، من به طور خلاصه سه رویکرد اصلی را شرح دادم که می توان آن‌ها را برای شروع کار در حرفه خود در نظر گرفت و تا حد زیادی آن را در ترتیب اهمیت زیر براساس تجربه من فهرست کرد. همانطور که گفته شد، من هنوز در این سفر هستم و به هیچ وجه در هیچ یک از این حوزه‌ها متخصص نیستم، اما فکر می‌کنم به اندازه کافی مطالب را دیده‌ام و مصرف کرده‌ام تا تمایل خوبی به آنچه در بیرون از اینجا وجود دارد و بهترین نتیجه برای باک شما داشته باشم.

ثبت‌نام در دانشگاه

مزایا:

تعامل انسانی — از استادان گرفته تا دانشجویان دانشی که در این محیط مورد بحث و بررسی قرار می‌گیرد بی‌نظیر است.

فرصت‌های شغلی — بیشتر دانشگاه‌ها فرصت‌های شغلی و مشارکت با بسیاری از شرکت‌ها دارند و می‌توانند به شما در یافتن مقصد بعدی در شغل جدید تان کمک کنند.

راه‌اندازی اردوگاه‌ها و دوره‌های کوتاه — یک جایگزین که هدفمندتر، سریع‌تر و ارزان‌تر از برنامه‌های مبتنی بر مدرک است

معایب:

هزینه‌های فرصت — پول و زمان شخصی زیادی برای یک برنامه سنتی دو یا چهار ساله لازم است.

نیاز به پیش‌نیازها-بسته به برنامه‌ای که ممکن است برای ورود به برنامه نیاز داشته باشید. آزمون‌های استاندارد، مقطع کارشناسی تکمیل‌شده و …)

دوره‌های آنلاین گسترده (MOOC)

مزایا:

قابلیت دسترسی — امروزه گزینه‌های زیادی وجود دارد که به نظر می‌رسد کل سیستم آموزشی در حال وارونه شدن است. بنابراین انتخاب‌ها و سبک‌های یادگیری بسیاری وجود دارند که باید از میان آن‌ها انتخاب کنید.

چارچوب هدفمند — بسته به جهت در علم داده / یادگیری ماشینی / هوش مصنوعی / تجزیه و تحلیل / مسیر مهندسی که می‌خواهید بگیرید، تعداد زیادی از دوره‌ها وجود دارد که برای انتخاب افراد در دسترس هستند.

مشارکت با سازمان‌های آکادمیک — بسیاری از دانشگاه‌ها با شرکت‌های MOOC (مانند دوره‌ها) هم‌کاری می‌کنند تا دوره‌های کیفیت در سطح دانشگاه را به شکلی جایگزین و قابل‌دسترس به شما بدهند.

معایب:

نقشه راه — من این را به عنوان یک کنترل لیست می‌کنم زیرا گزینه‌های زیادی وجود دارند که می‌توانند زمان زیادی را صرف تلاش برای تدوین یک برنامه برای یادگیری و چه دوره‌هایی برای گذراندن کنند. من پیشنهاد می‌کنم که قبل از شروع هر یک از MOOC تحقیقاتی انجام دهید تا مهارت‌های مورد نیاز برای مسیر شغلی که می‌خواهید را شناسایی کنید و سپس سعی کنید چارچوبی برای دوره‌هایی که از این هدف پشتیبانی می‌کنند، ایجاد کنید. ممکن است در ابتدا ترسناک باشد، اما برای اطمینان از این که شما چرخ‌های خود را نمی‌چرخید، این مساله مهم است و اگرچه MOOC ممکن است کارهایی برای انجام این کار داشته باشد، سطح درک هر فرد و اهداف شغلی او همیشه بسیار متفاوت است.

به رسمیت شناختن دستاورد — من فقط می‌خواستم این موضوع را در مورد MOOC برجسته کنم. به طور کلی شما این دوره‌ها را برای یادگیری چیزهای جدید که قادر به استفاده از آن‌ها در یک محیط حرفه‌ای هستند، انتخاب می‌کنید. این بدان معنی است که یک دوره کامل شده در یک MOOC به همان اندازه که یک دوره دانشگاهی گفته می‌شود، مورد بررسی قرار نمی‌گیرد، بلکه اگر مهارت‌ها و دانش کسب‌شده را در نظر بگیرید و بتوانید آن را از طریق یک مجموعه کار نشان دهید (یعنی مانند حفظ یک حساب Github با پروژه‌های جدید) که در آن ارزش وجود دارد.

خودآموزی (در واقع با دو روش دیگر قابل‌مقایسه نیست، بلکه یک مکمل عالی است)

مزایا:

یادگیری تکمیلی — همانطور که در بالا ذکر شد، این راهی عالی برای یادگیری آفلاین است. شما می‌توانید از منابع ثابت داده برای کمک به پشتیبانی از موضوعاتی که یاد می‌گیرید استفاده کنید.

هزینه‌ها — کتاب‌ها (کتاب‌های دیجیتال و کاغذی) نسبت به مقدار اطلاعات داخل آن‌ها نسبتا ارزان هستند. ویدئوهای یوتیوب رایگان هستند، به راحتی این گزینه را ارزان‌ترین گزینه می‌کنند.

معایب:

راهنمایی — دام اصلی اتکا به یادگیری خود این است که تعصب تایید خود شما در موضوعات مختلف ممکن است شما را به سمتی هدایت کند که برای زمان شما ایده‌آل و یا بهینه نباشد.

فقدان تعامل — یادگیری توسط خودتان دشوار است! اگر شما یک مفهوم را درک نمی‌کنید، گاهی اوقات این ها چیزهایی هستند که ما زیر فرش بررسی می‌کنیم و ادامه می‌دهیم و شما درک کاملی از برخی مفاهیم ارائه‌شده را از دست می‌دهید.

این متن با استفاده از ربات ترجمه مقاله هوش مصنوعی ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.