چگونه در ۶ ماه از صفر به یک محقق داده رشد پیدا کنیم؟

منتشر‌شده در towardsdatascience به تاریخ ۳۱ آگوست ۲۰۲۱
لینک منبع How To Grow From Non-Coder to Data Scientist in 6 Months

بسیاری از افراد با پیشینه‌های مختلف در لینکدین به من پیام می‌دهند. و درخواست نکات و پیشنهادهایی برای انتقال شغل خود به علم داده دارند. من قبلا فکر می‌کردم، تعداد زیادی از منابع به صورت آنلاین در دسترس هستند تا علم داده را به صورت رایگان یاد بگیرید. پس چرا آن‌ها از من می‌پرسند؟ پس از آنکه با یکی از آن‌ها صحبت کردم به وضوح دریافتم،

وفور گزینه‌ها تبدیل به یک طلسم شده‌است.

بسیاری مطمئن نبودند که چطور و از کجا شروع کنند؟

· بعضی از آن‌ها اعتماد به نفس کافی نداشتند.

· برخی از آن‌ها به دنبال انگیزه و الهام بودند.

· برخی فقط می‌خواهند بدانند که آیا حوزه کاری برای آن‌ها وجود دارد یا خیر.

· بیشتر آن‌ها به دنبال یک نقشه روشن می‌گشتند.

همچنین برخی از توصیفات شغلی برای موقعیت‌های سطح ورودی در علم داده را بررسی می‌کردند. واضح بود که انتظارات بسیار بالا هستند. این مساله بیشتر باعث استرس و اضطراب زیادی به ویژه در میان افراد با پیشینه غیر فنی می‌شود. هم چنین این دلیل این است که چرا بسیاری از افراد قادر به حفظ سطح انگیزش در طول یادگیری خود نیستند.

در این مقاله، قصد دارم یک برنامه روشن را به شما نشان دهم. برای کمک به شما که نه تنها علم داده را یاد بگیرید بلکه یک شغل نیز به دست آورید.

آغاز ساده اما ثابت قدم

رایج‌ترین اشتباهی که افراد در حال آموختن علم داده انجام می‌دهند، شروع با یک موضوع پیچیده است. طبیعی است که جذب یک موضوع جالب شوید. مشکل این است که اگر شما خیلی زود در سفر یادگیری خود به یک ایست بازرسی جاده‌ای برخورد کنید. همین کافی است که انگیزه خود را از دست بدهید و کاری کنید که از این کار دست بکشید. زمانی که با یک موضوع پیچیده شروع می‌کنید، احتمال پرداختن به مسائل بسیار بالا است.

توصیه شماره یک من به افرادی که با یادگیری علم داده شروع می‌کنند این است که کوچک شروع کنند. در زیر برخی از مجموعه مهارت‌های پایه‌ای که به صورت روزانه در یک کار علمی داده مورد استفاده قرار می‌گیرند، آمده‌است.

· پایتون/آر

· زبان SQL

· آمار پایه

خب، اما چقدر تخصص لازم است و کجا یاد بگیریم؟ برای هر یک از این موضوعات، من به شما منابع را از جایی که می‌توانید یاد بگیرید، نشان خواهم داد.

یادگیری کد با استفاده از پایتون/R

برای تبدیل شدن به یک دانشمند داده شما باید کد بنویسید. از خواندن داده‌ها، کاوش مجموعه داده‌ها، ایجاد یک تجسم، اجرای مهندسی ویژگی، و ساخت یک مدل همه چیز نیاز به کدگذاری دارد. ابزارهای زیادی برای خودکار کردن کارهای تکراری وجود دارد اما برای رشد به عنوان یک دانشمند داده شما باید یاد بگیرید که کد نوشتن را یاد بگیرید.

اگر شما در کدگذاری تازه کار هستید، پلتفرم‌های مبتنی بر وب بهترین مکان برای شروع یادگیری کد هستند. محیط تعاملی مبتنی بر وب یادگیری شما را بسیار آسان می‌کند. شما با انجام این کار خودتان بیشتر در مورد موضوع یاد می‌گیرید. همچنین، هیچ گونه استرس در راه‌اندازی محیط و نصب ابزارها وجود ندارد.

یک پلتفرم فوق‌العاده مبتنی بر وب برای یادگیری برنامه‌نویسی پایتون، Codecademy است. این یک سکوی شگفت‌انگیز برای یادگیری کدگذاری به شیوه‌ای تعاملی است. ادامه دادن از جایی که آخرین بار آن را ترک کردید آسان است و هم چنین به پی‌گیری پیشرفت شما کمک می‌کند. در نتیجه خوب خواهد بود که زمانی که سفر می‌کنید یا زمانی که کمی وقت اضافه دارید، یادگیری را انجام دهید. اگر تصمیم گرفته‌اید که با R را انتخاب کنید، در این صورت هنوز هم می‌توانید از کدآکادمییاد بگیرید.

هنگامی که آموزش آنلاین پایتون یا R را تکمیل کردید، می‌توانید برنامه نویسی را از سیستم خود امتحان کنید. ابزارهای مورد نیاز را نصب کرده و امتحان کنید. اگر برای شروع با زیر راحت باشید، کافی خواهد بود.

· انواع مختلف داده‌ها (شامل انواع داده‌های جمع‌آوری) و عملیات آن‌ها

· عبارات کنترل (If Then Else, For Loop، و غیره)

· تابع و توابع لامبدا

یادگیری SQL

مجموعه مهارت دیگری که باید برای یک دانشمند داده داشته باشد SQL است. هنگامی که شما به یک محیط شرکتی حرکت می‌کنید، تمام داده‌ها به طور کلی در DBs ذخیره می‌شوند. برخلاف محیط یادگیری، مجموعه داده‌ها به آسانی برای دانشمندان داده فراهم نمی‌شوند. این نقش اصلی تیم علم داده برای درک و استخراج مجموعه داده مورد نیاز است. برای انجام این کار باید دانش خوبی از SQL داشته باشید.

دوباره، دوره در اینجا در کدآکادمی یک پلت فرم تعاملی برای یادگیری SQL پایه فراهم می‌کند. این کار به شما کمک خواهد کرد تا ویژگی‌های پایه و ترکیب SQL را داشته باشید. پلتفرم‌های آنلاین مانند یادگیری وجود دارند که سناریوهای عملی را فراهم می‌کنند که چالش‌های زندگی واقعی را تکرار می‌کنند.

مثلا، پایتون / R زمانی که با SQL راحت باشید می‌توانید سیستم مدیریت پایگاه‌داده منبع بازMySQL را نصب کنید. این کار با یک پایگاه‌داده داخلی انجام می‌شود. شما می‌توانید به فهرست پخش SQL یادگیری من در زیر مراجعه کنید. این کار به شما کمک می‌کند تا ویژگی‌های مشترک SQL که در کار روزمره یک دانشمند داده استفاده می‌شود را داشته باشید.

آمار پایه

دانش آمار پایه به درک بهتر داده‌ها کمک می‌کند. همانطور که مهارت‌های خود را در علم داده ارتقا می‌دهید. دانش آمار پایه به یافتن راه‌حل‌های بهتر کمک خواهد کرد.

دوره آمار و احتمال در آکادمی خان همه موضوعات کلیدی آماری مورد نیاز برای یک دانشمند داده را پوشش خواهد داد. اگر این درس را طاقت‌فرسا می‌دانید و یا مشتاق هستید که با علم داده فقط با آمار کافی شروع کنید، مقالاتی را در این مورد بررسی کنید.

این شاخه مفاهیم آماری پایه و ضروری را پوشش می‌دهد که برای یک دانشمند داده مورد نیاز است. اگر بیشتر به سمت ویدئوهای آموزشی تمایل دارید، این فهرست پخش را بررسی کنید.

ثبات

این برای شروع کوچک هنگام یادگیری علم داده کافی است. اما اطمینان از ثبات، به ویژه در روزه‌ای اولیه، مهم‌تر است. اگر به مدت یک یا دو هفته یاد بگیرید و مدت زیادی استراحت کنید، این به یادگیری کمکی نمی‌کند. شما باید هر هفته زمان ثابتی را به یادگیری خود اختصاص دهید.

افزایش مهارت‌های خود

هنگامی که با مهارت‌های اساسی بالا آشنا شدید، وقت آن است که آن‌ها افزایش دهید. زمان آن رسیده‌است که کار بر روی مجموعه داده‌ها را شروع کنیم و در مورد تصویرسازی داده‌ها، اکتشاف داده‌ها و ساخت مدل یاد بگیریم.

یاد بگیرید که داده‌ها را تصویرسازی کنید

تصویرسازی یک مهارت کلیدی برای یک دانشمند داده است. این کار به ارتباط واضح بینش‌ها و بیرون آوردن الگوهای موجود در مجموعه داده کمک می‌کند. برای مردم انتخاب الگوها از داده‌های بصری در مقایسه با داده‌های جدولی یا فقط متنی آسان است. تجسم سازی نقش مهمی هم در تجزیه و تحلیل داده‌ها و هم در ارتباطات ایفا می‌کند.

یادگیری انجام تجزیه و تحلیل داده‌ها

بسیاری دوره‌های مرتبط با علم داده درCoursera وجود دارد. انتخاب بهترین گزینه مناسب برای مجموعه مهارت‌های شما می‌تواند بسیار گیج‌کننده باشد. در زیر برخی از دوره‌های آموزشی که می‌توانید براساس سطح تخصص فعلی خود انتخاب کنید آورده شده‌است.

اگر مبتدی هستید و هیچ تجزیه و تحلیل داده‌ای انجام نداده اید، با این دوره کوتاه ۲ ساعته از Coursera شروع کنید.

Exploratory Data Analysis With Python and Pandas

In a video that plays in a split-screen with your work area, your instructor will walk you through these steps: Initial…

www.coursera.org

اگر یک ایده اساسی در مورد تجزیه و تحلیل داده‌ها دارید و یا اگر دوره بالا را کامل کرده‌اید، می‌توانید برای دوره زیر ثبت‌نام کنید. این درس بازخوردهای شگفت انگیزی دارد و بسیاری اذعان کرده‌اند که به خاطر این درس مزایای ملموس دریافت کرده‌اند.

Data Analysis with Python

Learn how to analyze data using Python. This course will take you from the basics of Python to exploring many different…

www.coursera.org

اگر مشتاق یادگیری بیشتر هستید، می‌توانید در مورد مهندسی ویژگی از کاگل با استفاده از درس زیر یاد بگیرید.

Learn Feature Engineering Tutorials

Better features make better models. Discover how to get the most out of your data.

www.kaggle.com

برپاسازی یک پی محکم

اکنون زمان آن است که مهارت‌های خود را ارتقا دهید. در زیر برخی از دوره‌های Coursera آورده شده‌اند که می‌توانند به ایجاد یک بنیان قوی کمک کنند. این کار به درک و یادگیری در مورد فعالیت‌های انجام‌شده توسط تیم دانش داده در سراسر خط لوله پروژه کمک می‌کند. شما درباره درک مساله، اجرای تجزیه و تحلیل برای استخراج استنتاج‌ها و بینش‌ها، انتخاب مدل مناسب برای مشکل کسب‌وکار یاد خواهید گرفت. این دوره‌ها همچنین پروژه‌هایی دارند که بخشی از برنامه آموزشی است که تجربه پروژه دست‌اول را فراهم می‌کند.

اغلب این پروژه‌ها بلند مدت هستند و حداقل به چند هفته تلاش نیاز دارند. اما اینها حیاتی هستند و به شما کمک می‌کنند تا برای مصاحبه‌ها و چالش‌های علم داده آماده شوید.

در اینجا برخی جزئیات در مورد دوره‌های زیر آورده شده‌است تا به شما در انتخاب بهترین روش مناسب برای شما کمک کند. همچنین، برای مرور کردن موضوعاتی که در حال حاضر پوشش داده شده‌اند، تردید نکنید.

گزینه ۱-علم داده‌های کاربردی با پایتون توسط دانشگاه میشیگان: اگر در مورد موضوعاتی که تا کنون در این مقاله پوشش داده شده‌اند، اعتماد به نفس داشته باشید، درس زیر مناسب‌تر است. این دوره بر روی آمار پایه یا تجزیه و تحلیل داده‌ها تمرکز نمی‌کند. این کار شما را به سرعت به موارد استفاده از یادگیری ماشینی، متن کاوی و تحلیل شبکه می‌برد.

روش ۲-متخصص علوم داده دانشگاه جان‌هاپکینز: این درس براساس R. است. اگر شما در حال یادگیری علم داده با استفاده از R هستید، این روش مناسب‌تر خواهد بود. این یک دوره کامل علم داده است که موضوعات اکتشاف داده، تصویرسازی، آمار و ساخت مدل را پوشش می‌دهد.

روش ۳-علم دادهIBM: این یک دوره کامل از علم داده شبیه به آنچه که در بالا ذکر شد، می‌باشد. این درس با استفاده از پایتون آموزش داده می‌شود که آن را جذاب‌تر می‌کند. این درس فرصت شغلی بهتری به شما می‌دهد. حدود ۲۰ درصد از کسانی که این دوره را به پایان رساندند فرصت شغلی پیدا کرده‌اند. این درس کل خط لوله یک پروژه علم داده را پوشش می‌دهد. همچنین ابزارها، تکنیک‌ها و کتابخانه‌هایی را پوشش می‌دهد که معمولا توسط دانشمندان داده مورد استفاده قرار می‌گیرند.

اهداف خود را مشخص کنید و برد خود را جشن بگیرید

مهم‌ترین بخش سفر یادگیری این است که هدف داشته باشید و اهداف خود را با جدیت پی‌گیری کنید. به هنگام یادگیری علم داده، پرت شدن حواس بسیار آسان است. بهترین راه برای جلوگیری از هر گونه حواس‌پرتی یا واگرایی از طرح اصلی، نوشتن اهداف است. بیشتر منابع ذکر شده در این مقاله یک ردیاب پیشرفت دارند. برای هر هفته چند هدف مشخص کنید و به آن‌ها پایبند باشید. برای افزایش مسئولیت‌پذیری، پیشرفت یادگیری خود را در یک وبلاگ و یا وب سایتLinkedIn به اشتراک بگذارید.

هم چنین به اشتراک گذاشتن دستاوردها و پیشرفت به ایجاد انرژی و انگیزه مثبت برای پی‌گیری بیشتر کمک می‌کند. یادگیری علم داده یک سفر طولانی است، شما باید انگیزه‌های خود را به اندازه کافی بالا داشته باشید تا آن را حفظ و تکمیل کنید.

یکی از دلایل مهم برای ترک یادگیری علم داده فقدان اعتماد به نفس است. داشتن یک برنامه و پی‌گیری روند پیشرفت به ایجاد اعتماد به نفس کمک می‌کند.

برای شکست آماده باشید اما به یادگیری ادامه دهید.

انتقال راه‌تان به علم داده‌ها راه ساده‌ای نخواهد بود. به برخی مسائل فنی و دیگر موانع احتمالی که می‌توانند اعتماد به نفس شما را تکان دهند احترام بگذارید. فقط یک چیز را به یاد داشته باشید که حتی دانشمندان با تجربه داده با مشکلات برخورد می‌کنند و آن بخشی از کار است. فضای علم داده یک زمینه به سرعت در حال تحول است به طوری که برخورد با مشکلات غیر معمول نیست. اما نکته مثبت این است که یک سیستم پشتیبانی بسیار خوب وجود دارد. تعدادی از انجمن‌های آنلاین وجود دارند که به شما کمک خواهند کرد. ثبات نقش مهمی بازی می‌کند، هر روز رفتن به رختخواب با کمی دانش بیشتر تاثیر قابل‌توجهی بر شغل شما خواهد داشت.

ایجاد ارتباط حرفه‌ای

به افرادی که پس‌زمینه‌ای مشابه شما دارند مراجعه کنید و راه خود را در علم داده پیدا کنید. این کار به درک چالش‌های شغل و مهارت‌های لازم برای تمرکز بر روی آن کمک می‌کند. این کار تصویر خوبی از چیزهایی که باید بر روی آن‌ها کار کنید به شما می‌دهد. ایجاد ارتباط حرفه‌ای نیز نقش مهمی در جستجوی شغل دارد. تعدادی از فرصت‌های علم داده به طور مستقیم از طریق ارجاع بدون رفتن به پورتال های شغلی پر می‌شوند. جدا از رسیدن به افرادی با پس‌زمینه مشابه. شرکت در جلسات ملاقات و دیگر رویدادهای علمی اطلاعات عمومی می‌تواند به ایجاد شبکه حرفه‌ای شما کمک کند.

نکاتی برای گرفتن شغل علوم داده

بسیاری از افرادی که علم داده را یاد می‌گیرند در حال تلاش برای پیدا کردن یک شغل مناسب هستند. من می‌خواهم نکاتی را به اشتراک بگذارم که می‌تواند به افزایش شانس استخدام شما کمک کند.

· شرکت‌ها را شناسایی کنید: بازی با نقاط قوت‌تان به شما قدرت نفوذ بهتری خواهد داد. شرکت‌هایی که با پس‌زمینه آموزشی یا حرفه‌ای شما هم تراز هستند را شناسایی کنید. همچنین بسیاری از موقعیت‌های علمی داده‌های عمومی وجود دارند که شما می‌توانید برای آن‌ها نیز درخواست دهید.

· یک پرتفولیو ایجاد کنید: سازمان‌ها زمان و منابع محدودی برای استخدام افراد جدید دارند. یک نمونه کار به نشان دادن توانایی‌های شما کمک می‌کند. این کار اغلب شانس شما برای پیدا کردن فهرست نهایی برای مصاحبه را افزایش می‌دهد.

· قبل از مصاحبه: درباره نقشی که برای آن درخواست می‌دهید و درباره شرکت تحقیق کنید. بسیار خوب است که برای درک بهتر کار، فرهنگ و غیره به کارمندان فعلی دسترسی پیدا کنید.

· در طول مصاحبه: اعتماد به نفس داشته باشید و در عین حال در مورد نقاط قوت و ضعف خود صادق باشید. کارفرمایان کاندیداهایی را که دارای صداقت بالا و دانش علم داده کمتری هستند بر افرادی با دانش بسیار بالا در علم داده که صادق نیستند یا شفاف نیستند ترجیح می‌دهند.

آیا به انگیزه بیشتری نیاز دارید؟

داستانی در مورد سفر شخصی از علم اعصاب به علم داده وجود دارد. او پس از ۸ سال مطالعه و کار در علوم اعصاب، راه خود را به سمت علم داده‌ها پیدا کرد.

من نیز در ابتدا هیچ ایده‌ای در مورد R یا پایتون نداشتم. و هم‌چنین تحصیلات رسمی در علم داده یا آمار نداشتم. در واقع، من در برنامه‌نویسی خوب نبودم، اما در حال حاضر ۲ کتاب در علم داده تالیف کرده‌ام و با موفقیت برخی از پروژه‌های علم داده جامع را اجرا کرده‌ام.

امیدوارم از خواندن این مقاله لذت برده باشید!

این متن با استفاده از ربات مترجم مقاله علم داده ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.