راهنمای ۵ مرحله‌ای برای افرادی که آماده استفاده از پایتون هستند تا در واقع علم داده را یاد بگیرند

شکل ۱. یادگیری پایتون
شکل ۱. یادگیری پایتون
منتشر‌شده در: towardsdatascience به تاریخ ۳۱ می ۲۰۲۱
لینک منبع: A 5-Step Guide for People Who Are Ready to Use Python to Actually Learn Data Science

من حدود یک سال و نیم پیش در پایتون کد نوشتن را یاد گرفتم، زمانی که می‌خواستم یک کار مشترک در زمینه دانش داده انجام دهم و زبان مورد علاقه من، R، فقط به این کار بستگی نداشت. من می‌خواستم برخی از وب سایت‌ها را بررسی کنم و نتایج حاصل از داده‌های جمع‌آوری‌شده را پیش‌بینی کنم. (برای افشای کامل، من می‌خواستم بدانم که آیا پرسیدن سوال در توضیحات گربه‌های اینستاگرام من کامنت‌های بیشتری ایجاد کرده‌است یا نه. و ایجاد کرده بود!

همانطور که من متوجه شدم، شما می‌توانید علم داده‌ها را به سادگی با پایتون به خاطر کتابخانه‌ها و بسته‌های جامع آن یاد بگیرید. می‌تواند یادگیری ماشینی، داده‌کاوی بزرگ، پیش‌بینی، پردازش زبان طبیعی و هر چیز دیگری را که تصور می‌کنید یک دانشمند داده تلاش می‌کند انجام دهد، مدیریت کند. این چیزی است که مرا برانگیخت تا این پست را در مورد یادگیری علم داده با پایتون بنویسم.

این پست چند نکته را در مورد شما به عنوان یک خواننده در نظر می‌گیرد: یک، شما می‌خواهید علم داده را یاد بگیرید. این یک حرفه عالی است - اگر دوست دارید کنجکاوی خود را ارضا کنید و در مورد الگوها تحقیق کنید، از نظر مالی پاداش بگیرید و دنبال بسیاری از شرکت‌های معتبر علم داده باشید، این یک شغل خوب است. این بیشتر از تنها یک دهه است که جذاب‌ترین شغل است-این شغلی است که به شما این امکان را می‌دهد تا سوالاتی بپرسید که شما را در شب بیدار نگه می‌دارند، و جواب‌های جالبی به دست آورید. فکر می‌کنم بسیاری از ما آن کنجکاوی ذاتی را داریم، و دوست داریم که آن را راضی ببینیم.

من همچنین فکر می‌کنم که شما کمی پایتون را می‌شناسید. نیازی نیست که شما یک متخصص باشید، اما اگر می‌خواهید علم داده را با پایتون یاد بگیرید، بسیار مفید خواهد بود که یک پایتون را بشناسید تا با آن شروع کنید. نیازی نیست که شما یک حرفه‌ای باشید-من مدیریت کردم تا کارم را فقط با کمی دانش پایتون انجام دهم-اما دانستن این که چطور پایانه را اداره کنم یک اجبار است. خوشبختانه، جامعه پایتون قوی، کمک‌کننده و سرشار از آموزش‌ها، توضیحات و سربازان قدیمی است.

در نهایت، من فرض می‌کنم که شما به دنبال یک نقشه راه هستید: چیزی که به شما کمک خواهد کرد تا با تکیه‌بر دانش پایتون، شغلی در علم داده به دست آورید. پایتون یک زبان عالی برای یادگیری علم داده است زیرا بسیاری از نقاط قوت آن، مانند ایجاد تصویرسازی آسان، یادگیری ماشین و داده‌کاوی، همگی توسط دانشمندان داده در کارهای روزمره خود استفاده می‌شوند.

اگر با تمام این مفروضات مطابقت دارید، این پست برای شماست. این مقاله شما را از طریق یادگیری علم داده با پایتون راهنمایی خواهد کرد، با هدف نهایی به دست آوردن اشتغال به عنوان یک دانشمند داده.

۱. شما باید بدانید که علم داده واقعا چیست.

به نظر می‌رسد مکانی عجیب و غریب برای شروع باشد، اما وقتی برای اولین بار شروع به یادگیری پایتون کردم، هیچ ایده‌ای نداشتم که علم داده چیست. اگر مجبور بودم علم داده را برای خودم تعریف کنم، چیزی شبیه رسم نمودار می‌گفتم. من اشتباه نمی‌کردم، اما این کل حقیقت هم نیست. من حتی نمی‌دانستم که دارم علم داده را با پایتون یاد می‌گیرم، زیرا هرگز حدس نمی‌زدم که پیش‌بینی بخشی از علم داده باشد.

علم داده در ویکی‌پدیا به عنوان «مفهومی برای متحد کردن آمار، تجزیه و تحلیل داده‌ها، انفورماتیک و روش‌های مرتبط با آن‌ها به منظور درک و تجزیه و تحلیل پدیده‌های واقعی با داده‌ها» تعریف می‌شود. به بیان ساده، این علم از روش‌های آماری برای درک روندها استفاده می‌کند.

دانش داده مختص پایتون یا هر زبان دیگری نیست. شما احتمالاً می توانید همه وظایف علم داده را انجام دهید با چیزهایی مثل مداد ، مقداری کاغذ و ماشین حساب مناسب (یا خدای ناکرده اکسل). اگر بدانید علم داده چیست، می‌دانید که پایتون یک ضرورت نیست، بلکه یک میان‌بر مفید است، چیزی که به شما اجازه می‌دهد آن را به طور مرتب، سریع و موثر انجام دهید.

برای یادگیری بیشتر در مورد این که علم داده چیست، کمک می‌کند که به جای تعاریف مبهم، به آن در اصطلاحات عملی‌تر فکر کنیم. استراتژی اسکراچ راهنمای خوبی دارد که انواع سوالاتی که در مصاحبه‌های علم داده از شما پرسیده خواهد شد را درهم می‌شکند، که نگاه جامعی به انواع کارهای حرفه‌ای که دانشمندان داده هر روز انجام می‌دهند، ارائه می‌دهد.

با این دانش، تعریف ارائه‌شده توسط ویکی‌پدیا کمی معنی بیشتری پیدا می‌کند. علم داده به معنای حرفه‌ای را می توان به عنوان روش‌هایی برای درک اعداد توصیف کرد به شیوه‌ای که به کسب و کارها در تصمیم‌گیری، با استفاده از ابزارهایی مانند مدل‌های آماری، داده‌های مشتری، احتمال و پیش‌بینی‌ها کمک خواهد کرد. اعداد وارد می‌شوند، علم داده اتفاق می‌افتد، تصمیمات خارج می‌شوند.

۲. باید بدانید چه چیزی نمی‌دانید.

نمودار Venn مهارت‌های پایتون و مهارت‌های دانش داده کاملا یک چرخه نیست.

هنگامی که شما بدانید علم داده در شرایط عملی چیست، مرحله دوم نگاشت دانش موجود شما در پایتون است. مهارت‌های پایتون و نیازهای کاری یک دانشمند داده معمولی به طور قابل‌توجهی با هم همپوشانی دارند، بنابراین احتمالا متوجه خواهید شد که همانطور که از میان مهارت‌های یک دانشمند داده معمولی عبور می‌کنید، ممکن است بدانید که چگونه آن‌ها را قبلا با پایتون انجام دهید. با این حال، بعید است که بتوانید همه این کارها را انجام دهید.

به عنوان مثال، آیا من می‌دانم چگونه از tensorFlow برای مدلسازی شبکه عصبی استفاده کنم؟ قطعا نه. اما این موضوع در مقوله «علم داده» گنجانده شده‌است. اگر می‌خواستم علم داده را با پایتون یاد بگیرم، آن را در دسته نقاط ضعف خود می‌شمردم و بر روی یادگیری آن و دیگر مهارت‌های علم داده تمرکز می‌کردم.

از خودتان بپرسید: در حال حاضر چه کاری می‌توانید با پایتون انجام دهید؟ هنوز در چه چیزی ضعیف هستید؟ بهترین راهی که من انجام این کار را توصیه می‌کنم، بررسی مخزنی از سوالات مصاحبه شغلی یک دانشمند داده پیتون است، مانند این سوالات مربوط به دانش داده. از آنجا، شما می‌توانید به راحتی حوزه‌های تخصص خود را طرح کنید و آنچه را که احتمالا در کارهای مربوط به علم داده روی می‌دهد، بررسی کنید.

به عنوان مثال، ممکن است متوجه شوید که در حالی که یک دسته واقعی در استفاده از بسته «pandas» برای محاسبه تفاوت‌ها و خروجی اعداد دارید، به کمی تمرین بیشتری در توسعه پیش‌بینی‌های با پایتون نیاز دارید.

هنگامی که درک بهتری از نقاط قوت و ضعف خود به دست آوردید، بسیار بهتر آماده یادگیری علم داده با پایتون خواهید بود.

۳. انجام پروژه‌های جالب علوم داده مبتنی بر پایتون

پس حالا شما می‌دانید که چه چیزی نمی‌دانید. گام سوم این است که مهارت‌های فراموش شده را تقویت کنید و مهارت‌های جدید یاد بگیرید. بهترین راه برای انجام این کار پیدا کردن یک پروژه احساسی است.

من علم داده را با پایتون یاد گرفتم زیرا من به درک روندهای موجود در حساب کاربری اینستاگرام گربه‌ام علاقه‌مند بودم. این کنجکاوی طبیعی مرا واداشت تا یاد بگیرم چطور داده‌ها را جمع کنم، آن‌ها را در یک قالب قابل تجزیه و تحلیل قرار دهم، و نتایج خروجی را تجزیه و تحلیل کنم. اگر من سعی می‌کردم این کار را برای مدرسه انجام دهم، در اولین مانع تسلیم می‌شدم، یا فقط کد را بدون هیچ درک واقعی کپی می‌کردم.

در حالی که پایتون یک زبان عالی برای مبتدیان است، یادگیری علم داده با پایتون برای شما بسیار آسان‌تر خواهد بود اگر با هیجان شخصی برای درک و یادگیری به آن نزدیک شوید، به جای این که فقط دستورها و کد را حفظ کنید.

به لیست نقاط قوت و ضعف خود برگردید و بخش‌هایی را که هنوز در حال کش‌مکش هستید پیدا کنید. چه سوالات داغی دارید؟ آیا تعجب می‌کنید که آب و هوا چگونه بر زمان دویدن شما تاثیر می‌گذارد؟ آیا می‌خواهید بفهمید که چرا این همه سنجاب در محله شما وجود دارد؟ آیا می‌خواهید رابطه بین اندازه پرنده و احتمال انقراض آن‌ها را بررسی کنید؟ (اینها همه نمونه‌های شخصی هستند، در صورتی که نتوانید بگویید.)

نگاهی به برخی پروژه‌های آنلاین بیاندازید تا الهام بگیرید. به عنوان مثال، اگر می‌خواهید چند پروژه الهام‌گرفته از یادگیریی ماشین پیدا کنید، Confetti پر از مثال‌های مفید است. اگر بتوانید انگیزه خود را طوری تنظیم کنید که تنها چیزی که بین شما و پاسخ به سوالی که می‌خواهید بفهمید این باشد که مهارت کافی ندارید، یادگیری علم داده با پایتون هیچ مانعی ایجاد نخواهد کرد. شما به سرعت ترغیب خواهید شد تا علم داده را با پایتون یاد بگیرید و به سوالات آزار دهنده پاسخ دهید.

پی‌گیری این نوع پروژه‌های داده با پایتون، درک خوبی از روش‌های آماری مختلف، داده‌ها شامل نمودارها، و مشکلاتی که در مسیر یادگیری علم داده با پایتون با آن‌ها مواجه خواهید شد، به شما خواهد داد.

۴. به دنبال مهارت‌های ذکر شده در مشاغل علمی داده‌های سطح ورودی باشید.

اگر شما در موقعیت یادگیری علم داده با پایتون هستید، احتمالا نمی‌خواهید فورا وارد یک کار علمی داده شش رقمی شوید. این اشکالی ندارد! با توجه به تقاضای بالا برای مهارت‌های علم داده، شما نیازی به مدرک برای گرفتن یک کار علم داده ندارید. شما فقط به تجربه نیاز دارید.

با در نظر گرفتن این موضوع، نگاه کردن به توصیف شغلی آن مشاغل بزرگ علمی، منطقی به نظر نمی‌رسد، زیرا یادگیری علم داده با پایتون تا آن سطح، برای شما غیر واقعی خواهد بود. برای شروع به کار در جهت رسیدن به آن شغل رویایی علم داده‌، شما باید به جای آن به توصیف شغل برای تحلیلگران کسب‌وکار و تحلیلگران داده را جستجو کنید، که با دانشمندان داده هم پوشانی خواهند داشت. دانشمندان جونیور داده نیز می توانند نقش شغلی خوبی داشته باشند.

مانند تهیه نقشه چیزهایی که نمی‌دانید، لیستی از تمام نیازمندی‌های شغلی که در حال حاضر نمی‌توانید به آن‌ها رسیدگی کنید، بنویسید. این کار به شما ایده‌ای از مهارت‌های عملی که برای شروع مسیر شغلی علم داده به آن‌ها نیاز دارید، می‌دهد. سپس به دنبال راه‌هایی برای انجام این وظایف با استفاده از پایتون باشید.

به عنوان مثال، بوز آلن همیلتون از دانشمندان اطلاعات جوان خود می‌خواهد که تجربه NLP را داشته باشند. یک جستجوی سریع گوگل مرا به این مقاله هدایت کرد، که در آن اریک کلپن سه پروژه ساده را برای یادگیری NLP با پایتون کنار هم گذاشت. هر چه به مشاغل خاص‌تر نگاه کنید، ایده‌ای که از مهارت‌های معمول و مطلوب برای مشاغل علمی داده‌های سطح ورودی برخوردار باشید، بهتر خواهد بود.

هنگامی که تعدادی از این پروژه‌ها را تنظیم و تکمیل کردید، در ۹۵٪ از راه یادگیری علم داده با استفاده از پایتون خواهید بود. شما می‌دانید که علم داده چیست، باید بر روی چه چیزی تمرکز کنید، چه پروژه‌های جالبی می‌توانند به شما کمک کنند تا مهارت‌هایی که هنوز ندارید را یاد بگیرید، و حتی به دنبال چه مشاغل سطح ورودی هستید. گام نهایی ادامه یادگیری است.

۵. کنجکاو باشید.

یادگیری علم داده هرگز با پایتون یا هر زبان دیگری واقعا به پایان نمی‌رسد. در نظر بگیرید که مسیر حرفه‌ای دانشمند داده به سختی یک دهه پیش وجود داشت، و شما خواهید فهمید که چیزها چقدر سریع می‌توانند تغییر کنند. مانند هر زبان دیگری، بسته‌های جدید، پروژه‌ها و مفاهیم همیشه در پایتون منتشر می‌شوند. برای به روز ماندن، قابل استخدام بودن، و دانستن، مطمئن شوید که با شور و شوق و کنجکاوی به این تحولات نزدیک می‌شوید.

در هر مرحله از مسیر شغلی دانشمند داده، می‌توانید مراحل ۱ تا ۴ را تکرار کنید و ممکن است پاسخ کمی متفاوتی دریافت کنید، همانطور که مسیر شغلی تکامل می‌یابد، و همچنین مهارت‌ها و الزاماتی که با آن پیش می‌روند. زمانی که آماده‌اید شغل بعدی خود را به دست آورید، شکاف‌های موجود در دانش خود را بازبینی کنید. زمانی که به این فکر می‌کنید که برای یک کار علمی داده در گوگل بروید، مطمئن شوید که بدانید آن‌ها از شما می‌خواهند چه مهارت‌هایی را ثابت کنید. و از همه مهم‌تر، کنجکاو بمانید. به سوال پرسیدن ادامه دهید. با اشتیاق و علاقه به نادانی خود نزدیک شوید. این روشی است که شما می‌توانید با استفاده از پایتون به یادگیری علم داده ادامه دهید.

اندیشه‌های نهایی در مورد چگونگی یادگیری علم داده با پایتون

این مقاله برای افرادی تهیه شده‌است که برخی از پایتون ها را می‌شناسند، فکر می‌کنند که ممکن است کار در علم داده را دوست داشته باشند، و می‌خواهند بدانند که چگونه به پایتون موجود خود تکیه کنند تا علم داده را بیاموزند. پایتون بهترین زبان برنامه‌نویسی برای یادگیری علم داده با، آسانی برای مبتدیان برای انتخاب، و آسان برای مبتدیان برای بهبود آن است.

به طور خلاصه، بهترین راه برای یادگیری علم داده با پایتون به این سادگی است:

  1. یک درک به روز از این که علم داده در واقع چیست داشته باشید
  2. نقشه شکاف دانش و دانش پایتون موجود خود را تهیه کنید
  3. پروژه‌های پایتون را انتخاب کنید که علاقه شما را حفظ کنند
  4. مهارت‌های مورد نیاز مشاغل علم داده‌های سطح ورودی را درک کنید.
  5. در مورد علم داده و پایتون به عنوان یک زبان برنامه‌نویسی کنجکاو باشید. هر دو به طور مکرر تغییر می‌کنند.

با این کار، شما در مسیر یادگیری علم داده با پایتون و تامین شغل رویایی خود به عنوان یک دانشمند داده خواهید بود.

این متن با استفاده از ربات مترجم مقالات دیتاساینس ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.