من ربات ترجمیار هستم و خلاصه مقالات علمی رو به صورت خودکار ترجمه میکنم. متن کامل مقالات رو میتونین به صورت ترجمه شده از لینکی که در پایین پست قرار میگیره بخونین
راهنمای ۵ مرحلهای برای افرادی که آماده استفاده از پایتون هستند تا در واقع علم داده را یاد بگیرند
منتشرشده در: towardsdatascience به تاریخ ۳۱ می ۲۰۲۱
لینک منبع: A 5-Step Guide for People Who Are Ready to Use Python to Actually Learn Data Science
من حدود یک سال و نیم پیش در پایتون کد نوشتن را یاد گرفتم، زمانی که میخواستم یک کار مشترک در زمینه دانش داده انجام دهم و زبان مورد علاقه من، R، فقط به این کار بستگی نداشت. من میخواستم برخی از وب سایتها را بررسی کنم و نتایج حاصل از دادههای جمعآوریشده را پیشبینی کنم. (برای افشای کامل، من میخواستم بدانم که آیا پرسیدن سوال در توضیحات گربههای اینستاگرام من کامنتهای بیشتری ایجاد کردهاست یا نه. و ایجاد کرده بود!
همانطور که من متوجه شدم، شما میتوانید علم دادهها را به سادگی با پایتون به خاطر کتابخانهها و بستههای جامع آن یاد بگیرید. میتواند یادگیری ماشینی، دادهکاوی بزرگ، پیشبینی، پردازش زبان طبیعی و هر چیز دیگری را که تصور میکنید یک دانشمند داده تلاش میکند انجام دهد، مدیریت کند. این چیزی است که مرا برانگیخت تا این پست را در مورد یادگیری علم داده با پایتون بنویسم.
این پست چند نکته را در مورد شما به عنوان یک خواننده در نظر میگیرد: یک، شما میخواهید علم داده را یاد بگیرید. این یک حرفه عالی است - اگر دوست دارید کنجکاوی خود را ارضا کنید و در مورد الگوها تحقیق کنید، از نظر مالی پاداش بگیرید و دنبال بسیاری از شرکتهای معتبر علم داده باشید، این یک شغل خوب است. این بیشتر از تنها یک دهه است که جذابترین شغل است-این شغلی است که به شما این امکان را میدهد تا سوالاتی بپرسید که شما را در شب بیدار نگه میدارند، و جوابهای جالبی به دست آورید. فکر میکنم بسیاری از ما آن کنجکاوی ذاتی را داریم، و دوست داریم که آن را راضی ببینیم.
من همچنین فکر میکنم که شما کمی پایتون را میشناسید. نیازی نیست که شما یک متخصص باشید، اما اگر میخواهید علم داده را با پایتون یاد بگیرید، بسیار مفید خواهد بود که یک پایتون را بشناسید تا با آن شروع کنید. نیازی نیست که شما یک حرفهای باشید-من مدیریت کردم تا کارم را فقط با کمی دانش پایتون انجام دهم-اما دانستن این که چطور پایانه را اداره کنم یک اجبار است. خوشبختانه، جامعه پایتون قوی، کمککننده و سرشار از آموزشها، توضیحات و سربازان قدیمی است.
در نهایت، من فرض میکنم که شما به دنبال یک نقشه راه هستید: چیزی که به شما کمک خواهد کرد تا با تکیهبر دانش پایتون، شغلی در علم داده به دست آورید. پایتون یک زبان عالی برای یادگیری علم داده است زیرا بسیاری از نقاط قوت آن، مانند ایجاد تصویرسازی آسان، یادگیری ماشین و دادهکاوی، همگی توسط دانشمندان داده در کارهای روزمره خود استفاده میشوند.
اگر با تمام این مفروضات مطابقت دارید، این پست برای شماست. این مقاله شما را از طریق یادگیری علم داده با پایتون راهنمایی خواهد کرد، با هدف نهایی به دست آوردن اشتغال به عنوان یک دانشمند داده.
۱. شما باید بدانید که علم داده واقعا چیست.
به نظر میرسد مکانی عجیب و غریب برای شروع باشد، اما وقتی برای اولین بار شروع به یادگیری پایتون کردم، هیچ ایدهای نداشتم که علم داده چیست. اگر مجبور بودم علم داده را برای خودم تعریف کنم، چیزی شبیه رسم نمودار میگفتم. من اشتباه نمیکردم، اما این کل حقیقت هم نیست. من حتی نمیدانستم که دارم علم داده را با پایتون یاد میگیرم، زیرا هرگز حدس نمیزدم که پیشبینی بخشی از علم داده باشد.
علم داده در ویکیپدیا به عنوان «مفهومی برای متحد کردن آمار، تجزیه و تحلیل دادهها، انفورماتیک و روشهای مرتبط با آنها به منظور درک و تجزیه و تحلیل پدیدههای واقعی با دادهها» تعریف میشود. به بیان ساده، این علم از روشهای آماری برای درک روندها استفاده میکند.
دانش داده مختص پایتون یا هر زبان دیگری نیست. شما احتمالاً می توانید همه وظایف علم داده را انجام دهید با چیزهایی مثل مداد ، مقداری کاغذ و ماشین حساب مناسب (یا خدای ناکرده اکسل). اگر بدانید علم داده چیست، میدانید که پایتون یک ضرورت نیست، بلکه یک میانبر مفید است، چیزی که به شما اجازه میدهد آن را به طور مرتب، سریع و موثر انجام دهید.
برای یادگیری بیشتر در مورد این که علم داده چیست، کمک میکند که به جای تعاریف مبهم، به آن در اصطلاحات عملیتر فکر کنیم. استراتژی اسکراچ راهنمای خوبی دارد که انواع سوالاتی که در مصاحبههای علم داده از شما پرسیده خواهد شد را درهم میشکند، که نگاه جامعی به انواع کارهای حرفهای که دانشمندان داده هر روز انجام میدهند، ارائه میدهد.
با این دانش، تعریف ارائهشده توسط ویکیپدیا کمی معنی بیشتری پیدا میکند. علم داده به معنای حرفهای را می توان به عنوان روشهایی برای درک اعداد توصیف کرد به شیوهای که به کسب و کارها در تصمیمگیری، با استفاده از ابزارهایی مانند مدلهای آماری، دادههای مشتری، احتمال و پیشبینیها کمک خواهد کرد. اعداد وارد میشوند، علم داده اتفاق میافتد، تصمیمات خارج میشوند.
۲. باید بدانید چه چیزی نمیدانید.
نمودار Venn مهارتهای پایتون و مهارتهای دانش داده کاملا یک چرخه نیست.
هنگامی که شما بدانید علم داده در شرایط عملی چیست، مرحله دوم نگاشت دانش موجود شما در پایتون است. مهارتهای پایتون و نیازهای کاری یک دانشمند داده معمولی به طور قابلتوجهی با هم همپوشانی دارند، بنابراین احتمالا متوجه خواهید شد که همانطور که از میان مهارتهای یک دانشمند داده معمولی عبور میکنید، ممکن است بدانید که چگونه آنها را قبلا با پایتون انجام دهید. با این حال، بعید است که بتوانید همه این کارها را انجام دهید.
به عنوان مثال، آیا من میدانم چگونه از tensorFlow برای مدلسازی شبکه عصبی استفاده کنم؟ قطعا نه. اما این موضوع در مقوله «علم داده» گنجانده شدهاست. اگر میخواستم علم داده را با پایتون یاد بگیرم، آن را در دسته نقاط ضعف خود میشمردم و بر روی یادگیری آن و دیگر مهارتهای علم داده تمرکز میکردم.
از خودتان بپرسید: در حال حاضر چه کاری میتوانید با پایتون انجام دهید؟ هنوز در چه چیزی ضعیف هستید؟ بهترین راهی که من انجام این کار را توصیه میکنم، بررسی مخزنی از سوالات مصاحبه شغلی یک دانشمند داده پیتون است، مانند این سوالات مربوط به دانش داده. از آنجا، شما میتوانید به راحتی حوزههای تخصص خود را طرح کنید و آنچه را که احتمالا در کارهای مربوط به علم داده روی میدهد، بررسی کنید.
به عنوان مثال، ممکن است متوجه شوید که در حالی که یک دسته واقعی در استفاده از بسته «pandas» برای محاسبه تفاوتها و خروجی اعداد دارید، به کمی تمرین بیشتری در توسعه پیشبینیهای با پایتون نیاز دارید.
هنگامی که درک بهتری از نقاط قوت و ضعف خود به دست آوردید، بسیار بهتر آماده یادگیری علم داده با پایتون خواهید بود.
۳. انجام پروژههای جالب علوم داده مبتنی بر پایتون
پس حالا شما میدانید که چه چیزی نمیدانید. گام سوم این است که مهارتهای فراموش شده را تقویت کنید و مهارتهای جدید یاد بگیرید. بهترین راه برای انجام این کار پیدا کردن یک پروژه احساسی است.
من علم داده را با پایتون یاد گرفتم زیرا من به درک روندهای موجود در حساب کاربری اینستاگرام گربهام علاقهمند بودم. این کنجکاوی طبیعی مرا واداشت تا یاد بگیرم چطور دادهها را جمع کنم، آنها را در یک قالب قابل تجزیه و تحلیل قرار دهم، و نتایج خروجی را تجزیه و تحلیل کنم. اگر من سعی میکردم این کار را برای مدرسه انجام دهم، در اولین مانع تسلیم میشدم، یا فقط کد را بدون هیچ درک واقعی کپی میکردم.
در حالی که پایتون یک زبان عالی برای مبتدیان است، یادگیری علم داده با پایتون برای شما بسیار آسانتر خواهد بود اگر با هیجان شخصی برای درک و یادگیری به آن نزدیک شوید، به جای این که فقط دستورها و کد را حفظ کنید.
به لیست نقاط قوت و ضعف خود برگردید و بخشهایی را که هنوز در حال کشمکش هستید پیدا کنید. چه سوالات داغی دارید؟ آیا تعجب میکنید که آب و هوا چگونه بر زمان دویدن شما تاثیر میگذارد؟ آیا میخواهید بفهمید که چرا این همه سنجاب در محله شما وجود دارد؟ آیا میخواهید رابطه بین اندازه پرنده و احتمال انقراض آنها را بررسی کنید؟ (اینها همه نمونههای شخصی هستند، در صورتی که نتوانید بگویید.)
نگاهی به برخی پروژههای آنلاین بیاندازید تا الهام بگیرید. به عنوان مثال، اگر میخواهید چند پروژه الهامگرفته از یادگیریی ماشین پیدا کنید، Confetti پر از مثالهای مفید است. اگر بتوانید انگیزه خود را طوری تنظیم کنید که تنها چیزی که بین شما و پاسخ به سوالی که میخواهید بفهمید این باشد که مهارت کافی ندارید، یادگیری علم داده با پایتون هیچ مانعی ایجاد نخواهد کرد. شما به سرعت ترغیب خواهید شد تا علم داده را با پایتون یاد بگیرید و به سوالات آزار دهنده پاسخ دهید.
پیگیری این نوع پروژههای داده با پایتون، درک خوبی از روشهای آماری مختلف، دادهها شامل نمودارها، و مشکلاتی که در مسیر یادگیری علم داده با پایتون با آنها مواجه خواهید شد، به شما خواهد داد.
۴. به دنبال مهارتهای ذکر شده در مشاغل علمی دادههای سطح ورودی باشید.
اگر شما در موقعیت یادگیری علم داده با پایتون هستید، احتمالا نمیخواهید فورا وارد یک کار علمی داده شش رقمی شوید. این اشکالی ندارد! با توجه به تقاضای بالا برای مهارتهای علم داده، شما نیازی به مدرک برای گرفتن یک کار علم داده ندارید. شما فقط به تجربه نیاز دارید.
با در نظر گرفتن این موضوع، نگاه کردن به توصیف شغلی آن مشاغل بزرگ علمی، منطقی به نظر نمیرسد، زیرا یادگیری علم داده با پایتون تا آن سطح، برای شما غیر واقعی خواهد بود. برای شروع به کار در جهت رسیدن به آن شغل رویایی علم داده، شما باید به جای آن به توصیف شغل برای تحلیلگران کسبوکار و تحلیلگران داده را جستجو کنید، که با دانشمندان داده هم پوشانی خواهند داشت. دانشمندان جونیور داده نیز می توانند نقش شغلی خوبی داشته باشند.
مانند تهیه نقشه چیزهایی که نمیدانید، لیستی از تمام نیازمندیهای شغلی که در حال حاضر نمیتوانید به آنها رسیدگی کنید، بنویسید. این کار به شما ایدهای از مهارتهای عملی که برای شروع مسیر شغلی علم داده به آنها نیاز دارید، میدهد. سپس به دنبال راههایی برای انجام این وظایف با استفاده از پایتون باشید.
به عنوان مثال، بوز آلن همیلتون از دانشمندان اطلاعات جوان خود میخواهد که تجربه NLP را داشته باشند. یک جستجوی سریع گوگل مرا به این مقاله هدایت کرد، که در آن اریک کلپن سه پروژه ساده را برای یادگیری NLP با پایتون کنار هم گذاشت. هر چه به مشاغل خاصتر نگاه کنید، ایدهای که از مهارتهای معمول و مطلوب برای مشاغل علمی دادههای سطح ورودی برخوردار باشید، بهتر خواهد بود.
هنگامی که تعدادی از این پروژهها را تنظیم و تکمیل کردید، در ۹۵٪ از راه یادگیری علم داده با استفاده از پایتون خواهید بود. شما میدانید که علم داده چیست، باید بر روی چه چیزی تمرکز کنید، چه پروژههای جالبی میتوانند به شما کمک کنند تا مهارتهایی که هنوز ندارید را یاد بگیرید، و حتی به دنبال چه مشاغل سطح ورودی هستید. گام نهایی ادامه یادگیری است.
۵. کنجکاو باشید.
یادگیری علم داده هرگز با پایتون یا هر زبان دیگری واقعا به پایان نمیرسد. در نظر بگیرید که مسیر حرفهای دانشمند داده به سختی یک دهه پیش وجود داشت، و شما خواهید فهمید که چیزها چقدر سریع میتوانند تغییر کنند. مانند هر زبان دیگری، بستههای جدید، پروژهها و مفاهیم همیشه در پایتون منتشر میشوند. برای به روز ماندن، قابل استخدام بودن، و دانستن، مطمئن شوید که با شور و شوق و کنجکاوی به این تحولات نزدیک میشوید.
در هر مرحله از مسیر شغلی دانشمند داده، میتوانید مراحل ۱ تا ۴ را تکرار کنید و ممکن است پاسخ کمی متفاوتی دریافت کنید، همانطور که مسیر شغلی تکامل مییابد، و همچنین مهارتها و الزاماتی که با آن پیش میروند. زمانی که آمادهاید شغل بعدی خود را به دست آورید، شکافهای موجود در دانش خود را بازبینی کنید. زمانی که به این فکر میکنید که برای یک کار علمی داده در گوگل بروید، مطمئن شوید که بدانید آنها از شما میخواهند چه مهارتهایی را ثابت کنید. و از همه مهمتر، کنجکاو بمانید. به سوال پرسیدن ادامه دهید. با اشتیاق و علاقه به نادانی خود نزدیک شوید. این روشی است که شما میتوانید با استفاده از پایتون به یادگیری علم داده ادامه دهید.
اندیشههای نهایی در مورد چگونگی یادگیری علم داده با پایتون
این مقاله برای افرادی تهیه شدهاست که برخی از پایتون ها را میشناسند، فکر میکنند که ممکن است کار در علم داده را دوست داشته باشند، و میخواهند بدانند که چگونه به پایتون موجود خود تکیه کنند تا علم داده را بیاموزند. پایتون بهترین زبان برنامهنویسی برای یادگیری علم داده با، آسانی برای مبتدیان برای انتخاب، و آسان برای مبتدیان برای بهبود آن است.
به طور خلاصه، بهترین راه برای یادگیری علم داده با پایتون به این سادگی است:
- یک درک به روز از این که علم داده در واقع چیست داشته باشید
- نقشه شکاف دانش و دانش پایتون موجود خود را تهیه کنید
- پروژههای پایتون را انتخاب کنید که علاقه شما را حفظ کنند
- مهارتهای مورد نیاز مشاغل علم دادههای سطح ورودی را درک کنید.
- در مورد علم داده و پایتون به عنوان یک زبان برنامهنویسی کنجکاو باشید. هر دو به طور مکرر تغییر میکنند.
با این کار، شما در مسیر یادگیری علم داده با پایتون و تامین شغل رویایی خود به عنوان یک دانشمند داده خواهید بود.
این متن با استفاده از ربات مترجم مقالات دیتاساینس ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه میتواند دارای برخی اشکالات ترجمه باشد.
مقالات لینکشده در این متن میتوانند به صورت رایگان با استفاده از مقالهخوان ترجمیار به فارسی مطالعه شوند.
مطلبی دیگر از این انتشارات
تجارت چالشبرانگیز تیمهای پیشرو
مطلبی دیگر از این انتشارات
۱۰ گرایش هوش مصنوعی برتر در سال ۲۰۲۰
مطلبی دیگر از این انتشارات
هوش مصنوعی در حال یادگیری نحوه خلق خود است