۵ درسی که باید در ابتدای یادگیری علوم داده بدانید.

شکل 1: یادگیری علوم داده
شکل 1: یادگیری علوم داده


منتشرشده در towardsdatascience به تاریخ ژانویه 2021
لینک منبع: 5Lessons I Wish I’d Known When I Started Learning Data Science


یکی از قدیمی‌ترین دوستانم با شروع به یادگیری علوم داده، مرا برای مشاوره فراخواند. او می‌خواست رشته‌اش را عوض کند. من در نهایت یک گفتگوی طولانی با او در مورد تجربه‌هایی که برای من مفید بود داشتم. واضح بود که او غرق در هزاران منبع در دسترس آنلاین بود و می‌خواست اطلاعات قابل‌اعتماد کسی را بشنود که با موفقیت وارد علوم داده شده است.

درحالی‌که واقعاً فروتن بودم، او تصمیم گرفت از من مشاوره بخواهد؛ من متوجه شدم که افراد زیادی هستند که منبع اطلاعات قابل‌اعتمادی ندارند و می‌توانند از چیزهایی که من به او گفتم بهره ببرند. اگر شما شروع به یادگیری علوم داده در موقعیت مشابه به‌عنوان دوست من کنید، این مقاله برای شما است. در این مقاله، من هر چیزی را که دوست داشتم بدانم و هر درسی که برای شما به معنای یک تجربه بهتر یادگیری است را خلاصه می‌کنم.

مطالعه مقاله بهترین راه برای آماده‌سازی شغلی در علم داده / یادگیری ماشینی چیست؟ توصیه می‌شود.


شما برای ورود به این رشته نیازی به مدرک کارشناسی ارشد ندارید.

هیچ راهی برای اطمینان ۱۰۰٪ وجود ندارد، مگر این‌که خودتان آن را تجربه کنید. اما اگر بخواهید به دنبال نمونه‌هایی در دنیا بگردید و با افرادی که در حال حاضر در این زمینه هستند صحبت کنید، آن‌ها نیز همین را به شما خواهند گفت.

بسیاری در حال حاضر در علوم داده و هوش مصنوعی بدون تحصیلات رسمی مرتبط غوغا می‌کنند، چه رسد به مدرک کارشناسی ارشد! من به‌اندازه کافی خوش‌شانس بودم که توسط یک مهندس گوگل هدایت شدم، و کلمات او به من دیدگاهی مناسب دادند.

او گفت: من از یک دانشگاه معتبر کارشناسی ارشد دریافت کرده‌ام، اما در تیم من [در گوگل] افرادی هستند که این مدرک را ندارند، اما اگر عملکرد آن‌ها بهتر نباشد به همان اندازه خوب است.

کارشناسی ارشد یکی از روش‌های ثابت‌شده تاریخی برای نشان دادن تخصص شماست - راه‌های دیگری نیز وجود دارند. تا جایی که بتوانید تخصص خود را نشان دهید، خوب خواهید بود.

زمانی که در سال ۲۰۱۷ شروع به یادگیری علوم داده‌ها کردم، بر این باور بودم که علی‌رغم اتمام دوره کارشناسی علوم کامپیوتر، به مدرک کارشناسی ارشد نیاز دارم. من طرح MS در ایالات‌متحده و آماده‌سازی برای GREs را به یاد دارم. هرچه بیشتر درباره برنامه‌های طرح کارشناسی ارشد و ماژول‌هایی که ارائه می‌دادند تحقیق می‌کردم، بیشتر برایم روشن می‌شد. من می‌توانم آنچه را که آن‌ها در طول دوره کارشناسی ارشد آموزش می‌دهند، مستقیماً از آن‌ها، به‌راحتی در خانه خود با کمترین هزینه یاد بگیرم.

صبر کنید، آیا من این را گفتم؟ این برای شما چه معنی دارد؟ بله. برای سرمایه‌گذاری بسیار ارزان‌تر می‌توانید دوره‌های مشابه را از اساتید سیستم‌عامل‌های MOOC مانند Coursera ،Udacity و EdX بیاموزید.

کدام دوره‌ها؟ کدام پلتفرم‌ها؟ توصیه می‌کنم نگاهی به مقاله قبلی بیاندازید که من در آن منابعی را که استفاده کرده‌ام را توصیف می‌کنم.

من در اینجا جایگزین مدرک کارشناسی ارشد را برای شما خلاصه می‌کنم: نقاط قوت و ضعف خود را شناسایی کنید. اگر از یک زمینه متفاوت به اینجا آمده‌اید، ببینید چطور می‌توانید از مهارت‌های موجود خود به نفع خود استفاده کنید. آنچه هنوز برای یادگیری نیاز دارید را مشخص کنید و فقط روی آن‌ها تمرکز کنید.

برای یادگیری این مفاهیم به دوره‌های آنلاین از دانشگاه‌های مشهور بروید. من از کمک به شما در ارائه دوره‌های پیشنهادی بر اساس مهارت‌های موجود بسیار خوشحال خواهم شد. از این مهارت‌ها برای خلق پروژه‌های پورتفولیو استفاده کنید که تخصص شما را نشان می‌دهند. بهترین راه برای محکم کردن یادگیری استفاده از آن در یک پروژه است.

می‌دانم، ساده به نظر می‌رسد، اما جواب می‌دهد. شما برای ورود به این رشته نیازی به مدرک کارشناسی ارشد ندارید، اما هنوز هم باید تخصص و مهارت‌های خود را به نمایش بگذارید.


لازم نیست بین پایتون و زبان R یکی را انتخاب کنید.

این، اولین تصمیمی است که علاقه‌مندان به آن نیاز دارند. اگر شما نیز این سؤال را داشتید، من کاملاً درک می‌کنم. پاسخ کوتاه من این است: در نهایت از هر دو استفاده خواهید کرد.

با توجه به پیشینه علوم کامپیوتر، من به‌طور طبیعی با پایتون راحت بودم. من هیچ‌وقت زبان R را دوست نداشتم، عمدتاً به این خاطر که نتوانستم نحو را به دست آورم، و برای بیشتر کارها به پایتون مراجعه می‌کردم. چند ماه از سفر یادگیری من نگذشته بود که من خوش‌شانس بودم و یک دوره کارآموزی در دانشگاه را تحت نظر یک پروفسور به پایان رساندم.

این یک کارآموزی تجزیه‌وتحلیل داده بود و طعم دنیای علوم داده را به من داد. بااین‌حال، یک مشکل وجود داشت. استادی که مجبور بودم با او کار کنم با زبان R راحت بود. او از من خواست که همین کار را انجام دهم. اگر این اتفاق برای شما بیافتد، شما دو گزینه دارید: نه بگویید و به‌عنوان یکی از ضعیف‌ترین کارآموزان در معرض خطر باشید. بله بگویید - اما باید یک زبان جدید را از ابتدا یاد بگیرید.

من دومی را انجام دادم. من می‌خواستم به هر قیمتی که شده وارد این حوزه شوم، اگر به این معنی بود که باید یک زبان جدید یاد می‌گرفتم، اجازه دهید همین‌گونه باشد. من از این تجربه سپاسگزارم زیرا در اواخر دوره، من در نهایت یک ذهنیت یادگیری را اتخاذ کردم.

یک سال بعد، برای اولین شغلم، من باید هم از پایتون و هم از زبان R استفاده می‌کردم. حالا، در طول شغلم، من در درجه اول از PySpark استفاده می‌کنم. این شبیه به پایتون است، اما چیزهای بیشتری برای یادگیری وجود دارد. به لطف تجربیات قبلی، من بر ترس از یادگیری زبان‌های جدید غلبه کردم.

من عاشق این هستم که به چالش کشیده شوم و در نهایت پیروز شوم. این برای شما چه معنی دارد؟ وقتی شروع می‌کنید، اغلب سخت است که انتخاب‌های زیادی داشته باشید، و باید بهترین انتخاب را بکنید. اما وارد بحث این‌که کدام زبان / ابزار بهتر است نشوید. چرا؟ همه زبان‌ها هدفی در این اکوسیستم دارند.

به‌عنوان یک قاعده کلی، اگر شما از یک پس‌زمینه آمار یا ریاضی می‌آیید، توصیه می‌کنم با R شروع کنید. اگر از علوم کامپیوتر یا زمینه‌های دیگر آمده‌اید، می‌توانید با پایتون شروع کنید.

در نهایت، زبان مهم نیست. اینکه شما چقدر در مفاهیم علوم داده و هوش مصنوعی خوب هستید بیش‌ترین اهمیت را دارد. در نهایت هدف استفاده از هر ابزار یا زبانی که به بهترین نحو با مشکل متناسب باشد، این است که به تکنولوژی-اگنستیک منجر شود.

شاید به مطالعه مقاله کدنویسی را فراموش کنید! اکنون می‌توانید مسائل هوش مصنوعی خود را با اکسل حل کنید علاقه‌مند باشید.

عنوان شغل شما مهم نیست؛ نوع کار مهم است.

اکثر مبتدیان (از جمله من) از عنوان «دانشمند داده» پیروی می‌کنند. به‌هرحال، این کار به‌عنوان بهترین کار قرن بیست و یکم شناخته شده است.

اولین مواجه من با علوم داده به‌عنوان یک کارآموز تحلیلگر داده بود. قبل از اینکه اخیراً نقش یک دانشمند ارشد داده را بپذیرم، من همچنین به‌عنوان یک مهندس یادگیری ماشین کار کرده‌ام.
عجیب است که من از هر نقشی که تاکنون ایفا کرده‌ام لذت می‌بردم. متوجه شدم که بیشتر روی کاری که انجام می‌دادم تمرکز داشتم تا بر روی عنوان. پرسش‌هایی که از خود می‌کردم: آیا من هر روز چیز جدیدی یاد می‌گیرم؟ آیا کاری که من انجام می‌دهم تأثیری روی دنیای واقعی دارد؟ آیا من در معرض یک خط یادگیری ماشین end-to-end قرار گرفتم؟

اگر در مورد نقش‌های مختلف در علوم داده، تحلیلگر داده چیزی نشنیده‌اید، از این قرارند: مهندس داده، تحلیلگر هوش تجاری، مهندس یادگیری ماشین، تحلیلگر محصول، تحلیلگر کسب‌وکار، مهندس MLOps و این فهرست ادامه دارد.

اگر فراتر به‌عنوان نگاه کنید و بر روی کاری که انجام می‌دهید تمرکز کنید، همه نقش‌ها می‌توانند به همان اندازه پاداش داشته باشند. دنبال چه چیزی بگردید: به‌عنوان یک مبتدی، لطفاً ذهن باز داشته باشید. دانشمند داده یک اصطلاح فراگیر است، و عنوان آن مهم نیست، اما نوع کار مهم است. شما می‌توانید به‌عنوان یک دانشمند داده درحالی‌که پرس‌وجوی پیش‌پاافتاده SQL را انجام می‌دهید، و یا به‌عنوان یک تحلیلگر داده در حال کار بر روی فن‌آوری‌های پیشرفته شناخته شوید. هر دو وجود دارند.

من توصیه می‌کنم هر نقشی را به عهده بگیرید تا یادگیری موارد جدید، شما را به چالش بکشد. به‌طور پیوسته یک سری سؤالات بر اساس این‌که چه چیزی برای شما بیش‌ترین اهمیت را دارد، از خودتان بپرسید تا واقعیت را بررسی کنید. توجه زیاد به عناوین شانس شما برای ورود به میدان را محدود خواهد کرد، و شما نمی‌خواهید این کار را انجام دهید. امتحان کردن نقش‌های مختلف به شما کمک می‌کند نقاط قوت خود را مشخص کنید. هنگامی‌که متوجه شدید در چه چیزی خوب هستید، ممکن است بر روی آن تمرکز کرده و تخصص خود را پیدا کنید.


به استارتاپ‌ها برای اولین کار علوم داده خود نزدیک شوید.

اگر در جای مناسب قرار بگیرید منحنی یادگیری بسیار زیاد است. من در این یکی خیلی شانس آوردم. من در جزیره کوچکی به نام سری‌لانکا زندگی می‌کنم، و تنها تعداد انگشت‌شماری از شرکت‌ها در علوم داده و هوش مصنوعی وجود دارند. فرصت‌های شغلی در مقایسه با ایالات‌متحده و بریتانیا در اینجا کم هستند.

ازآنجاکه در اینجا شرکت‌های فن‌آوری بزرگ زیادی با مشاغل علوم داده نداریم، خود را در یک استارتاپ هوش مصنوعی یافتم، و نمی‌توانستم خوشحال‌تر از این باشم. شما واقعاً نیازی به یک شرکت فن‌آوری بزرگ در پشت نام خود در ابتدای کارتان ندارید. منحنی یادگیری بسیار مهم‌تر است. اگر استارتاپ مناسب را پیدا کنید که یادآور ارزش‌ها و فرهنگ شما باشد، احساس خواهید کرد که در خانه هستید.

استارتاپ‌ها یک تجربه یادگیری غنی با فرصت‌های فراوان برای رشد ارائه می‌دهند. اگر شما طرز فکر درستی برای استارتاپ داشته باشید، هیچ‌کس نمی‌تواند شما را از شکوفایی در حرفه‌تان باز دارد.

چگونه به استارتاپ‌ها نزدیک شویم: استارتاپ‌ها همه در مورد افراد و فرهنگ هستند. بهترین راه برای فهمیدن این‌که آیا شما متناسب خواهید بود، از طریق ارتباط با کارمندان آن‌ها است. در اینجا به چند نکته اشاره می‌کنیم:

· با کارمندان در لینکدین ارتباط برقرار کنید و حساب رسانه‌های اجتماعی آن‌ها را فالو کنید. این به شما طعم فرهنگ آن‌ها و کاری که بر روی آن کار می‌کنند را می‌دهد.

· بر اساس درک شما از استارتاپ‌ها، لیستی کوتاه از استارتاپ‌هایی که واقعاً به آن‌ها علاقه دارید، تهیه کنید.

· بر روی مهارت‌های مورد نیاز کار کنید و پروژه‌های قابل‌نمایش برای به نمایش گذاشتن ایجاد کنید.

· از طریق ایمیل و یا لینکدین به فردی از تیم مراجعه کنید و به او اطلاع دهید که به کاری که آن‌ها انجام می‌دهند علاقه دارید.

اگر یک جای خالی وجود داشته باشد، در نهایت جواب خواهد داد. صبور باشید.

این یک داستان واقعی از چند جوان علاقه‌مند به داده‌های پرشور است که به استارتاپ هوش مصنوعی که من عضو آن بودم، پیوستند. آن‌ها دقیقاً همان کاری را کردند که من در بالا ذکر کردم، و ما خیلی خوشحال بودیم که از آن‌ها در به تیممان استقبال کنیم.


هرگز برای شروع به اشتراک‌گذاری هرچه می‌دانید، هرچند کم زود نیست.

یک نفر (و خود شما در آینده) از آن بهره‌مند خواهد شد و از آن تقدیر خواهد کرد. وقتی من شروع به یادگیری علوم داده‌ها کردم، احساس کردم که هیچ دانشی برای به اشتراک گذاشتن ندارم. منظورم این است که چه کسی ممکن است بخواهد در مورد تجربیات من بداند؟ من به‌هیچ‌وجه متخصص نیستم.

من متقاعد شدم که نوشته راشل توماس از Fast.ai را بنویسم و ​​سرانجام گامی برداشتم تا دانش خود را در اینجا در یک وبلاگ به اشتراک بگذارم. دو تغییر مهم رخ داد: اول، بسیاری از افراد می‌توانستند با تجربیات من ارتباط برقرار کنند و از کار من بهره‌مند شوند. من به‌طور مداوم بازخوردهای مثبت دریافت می‌کردم و خیلی خوشحال بودم که به هر کسی که به من می‌رسید کمک کنم. دوم، من شروع به درک مفاهیمی که نوشتم، خیلی بهتر از قبل کردم. یادگیری یک چیز است، اما وقتی سعی کردم آن را در یک مقاله توضیح دهم، مجبور شدم تحقیقات بیشتری انجام دهم و یادگیری‌ها و توضیحات خود را ترکیب کنم. این عمل درک من از مفاهیم اصلی را افزایش داد.

من بیش از آنچه خوانندگان من از آن بهره‌مند شده‌اند، از آن بهره‌مند شده‌ام. یادگیری یک چیز جدید و به اشتراک گذاشتن آن با خوانندگان من اکنون تبدیل به یک عادت شده است. ای‌کاش خیلی زودتر شروع به اشتراک‌گذاری می‌کردم.

«تدریس دو بار یادگرفتن است.» جوزف ژوبرت

چگونه به اشتراک‌گذاری را آغاز کنیم؟ وقتی در حال پیشرفت از طریق سفر یادگیری خود هستید، در واقع چیز زیادی برای به اشتراک گذاشتن ندارید. شما هنوز هم می‌توانید با به اشتراک گذاشتن تجربیات خود درباره آنچه یاد گرفته‌اید، آنچه که جواب داد و آنچه که جواب نداد شروع کنید.

این می‌تواند در وبلاگ شما، Medium، یا هر پلتفرم دیگری مانند یوتیوب باشد. به این فکر کنید که به یک دوست یاد می‌دهید تا با شما یاد بگیرد.
شما به‌راحتی افراد همفکر را از این پلتفرم‌ها پیدا خواهید کرد. هرچه بیشتر یاد بگیرید، چیزهای بیشتری برای یادگیری باقی می‌ماند. به‌عنوان یک مبتدی، شما نمی‌خواهید به‌عنوان کسی که رجز می‌خواند و همه چیز را می‌داند، ظاهر شوید.

همیشه به یاد داشته باشید که حتی اگر احساس می‌کنید به موفقیت‌های چشمگیری دست یافته‌اید، دستاوردهای زیادی برای رسیدن به آن وجود دارد. در مورد انواع بازخوردهایی که هنگام قرار دادن مطالب خود در آنجا دریافت می‌کنید، فروتن و صبور باشید.

اگر شروع نکنید، هرگز نمی‌دانید چه چیزی در چنته دارید.


سخن پایانی

از اینکه تاکنون مقاله را مطالعه کرده‌اید، سپاسگزارم. من واقعاً امیدوارم که این مقاله برای شما مفید بوده باشد، به‌خصوص اگر شما شروع به یادگیری علوم داده کرده‌اید. در این مقاله، من درس‌هایی را که در طول یک ساعت گفتگو با دوستم به اشتراک گذاشته بودم خلاصه کردم:

· شما برای ورود به این رشته نیازی به مدرک کارشناسی ارشد ندارید.

· لازم نیست بین پایتون و زبان R یکی را انتخاب کنید.

· عنوان شغل شما مهم نیست؛ نوع کار اهمیت دارد.

· به استارتاپ‌ها برای اولین کار علوم داده خود نزدیک شوید.

· هرگز خیلی زود نیست که شروع به به اشتراک‌گذاری هر چیز کوچکی که می‌دانید بکنید.

ترجمه این مقاله با استفاده از ربات ترجمه آنلاین مقالات دیتا ساینس انجام شده و به‌صورت محدود مورد بازبینی انسانی قرار گرفته است. در نتیجه ممکن است دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به‌صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.