Data Scientist & Big Data Strategist
مسیر آموزشی علمداده!
یکی از مهمترین گامهای تبدیلشدن به یک متخصص علمداده، انتخاب مسیر آموزشی بهینه جهت آموزش مفاهیم و ابزارهای کارآمد منطبق با بازار کار است. موضوعی که توسط مؤسسات و دورههای آموزشی که در کشور نیز در حال گسترش است کمتر به آن توجه میشود.
مسیر پیشنهادی زیر یکی از نمونه مسیرهای آموزشی مناسب جهت تبدیلشدن به یک متخصص علمداده و تحلیلگر کلان داده منطبق با بازار کار بینالمللی و ایران هست.
? بخش مقدماتی:
?پیشنیاز:
یکی از مهمترین پیشنیازهای ورود به حوزه علمداده فراگیری مفاهیم پایه حوزههای آمار، دادهکاوی و... است. آموزش ساختار و قواعد زبان برنامهنویسی پایتون، توانایی کار با پایگاه دادههای رابطهای و اجرای کوئریهای SQL ای نیز از دیگر پیشنیاز کلیدی میباشد.
?علمداده با پایتون:
پس از آموزش ساختار و قواعد زبان برنامهنویسی پایتون، در گام بعدی فراگیری کتابخانههای تحلیل داده این زبان برنامهنویسی حائز اهمیت است. کتابخانه Pandas بابت تحلیل دادههای ساختیافته، کتابخانه Numpy جهت پیادهسازی مفاهیم پایه ریاضی و آمار، کتابخانه Matplotlib جهت مصورسازی دادهها، کتابخانه IPython جهت اجرای Interctive پروژههای علمداده و... در این گام مفید خواهد بود.
?یادگیری ماشین:
در این گام هدف پیادهسازی و اجرای پروژههای یادگیری ماشین میباشد. کتابخانه Scikit learn از مطرحترین کتابخانههای زبان پایتون است که بهوسیله آن امکان پیادهسازی اکثر پروژههای یادگیری ماشین فراهم خواهد شد. آموزش تخصصی این کتابخانه در پروژههای موردی بسیار مفید است.
? بخش پیشرفته:
در بخش پیشرفته تمرکز بر پلتفرمها و ابزارهای نوظهور است که در صورت فراگیری آن امکان رشد بسیار سریعتر در این فیلد کاری میسر خواهد شد.
?یادگیری عمیق:
با توجه به قابلیتهای یادگیری عمیق در مسائل پیچیده، یادگیری فریمورکها و کتابخانههای یادگیری عمیق نقش به سزایی در موفقیت شما بهعنوان یک متخصص علمداده خواهد داشت. کتابخانههای Tensorflow و Keras دو کتابخانه مطرح یادگیری عمیق هستند که آموزش یکی از این دو بسیار مفید خواهد بود. تمامی این کتابخانهها دارای واسط برای زبان برنامهنویسی پایتون هستند.
?کلان داده:
با توجه به افزایش سرعت، حجم و تنوع اطلاعات، در حال حاضر دو جایگاه متخصص علمداده و تحلیلگر کلان داده بهمراتب به یکدیگر نزدیک شدهاند و بعضاً در فرصتهای شغلی متخصصین علمداده تواناییهای مرتبط با حوزه Big Data نیز از پیشنیازهای اصلی است. آشنایی با اکوسیستم Hadoop و زیر پروژههای آن همانند Pig, Sqoop, Hive و... در این بخش پیشنهاد میشود.
?آپاچی اسپارک:
آپاچی اسپارک یکی از برترین پلتفرمهای پردازشی در حوزه کلان داده است. فراگیری کتابخانههای یادگیری ماشین این پلتفرم(MLlib)، اجرای کوئریهای SQL در این پلتفرم پردازشی (Sprak SQL) و... جهت رشد سریعتر شما در این حوزه کاری بسیار موثر است.
پینوشت:
1- جهت یادگیری اصولی و کاهش پیچیدگیهای آموزشی در این مسیر توصیه میکنم حتما گامها به ترتیب طی شود. بعضاً برخی از علاقهمندان بدون دانش مقدماتی یا در شروع فرایندهای آموزشی به دنبال یادگیری مفاهیم و ابزارهای تخصصی یادگیری عمیق یا کلان داده میشوند. امری که سبب بروز پیچیدگی و کسب دانش سطحی خواهد شد.
2- انتخاب موسسه و دوره آموزشی مناسب یکی از کاتالیزورهای موفقیت شما در این مسیر آموزشی دشوار اما جذاب است. اگر علاقهمند به شرکت در دورههای حضوری یا آنلاین هستید دوره جامع علمداده دانشگاه تهران یکی از برترین دورههای این حوزه میباشد.
https://utperm.com/course/data-science-ut/
ارادتمند
محمدرضا محتاط
مطلبی دیگر از این انتشارات
Supervised Learning - قسمت اول
مطلبی دیگر از این انتشارات
به تصویر کشیدن داده ها
مطلبی دیگر از این انتشارات
قسمت اول- یادگیری ماشین چیست؟