یادگیری و آموزش هوش صنوعی
یادگیری و آموزش هوش صنوعی
خواندن ۹ دقیقه·۹ ماه پیش

یادگیری علوم داده به صورت خودآموز + تجربه یک متخصص

✅ پس از اشتباهات من درس بگیرید!

✍🏼 جولین بوثما / کارشناس ارشد آمار و مشاور علم داده

علم داده برای افراد مبتدی
علم داده برای افراد مبتدی


🔷 یادگیری علم داده به روش Self Study به مسیری محبوب و قابل قبول برای ورود به حوزه Data Science تبدیل شده است. با این حال، مانند هر روش دیگری، خودآموزی با چالش های زیادی همراه است. شما باید برنامه درسی خود را ایجاد کنید، انگیزه خود را حفظ کنید و خود را مسئول یادگیری تان بدانید. من هم از این چالش ها مستثنی نبودم و در سفر یادگیری ام اشتباهات زیادی مرتکب شدم.

🔶 من یک برنامه درسی خودآموز ۶ ماهه برای یادگیری علوم داده ایجاد کردم که در نوامبر ۲۰۲۱ شروع شد. حتی با وجود اینکه قبلاً مدرک کارشناسی ارشدم را در رشته آمار گرفته بودم و چند سالی در علم داده کار کرده بودم، هنوز مطالب زیادی وجود داشت که به آن ها مسلط نبودم. حقیقت این است که علم داده به سرعت در حال پیشرفت است و همه جا وجود دارد. پس "یادگیری" به عنوان بخش جدایی ناپذیر علم داده همواره لازم است.

🔺 پس از مطالعه در مورد برنامه درسی کارشناسی ارشد هوش مصنوعی دانیل بورک، فکر کردم که ایجاد یک برنامه درسی برای خودم برای پیشرفت و بهبود مهارت های علم داده ام ایده خوبی است. با این حال، برنامه درسی ۶ ماهه خودآموز من طبق برنامه پیش نرفت. اگر به فکر این هستید که علم داده را خودآموز بیاموزید، من به شما یاد خواهم داد که اشتباهاتی را که من انجام دادم مرتکب نشوید.

✅ برنامه درسی علوم داده من

📑 برنامه درسی که من ایجاد کردم ترکیبی از دوره ها و کتب آموزشی بود. من سعی کردم منابع را از مجموعه های مختلف انتخاب کنم تا فقط به یک فرد، شرکت یا پلتفرم تکیه نکنم. با این روش اگر یک منبع، مطالب را به گونه‌ای کامل که به من کمک کند،توضیح نمی‌داد، می‌توانستم به راحتی به منبع دیگری اتکا کنم تا اینکه مطالب را به روشی که خودم دوست دارم و بهتر می‌فهمم یاد بگیرم.

🔔 منابعی که من استفاده کردم عبارت بودند از:

📂 برای یادگیری ماشین:

1️⃣ کتاب Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow

2️⃣ دوره Python for Data Science and Machine Learning Bootcamp

📂 برای یادگیری عمیق:

1️⃣ دوره Practical Deep Learning for Coders

2️⃣ دوره Deep Learning Specialization

3️⃣ دوره Full Stack Deep Learning - Spring 2021

4️⃣ دوره Hugging Face community

📂 منابع اضافی:

1️⃣ کتاب Machine Learning by Tom M. Mitchell

2️⃣ کتاب Deep Learning (Adaptive Computation and Machine Learning series)

🔲 من حدود نیمی از منابع فوق را که قصد داشتم در برنامه درسی خود پوشش دهم تکمیل کردم. اما در سفر خودآموزی خود اشتباهات زیادی مرتکب شدم و که مایلم آن ها را در این مقاله با شما به اشتراک بگذارم.

🟥 اشتباه شماره (۱): نگرانی بیش از حد در مورد انتخاب بهترین دوره یا بهترین کتاب برای شروع یادگیری علم داده

🔷 ما واقعاً با تعداد زیادی از کتاب‌ها، دوره‌ها، ویدیوهای یوتیوب، پست‌های وبلاگ و منابع دیگری که برای شروع یادگیری علم داده در دسترس هستند، رو به رو هستیم و ممکن است در مورد انتخاب بهترین منابع دچار مشکل شویم. در واقع انتخاب منابعی که می خواهید در دوره یادگیری خود استفاده کنید ممکن است دشوار باشد و به طور طبیعی، شما می خواهید فقط از بهترین یا توصیه شده ترین منابع استفاده کنید.

🔶 آمادگی برای خودآموزی بسیار مهم است. اسکات یانگ در کتاب Ultralearning خود بیان می‌کند که حدود ۱۰ درصد از کل سرمایه‌گذاری شما در پروژه باید صرف «یادگیری» یا آماده‌سازی برای "آن چه و چگونه یاد خواهید گرفت"، شود.

🔔 هنگام انجام این آماده سازی، سبک یادگیری خودم را نادیده گرفتم و تاکید زیادی بر منبعی داشتم که در زمانی که واقعا برای من مناسب نبود، به شدت توصیه می شد. حقیقت این است که چیزی به نام یک دوره عالی یا یک کتاب جامع وجود ندارد! و من این تجربه گران بها را به سختی یاد گرفتم!

🟧 اشتباه شماره (۲): استفاده از منابعی که با سبک یادگیری من مطابقت نداشت

🔷 من از دوره های ویدیویی یا سخنرانی ها مطالب را خوب یاد نمی گیرم. ممکن است فکر کنید که از سال‌های زیادی که در دانشگاه گذرانده‌ام، درس‌ام را یاد گرفته‌ام، اما نه، این کار را نکردم. من با روش های بسیار فعال بهتر یاد می گیرم. من نمی توانم منفعلانه یاد بگیرم. این مدل ممکن است فقط برای من کار نکند و شما با یادگیری از طریق ویدیوهای آموزشی یا منابع آنلاین بهتر مباحث را فرا بگیرید. اما من از طریق یادگیری عملی، فعالانه و تجربیات و تمرینات واقعی مباحث را بهتر یاد می گیرم.

◼️ در دانشگاه، چیزی که باعث شد من با نمرات عالی فارغ التحصیل شوم، سوالات تمرینی فراوان، برگه های امتحانات گذشته، تمرین ها و تکالیف پروژه ای بود که انجام دادم. من اطلاعات بسیار کمی از نشستن در یک سخنرانی یا کلاس حفظ کردم، چه یادداشت برداری کرده باشم یا نه. من نیاز داشتم که در واقع به روشی فعال با مطالب درگیر باشم تا بتوانم هر چیزی را به خاطر بسپارم یا یاد بگیرم.

🔺 اما این روش برای سفر خودآموز من تفاوت داشت. متوجه شدم که تمام دوره‌های ویدیویی که در برنامه درسی‌ام برنامه‌ریزی کرده بودم، به من در یادگیری کمک نمی‌کنند. آن ها بیش از حد منفعل بودند. به همین دلیل، از یادگیری بسیاری از مفاهیم اصلی باز ماندم و هر چقدر سعی می کردم مفاهیمی را که در دوره ویدیویی مورد بحث قرار گرفته بفهمم، بی ثمر بود و احساس ناامیدی زیادی می کنم.

🟨 اشتباه شماره (۳): انجام ندادن پروژه های کافی

🔷 قصد من از برنامه درسی ام این بود که تا حد امکان پروژه های زیادی را انجام دهم که از طریق مفاهیم و روش های مختلفی که یاد می گرفتم پیشرفت کنم. این کار با کتاب Hands on Machine Learning خیلی خوب شروع شد و من برای هر فصل پروژه‌ای انجام دادم، اما وقتی دوره‌های مبتنی بر ویدیو را شروع کردم، شرایط تغییر کرد و وارد حالت منفعلانه شدم.

🔔 تینا هوانگ در یکی از ویدیوهای یوتیوب خود اشاره می کند که شما فقط باید به اندازه نیاز یاد بگیرید تا بتوانید دانش خود را در یک پروژه به کار ببرید. این در واقع مهم ترین بخش مطالعه علم داده است - پروژه ها، پروژه ها، پروژه ها!

اگر دوست دارید پایتون را بخوبی یاد بگیرید، سفر یادگیری پایتون از صفر را نیز مطالعه کنید.

🟪 اشتباه شماره (۴): رفع مشکلات پروژه با یادگیری تمام ریاضیات

🔷 یادگیری ماشین بر پایه ریاضیات بنا شده است. با این حال، برای یادگیری، اعمال یا انجام علم داده نیازی به دانستن یا درک همه ریاضیات ندارید! در طول سفر خودآموزی، قبل از اینکه به مبحث بعدی بروم، بیش از حد بر درک هر مفهوم ریاضی تمرکز می کردم.

🔶 این چیزی است که از دوران دانشگاه در من ریشه دوانده بود. اثبات قضایا و کار کردن الگوریتم‌ها در فرآیند یادگیری استاندارد بود. در حالی که من معتقدم که داشتن پایه های ریاضی برای درک عمیق یک مفهوم مهم است، اما قطعاً لازم نیست هر مفهوم ریاضی مورد استفاده در یک روش را بشناسیم یا درک کنیم. این به سادگی شما را به دانشمند داده بهتری تبدیل نمی کند.

🔔 مهم ترین عامل در انجام یک پروژه خوب به عنوان یک دانشمند داده (به نظر من) حل مسئله است. آیا می توانید مشکلی را که به شما ارائه می شود را انتخاب کنید و راه حلی را تدوین کنید که ارزشمند باشد؟

🟦 اشتباه شماره (۵): خواندن مقالات تحقیقاتی از ابتدا در آغاز سفر

🔶 خواندن یا نخواندن مقالات تحقیقاتی موضوعی پیچیده در علم داده است و با توجه به تعداد تحقیقات جدید روزانه منتشر می شود.

◼️ قبل از شروع این سفر خودآموز، اصلاً چیز زیادی در مورد یادگیری عمیق نمی دانستم. من کاملا مبتدی بودم. من این اشتباه را مرتکب شدم که فکر می‌کردم باید مقالات تحقیقاتی مرتبط با برخی از موضوعاتی را که یاد می‌گرفتم بخوانم (و درک کنم).

🔷 خواندن مقالات تحقیقاتی قبل از اینکه درک کاملی از مفاهیم و روش‌های اطراف داشته باشم فقط باعث شد احساس ناامیدی و ناکافی بودن کنم، مثل اینکه به نوعی دانشمند داده‌ای «بد» هستم، زیرا این مقالات تحقیقاتی برای من خیلی معنی نداشت.

🔔 در سفر یادگیری خود نیازی به خواندن مقالات تحقیقاتی ندارید، به خصوص اگر هنوز در ابتدای راه هستید و در حال یادگیری مطالب جدید هستید. اگر به مقالات تحقیقاتی علاقه دارید، توصیه می‌کنم آن ها را بعداً؛ زمانی که پایه‌های شما در علم داده قوی شد، آغاز کنید.

📍 قدم بعدی چیست؟

🔰 سفر خودآموز من صرفاً به این دلیل تمام نشده است که دوره زمانی شش ماهه تمام شده است. یادگیری بخش ثابتی از دانشمند داده بودن است و من از آن لذت می برم. در غیر این صورت، اشتباهات و شکست های من به من آموخته است که چه کارهایی را انجام ندهم و به عنوان راهنمای اهداف یادگیری آینده من خواهد بود. در ادامه، من بر دو جنبه اصلی یادگیری خود تمرکز می کنم:

1️⃣ استفاده از منابعی که شامل بخش های فعال تری از یادگیری است

2️⃣ انجام پروژه های بیشتر

💎 برای اولین نکته، من یک کتاب آنلاین عالی (رایگان) به نام Dive Into Deep Learning پیدا کردم که قبلاً به شدت از آن برای مطالعه یادگیری عمیق استفاده می کردم. هر موضوع را با ترکیبی از ریاضی، کد و توضیحات پوشش می دهد و یادگیری مبتنی بر پروژه را با مجموعه ای از داده های واقعی انجام می دهد.

💎 من از DataCamp Workspaces برای یافتن داده ها و تکمیل پروژه ها، برای نکته دوم استفاده می کنم. دلیل استفاده من از DataCamp Workspaces این است که هر مجموعه داده ای که ارائه می دهند دارای بخش چالش ها و سناریوها است. وقتی نمی‌دانید با یک مجموعه داده جدید از کجا شروع کنید، این موارد بسیار مفید هستند.

🔔 به نظر من سناریوها بسیار مفید هستند زیرا شما را بلافاصله در حالت حل مسئله قرار می دهند. با استفاده از این سناریوها شما می توانید یک پروژه برای مجموعه خود بسازید که علاوه بر اینکه بر مدل های یادگیری ماشین توجه دارد، به جنبه های تجاری و حل مسئله نیز توجه ویژه ای دارد.

✅ نتیجه:

🔷 امیدوارم با به اشتراک گذاشتن اشتباهاتی که در این مقاله مرتکب شدم بتوانم به شما در سفر خودآموزی تان کمک کنم.

📣 در پایان به این نکته اشاره می کنم که؛ خودآموزی به همان اندازه که به کشف مطالب مربوط می شود، مربوط به کشف خود است. شما یاد می گیرید که چه چیزی برای شما مفید است و چه چیزی نه و گاهی اوقات با فرآیندها یا توصیه های دیگران مطابقت ندارد و این مشکلی ایجاد نمی کند.

🔴 و مهم تر از همه اینکه، علم داده یک رشته تماشاگر نیست! در نهایت باید دست خود را در انجام پروژه‌ها و اجرای چیزهایی که یاد می‌گیرید، کثیف کنید، حتی اگر هنوز کامل «آماده» نباشید!

deep learningmachine learningیادگیری ماشینعلم دادهمتخصص علم داده
هوش مصنوعی یک علم پیشرو در صنعت و آموزش است. این علم میتواند باعث رشد و پیشرفت زندگی انسان ها به صورت چشمگیری بشود. پس آموزش و یادگیری این علم برای همه انسان ها ضروری و مهم است.
شاید از این پست‌ها خوشتان بیاید