MindMover.Academy
MindMover.Academy
خواندن ۲ دقیقه·۳ سال پیش

علوم داده (Data Science)- بخش آخر (مدل سازی و به کار گیری)

سلام همراهان عزیز آکادمی مایند موور

با آخرین بخش علوم داده و به کارگیری آن در کسب و کار در خدمتتون هستیم. در این بخش به مدلسازی و ارزیابی مدل می پردازیم.

بعد از اتمام این بخش وارد یادگیری پایتون از صفر تا صد خواهیم شد. از نحوه نصب نرم افزار و شروع برنامه نویسی تا یادگیری ماشین و الگوریتم های آن.

مدل سازی داده ها (Data Modeling)

اهداف

– تعیین ویژگیهای داده بهینه شده برای مدل یادگیری ماشین 
– تعیین مدل یادگیری ماشین مفید جهت پیش بینی هدف
– ایجاد یک مدل یادگیری ماشین مناسب برای تولید.

مراحل انجام:

در این مرحله سه وظیفه اصلی مطرح می شود:

مهندسی ویژگی: ایجاد ویژگی های داده از داده های خام برای تسهیل آموزش مدل.
آموزش مدل: مدلی را پیدا کنید که با مقایسه معیارهای موفق به سوال شما دقیق تر پاسخ می دهد.
تعیین کنید که آیا مدل شما برای تولید مناسب است یا خیر.

مهندسی ویژگی (Feature engineering)

مهندسی ویژگی شامل گنجاندن ، گردآوری و تبدیل متغیرهای خام برای ایجاد ویژگی های مورد استفاده در تجزیه و تحلیل است. اگر می خواهید بدانید که چه چیزی باعث ایجاد یک مدل می شود، باید نحوه ارتباط ویژگی ها با یکدیگر و نحوه استفاده الگوریتم های یادگیری ماشین از این ویژگی ها را درک کنید.

این مرحله نیاز به ترکیبی خلاقانه از تخصص دامنه (domain expertise) و درک های به دست آمده از مرحله اکتشاف داده ها (data exploration) دارد. مهندسی ویژگی یک عمل متوازن برای یافتن و شامل متغیرهای مفید و آموزنده است، اما در عین حال سعی می کند از بسیاری از متغیرهای غیر مرتبط جلوگیری کند. متغیرهای مفید نتیجه شما را بهبود می بخشد. متغیرهای غیر مرتبط در  مدل اختلال وارد می کنند. شما همچنین باید این ویژگی ها را برای داده های جدیدی که در حین ثبت به دست آمده ایجاد کنید. در نتیجه ، تولید این ویژگی ها فقط می تواند به داده های موجود در زمان ثبت و احتساب بستگی داشته باشد.

آموزش و ارزیابی مدل (Model Training & Evaluation)

بسته به نوع سوالی که می خواهید به آن پاسخ دهید ، الگوریتم های مدل سازی زیادی در دسترس است که در آینده به آنها می پردازیم

فرایند آموزش مدل شامل مراحل زیر است:

– (Split the input data) داده های ورودی را به طور تصادفی برای مدل سازی به یک مجموعه داده آموزشی (training data) و یک مجموعه داده آزمایشی (test data) تقسیم کنید

– (Build the models) با استفاده از مجموعه داده های آموزشی مدل ها را بسازید.
– (Evaluate) آموزش و مجموعه داده های تست را ارزیابی کنید. از مجموعه ای از الگوریتم های یادگیری ماشین به همراه پارامترهای مختلف تنظیم مربوطه (معروف به جارو پارامترها(parameter sweep)) استفاده کنید که به منظور پاسخگویی به سوال مرتبط با داده های فعلی است.
– (Determine) با مقایسه معیارهای موفق بین روش های جایگزین ، “بهترین” راه حل برای پاسخ به سوال را تعیین کنید.

ادامه در :

https://mindmover.academy/data-science-4/





علوم دادهمدل سازی و ارزیابییادگیری ماشینdata scieneceمایند موور آکادمی
” هدف ما آموزش آنلاین تخصص های روز دنیا ویژه بازار کار٬ ارتقاء شغلی و کسب و کار با بهترین کیفیت و امکانات قابل دسترس است.”
شاید از این پست‌ها خوشتان بیاید