پروژه عملی طبقه بندی با یادگیری ماشین صفر تا صد - قسمت 0

چند روزی هست که درگیر یک پایان نامه هستم و موضوع مرتبط با یادگیری ماشین و طبقه بندی تو اون هست. برای همین تو این سری از مطالب میخوام با هم یک پروژه عملی رو ببریم جلو و با پایتون یسری کد بزنیم.منبع انگلیسی این مطلب اینجا هستش.

کلا روند آموزش به این صورت هست :

  • ایجاد یک آزمایشگاه براساس پایتون
  • لوود کردن دیتاست
  • نمایش خلاصه آماری از دیتاست
  • نمایش آمار گرافیکی از دیتاست
  • ارزیابی الگوریتم های طبقه بندی :
  • Logistic Regression (LR)
  • Linear Discriminant Analysis (LDA)
  • K-Nearest Neighbors (KNN).
  • Classification and Regression Trees (CART).
  • Gaussian Naive Bayes (NB).
  • Support Vector Machines (SVM).
  • ایجاد یک مدل تخمینی

در این پست به پیاده سازی آزمایشگاه می پردازیم.برای آزمایشگاه ما باید این موارد رو نصب کنیم :

  • python 2.7-3.6+
  • scipy
  • numpy
  • matplotlib
  • pandas
  • sklearn

برای نصب پایتون از این لینک استفاده کنید.(موقع نصب حتما تیک PATH بزنید)

برای نصب موارد بعدی بسته به سیستم عاملی که داریم باید اقدام کنیم و تو هر سیستم تفاوتهایی هست. من چون از ویندوز استفاده میکنم رو این سیستم عامل میرم جلو.

یکی از روشهای آسون برای پیاده سازی آزمایشگاه استفاده از ابزار Anaconda هستش.با نصب این ابزار تقریبا تمام موارد رو یکجا نصب میکنید.

برای نصب Anaconda در ویندوز ابتدا اون رو از این لینک دانلود کنید .این ابزار نسخه های مختلفی داره که رایگانش رو ما استفاده میکنیم .

بعد از دانلود Anaconda که حدودا 500 مگ هست و نصب اون که NEXT زدن هست (نصب ابزار ممکنه 10 دقیقه ای طول بکشه و سه گیگ هم فضا برای نصب نیاز باشه)، باید این ابزار کانفیگش کنیم. برای کانفیگ این ابزار ابتدا برنامه Anaconda Navigator رو باز کنید که نسخه گرافیکی هستش و ابزارها و ... رو برای کار فراهم میکنه.

خب در این شکل وارد محیط کامندلاینی میشیم (انتخاب CMD.exe - گزینه اول) و میریم برای کانفیگ :

برای چک کردن نسخه کامند لاینی که conda نام داره از این دستور استفاده میکنیم :

conda -V

برای چک کردن نسخه پایتون هم از دستور زیر :

python -V

برای اینکه محیط conda و anaconda رو بروز کنید از دستورات زیر استفاده کنید :

conda update conda
conda update anaconda

برای اینکه مطمئن بشیم ماژولهای مورد نیاز دیگه هم نصب شده ، یک فایل notepad باز کنید و کد زیر رو توش کپی کنید و با اسم دلخواه و فرمت py ذخیره کنید .

# scipy
import scipy
print('scipy: %s' % scipy.__version__)
# numpy
import numpy
print('numpy: %s' % numpy.__version__)
# matplotlib
import matplotlib
print('matplotlib: %s' % matplotlib.__version__)
# pandas
import pandas
print('pandas: %s' % pandas.__version__)
# statsmodels
import statsmodels
print('statsmodels: %s' % statsmodels.__version__)
# scikit-learn
import sklearn
print('sklearn: %s' % sklearn.__version__)

حالا کافیه کد رو با دستور پایتون اجرا کنید :

خب تصویر نشون میده که مواردی که میخواستیم نصب شدن و قابل استفاده هستند. اما اگه دوست داشته باشین میتونید این پکیج رو با دستور زیر بروز کنید:

conda update scikit-learn

حالا اگه دوباره فایل versions.py رو اجرا کنید اگر نسخه ای بروز شده باشه رو با تغییر نسخه اش ببینید.

خب حالا ما آزمایشگاهمون رو درست کردیم و میتونیم ازش استفاده کنیم.

در پست بعدی به لوود دیتاست و نمایش آماری از این دیتاست ها می پردازیم.