آموزش تمام مدل‌های طبقه‌بندی یا رگرسیون در یک خط کد پایتون

شکل ۱. پیش‌بینی تنبلی
شکل ۱. پیش‌بینی تنبلی
منتشر‌شده د: towardsdatascience به تاریخ ۱۰ می ۲۰۲۱
لینک منبع: Train all Classification or Regression models in one line of Python Code

یادگیری ماشینی خودکار (Auto-ML) به خودکارسازی اجزای کانال ارتباطی توسعه مدل علوم داده اشاره دارد. AutoML حجم کار یک دانشمند داده را کاهش می‌دهد و جریان کار را سرعت می‌بخشد. autoML می‌تواند برای خودکار کردن اجزای مختلف کانال ارتباطی، از جمله درک داده، EDA، پردازش داده، آموزش مدل، تنظیم هایپرپارامتری و غیره مورد استفاده قرار گیرد.

برای یک پروژه یادگیری ماشینی سر‌به‌سر، پیچیدگی هر یک از مولفه‌های کانال ارتباطی به پروژه بستگی دارد. کتابخانه‌های باز شدهautoML مختلف وجود دارند که هر یک از اجزای کانال ارتباطی را سرعت می‌بخشند. مقاله زیر را بخوانید تا این هشت کتابخانهautoML را برای خودکار کردن کانال ارتباطی یادگیری ماشینی بشناسید.

در این مقاله، ما در مورد چگونگی خودکار کردن فرآیند آموزش مدل با استفاده از کتابخانه پایتون منبع باز پیش‌بینی تنبلی بحث خواهیم کرد.

مطالعه مقاله کد پایتون خود را با سرعت C اجرا کنید! توصیه می‌شود.

پیش‌بینی تنبلی (LazyPredict) چیست؟

در اصل LazyPredict یک کتابخانه پایتون منبع باز است که آموزش مدل کانال ارتباطی را خودکار کرده و جریان کار را سرعت می‌بخشد. پیش‌بینی تنبلی حدود ۳۰ مدل طبقه‌بندی را برای یک مجموعه داده طبقه‌بندی آموزش می‌دهد و حدود ۴۰ مدل رگرسیون را برای یک مجموعه داده رگرسیون آموزش می‌دهد.

پیش‌بینی تنبلی با مدل‌های آموزش‌دیده همراه با معیار عملکرد بدون نوشتن کدهای بیشتر، باز‌می‌گردد. می‌توان معیارهای عملکرد هر مدل را مقایسه کرد و بهترین مدل را برای بهبود بیشتر عملکرد تنظیم کرد.

نصب:

پیش‌بینی تنبلی را می‌توان از کتابخانه PyPl با استفاده از کد زیر نصب کرد:

pip install lazypredict

پس از نصب، فرد می‌تواند کتابخانه را وارد کند تا آموزش خودکار مدل‌های طبقه‌بندی و رگرسیون را انجام دهد.

from lazypredict.Supervised import LazyRegressor, LazyClassifier

کاربرد:

پیش‌بینی تنبلی از هر دو مسئله طبقه‌بندی و رگرسیون پشتیبانی می‌کند، بنابراین من نمایشی از هر دو وظیفه را مورد بحث قرار خواهم داد.

مجموعه داده مسکن بوستون (رگرسیون) و تایتانیک (طبقه‌بندی) برای نمایش کتابخانه پیش‌بینی تنبلی مورد استفاده قرار می‌گیرند.

طبقه‌بندی وظیفه:

کاربرد پیش‌بینی تنبلی بسیار شهودی و شبیه به علم-یادگیری است. اول، یک نمونه از برآوردکننده LazyClassifier برای کار طبقه‌بندی ایجاد کنید. می‌توان معیارهای سفارشی را برای ارزیابی تصویب کرد، به طور پیش‌فرض هر یک از مدل‌ها بر روی دقت، درجه ROC AUC، نمره F1 ارزیابی خواهند شد.

قبل از اقدام به آموزش مدل پیش‌بینی تنبلی، فرد باید مجموعه داده‌ها را بخواند و آن را پردازش کند تا برای آموزش مناسب باشد.

(کد نوشته شده)، پردازش داده‌های تایتانیک

پس از مهندسی ویژگی و تقسیم داده‌ها در آموزش داده‌های آزمون، می‌توانیم با آموزش مدل با استفاده از پیش‌بینی لازیپ پیش برویم.

# LazyClassifier Instance and fiting data

cls= LazyClassifier(ignore_warnings=False, custom_metric=None)

models, predictions = cls.fit(X_train, X_test, y_train, y_test)

شکل ۲. معیارهای عملکرد ۲۷ مدل طبقه‌بندی برای مجموعه داده‌های تایتانیک

وظیفه رگرسیون:

همانند آموزش مدل طبقه‌بندی، پیش‌بینی با آموزش مدل خودکار برای مجموعه داده‌های رگرسیون انجام می‌شود. پیاده‌سازی شبیه به کار طبقه‌بندی با تغییر در نمونه LazyRegressor است.

(کد نویسنده)، پردازش مجموعه داده‌های مسکن بوستون

reg = LazyRegressor(ignore_warnings=False, custom_metric=None)

models, predictions = reg.fit(X_train, X_test, y_train, y_test)

با توجه به معیارهای عملکرد بالا، طبقه‌بندی کننده AdaBoost بهترین مدل برای وظایف طبقه‌بندی است و مدل GradientBoostingRegressor بهترین مدل برای وظایف رگرسیون است.

نتیجه‌گیری:

در این مقاله، ما در مورد اجرای کتابخانه پیش‌بینی تنبلی بحث کرده‌ایم که می‌تواند حدود ۷۰ طبقه‌بندی و مدل رگرسیون را در چند خط از کد پایتون آموزش دهد. این یک ابزار بسیار مفید است، زیرا یک تصویر کلی از نحوه اجرای مدل ارائه می‌دهد، و می‌توان عملکرد هر یک از مدل‌ها را مقایسه کرد.

هر مدل با پارامترهای پیش‌گزیده خود آموزش داده می‌شود، زیرا تنظیم بیش از حد پارامترها را انجام نمی‌دهد. پس از انتخاب بهترین مدل اجرا کننده، توسعه‌دهنده می‌تواند مدل را برای بهبود بیشتر عملکرد تنظیم کند.

این متن با استفاده از ربات ترجمه مقالات دیتاساینس ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.