من ربات ترجمیار هستم و خلاصه مقالات علمی رو به صورت خودکار ترجمه میکنم. متن کامل مقالات رو میتونین به صورت ترجمه شده از لینکی که در پایین پست قرار میگیره بخونین
آموزش تمام مدلهای طبقهبندی یا رگرسیون در یک خط کد پایتون
منتشرشده د: towardsdatascience به تاریخ ۱۰ می ۲۰۲۱
لینک منبع: Train all Classification or Regression models in one line of Python Code
یادگیری ماشینی خودکار (Auto-ML) به خودکارسازی اجزای کانال ارتباطی توسعه مدل علوم داده اشاره دارد. AutoML حجم کار یک دانشمند داده را کاهش میدهد و جریان کار را سرعت میبخشد. autoML میتواند برای خودکار کردن اجزای مختلف کانال ارتباطی، از جمله درک داده، EDA، پردازش داده، آموزش مدل، تنظیم هایپرپارامتری و غیره مورد استفاده قرار گیرد.
برای یک پروژه یادگیری ماشینی سربهسر، پیچیدگی هر یک از مولفههای کانال ارتباطی به پروژه بستگی دارد. کتابخانههای باز شدهautoML مختلف وجود دارند که هر یک از اجزای کانال ارتباطی را سرعت میبخشند. مقاله زیر را بخوانید تا این هشت کتابخانهautoML را برای خودکار کردن کانال ارتباطی یادگیری ماشینی بشناسید.
در این مقاله، ما در مورد چگونگی خودکار کردن فرآیند آموزش مدل با استفاده از کتابخانه پایتون منبع باز پیشبینی تنبلی بحث خواهیم کرد.
مطالعه مقاله کد پایتون خود را با سرعت C اجرا کنید! توصیه میشود.
پیشبینی تنبلی (LazyPredict) چیست؟
در اصل LazyPredict یک کتابخانه پایتون منبع باز است که آموزش مدل کانال ارتباطی را خودکار کرده و جریان کار را سرعت میبخشد. پیشبینی تنبلی حدود ۳۰ مدل طبقهبندی را برای یک مجموعه داده طبقهبندی آموزش میدهد و حدود ۴۰ مدل رگرسیون را برای یک مجموعه داده رگرسیون آموزش میدهد.
پیشبینی تنبلی با مدلهای آموزشدیده همراه با معیار عملکرد بدون نوشتن کدهای بیشتر، بازمیگردد. میتوان معیارهای عملکرد هر مدل را مقایسه کرد و بهترین مدل را برای بهبود بیشتر عملکرد تنظیم کرد.
نصب:
پیشبینی تنبلی را میتوان از کتابخانه PyPl با استفاده از کد زیر نصب کرد:
pip install lazypredict
پس از نصب، فرد میتواند کتابخانه را وارد کند تا آموزش خودکار مدلهای طبقهبندی و رگرسیون را انجام دهد.
from lazypredict.Supervised import LazyRegressor, LazyClassifier
کاربرد:
پیشبینی تنبلی از هر دو مسئله طبقهبندی و رگرسیون پشتیبانی میکند، بنابراین من نمایشی از هر دو وظیفه را مورد بحث قرار خواهم داد.
مجموعه داده مسکن بوستون (رگرسیون) و تایتانیک (طبقهبندی) برای نمایش کتابخانه پیشبینی تنبلی مورد استفاده قرار میگیرند.
طبقهبندی وظیفه:
کاربرد پیشبینی تنبلی بسیار شهودی و شبیه به علم-یادگیری است. اول، یک نمونه از برآوردکننده LazyClassifier برای کار طبقهبندی ایجاد کنید. میتوان معیارهای سفارشی را برای ارزیابی تصویب کرد، به طور پیشفرض هر یک از مدلها بر روی دقت، درجه ROC AUC، نمره F1 ارزیابی خواهند شد.
قبل از اقدام به آموزش مدل پیشبینی تنبلی، فرد باید مجموعه دادهها را بخواند و آن را پردازش کند تا برای آموزش مناسب باشد.
(کد نوشته شده)، پردازش دادههای تایتانیک
پس از مهندسی ویژگی و تقسیم دادهها در آموزش دادههای آزمون، میتوانیم با آموزش مدل با استفاده از پیشبینی لازیپ پیش برویم.
# LazyClassifier Instance and fiting data
cls= LazyClassifier(ignore_warnings=False, custom_metric=None)
models, predictions = cls.fit(X_train, X_test, y_train, y_test)
شکل ۲. معیارهای عملکرد ۲۷ مدل طبقهبندی برای مجموعه دادههای تایتانیک
وظیفه رگرسیون:
همانند آموزش مدل طبقهبندی، پیشبینی با آموزش مدل خودکار برای مجموعه دادههای رگرسیون انجام میشود. پیادهسازی شبیه به کار طبقهبندی با تغییر در نمونه LazyRegressor است.
(کد نویسنده)، پردازش مجموعه دادههای مسکن بوستون
reg = LazyRegressor(ignore_warnings=False, custom_metric=None)
models, predictions = reg.fit(X_train, X_test, y_train, y_test)
با توجه به معیارهای عملکرد بالا، طبقهبندی کننده AdaBoost بهترین مدل برای وظایف طبقهبندی است و مدل GradientBoostingRegressor بهترین مدل برای وظایف رگرسیون است.
نتیجهگیری:
در این مقاله، ما در مورد اجرای کتابخانه پیشبینی تنبلی بحث کردهایم که میتواند حدود ۷۰ طبقهبندی و مدل رگرسیون را در چند خط از کد پایتون آموزش دهد. این یک ابزار بسیار مفید است، زیرا یک تصویر کلی از نحوه اجرای مدل ارائه میدهد، و میتوان عملکرد هر یک از مدلها را مقایسه کرد.
هر مدل با پارامترهای پیشگزیده خود آموزش داده میشود، زیرا تنظیم بیش از حد پارامترها را انجام نمیدهد. پس از انتخاب بهترین مدل اجرا کننده، توسعهدهنده میتواند مدل را برای بهبود بیشتر عملکرد تنظیم کند.
این متن با استفاده از ربات ترجمه مقالات دیتاساینس ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه میتواند دارای برخی اشکالات ترجمه باشد.
مقالات لینکشده در این متن میتوانند به صورت رایگان با استفاده از مقالهخوان ترجمیار به فارسی مطالعه شوند.
مطلبی دیگر از این انتشارات
محاسبات کوانتومی: تاریخچه منشأ و پس از آن
مطلبی دیگر از این انتشارات
کریستال زمان ایجاد شده در داخل یک کامپیوتر کوانتومی
مطلبی دیگر از این انتشارات
تکنولوژی تراشه جدید IBM، گام بزرگ بعدی در قانون مور را نشان میدهد.