Mikhail Raevskiy
Aug 18, 2020
یکی از دلایل ارزشمند بودن زبان پایتون برای علوم داده وجود مجموعههای عظیم از کتابخانههای تحلیل و تصویرسازی داده است . در این مقاله به شرح محبوبترینها خواهیم پرداخت .
فریم ورک ( چهارچوب ) یادگیری عمیق TensorFlow که توسط گوگل توسعه داده شده است ، بدون شک محبوبترین ابزار برای آموزش شبکه عصبی است . گوگل به طور فعال از چهارچوب خاص خود در خدمات گستردهای مانند gmail و google Translate استفاده میکند . همچنین TensorFlow توسط برندهایی مانند Dropbox ، Xiaomi ، Airbnb ، Uber و ... استفاده میشود .
یک کتابخانه محبوب یادگیری ماشین است که در زبانهای پایتون ، C و C++ نوشته شده است . با یک انتخاب مشترک برای حل مشکلات کلاسیک یادگیری ماشین که هم در سیستمهای صنعتی و هم در تحقیقات علمی استفاده میشود .
NumPy یکی از محبوب ترین کتابخانه های پایتون برای یادگیری ماشین است. TensorFlow و سایر کتابخانه ها از آن برای اجرای عملیات روی آرایههای چند بعدی به صورت داخلی استفاده میکنند.
الگوریتم های ریاضی اجرا شده در زبان های گزارهای و تفسیر شده (پایتون) اکثرا بسیار کندتر از آنهایی است که در زبان های کامپایل شده و محاسباتی اجرا می شوند. کتابخانه NumPy پیاده سازی الگوریتم محاسباتی بهینه شده برای کار با آرایه های چند بعدی را فراهم می کند.
اگر شما نیاز دارید که با سرعت و به راحتی یک مدل یادگیری عمیق را جمع کنید ، Keras یک انتخاب عالی است . P یک الحاقیه ( add-on ) در چهارچوب TensorFlow و Theano است. هدف این کتابخانه کار عملیاتی با شبکه های یادگیری عمیق است ، در حالی که به صورت فشرده ، مدولار و قابل توسعه طراحی شده است . Keras جدا از کتابخانه محاسبات علمی که به عنوان محاسبات بکاند استفاده میشود ، یک مجموعه انتزاعی بصری با سطح بالا را فراهم کرده که ساخت شبکه های عصبی را آسان میکند .
یکی از بهترین گزینهها برای کار با شبکههای عصبی است که رقیبی دیرینه برایTensorFlow است. در درجه اول توسط گروه هوش مصنوعی فیس بوک توسعه یافته است. PyTorch به عنوان چارچوب یادگیری عمیق در شبکه خصمانه مولد استفاده شد.
چارچوبی برای تقویت کردن گرادیان است ، یکی از محبوب ترین الگوریتم ها در رقابت ها و چالشهای Kaggle . افزایش گرادیان یک روش یادگیری ماشین برای طبقه بندی و مشکلات رگرسیون است که یک مدل پیش بینی را در قالب مجموعهای از مدل های پیش بینی (معمولاً درختان تصمیم گیری ) می سازد.
کتابخانهای است که ساختارهای با سطح بالا را برای کار با دادهها و طیف وسیعی از ابزار برای تجزیه و تحلیل آنها را فراهم میکند. این کتابخانه این امکان را میدهد بسیاری از دستورات پیچیده را با مقدار کمی کد اجرا کرد : مرتب سازی و گروه بندی داده ها ، کار با دادههای از دسترفته ، سریهای زمانی و ... همه داده ها در قالب جدولهای داده ارائه میشوند.
SciPy برای محاسبات علمی و مهندسی از جمله کارهای مربوط به یادگیری ماشین ضروری است.
یک کتابخانه پایتون برای تصویرسازی و دیباگ کردن مدلهای یادگیری ماشین با استفاده از API Unified است. پشتیبانی داخلی برای چند فریمورک یادگیری ماشین و کتابخانه ها وجود دارد مانند : Scikit-Learn ، Keras، LightGBM که در بالا ذکر شدهاند ذکر شده در بالا، و همچنین Xgboost، lightning و CatBoost.
یک پکیج کتابخانه ها و برنامههای پردازشی نمادین و آماری Natural Language است. این کتابخانه با مستندات گستردهای همراه است ، از جمله یک کتاب توضیح مفاهیم درون وظایف پردازشی Natural Language که میتواند با این پکیج انجام شود.
Pillow یک نسخه بهبود یافته کتابخانه تصویر PIL (کتابخانهای در Python) است و از انواع انواع فایل ها پشتیبانی میکند مانند PDF، WebP، PCX، PNG، JPEG، GIF، PSD، WebP، PCX، GIF، IM، EPS، ICO، BMP و ...
تعداد زیادی از ابزارهای فیلترکردن را در خود دارد که میتواند برای وظایف بصری کامپیوتر مورد استفاده قرار گیرد.