چرا باید قبل از یادگیری عمیق، تحلیل رگرسیون را یاد بگیرید؟

شکل ۱. تحلیل رگرسیون و از یادگیری عمیق
شکل ۱. تحلیل رگرسیون و از یادگیری عمیق
منتشر‌شده در towardsdatascience به تاریخ ۲۶ ژوئن ۲۰۲۱
لینک منبع Why You Should Learn Regression Analysis Before Deep Learning

مقدمه

اول، من نمی‌گویم که رگرسیون خطی بهتر از یادگیری عمیق است.

دوم، اگر می‌دانید که به طور خاص به کاربردهای مربوط به یادگیری عمیق مانند بینش کامپیوتر، تشخیص تصویر، یا تشخیص گفتار علاقه دارید، این مقاله احتمالا ارتباط کمتری با شما دارد.

اما برای بقیه، می‌خواهم نظراتم را در مورد این که چرا فکر می‌کنم شما بهتر است تجزیه و تحلیل رگرسیون را نسبت به یادگیری عمیق یاد بگیرید، بدهم. چرا؟ چون زمان یک منبع محدود است و این که چطور وقت خود را اختصاص می‌دهید مشخص می‌کند که در سفر یادگیری خود پیش می‌روید.

و بنابراین، من قصد دارم نظراتم را برای اینکه چرا فکر می‌کنم شما باید آنالیز رگرسیون را قبل از یادگیری عمیق یاد بگیرید، بدهم.

اما در ابتدا، تحلیل رگرسیون چیست؟

به عبارت ساده، تجزیه و تحلیل رگرسیون معمولا به جای رگرسیون خطی به کار می‌رود.

به طور کلی، تجزیه و تحلیل رگرسیون به مجموعه‌ای از روش‌های آماری اشاره دارد که برای برآورد روابط بین متغیرهای مستقل و وابسته استفاده می‌شوند.

با این حال، یک تصور غلط بزرگ این است که تحلیل رگرسیون تنها به رگرسیون خطی اشاره دارد، که چنین نیست. تکنیک‌های آماری زیادی در تجزیه و تحلیل رگرسیون وجود دارند که بسیار قدرتمند و مفید هستند. این موضوع مرا به سوی نخستین نکته سوق می‌دهد:

نکته # ۱. تجزیه و تحلیل رگرسیون بسیار متنوع است و کاربرد گسترده‌ای دارد.

رگرسیون خطی و شبکه‌های عصبی هر دو مدل‌هایی هستند که می‌توانید از آن‌ها برای پیش‌بینی با توجه به برخی ورودی‌ها استفاده کنید. اما فراتر از پیش‌بینی، تحلیل رگرسیون به شما این امکان را می‌دهد که کارهای بیشتری انجام دهید که شامل موارد زیر هستند اما محدود به موارد زیر نیستند:

  • تحلیل رگرسیون به شما این امکان را می‌دهد که قدرت روابط بین متغیرها را درک کنید. با استفاده از اندازه‌گیری‌های آماری مانند R- مربع / تنظیم R مربع، تحلیل رگرسیون می‌تواند به شما بگوید که چه مقدار از کل تغییرپذیری در داده‌ها توسط مدل شما توضیح داده می‌شود.
  • تجزیه و تحلیل رگرسیون به شما می‌گوید که کدام عوامل پیش‌بینی در یک مدل از نظر آماری مهم هستند و کدام یک از آن‌ها مهم نیستند. به عبارت ساده‌تر، اگر شما به یک مدل رگرسیون ۵۰ ویژگی ارائه دهید، می‌توانید بفهمید که کدام ویژگی‌ها پیش‌بینی‌کننده خوبی برای متغیر هدف هستند و کدام یک نیستند.
  • تجزیه و تحلیل رگرسیون می‌تواند یک فاصله اطمینان برای هر ضریب رگرسیون که تخمین می‌زند، ایجاد کند. شما نه تنها می‌توانید یک ضریب را برای هر ویژگی تخمین بزنید، بلکه می‌توانید طیف وسیعی از ضرایب را با سطح اعتماد نیز به دست آورید (به عنوان مثال. ۹۹ درصد اطمینان) که این ضریب در آن وجود دارد.
  • و خیلی بیشتر …

نکته من این است که مجموعه‌ای از تکنیک‌های آماری در تجزیه و تحلیل رگرسیون وجود دارند که به شما این امکان را می‌دهند که از فقط «آیا می‌توانیم با توجه بهX (ها) ، Y را پیش‌بینی کنیم؟» به سوالات بیشتری پاسخ دهید.

نکته # ۲. تحلیل رگرسیون کم‌تر از یک جعبه سیاه است و ارتباط برقرار کردن آسان‌تر است.

دو عامل مهمی که من همیشه هنگام انتخاب یک مدل در نظر می‌گیرم این است که آن چقدر ساده و قابل تفسیر است.

چرا؟

یک مدل ساده‌تر به این معنی است که ارتباط دادن نحوه کار خود مدل و نحوه تفسیر نتایج یک مدل آسان‌تر است.

به عنوان مثال، این احتمال وجود دارد که اکثر کاربران کسب‌وکار، مجموع حداقل مربعات (یعنی خط بهترین تناسب) را بسیار سریع‌تر از تکثیر معکوس درک کنند. این مهم است زیرا مشاغل به نحوه کار منطق اساسی در یک مدل علاقه‌مند هستند -در تجارت هیچ چیز از عدم قطعیت بدتر نیست- و یک جعبه سیاه یک معادل عالی برای آن است.

در نهایت، مهم است که بدانیم اعداد یک مدل چطور مشتق می‌شوند و چطور می‌توان آن‌ها را تفسیر کرد.

نقطه # ۳. یادگیری تحلیل رگرسیون در کل درک بهتری از استنباط آماری به شما خواهد داد.

باور کنید یا نه، یادگیری تحلیل رگرسیون من را به یک همکار بهتر (پایتون و آر)، یک متخصص آمار بهتر تبدیل کرد، و به من درک بهتری از مدل‌های ساخت کلی داد.

برای اینکه کمی بیشتر شما را هیجان‌زده کنم، تحلیل رگرسیون به من کمک کرد تا موارد زیر را یاد بگیرم (نه فقط محدود به این‌ها) :

  • ساخت مدل‌های رگرسیون ساده و چندگانه
  • انجام تجزیه و تحلیل باقی مانده و اعمال دگرگونی‌هایی مانند Box-Cox
  • محاسبه فواصل اطمینان برای ضرایب رگرسیون و باقیمانده‌ها
  • تعیین اهمیت آماری مدل‌ها و ضرایب رگرسیون از طریق آزمون فرضیه
  • ارزیابی مدل‌ها با استفاده از مربع R، MSPE، MAE، MAPE، PM، لیست ادامه دارد …
  • شناسایی چند خطی بودن با عامل تورم واریانس (VIF)
  • مقایسه مدل‌های رگرسیون مختلف با استفاده از F-test جزئی

این فقط یک نمونه از چیزهایی است که یاد گرفته‌ام و من بسیار سطحی آن‌ها را بیان کرده‌ام. بنابراین اگر فکر می‌کنید که این کار به نظر یک چیز جالب می‌رسد، از شما می‌خواهم که بررسی کنید و حداقل ببینید چه چیزی را می‌توانید یاد بگیرید.

چگونه می‌توانید تحلیل رگرسیون را یاد بگیرید؟

اخیرا، من متوجه‌شده‌ام که بهترین راه برای یادگیری یک موضوع جدید پیدا کردن سخنرانی‌ها یا یادداشت‌های درسی از یک کالج / دانشگاه است. باور نکردنی است که چقدر چیزهای رایگان در وب موجود است.

به طور خاص، من شما را با دو منبع عالی ترک می‌کنم که می‌توانید برای شروع از آن‌ها استفاده کنید:

Welcome to STAT 501! | STAT ۵۰۱

از مطالعه شما متشکرم!

امیدوارم این مقاله را مفید و روشنگر یافته باشید! به یاد داشته باشید که نظرات من براساس تجربیاتم هستند و ممکن است با نظرات شما هم‌خوانی نداشته باشند و این اشکالی ندارد! با این حال، اگر شما با این موضوع موافق باشید و با نظرات من موافق باشید، من شما را تشویق می‌کنم که به این موضوع بپردازید-از آن پشیمان نخواهید شد.

مثل همیشه، من بهترین شانس را در تلاش‌هایتان برای شما آرزو می‌کنم!

این متن با استفاده از ربات ترجمه مقالات دیتاساینس ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.