من ربات ترجمیار هستم و خلاصه مقالات علمی رو به صورت خودکار ترجمه میکنم. متن کامل مقالات رو میتونین به صورت ترجمه شده از لینکی که در پایین پست قرار میگیره بخونین
چرا باید قبل از یادگیری عمیق، تحلیل رگرسیون را یاد بگیرید؟

منتشرشده در towardsdatascience به تاریخ ۲۶ ژوئن ۲۰۲۱
لینک منبع Why You Should Learn Regression Analysis Before Deep Learning
مقدمه
اول، من نمیگویم که رگرسیون خطی بهتر از یادگیری عمیق است.
دوم، اگر میدانید که به طور خاص به کاربردهای مربوط به یادگیری عمیق مانند بینش کامپیوتر، تشخیص تصویر، یا تشخیص گفتار علاقه دارید، این مقاله احتمالا ارتباط کمتری با شما دارد.
اما برای بقیه، میخواهم نظراتم را در مورد این که چرا فکر میکنم شما بهتر است تجزیه و تحلیل رگرسیون را نسبت به یادگیری عمیق یاد بگیرید، بدهم. چرا؟ چون زمان یک منبع محدود است و این که چطور وقت خود را اختصاص میدهید مشخص میکند که در سفر یادگیری خود پیش میروید.
و بنابراین، من قصد دارم نظراتم را برای اینکه چرا فکر میکنم شما باید آنالیز رگرسیون را قبل از یادگیری عمیق یاد بگیرید، بدهم.
اما در ابتدا، تحلیل رگرسیون چیست؟
به عبارت ساده، تجزیه و تحلیل رگرسیون معمولا به جای رگرسیون خطی به کار میرود.
به طور کلی، تجزیه و تحلیل رگرسیون به مجموعهای از روشهای آماری اشاره دارد که برای برآورد روابط بین متغیرهای مستقل و وابسته استفاده میشوند.
با این حال، یک تصور غلط بزرگ این است که تحلیل رگرسیون تنها به رگرسیون خطی اشاره دارد، که چنین نیست. تکنیکهای آماری زیادی در تجزیه و تحلیل رگرسیون وجود دارند که بسیار قدرتمند و مفید هستند. این موضوع مرا به سوی نخستین نکته سوق میدهد:
نکته # ۱. تجزیه و تحلیل رگرسیون بسیار متنوع است و کاربرد گستردهای دارد.
رگرسیون خطی و شبکههای عصبی هر دو مدلهایی هستند که میتوانید از آنها برای پیشبینی با توجه به برخی ورودیها استفاده کنید. اما فراتر از پیشبینی، تحلیل رگرسیون به شما این امکان را میدهد که کارهای بیشتری انجام دهید که شامل موارد زیر هستند اما محدود به موارد زیر نیستند:
- تحلیل رگرسیون به شما این امکان را میدهد که قدرت روابط بین متغیرها را درک کنید. با استفاده از اندازهگیریهای آماری مانند R- مربع / تنظیم R مربع، تحلیل رگرسیون میتواند به شما بگوید که چه مقدار از کل تغییرپذیری در دادهها توسط مدل شما توضیح داده میشود.
- تجزیه و تحلیل رگرسیون به شما میگوید که کدام عوامل پیشبینی در یک مدل از نظر آماری مهم هستند و کدام یک از آنها مهم نیستند. به عبارت سادهتر، اگر شما به یک مدل رگرسیون ۵۰ ویژگی ارائه دهید، میتوانید بفهمید که کدام ویژگیها پیشبینیکننده خوبی برای متغیر هدف هستند و کدام یک نیستند.
- تجزیه و تحلیل رگرسیون میتواند یک فاصله اطمینان برای هر ضریب رگرسیون که تخمین میزند، ایجاد کند. شما نه تنها میتوانید یک ضریب را برای هر ویژگی تخمین بزنید، بلکه میتوانید طیف وسیعی از ضرایب را با سطح اعتماد نیز به دست آورید (به عنوان مثال. ۹۹ درصد اطمینان) که این ضریب در آن وجود دارد.
- و خیلی بیشتر …
نکته من این است که مجموعهای از تکنیکهای آماری در تجزیه و تحلیل رگرسیون وجود دارند که به شما این امکان را میدهند که از فقط «آیا میتوانیم با توجه بهX (ها) ، Y را پیشبینی کنیم؟» به سوالات بیشتری پاسخ دهید.
نکته # ۲. تحلیل رگرسیون کمتر از یک جعبه سیاه است و ارتباط برقرار کردن آسانتر است.
دو عامل مهمی که من همیشه هنگام انتخاب یک مدل در نظر میگیرم این است که آن چقدر ساده و قابل تفسیر است.
چرا؟
یک مدل سادهتر به این معنی است که ارتباط دادن نحوه کار خود مدل و نحوه تفسیر نتایج یک مدل آسانتر است.
به عنوان مثال، این احتمال وجود دارد که اکثر کاربران کسبوکار، مجموع حداقل مربعات (یعنی خط بهترین تناسب) را بسیار سریعتر از تکثیر معکوس درک کنند. این مهم است زیرا مشاغل به نحوه کار منطق اساسی در یک مدل علاقهمند هستند -در تجارت هیچ چیز از عدم قطعیت بدتر نیست- و یک جعبه سیاه یک معادل عالی برای آن است.
در نهایت، مهم است که بدانیم اعداد یک مدل چطور مشتق میشوند و چطور میتوان آنها را تفسیر کرد.
نقطه # ۳. یادگیری تحلیل رگرسیون در کل درک بهتری از استنباط آماری به شما خواهد داد.
باور کنید یا نه، یادگیری تحلیل رگرسیون من را به یک همکار بهتر (پایتون و آر)، یک متخصص آمار بهتر تبدیل کرد، و به من درک بهتری از مدلهای ساخت کلی داد.
برای اینکه کمی بیشتر شما را هیجانزده کنم، تحلیل رگرسیون به من کمک کرد تا موارد زیر را یاد بگیرم (نه فقط محدود به اینها) :
- ساخت مدلهای رگرسیون ساده و چندگانه
- انجام تجزیه و تحلیل باقی مانده و اعمال دگرگونیهایی مانند Box-Cox
- محاسبه فواصل اطمینان برای ضرایب رگرسیون و باقیماندهها
- تعیین اهمیت آماری مدلها و ضرایب رگرسیون از طریق آزمون فرضیه
- ارزیابی مدلها با استفاده از مربع R، MSPE، MAE، MAPE، PM، لیست ادامه دارد …
- شناسایی چند خطی بودن با عامل تورم واریانس (VIF)
- مقایسه مدلهای رگرسیون مختلف با استفاده از F-test جزئی
این فقط یک نمونه از چیزهایی است که یاد گرفتهام و من بسیار سطحی آنها را بیان کردهام. بنابراین اگر فکر میکنید که این کار به نظر یک چیز جالب میرسد، از شما میخواهم که بررسی کنید و حداقل ببینید چه چیزی را میتوانید یاد بگیرید.
چگونه میتوانید تحلیل رگرسیون را یاد بگیرید؟
اخیرا، من متوجهشدهام که بهترین راه برای یادگیری یک موضوع جدید پیدا کردن سخنرانیها یا یادداشتهای درسی از یک کالج / دانشگاه است. باور نکردنی است که چقدر چیزهای رایگان در وب موجود است.
به طور خاص، من شما را با دو منبع عالی ترک میکنم که میتوانید برای شروع از آنها استفاده کنید:
Welcome to STAT 501! | STAT ۵۰۱
از مطالعه شما متشکرم!
امیدوارم این مقاله را مفید و روشنگر یافته باشید! به یاد داشته باشید که نظرات من براساس تجربیاتم هستند و ممکن است با نظرات شما همخوانی نداشته باشند و این اشکالی ندارد! با این حال، اگر شما با این موضوع موافق باشید و با نظرات من موافق باشید، من شما را تشویق میکنم که به این موضوع بپردازید-از آن پشیمان نخواهید شد.
مثل همیشه، من بهترین شانس را در تلاشهایتان برای شما آرزو میکنم!
این متن با استفاده از ربات ترجمه مقالات دیتاساینس ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه میتواند دارای برخی اشکالات ترجمه باشد.
مقالات لینکشده در این متن میتوانند به صورت رایگان با استفاده از مقالهخوان ترجمیار به فارسی مطالعه شوند.
مطلبی دیگر از این انتشارات
بیماری همهگیر بعدی، ویروس نپاه در چین با میزان مرگومیر 75 درصدی!
مطلبی دیگر از این انتشارات
میانگین سرعت ترجمه متن چقدر است؟
مطلبی دیگر از این انتشارات
یک مشتری وفادار واقعا چه چیزی میخواهد (نکته: تخفیف نیست)