به نام خدا
در برخی مسائل نیاز داریم بدانیم کدام ویژگی ها با هم بیشترین همبستگی را دارند. برای تعیین میزان همبستگی ها می توانیم از تابع زیر استفاده کنیم تا همبستگی همه ی داده ها را مشاهده کنیم(این دستور برای دیتافریم ها در کتابخانه ی Pandas است).
گاهی اوقات تعداد ویژگی ها زیاد است و سخت است این مقادیر را پیدا کنیم.
برای اینکه بتوانیم ویژگی هایی که بیشترین همبستگی را دارند پیدا کنیم می توانیم از کدی که در لینک زیر قرار دادم استفاده کنیم.
https://www.kaggle.com/code/skhalili/find-the-nth-largest-value-in-a-correlation-matrix?scriptVersionId=101892455
در این کد تابعی نوشته شده است که می تواند به تعداد دلخواه ویژگی هایی که بیشترین همبستگی را دارند مشخص کند.