Sanaz Khalili
Sanaz Khalili
خواندن ۱ دقیقه·۲ سال پیش

پیدا کردن nتا بزرگترین مقدار در ماتریس همبستگی

به نام خدا

در برخی مسائل نیاز داریم بدانیم کدام ویژگی ها با هم بیشترین همبستگی را دارند. برای تعیین میزان همبستگی ها می توانیم از تابع زیر استفاده کنیم تا همبستگی همه ی داده ها را مشاهده کنیم(این دستور برای دیتافریم ها در کتابخانه ی Pandas است).

گاهی اوقات تعداد ویژگی ها زیاد است و سخت است این مقادیر را پیدا کنیم.

برای اینکه بتوانیم ویژگی هایی که بیشترین همبستگی را دارند پیدا کنیم می توانیم از کدی که در لینک زیر قرار دادم استفاده کنیم.

https://www.kaggle.com/code/skhalili/find-the-nth-largest-value-in-a-correlation-matrix?scriptVersionId=101892455

در این کد تابعی نوشته شده است که می تواند به تعداد دلخواه ویژگی هایی که بیشترین همبستگی را دارند مشخص کند.

همبستگیcorrelationdata science
https://github.com/sanazkhalili - https://www.kaggle.com/skhalili
شاید از این پست‌ها خوشتان بیاید