بسته psych در R Language

اولین گام در یادگیری ماشین و مهندسی داده، بررسی مجموعه داده های موجود و آشنایی با خواص مختلف آماری آنهاست که به نام تحلیل اکتشافی داده از آن یاد می کنیم. در بسیاری از موارد، این تحلیل اولیه، عملیاتپیش پردازش داده را هم جهت می دهد و تعیین می کند کدام یک خواص [Featues] یا مشخصات داده ها باید حذف شوند و یا چه تبدیلاتی روی داده ها باید صورت گیرد تا آماده ورود به مراحل بعد و اعمال الگوریتم های مختلف یادگیری ماشین شویم. (به نقل از سایت مهندسی داده، استاد عزیزم سید مجتبی بنایی)

بسته psych از پرکاربردترین بسته ها در R Language برای تحلیل اکتشافی داده است.

نام این بسته از عبارت زیر اتخاذ شده است:

Procedures for Psychological, Psychometric, and Personality Research

تابع describe در این بسته به صورت زیر است:

describe (x, na.rm = TRUE,  interp=FALSE, skew = TRUE, ranges = TRUE, trim=.1,type=3,check=TRUE,fast=NULL,quant=NULL,IQR=FALSE,omit=FALSE)

این تابع کمینه، بیشینه، انحراف استاندارد، خطای استاندارد (se) (میزان انحراف میانگین نمونه از میانگین جامعه)، میانه قدرمطلق انحرافات (mad)، کشیدگی (kurtosis)، چولگی (skewness) و... را محاسبه می کند.

چنانچه quant برابر not NULL باشد، چارک اول و سوم محاسبه می شود.