علاقه مند به تحلیل داده و داده کاوی. لینکدین:https://www.linkedin.com/in/mohammad-fatehi-09654062/
بسته psych در R Language
اولین گام در یادگیری ماشین و مهندسی داده، بررسی مجموعه داده های موجود و آشنایی با خواص مختلف آماری آنهاست که به نام تحلیل اکتشافی داده از آن یاد می کنیم. در بسیاری از موارد، این تحلیل اولیه، عملیاتپیش پردازش داده را هم جهت می دهد و تعیین می کند کدام یک خواص [Featues] یا مشخصات داده ها باید حذف شوند و یا چه تبدیلاتی روی داده ها باید صورت گیرد تا آماده ورود به مراحل بعد و اعمال الگوریتم های مختلف یادگیری ماشین شویم. (به نقل از سایت مهندسی داده، استاد عزیزم سید مجتبی بنایی)
بسته psych از پرکاربردترین بسته ها در R Language برای تحلیل اکتشافی داده است.
نام این بسته از عبارت زیر اتخاذ شده است:
Procedures for Psychological, Psychometric, and Personality Research
تابع describe در این بسته به صورت زیر است:
describe (x, na.rm = TRUE, interp=FALSE, skew = TRUE, ranges = TRUE, trim=.1,type=3,check=TRUE,fast=NULL,quant=NULL,IQR=FALSE,omit=FALSE)
این تابع کمینه، بیشینه، انحراف استاندارد، خطای استاندارد (se) (میزان انحراف میانگین نمونه از میانگین جامعه)، میانه قدرمطلق انحرافات (mad)، کشیدگی (kurtosis)، چولگی (skewness) و... را محاسبه می کند.
چنانچه quant برابر not NULL باشد، چارک اول و سوم محاسبه می شود.
مطلبی دیگر از این انتشارات
10 وبلاگ برتر علوم داده
مطلبی دیگر از این انتشارات
تحولات عمده تکنولوژی در 150 سال گذشته
مطلبی دیگر از این انتشارات
فضای ویژگی در یادگیری ماشین