Data Scientist & Big Data Strategist
پرکاربردترین تکنیکهای آماری در علمداده
یادگیری تخصصی تکنیکها و الگوریتمهای آماری همواره یکی از چالشهای متخصصین علمداده است. در ادامه 10 تکنیک پرکاربرد آمار در پروژههای علمداده و دادهکاوی معرفی میشوند.
1- رگرسیون خطی (Linear Regression)
2- الگوریتمهای طبقهبندی (Classification)
3- نمونهسازی (Resampling)
4- کاهش بعد (Dimension Reduction)
5- مدلهای غیرخطی (Nonlinear Models)
6- الگوریتمهای بدون نظارت (Unsupervised Learning)
7- الگوریتم ماشین پشتیبان بردار (SVM)
8- متدهای انتخاب زیرمجموعه (Subset Selection)
9- مدلهای مبتنی بر درخت (Tree-Based Methods)
10- روش Shrinkage
در شکل زیر به تفکیک، متدها و الگوریتمهای مورد نیاز در هر دسته عنوان شده است. آموزش هدفمند در هر یک از این موارد در گسترش دانش آماری علاقهمندان میتواند بسیار مفید باشد.
پینوشت:
در لینک زیر نیز یک جزوه تخصصی از مباحث آماری در یادگیری ماشین به زبان انگلیسی در 47 صفحه برای علاقهمندان این حوزه قابل دانلود است.
https://gwthomas.github.io/docs/math4ml.pdf
مطلبی دیگر از این انتشارات
تشخیص چهره با پایتون
مطلبی دیگر از این انتشارات
چگونگی کار با الگوریتم درخت تصمیم به کمک کتابخانه Scikit-Learn
مطلبی دیگر از این انتشارات
الگوریتم سیاه چاله چیه ؟!