Data Scientist & Big Data Strategist
انتخاب الگوریتم مناسب در پروژههای دادهکاوی
یکی از چالشهای مهم در پروژههای دادهکاوی انتخاب الگوریتم مناسب و بهینه بنا به نیازمندیهای مسئله است. در ادامه برخی از مؤلفههای کلیدی جهت انتخاب الگوریتمهای یادگیری ماشین در یک پروژه دادهکاوی ذکر خواهد گردید.
1- هدف تحلیل(متغیرهدف): هدف تحلیل و نوع متغیر هدف(Target) از مهمترین مؤلفههای انتخاب الگوریتم و تکنیک موردنیاز خواهد بود. هر یک از تحلیلهای توصیفی، پیشبینانه و... توسط الگوریتمهای مشخصی پشتیبانی خواهند شد. بهصورت کلی بنا به نوع متغیر هدف و تحلیل موردنیاز به الگوریتمهای مختلفی همانند خوشهبندی، طبقهبندی، پیشبینی، کاهش بعد، قوانین انجمنی و... نیاز خواهد شد.
2-دقت و صحت: در برخی از مسائل که هدف کسب دقت بالاتر میباشد برخی از الگوریتمها همانند SVM، شبکههای عصبی، Random Forest و... به نسبت سایر الگوریتمها پیشنهاد میشود.
3- سرعت: در مسائلی که هدف سرعت بیشتر در مدلسازی است برخی الگوریتمها همانند Naive Bayes، رگرسیون لوجستیک، رگرسیون خطی، درختهای تصمیمگیری و... عملکرد بهمراتب بهتری نسبت به سایر الگوریتمها دارند.
4- دادگان نامتوازن: یکی از چالشهای اساسی در پروژههای دادهکاوی وجود دادگان نامتوازن در کلاس متغیر هدف است. جهت مدیریت دادگان نامتوازن روشهای متعددی همانند OverSampling یا UnderSampling وجود دارد اما برخی از الگوریتمها نیز توانایی مدیریت این قبیل دادگان را دارند. از مهمترین الگوریتمهایی که توانایی مدیریت دادگان نامتوازن را دارند میتوان به الگوریتمهای Random Forset, C4.5, C5.0, CART و... اشاره کرد.
پینوشت:
1- انتخاب یک الگوریتم به سایر مؤلفهها همانند وجود تخصص لازم در تیم تحلیل داده و توانایی پیادهسازی آن، لزوم مشخص بودن یا نبودن قوانین کشفشده همانند روشهای BlackBox در مقابل روشهای Rule Base بستگی دارد.
2- ارائه راهحلهای کلی معمولاً کارآمد نخواهد بود اما در حوزه الگوریتمهای یادگیری ماشین طبق تجربیات موجود در پروژههای مختلف دو الگوریتم SVM و Random Forest معمولاً دارای نتایج کارآمدتری هستند.
ارادتمند
محمدرضا محتاط
https://t.me/dataanalysis
مطلبی دیگر از این انتشارات
قسمت دوم- پیادهسازی یک الگوریتم یادگیری ماشین
مطلبی دیگر از این انتشارات
آیا میتوان به سیستمهای هوش مصنوعی که صرفاً بر مبنای یادگیری عمیق بنا شده اند اعتماد کرد؟
مطلبی دیگر از این انتشارات
ترجمه های ماشینی چگونه متولد شدند ؟