وقتی یک مدل طبقه بندی ساختیم باید ارزیابی کنیم پیش بینی های انجام شده توسط مدل چقدر خوب است.
چند معیار وجود دارد که به ما کمک میکند مدل خود را بهبود ببخشیم.
معیارهای اساسی برای داده های فوق به شرح زیر است:
مثال بالا، فرض کنید که فقط 30 بیمار در واقع سرطان دارند. اگر مدل ما 25 نفر از آنها را مبتلا به سرطان تشخیص دهد چه؟
دقت در این مورد = 90% است که عدد کافی برای مدل به عنوان "accurate" در نظر گرفته شود. با این حال، 5 بیمار وجود دارند که واقعاً سرطان دارند و مدل پیشبینی کرده است که آنها به سرطان مبتلا نیستند. بدیهی است که این هزینه بسیار بالایی است. مدل ما باید سعی کند این منفی های کاذب را به حداقل برساند.
خلاصه تفاوتهای بین F1-score و accuracy :
یک accuracy زمانی استفاده میشود که مثبتهای واقعی و منفیهای واقعی مهمتر هستند، در حالی کهF1-score زمانی استفاده میشود که منفیهای کاذب و مثبتهای غلط بسیار مهم هستند.
هنگامی که توزیع کلاس مشابه است می توان از accuracy استفاده کرد در حالی کهF1-score معیار بهتری است وقتی کلاس های نامتعادل مانند مورد بالا وجود دارد.
در اکثر مسائل طبقه بندی واقعی، توزیع کلاس نامتعادل وجود دارد و بنابراین F1-scoreمعیار بهتری برای ارزیابی مدل ما است.
منبع :
https://medium.com/analytics-vidhya/accuracy-vs-f1-score-6258237beca2
منبع تصویر :
https://www.thoughtco.com/thmb/4oLEU_j-T1dZPPf6WvHHocekmmE=/395x0/filters:no_upscale():max_bytes(150000):strip_icc()/GettyImages-84754796-5693f0bd5f9b58eba493964c.jpg