برای استفاده از مدل های کامپیوتر ویژن و به خصوص مدل های خانواده YOLO نیاز به دیتای درست میباشد این دیتا باید به صورتی باشد که تصاویر در یک فولدر و لیبل های تصاویر هم در یک فولدر دیگر باشند اما اسم و لیبل هر عکس باید یک اسم داشته باشند
فرمت لیبل ها باید به صورت فایل های تکست باشد
یک مثال از فایل لیبل :
1 59.0 56.0 101.0 171.0
2 96.0 63.0 149.0 181.0
23 157.0 97.0 211.0 199.0
8 219.0 113.0 273.0 216.0
1 285.0 124.0 325.0 245.0
6 318.0 141.0 382.0 242.0
1 396.0 177.0 435.0 282.0
1 442.0 192.0 488.0 295.0
اولین عدد اسم کلاس و 4 عدد جلوی ان مشخصات قرار گرفتن ان کلاس میباشد
اما گاهی ممکن است دیتای ما به این صورت نباشد و دیتا های موجود در اینترنت به صورت فایل های XMLهستند
یک دیتاست بزرگ پلاک های ایرانی موجود در اینترنت در لینک زیر موجود است https://github.com/mut-deep/IR-LPR
باتشکر از سازندگان این دیتاست :
Mahdi Rahmani, Melika Sabaghian, Seyyede Mahila Moghadami, Mohammad Mohsen Talaie, Mahdi Naghibi, Mohammad Ali Keyvanrad
برای تبدیل این دیتاست به فرمت YOLO
میتوانید از کد زیر استفاده نماید :
https://github.com/M1jid/xml-Convert-to-yolo
مقاله انتشار یافته این دیتاست :
https://arxiv.org/abs/2209.04680