داریوش مهدی پور یقینی
داریوش مهدی پور یقینی
خواندن ۱ دقیقه·۱ سال پیش

چه دیتاستی به درد اینچیه می خوره؟

برای اینکه بتونیم مدل مدنظر برای اینچیه رو ترین کنیم و توسعه بدیم باید دیتاست مناسب برای این کار رو پیدا کنیم. پس لازمه اول بدونیم دیتاستی که بهش نیازداریم دقیقا چه ویژگی هایی داره و ساختارش باید چجور باشه. این ویژگی ها رو بر مبنای عملکردی که از اینچیه مد نظرمون هست در میاریم.

انتظاری که ما از اینچیه داریم اینه که هر تصویری بهش داده می شه، کلاس های متناسب با اون تصویر رو بده. با این تعریف می شه فهمید که ما با یک مساله کلاسبندی تصویر روبرو هستیم و متناسب با اون دیتاست انتخاب کنیم. دیتاست های مناسب برای کلاس بندی دیتاست هایی هستن که لیبل یا تارگت هر تصویر هم مشخص باشه. یعنی دیتای آموزشی کلاسش هم مشخص باشه. یکی از مهمترین و معروفترین دیتاست ها برای آموزش مدل کلاسبند تصویری دیتا ست CFAR-10 هست.

این دیتا ست 60 هزار تا تصویر داره که تمامی این تصاویر تو ده دسته قرار گرفتن.

این دیتاست از نظر تعداد تصویر برای ترین مدل خیلی خوبه ولی یک مشکل اساسی داره و اون هم اندازه تصاویر هستش. نمونه های این دیتا ست تو اندازه های 32 در 32 پیکسل تهیه شدن. عملا تصاویری که کاربرا برای کلاس بندی به اینچیه ارسال خواهند کرد خیلی بزرگ تر از این تصاویر خواهند بود. پس باید دیتا ستی که استفاده می کنیم اندازه نمونه هاش از این بزرگتر باشه. علاوه بر این دیتاستی که می خوایم باید برای هر تارگت چندین کلاس سلسله مراتبی برای نمونه ها تارگت زده بشه. مثلا وقتی یک تصویر از سگ بهش داده بهش بتونه اونو کلاس های حیوانات، سگ ها، سگهای پاکوتاه و ... دسته بندی کنه. با این تفاسیر ممکنه لازم باشه ما دیتاست مناسب برای کارخودمون رو با اسکرپ کردن اطلاعات تو سایت های مختلف جمع آوری کنیم.


منبع: اینچیه

تصویراینچیهدیتاستinchiyehصوت
مدرس دانشگاه، مولف کتاب، برنامه نویس، عاشق هوش مصنوعی مخصوصا یادگیری عمیق، کتاب و مسافرت و گشت و گذار تو طبیعت مخصوصا بکرش رو هم خیلی دوست دارم.
شاید از این پست‌ها خوشتان بیاید