بازیابی تصویر یعنی جستجو، کاوش و بازیابی تصاویر از یک پایگاه داده بزرگ دیجیتال. توی بازیابی تصویر، تعدادی تصویر با خصوصیات مشابه از پایگاه داده انتخاب میشه و شبیهترین اونها برای کاربر بازیابی میشه. شاخصگذاری دقیق تصاویر و انتخاب معیار شباهت مناسب، تاثیر قابل ملاحظهای روی عملکرد سیستم بازیابی تصویر میذاره.
بازیابی تصویر به سه صورت کلی انجام میشود:
۱. بازیابی تصویر توصیفی(روش سنتی): بازیابی با تفسیرهای متنی از پیش نوشتهشده برای تصاویر؛ مانند عنوان، اندازه،زمان ثبت شدن، مالک تصویر، کلمات کلیدی، برچسبها و...
۲. بازیابی تصویر محتوایی(روش امروزی): توضیح و تفسیر تصویر با استخراج خودکار ویژگیها و اشیاء موجود در تصویر برای تصویر فراهم میشه.
۳. ترکیبی از دو روش بالا
امروزه روش سنتی به تنهایی جوابگو نیست و به سیستمهای بازیابی تصویر محتوامحور، برای استفاده موثر و مناسب از پایگاه دادههای بزرگ تصویری احتیاج داریم.
۱. سیستمهای بازیابی تصویر متن محور (Concept based)
در این سیستمها، تصاویر توسط متادادههای متنی (نوشتاری) مثل کلمات کلیدی، عنوان، برچسبها و... تفسیر یا به اصطلاح حاشیه نویسی (annotating) میشدن. این کار به صورت دستی و توسط نیروی انسانی انجام میشد.
مزیت
پیادهسازی راحت و بازیابی سریع
معایب
۱. اضافهکردن دستی حاشیه نویسی برای پایگاهدادههای بزرگ کار سختیه.
۲. تصاویری که محتوای زیادی دارن، نیاز به توضیح بیشتری دارن
۳.دقیق نبودن حاشیه نویسی دستی و امکان تفسیر شدن غلط یک تصویر
۲. سیستمهای بازیابی تصویر محتوا محور (Content based)
بعد از توسعه سرویس های اینترنتی که تصاویر صنعتی، درسی، پزشکی، دارویی و... را در اختیار کاربران قرار میدادن و پررنگ تر شدن مشکلات سیستمهای متن محور، توجه زیادی به سمت سیستمهای محتوا محور جلب شد. در این سیستمها، بردار ویژگی تصاویر پایگاه داده از قبل استخراج شدهاند. این بردارهای ویژگی، تشکیل یک «پایگاه داده ویژگی» میدن. کاربر یک تصویر یا بخشی از اون را به عنوان کوئری ارسال میکنه. با استخراج ویژگیهای تصویر کوئری، شاخص و در نتیجه محتوای اون تصویر مشخص میشه. عملکرد این سیستمها بسیار به میزان دقت در شناسایی ویژگیها بستگی دارد. در نهایت، فاصله میان بردار ویژگی تصویر کوئری شده و تصاویر پایگاه داده محاسبه میشه و شبیهترین تصاویر بازیابی میشن.
مزیت
استخراج ویژگیهای تصاویر به صورت خودکار و کاهش چشمگیر خطا در حاشیهنویسی تصاویر
ایراد
هزینه محاسباتی بالاتر
محققان بازیابی تصویر محتوامحور ۲ مسیر عمده رو دنبال میکنن:
۱. چگونگی مدل کردن دستی محتوای تصاویر به صورت مجموعهای از ویژگیهای سطح پایین
۲. استفاده از یک سیستم استخراج ویژگی/تشخیص اشیاء برای استخراج خودکار ویژگیهای سطح پایین و سطح بالا
حالا، توی بازیابی تصویر محتوا محور، کامپیوتر باید یاد بگیره تا تصاویر را مثل انسانها ببینه و درک کنه. با «بازخورد ارتباط» (relevance feedback) میتونیم یک لینک ارتباطی بین تفسیر سطح پایین کامپیوتر از تصاویر (یه ماتریس از عدد و رقم که از عملیات روی پیکسلهای تصویر به دست میان) و تفسیر سطح بالای انسانها (اشیاء درون تصاویر؛ ما گربه و پرنده و ماشین رو میبینیم) برقرار کنیم. همانند قبل، برای
یک کوئری کاربر (یک تصویر) سیستم لیستی از تصاویر رو که بیشترین امتیاز را از معیار شباهت دریافت کردهاند، بازیابی میکنه. کاربر تصاویر بازیابی شده را به عنوان مرتبط (مثالهای مثبت) و غیر مرتبط (مثالهای منفی) علامتگذاری میکند و بعد با توجه به بازخورد کاربر، مجددا به پایگاه داده رجوع میکنه، تصاویر دیگهای رو انتخاب میکنه و یه لیست جدید از تصاویر رو به کاربر نمایش میده. یادتون باشه بازخورد ارتباط صفر و یکی نیست. یعنی ممکنه کامپیوتر ۱۰ تا تصویر رو برای بازیابی انتخاب کنه و ۳ تا از اونها مناسب بازیابی نباشن.
معمولا ما از کامپیوتر انتظار داریم، موقعی که کلاس یه تصویر رو تشخیص داد، تصاویری رو برای بازیابی انتخاب کنه که از همون کلاس باشن و اگه تصاویر انتخاب شده از کلاسهای دیگه باشن، اون موقع عملکرد سیستم امتیاز منفی از ما میگیره ولی کامپیوتر هم مثل ماهاست :> تا وقتی که اشتباه نکنه یاد نمیگیره. پس چالش کلی ما، نحوه ترکیب کردن مثالهای مثبت و منفی با یکدیگر است تا پاسخ به کوئری کاربر رو بهتر کنیم و کامپیوتر یاد بگیره چه تصاویری رو باید انتخاب کنه و چه تصاویری رو نباید انتخاب کنه.
انتخاب معیار شباهت مناسب هم خیلی مهمه. یادتونه که ویژگیهای تصاویر به صورت یه بردار ذخیره میشن؟ اگه بردارهای ویژگی به درستی تعریف و استخراج شده باشن، ما انتظار داریم که بردار ویژگی تصاویر مشابه، در نزدیکی هم قرار داشته باشه ( تصاویر مشابه، ویژگیهای مشابهی داشته باشن) پس معمولا از مقایسه، فاصله بین ۲ بردار ویژگی یا زاویه بین ۲ بردار ویژگی، برای سنجش شباهت بین تصاویر استفاده میکنن.
منابع
1. J.B. Judah, Multi-dimensional Indexing Review and Techniques, master’s thesis
2. Rajshree S. Dubey Niket, Bhargava Rajnish Choubey, Image Mining using Content Based Image Retrieval System, International Journal on Computer Science and Engineering, Vol. 02, No. 07, 2010
3. Manar Abdulkareem Al-Abaji, A Review of Content Based Image Mining System, Journal of University of Babylon for Pure and Applied Sciences,Vol 27, No.4, 2019