ویرگول
ورودثبت نام
زهرا حقگو
زهرا حقگو
خواندن ۵ دقیقه·۴ سال پیش

بازیابی تصویر

ساختار کلی یه سیستم بازیابی تصویر محتوا محور
ساختار کلی یه سیستم بازیابی تصویر محتوا محور

بازیابی تصویر یعنی جستجو، کاوش و بازیابی تصاویر از یک پایگاه داده بزرگ دیجیتال. توی بازیابی تصویر، تعدادی تصویر با خصوصیات مشابه از پایگاه داده انتخاب میشه و شبیه‌ترین اون‌ها برای کاربر بازیابی میشه. شاخص‌گذاری دقیق تصاویر و انتخاب معیار شباهت مناسب، تاثیر قابل ملاحظه‌ای روی عملکرد سیستم بازیابی تصویر میذاره.
بازیابی تصویر به سه صورت کلی انجام میشود:
۱. بازیابی تصویر توصیفی(روش سنتی): بازیابی با تفسیرهای متنی از پیش نوشته‌شده برای تصاویر؛ مانند عنوان، اندازه،زمان ثبت شدن، مالک تصویر، کلمات کلیدی، برچسب‌ها و...
۲. بازیابی تصویر محتوایی(روش امروزی‌): توضیح و تفسیر تصویر با استخراج خودکار ویژگی‌ها و اشیاء موجود در تصویر برای تصویر فراهم میشه.
۳. ترکیبی از دو روش بالا
امروزه روش سنتی به تنهایی جوابگو نیست و به سیستم‌های بازیابی تصویر محتوامحور، برای استفاده موثر و مناسب از پایگاه داده‌های بزرگ تصویری احتیاج داریم.

انواع سیستم‌های بازیابی تصویر

۱. سیستم‌های بازیابی تصویر متن محور (Concept based)
در این سیستم‌ها، تصاویر توسط متاداده‌های متنی (نوشتاری) مثل کلمات کلیدی، عنوان، برچسب‌ها و... تفسیر یا به اصطلاح حاشیه نویسی (annotating) میشدن. این کار به صورت دستی و توسط نیروی انسانی انجام میشد.


مزیت

پیاده‌سازی راحت و بازیابی سریع

معایب
۱. اضافه‌کردن دستی حاشیه نویسی برای پایگاه‌داده‌های بزرگ کار سختیه.

۲. تصاویری که محتوای زیادی دارن، نیاز به توضیح بیشتری دارن

۳.دقیق نبودن حاشیه نویسی دستی و امکان تفسیر شدن غلط یک تصویر

سیستم بازیابی تصویر متن محور
سیستم بازیابی تصویر متن محور

۲. سیستم‌های بازیابی تصویر محتوا محور (Content based)

بعد از توسعه سرویس های اینترنتی که تصاویر صنعتی، درسی، پزشکی، دارویی و... را در اختیار کاربران قرار میدادن و پررنگ تر شدن مشکلات سیستمهای متن محور، توجه زیادی به سمت سیستم‌های محتوا محور جلب شد. در این سیستم‌ها، بردار ویژگی تصاویر پایگاه داده از قبل استخراج شده‌اند. این بردارهای ویژگی، تشکیل یک «پایگاه داده ویژگی» میدن. کاربر یک تصویر یا بخشی از اون را به عنوان کوئری ارسال میکنه. با استخراج ویژگی‌های تصویر کوئری، شاخص و در نتیجه محتوای اون تصویر مشخص میشه. عملکرد این سیستم‌ها بسیار به میزان دقت در شناسایی ویژگی‌ها بستگی دارد. در نهایت، فاصله میان بردار ویژگی تصویر کوئری شده و تصاویر پایگاه داده محاسبه میشه و شبیه‌ترین تصاویر بازیابی میشن.


مزیت

استخراج ویژگی‌های تصاویر به صورت خودکار و کاهش چشمگیر خطا در حاشیه‌نویسی تصاویر
ایراد

هزینه محاسباتی بالاتر


محققان بازیابی تصویر محتوامحور ۲ مسیر عمده رو دنبال میکنن:
۱. چگونگی مدل کردن دستی محتوای تصاویر به صورت مجموعه‌ای از ویژگی‌های سطح پایین
۲. استفاده از یک سیستم استخراج ویژگی/تشخیص اشیاء برای استخراج خودکار ویژگی‌های سطح پایین و سطح بالا

سیستم بازیابی تصویر محتوا محور
سیستم بازیابی تصویر محتوا محور


حالا، توی بازیابی تصویر محتوا محور، کامپیوتر باید یاد بگیره تا تصاویر را مثل انسان‌ها ببینه و درک کنه. با «بازخورد ارتباط» (relevance feedback) میتونیم یک لینک ارتباطی بین تفسیر سطح پایین کامپیوتر از تصاویر (یه ماتریس از عدد و رقم که از عملیات روی پیکسل‌های تصویر به دست میان) و تفسیر سطح بالای انسان‌ها (اشیاء درون تصاویر؛ ما گربه و پرنده و ماشین رو می‌بینیم) برقرار کنیم. همانند قبل، برای
یک کوئری کاربر (یک تصویر) سیستم لیستی از تصاویر رو که بیشترین امتیاز را از معیار شباهت دریافت کرده‌اند، بازیابی میکنه. کاربر تصاویر بازیابی شده را به عنوان مرتبط (مثال‌های مثبت) و غیر مرتبط (مثالهای منفی) علامت‌گذاری می‌کند و بعد با توجه به بازخورد کاربر، مجددا به پایگاه داده رجوع می‌کنه، تصاویر دیگه‌ای رو انتخاب می‌کنه و یه لیست جدید از تصاویر رو به کاربر نمایش میده. یادتون باشه بازخورد ارتباط صفر و یکی نیست. یعنی ممکنه کامپیوتر ۱۰ تا تصویر رو برای بازیابی انتخاب کنه و ۳ تا از اون‌ها مناسب بازیابی نباشن.

معمولا ما از کامپیوتر انتظار داریم، موقعی که کلاس یه تصویر رو تشخیص داد، تصاویری رو برای بازیابی انتخاب کنه که از همون کلاس باشن و اگه تصاویر انتخاب شده از کلاس‌های دیگه باشن، اون موقع عملکرد سیستم امتیاز منفی از ما می‌گیره ولی کامپیوتر هم مثل ماهاست :> تا وقتی که اشتباه نکنه یاد نمی‌گیره. پس چالش کلی ما، نحوه ترکیب کردن مثال‌های مثبت و منفی با یکدیگر است تا پاسخ به کوئری کاربر رو بهتر کنیم و کامپیوتر یاد بگیره چه تصاویری رو باید انتخاب کنه و چه تصاویری رو نباید انتخاب کنه.

انتخاب معیار شباهت مناسب هم خیلی مهمه. یادتونه که ویژگی‌های تصاویر به صورت یه بردار ذخیره می‌شن؟ اگه بردارهای ویژگی به درستی تعریف و استخراج شده باشن، ما انتظار داریم که بردار ویژگی تصاویر مشابه، در نزدیکی هم قرار داشته باشه ( تصاویر مشابه، ویژگی‌های مشابهی داشته باشن) پس معمولا از مقایسه، فاصله بین ۲ بردار ویژگی یا زاویه بین ۲ بردار ویژگی، برای سنجش شباهت بین تصاویر استفاده می‌کنن.



منابع

1. J.B. Judah, Multi-dimensional Indexing Review and Techniques, master’s thesis
2. Rajshree S. Dubey Niket, Bhargava Rajnish Choubey, Image Mining using Content Based Image Retrieval System, International Journal on Computer Science and Engineering, Vol. 02, No. 07, 2010
3. Manar Abdulkareem Al-Abaji, A Review of Content Based Image Mining System, Journal of University of Babylon for Pure and Applied Sciences,Vol 27, No.4, 2019



بازیابی تصویربازیابی تصویر محتوامحورمعیار شباهتبازخورد ویژگی
دانشجوی ارشد هوش مصنوعی. اینجا بیشتر درباره هوش مصنوعی و علوم داده می‌نویسم.
شاید از این پست‌ها خوشتان بیاید