شاخص گذاری تصاویر(Image Indexing) به دلیل کار دستی(handwork) مورد نیاز برای تفسیر متنی تصاویر و مفهومی بـودن حس بینایی انسان که باعث برداشت متفاوت افراد از تصاویر میشود، کاری وقتگیر و ناکارآمد است. بعدها به منظور حل این مسائل، مبحث بازیابی تصویر محتوا-محور مطرح شد که در آن به جای توصیف تصویر به صورت دستی، تصاویر براساس محتوایشان بـه صورت خودکار شاخصگذاری میشن. در سیستمهای بازیابی تصویر از ویژگیهای سطح پایین مانند رنگ، بافت و شکل یا ویژگیهای سطح بالای اشیاء، برای شاخصگذاری تصاویر استفاده میشود.
معمولا بردارهای ویژگی تصاویر ابعاد بالایی دارند. پایگاه دادههای تصویری نیز معمولا بسیار گسترده هستن و جستجو در آنها زمانبر و پیچیده است. شاخصگذاری، باعث کاهش فضای جستجو و بهبود سرعت بازیابی پایگاه داده میشه. بازیابی تصویر محتوا- محور، از مجموعههای بزرگ تصاویر، نیاز به پشتیبانی از ساختار شاخصگذاری چند بعدی دارد. انتخاب روش شاخصگذاری چند بعدی، به ابعاد دادهها بستگی دارد و چون بردار ویژگی تصاویر و ویدئوها، با حدود ابعاد ۶۴تا ۵۰۰ بُعد، در دسته دادههای با ابعاد بسیار بالا قرار میگیره، برای آنها روشهای شاخصگذاری زیر پیشنهاد میشه:
R tree (حالتهای تعمیم یافته R* Tree R+ Tree)
B Tree (حالتهای تعمیم یافته B* Tree B+ Tree)
SS Tree
K-D-B Tree
روش R-Tree
ایده اصلی ساختمان داده R-tree این است که اشیاء نزدیک هم را در یک گروه قرار دهیم و آنها را در کوچکترین مستطیل ممکن احاطه کنیم. در سطح برگ، هر مستطیل نشان دهنده یک شیء است و هرچه به سمت سطوح بالاتر حرکت کنیم، یک گره تعداد اشیاء بیشتری را نشان می دهد. مستطیل ها نیز می تونن با هم همپوشانی داشته باشن. از آن جایی که همه اشیاء در مستطیلهای احاطهکننده قرار میگیرن، اگه یه جستجو تداخلی با یک مستطیل احاطهکننده نداشته باشه، پس نمیتونه تداخلی با هیچ یک از اشیاء داخل آن نیز داشته باشه. در واقع، ایده اصلی استفاده از مستطیل احاطهکننده، تصمیم گیری در مورد این است که داخل یک زیر درخت جستجو شود یا خیر. به این ترتیب اکثر گرهها اصلا در طول جستجو دیده نمیشن. این باعث میشه که این روش برای مجموعه دادهها و پایگاهدادههای بزرگ مناسب باشه.