به نام خدا
شاخص گذاری یکی از بخش های موتورهای جستجو می باشد. شاخص گذار یک نرم افزار است که داده ها را از
خزنده های وب می گیرد وداده ها را شاخص گذاری ، فشرده سازی کدگذاری می کند وسپس در پایگاه داده ذخیره می کند.
این بخش از موتورجستجو وظایف زیررا برعهده دارد :
الف) ذخیره داده هایی که از خرنده وب گرفته می شود.
ب)ایجاد نمایه های درست
(Creating proper indices)
ج) رتبه بندی موجودیت های مبنی برمعیارهای خاص نرم افزار
براساس وظایف بالا این بخش بامسائل زیرروبه رواست :
ساختارشاخص
نوع ذخیره سازی شاخص
ریشه یابی
stopwords حذف
ساخت دیکشنری چند زبانه
(Creating a multi-lingual dictionary for cross language searches)
ذخیره داده به صورت توزیع شده
اجرای الگوریتم رتبه بندی توزیع شده
ساخت شاخص های زیر
-Suffix tree
- Inverted Index (it has usually hash table form)
- Citation index
- N-Gram index
- Document-Term index (LSA related index)
- Other NLP related indices
(Using repositories of structured data) استفاده ازداده ساختاریافته مخزن
بروزرسانی شاخص ها ودیگر ساختارهای مربوط به داده در طی زمان
فشرده سازی در ذخیره ومحاسبات
lookupspeed
قدرت تحمل نقص
استخراج دانش بشری ضمنی ازداده
(Extracting implicit human knowledge from data)
موفق باشید
به امید خدا