علاقهمند به علم داده، یادگیری ماشین، پردازش زبان طبیعی، سیستمهای توصیهگر، منطق فازی
معرفی تزاروس ناسا
تزاروس چیست؟
تزاروس یا اصطلاحنامه مجموعهای از واژههای کنترل شده و منظم هستند. تزاروسها زیرمجموعهای از زبان اصلی و معمولا شامل اصطلاحات خاص یک حوزه هستند. هدف اصطلاحنامه ایجاد یکدستی در نمایهسازی اسناد و سهولت در کاوش اطلاعات میباشد. منظور از یکدستی ایجاد معیارهایی برای انتخاب واحد از بین چند انتخاب است.
برنامه اطلاعات علمی و فنی ناسا (STI)
برنامه اطلاعات علمی و فنی ناسا (STI) یک جزء حیاتی در فعالیت جهانی تحقیق و توسعه علمی و فنی هوافضا است که زیر نظر مدیر ارشد اطلاعات این آژانس فعالیت می کند. این برنامه، اطلاعات و اصطلاحات علمی و فنی ناسا را به دست آورده و سپس آنها را پردازش، بایگانی، اعلام و منتشر میکند. این برنامه اطلاعات بسیار حیاتی و مهمی را برای ناسا و سازمان های هوا فضایی و اخترشناسان سراسر دنیا فراهم میکند. دسترسی به پایگاه داده های هوانوردی و فضایی ناسا و رابط عمومی آن را فراهم میکند تا یکی از بزرگترین مجموعههای اطلاعات علمی و فنی علوم هوانوردی و فضایی در جهان را ارائه دهد.
تزاروس ناسا
شامل اصطلاحهای موضوعی تایید شدهای است که برای فهرست کردن و ارائه گزارش های فنی سازمان فضایی ناسا استفاده می شود. دامنه واژههای این تزاروس تنها محدود به مهندسی هوافضا نیست و کلیه حوزه های مرتبط با آن از جمله فیزیک، نجوم، اخترفیزیک، سیاره شناسی، علوم زمین و زیست شناسی را در بر میگیرد. حاوی بیش از 18400 اصطلاح موضوعی، 4300 تعریف و بیش از 4500 ارجاع متقابل است.
این تزاروس شامل دو جلد مکمل است:
جلد 1 - فهرست سلسله مراتبی با تعاریف: شامل تمام اصطلاحات موضوعی و ارجاعات متقابل تأیید شدهای است که ساختار سلسله مراتبی کامل را برای هر اصطلاح به همراه یک تعریف در صورت موجود نمایش می دهد.
جلد 2 - نمایش نقاط دسترسی: یک نمایش از کلمات کلیدی در متن است که دسترسی به هر کلمه را با هزاران نقطه دسترسی اضافی به اصطلاحات اصطلاحنامه، ارائه می کند.
قسمتهای مختلف جلد 1 تزاروس ناسا
- اصطلاحات آرایهای (Array Terms): اصطلاحات موضوعی با معانی بسیار گسترده یا مبهم برای نمایه سازی یا بازیابی مؤثر اطلاعات، اصطلاحات آرایه ای نام دارند. این روابط فقط با مرجع اصطلاح مرتبط (RT) نشان داده می شوند. علامت بینهایت (∞) در ابتدای تمام اصطلاحات آرایهای قرار میگیرد.
- شناسهها (identifiers): در اصطلاحنامه ناسا، شناسهها (یعنی عباراتی که موجودیتهای منحصربهفرد را مشخص میکنند) به عنوان اصطلاحات معمولی تلقی میشوند و ارجاعات متقابل کاملی برای آنها ارائه میشود. بیشتر شناسهها اسمهای خاص هستند و بسیاری از آنها برای یک مدل یا آیتم خاص دارای یک علامت عددی یا الفبایی هستند. به عنوان یک قاعده کلی، شناسه ها تنها در صورتی به اصطلاحنامه اضافه می شوند که ارتباط مهمی با علوم هوافضا داشته باشند.
- ترتیب قرارگیری عبارات: یک تکنیکِ مرتبسازیِ کامپیوتریِ کلمه محورِ خاص، در این تزاروس استفاده شده است. این تکنیک نامهای عددی را به ترتیبِ صعودی طبیعی مرتب میکند. عبارات غیرالفبایی موجود در عبارتها قبل از نویسههای الفبایی مرتبسازی میشوند.
- عبارت های مختلف استفاده شده در جلد یک تزاروس و کاربرد هرکدام:
نمونهای از یک ساختار سلسله مراتبی در تزاروس:
قسمت های مختلف جلد 2 تزاروس ناسا
- مراجع USE: برای ارجاعهای متقابل از اصطلاحهای غیر معتبر به اصطلاحهای معتبر استفاده میشوند.
- کلمات توقف (stop words) در نمایش کلمات در جلد 2 کاربردی ندارند و حذف شدهاند.
- ابهامزدا(Gloss): کلمه یا کلماتی هستند که در انتهای یک عبارت در پرانتز قرار می گیرند و برای ابهام زدایی هموگراف ها به کار می روند. علاوه بر این میتوانند برای بیان دامنه کلی یک اصطلاح نیز به کار روند.
نمونه ای از تزاروس جلد 2:
تزاروس ناسا در تاریخهای مختلفی و تکمیل دامنه واژگان به صورت چاپی هم عرضه شده است. عنوان و تاریخ چاپ این نسخهها به شرح زیر است:
- NASA Thesaurus; Subject Terms for Indexing Scientific and Technical Information. Preliminary Edition, 1967. NASA SP-7030. 3 Vols., Vol. 1, Alphabetical Listing, A-L; Vol. 2, Alphabetical Listing, M-Z; Vol. 3, Appendixes.
- NASA Thesaurus Alphabetical Update, 1971. NASA SP-7040.
- NASA Thesaurus. 1976 Edition. NASA SP-7050. 2 Vols., Vol. 1, Alphabetical Listing; Vol. 2, Access Vocabulary.
- NASA Thesaurus. 1982 Edition. NASA SP-7051. 2 Vols., Vol. 1, Hierarchical Listing; Vol. 2, Access Vocabulary.
- NASA Thesaurus. 1985 Edition. NASA SP-7053. 2 Vols., Vol. 1, Hierarchical Listing; Vol. 2, Access Vocabulary.
- NASA Thesaurus. 1988 Edition. NASA SP-7064. 3 Vols., Vol. 1, Hierarchical Listing; Vol. 2, Access Vocabulary; Vol. 3, Definitions. NASA Thesaurus. 1994 Edition. NASA SP-7096. 3 Vols., Vol. 1, Hierarchical Listing; Vol. 2, Access Vocabulary; Vol. 3, Definitions.
- NASA Thesaurus, 1998 Edition, NASA/SP-1998-7501, 2 Vols., Vol. 1, Hierarchical Listing With Definitions; Vol. 2, Rotated Term Display.
برای تعریف اصطلاحات علمی رایج، از تعریف نزدیک به مسائل ناسای آنها استفاده شده است. از برخی اصطلاحات مانند: نام مکان های رایج، عناصر شیمیایی، مدل های خاص رایانه ها، و اصطلاحات غیر فنی در این تزاروس تعریفی ارائه نشده است. این تزاروس سالها قبل از تلاش سیستماتیک برای تعریف اصطلاحات تهیه شده است و به همین دلیل برای برخی از عبارات نیز تعریفی ارائه نشده است .
این اصطلاحات به مرور در نسخههای مختلف کاملتر میشوند. تعاریف موجود در تزاروس توسط فرهنگنویسان و با تکیه بر منابعی مثل : متخصصان در این زمینه، های داده ناسا جستجوهای متون از پایگاه STI و مراجع تخصصی در مرکز اطلاعات هوافضای ناسا ساخته شده است.
مطلبی دیگر از این انتشارات
رباتهای اجتماعی (Social Bot) چیست؟
مطلبی دیگر از این انتشارات
حداکثرسازی نفوذ (influence maximization)
مطلبی دیگر از این انتشارات
بهینهسازی ازدحام ذرات در یادگیری تقویتی عمیق برای شناسایی رباتهای هرزنامه اجتماعی و کاربران تأثیرگذار بر هرزنامه در شبکه توییتر