درک معنای Ontology موضوع پیچیده ای در صنعت کامپیوتر بوده است. تعریف Ontology موضوعی بوده است که بحثهای زیادی بر سر آن همواره وجود داشته است است که عموما در حوزه هوش مصنوعی بوده است . Ontology تاریخچه بلندی در حوزه فلسفه دارد که در رابطه با موجودیت اشیا و مفاهیم در جهان صحبت می کند. همچنین غالباً کاربرد این مفهوم در حوزه معرفت شناسی که در رابطه با دانش و دانستن است مطرح است. کلمه آنتولوژی از دو واژه یونانی سرچشمه گرفته است.اجازه بدهید با تعریف انتولوژی در حوزه فلسفه موضوع را آغاز کنیم
تعریف فلسفی آنتولوژی:
به طور کلی Ontology یعنی مطالعه در رابطه با موجودیت اشیا در جهان و ارتباطاتی که آنها با یکدیگر دارند. همچنین شامل جزئیات ساختار سلسله مراتبی این اشیا می شود. همین طور در رابطه با دسته بندی اشیا با توجه به شباهت و تفاوت های آنها نسبت به یکدیگر صحبت می کند . موجودیت به چیزی می گویم که وجود دارد، حالا این موجودیت می تواند انتزاعی باشد یا واقعی باشد، فیزیکی باشد یا غیر فیزیکی باشد. این مفاهیم در واقع تفاوت را ببین موجودیت و کیفیت آنها برقرار می کند. موجودیت می تواند یک موجودیت مشخص یا یک مفهوم انتزاعی باشد که وجود آن شی را توضیح می دهد و نه کیفیت های مرتبط با آن را. موجودیت ها بلوکهای ساختمانی اصلی در ساختار آنتولوژی محسوب می شود که فرهنگ لغات یا مجموعه لغات یک آنتولوژی را تعریف می کند مانند کفش، معلم، آموزش، مطالعه )در واقع این مفاهیم میتواند فیزیکی یا غیر فیزیکی باشد (در فلسفه ontology یعنی مطالعه آنچه وجود دارد. فیلسوف ها از مفهوم آنتولوژی برای مطرح کردن پرسش های چالش برانگیز در رابطه با ارائه تئوری ها و مدل ها و همچنین درک بهتر هستی شناسانه جهان استفاده می کنند. سوالاتی از قبیل :
اجزای زیربنایی و اساسی جهان چه هستند؟
این اجزا چگونه به یکدیگر مرتبط هستند؟
برای مثال کفش یک شیء مادی است. قدم زدن یک مفهوم غیر مادی است. آیا اشیای فیزیکی مانند کفش واقعی تر از مفاهیمی مانند قدم زدن هستند؟ رابطه بین کفش و قدم زدن چیست؟
آنتولوژی فلسفی دوشاخه مهم دارد :
هستی شناسی یا انتولوژی مادی گرایانه :
باور به اینکه موادی نظیر ذرات و انرژی واقعی تر از مفاهیم ذهنی هستند .باور به اینکه هستی صرف نظر از از مشاهدات انسانی وجود دارد .
هستی شناسی یا انتولوژی غیر مادی و ذهنی :
باور به اینکه پدیده های غیر مادی نظیر ذهن انسان و آگاهی واقعی تر از از چیزهای مادی هستند. باور به اینکه حقیقت و هستی در ذهن ناظر ساخته و پرداخته می شود .
تعریف Ontology در علوم کامپیوتر :
در علوم کامپیوتر Ontology در واقع یک مدل داده است که دانش را به عنوان مجموعه ای از مفاهیم در یک حوزه نمایش می دهد، و ارتباطات بین این مفاهیم را معرفی می کند .وقتی یک آنتولوژی را توصیف می کنیم غالباً در رابطه با یک حوزه (Domain) مشخص صحبت میکنیم. درک و ساختن آنتولوژی برای کل جهان هستی کاری بیمعنی و بی پایان است.نظر به تعریف فیلسوفانه، آنتولوژی در واقع عبارت از یک تعریف و نامگذاری معین و رسمی است از نوع و ویژگی های یک موجودیت که در یک حوزه وجود دارد. بنابراین این توضیح به کاربرد عملی آنتولوژی با تعریف فلسفی البته با توجه به دسته بندی یا کلاس بندی کردن موجودیت ها اشاره می کند .
اینجا یک آنتولوژی یعنی توضیح چیزهایی که در یک حوزه مشخص وجود دارد، برخلاف توضیحات فلاسفه که در بالا ذکر شد. محققان اساساً علاقه مند به بحث کردن در رابطه با این که این موجودیت ها یا مفاهیم اجزا اساسی یا ذاتی یک سیستم هستند ندارند. آنها همچنین در رابطه با این که این مفاهیم واقعی و فیزیکی یا غیر واقعی و غیر مادی هستند نیز صحبتی ندارند. بلکه هدف در توضیح ساختار زیربنایی است که بر اشیا و گروه ها تاثیر میگذارد. بنابراین محققان در این رابطه بیشتر متمرکز بر نامگذاری اجزا و فرآیندها و دسته بندی کردن مفاهیم مشابه در دسته بندی های مربوطه می باشند.
مانند: اگر یک کلاس درس(سیستم) را در نظر بگیریم، در ان یک معلم ، یک هدف (بخشی از اجزای سیستم ) و تدریس کردن (فرایند سیستم) وجود دارد.
چرا از آنتولوژی ها استفاده می کنند ؟
امروزه مردم به دادههای فراوان از منابع مختلف که هر کدام مربوط به دامنه ها یا سیستمهای اطلاعاتی متفاوت می باشد استفاده می کنند. در واقع در مقایسه با دهه های گذشته حجم اطلاعات در هر لحظه به طرز قابل توجهی در حال افزایش است. برای مثال اگر یک سازمان را در نظر بگیریم، منابع داده آنها میتواند به فرم ها و حالت های مختلف نظیر فایلهای اکسل، پایگاههای داده (دیتابیس)،تصاویر، اسناد، دیاگرام هاو غیره باشد .از آنجایی که این اطلاعات با فرمت های کاملا متفاوتی به دست آمده اند، پیدا کردن روابط بین داده ها بسیار مشکل است.
در شرایطی مانند این بسیار سخت است که بفهمیم مثلا تصمیماتی که در قالب اسناد word ثبت شدهاند چگونه به فرآیندهای کاری که در ساختار مدلها و دیاگرام ها ترسیم شده اند مرتبط هستند و همچنین اینکه چگونه این فرآیندهای کاری به داده های ثبت شده در پایگاه داده مرتبط هستند و غیره .
بنابراین لازم است که بتوانیم داده ها را با وجود فرمت های مختلف، تحت شرایطی که بدانیم و تشخیص دهیم که این داده ها چه روابطی با هم دارند نمایش دهیم. آنتولوژی ها امکان برقراری چنین روابطی را برای داده ها فراهم می کنند. آنتولوژی در واقع فرمی از مدیریت دانش است. آنتولوژی دانش موجود در یک حوزه ( سازمان یا سیستم اطلاعاتی) را به صورت یک مدل (دیتامدل) دریافت میکند. این مدل سپس می تواند توسط کاربران مورد پرسش (کوئری) قرار گیرد تا انتولوژی به سوالات پیچیده پاسخ دهد و ارتباطات درون آن حوزه را نمایش دهد.
بر طبق گفته Tom Gruber که یک متخصص هوش مصنوعی در دانشگاه استنفورد می باشد، ” آنتولوژی در واقع بیان مشخصات یک مفهوم سازی می باشد که به برنامهها و انسانها کمک میکند تا اطلاعات خود را به اشتراک بگذارند و این یعنی آنتولوژی مجموعهای از مفاهیم (چیزها) ، رویدادها و روابط میباشد که توسط زبان طبیعی ایجاد شده اند، تا یک مرجع و فرهنگ لغت مشترک برای تبادل اطلاعات را بسازد .
ساختار اساسی یک آنتولوژی:
دو ساختار اساسی که در دنیای آنتولوژی ها مطرح هستند RDF و OWL می باشد. بر طبق این استاندارد ها یک آنتولوژی از کلاس ها و روابط تشکیل شده است
اجزای اصلی یک آنتولوژی:
چهار جز اصلی یک آنتولوژی عبارت اند از:
مفاهیم :
یک مفهوم مجموعه یا کلاسی از موجودیتها یا چیزهایی که درون یک حوزه وجود دارد می باشد. برای مثال “قانون عرفی” می تواند به عنوان یک مفهوم در حوزه حقوق و قانون محسوب شود .دو نوع مفهوم داریم:
ارتباطات :
ارتباطات در واقع به بیان تعاملات بین مفاهیم و یا معین کردن ویژگی های یک مفهوم می پردازد .دو نوع از ارتباطات داریم :
اعضا :
اعضا همان چیزهایی هستند که توسط یک مفهوم معرفی می شوند. مثلاً در یک سیستم کلاس درسی ، آقای دکتر احسانی عضوی از مفهوم معلم است. یک Ontology هیچ عضوی ندارد. در واقع یک Ontology صرفاً عبارت است از طراحی یک مفهوم سازی یا تصویرسازی از یک حوزه .ترکیب Ontology با اعضا چیزی است که به آن پایگاه دانش می گوییم.
اصل ها یا قاعده ها :
قاعده ها برای مقید کردن مقادیر برای کلاس ها یا اعضا مورد استفاده قرار می گیرد. مثلاً میتوان گفت سن یک انسان باید بیشتر از 0 و کمتر از ۱۲۰ باشد
چگونه از یک آنتولوژی استفاده کنیم ؟
یک آنتولوژی می تواند توسط کاربران مورد پرس و جو (کوئری گرفتن) قرار گیرد تا به پرسش های پیچیده پاسخ دهد و ارتباطات موجود در در آن حوزه را نمایش دهد. توسط آنتولوژی میتوانیم برای تعریف روابط واقعی و جاری که بین افراد یا موجودیت های مختلف برقرار است استفاده کنیم. بگذارید این موضوع را با یک مثال روشن تر کنیم:
یک آنتولوژی می تواند ارتباطات بین این دو را بگیرد و بر مبنای این مثال میتوانیم ویژگی ای تحت عنوان “Has employer” داشته باشیم .که آن را به این صورت می خوانیم:
“Peter has employer Microsoft”
همانطور که در بالا توضیح داده شد ترکیب کلاس ها و ارتباطات تحت عنوان “سه گانه ها” شناخته می شود .یک سهگانه از از موضوع (Subject)، گزاره (Predicate) و هدف (Object) تشکیل شده است.
این مفاهیم هسته اساسی آنتولوژی ها را تشکیل می دهد .با استفاده از این سه گانه ها می توان ترکیبات مختلفی از آنها را به روشهای گوناگونی ایجاد کنیم تا یک جلوه یا تصویر کاملی از از دنیای واقع توسط یک آنتولوژی نمایش دهیم.هرچقدر تعداد سه گانه های ما در یک آنتولوژی بیشتر باشد آنتولوژی جامع تر و غنی تر می گردد
حوزه های کاربردی برای آنتولوژی ها :
هستان شناسی در واقع عبارت است از یک توصیف رسمی از دانش به عنوان مجموعه ای از مفاهیم در یک دامنه مشخص و بیان ارتباطات بین این مفاهیم درون این دامنه.قبل از خواندن مقاله توجه داشته باشید سه مفهوم “هستان شناسی”، “هستی شناسی” و “آنتولوژی” در واقع اشاره به یک معنا و مفهوم دارند.
برای طراحی یک هستی شناسی لازم است اجزا آن نظیر اعضا( که به آن نمونه یا اشیا نیز می گوییم)، کلاس ها، خواص، ارتباطات، قیدها،قوانین و قواعد مشخص شوند. به طور کلی می توان گفت هستان شناسی نه فقط ساختار یک دانش را اشتراک گذاری کرده و قابل استفاده مجدد می کنند، بلکه همچنین می تواند دانش جدیدی را در رابطه با حوزه مورد نظر ارائه دهد .
البته روش های دیگری برای نمایش ساختار دانش مانند فرهنگ لغات ،دسته بندی ها، نقشه های موضوعی و مدلهای منطقی وجود دارد. هر چند بر خلاف دسته بندی های سنتی یا پایگاه داده های رابطه ای، هستان شناسی ها به ما اجازه می دهد ارتباطات را به اشکال مختلف و پیچیده ترین حالت ممکن بین مفاهیم و اجزا و عناصر تعیین کنیم .به عنوان یکی از از واحدهای سازنده تکنولوژی های معنایی، هستان شناسی ها بخشی از استانداردW3C وب معنایی می باشد. هستان شناسی ها ساختار اساسی و زیربنایی برای برقراری ارتباط بین اجزاء مختلف اطلاعات در فضای وب را به منظور فراهم کردن داده های پیوندی ایجاد می کند. به دلیل آنکه از هستی شناسی برای ایجاد یک ساختار مدل شده مشترک از داده برای پایگاه داده ها و سیستم های عامل توزیع شده و ناهمگن استفاده می شود، هستان شناسی ها قابلیت تعامل بین پایگاه های داده، جستجوی بین پایگاه های داده و مدیریت منسجم داده را فراهم می کند.
هستان شناسی ها راهکاری برای مدیریت بهتر داده ها :
برخی از مهمترین ویژگیهای هستان شناسی ها این است که می تواند یک درک مشترک از اطلاعات را فراهم کند و پیش فرض های مشخصی را در رابطه با حوزه هدف ارائه دهند. درنتیجه، قابلیت همکاری متقابل و برقراری ارتباطات متعدد بین عناصر یک مدل هستان شناسی، آن را به عنوان یک راهکار بسیار ارزشمند برای حل مشکلات مربوط به دسترسی و بازیابی داده ها در سازمان ها و ساختارهای بزرگ مطرح کرده است.همچنین هستان شناسی ها با توسعه و بهبود دادن کاربرد فراداده ها (metadata) که در نتیجه به سازمان ها این امکان را می دهد که معنای بهتر و دقیق تری از دادههای خود ارائه دهند،کیفیت داده ها را افزایش داده است.
استاندارد owl و مدل سازی هستان شناسی :
در سال های اخیر حرکتی به سوی استفاده از زبانهای هستان شناسی نظیر OWL ایجاد شده است. OWL یک زبان محاسباتی مبتنی بر منطق برای وب معنایی می باشد، که برای نمایش دانش پیچیده در رابطه با اشیا و ارتباطات بین آنها طراحی شده است. این زبان هم چنین تفاوتهای موجود بین کلاس ها، ویژگی ها و ارتباطات را به نحو بسیار دقیق و معناداری ایجاد می کند.با مشخص کردن کلاس ها و مشخصه های ارتباطات بین آنها و همچنین ساختار سلسله مراتبی آن ها ، OWL مدل سازی هستان شناسی را در پایگاه داده های معنایی (که تحت عنوان سه گانه هایRDF شناخته می شوند) فراهم می کند.OWL به همراه یک یک موتور استنتاج OWL مورد استفاده قرار می گیرد تا پایداری و سازگاری ساختارهای RDF را بررسی کنند .همچنین OWL مجهز به قابلیتی است که می تواند برای کلاس ها، اعضا و ویژگی ها قابلیت معادل بودن و متفاوت بودن نسبت به سایر کلاس اعضا و ویژگی ها را معین کند.ارتباطات به کاربران کمک می کند به نحو موثرتری بتوانند مفاهیم یکسان را پیدا کند حتی اگر منابع داده مختلف، آن مفاهیم را تا حدودی متفاوت بیان کرده باشد .همچنین باعث رفع ابهام بین اعضایی می شود که توصیفات یا اسامی یکسان دارند.
مزایای استفاده از هستی شناسی :
یکی از ویژگی های اصلی هستان شناسی ها این است که با داشتن روابط اصلی بین مفاهیم می توان استنتاج خودکار درباره داده ها ایجاد کرد. پیاده سازی کردن چنین استنتاج هایی در پایگاه داده های گراف معنایی که از هستان شناسی به عنوان شماتیک معنایی خود استفاده می کنند به سهولت صورت می گیرد.علاوه بر این هستان شناسی ها مشابه یک مغز عمل می کنند.هستان شناسی ها درکی مشابه درک یک انسان از مفاهیم و ارتباطات را دارند و می توانند همانند مغز انسان استنتاج کنند.
علاوه بر ویژگی استنتاج، انتولوژی ها ،به کاربر اجازه می دهد به نحوی منسجم و ساده بتواند از یک مفهوم به مفهوم دیگری درون هستی شناسی مسیریابی کند.ویژگی ارزشمند دیگر این است که هستان شناسی ها به سادگی قابل توسعه هستند. در نتیجه هستی شناسی ها با افزایش داده ها غنی تر می شوند و رشد بهتری پیدا می کند بدون آنکه در صورت وجود خطا یا نیاز به تغییر در هستان شناسی اثر نامطلوبی بر روی فرایند یا سیستم استفاده کننده بگذارد.همچنین هستان شناسی ها بستر مناسبی را برای نمایش دادن هر نوع فرمت داده فراهم می کند نظیر داده های ساخت یافته و نیمه ساخت یافته یا کاملا ساخت یافته .همچنین امکان یکپارچه سازی و جمع آوری بهتر داده ها، امکان متن کاوی آسان تر و تحلیل های مبتنی بر داده را فراهم می کند .
محدودیت های هستی شناسی :
در حالی که هستان شناسی ها یک مجموعه از ابزارها برای مدل سازی داده ها فراهم می کنند، اما از سوی دیگر با محدودیت های نیز روبرو هستند.یکی از این محدودیت ها وضعیت ساختار ویژگی ها می باشد .برای مثال هنگامی که ساختار کلاس های پیچیده را طراحی می کنیم جدیدترین نسخه هستان شناسی یعنیOWL با برخی محدودیت ها در رابطه با ساختارهای ویژگی ها روبرو است. محدودیت بعدی در رابطه با نحوه کاربرد قیدها توسطOWL می باشد. از این قید ها استفاده میکنیم تا تعیین کنیم که داده ها چگونه باید ساختار پیدا کنند و از اضافه شدن داده های ناسازگار توسط این قیدها پیشگیری می شود. اما این موضوع همیشه سودمند نیست. غالبا داده های وارد شده از یک منبع داده جدید به ساختار های سه گانه RDF به طور ساختاری با قیدهای تعیین شده توسط OWL ناسازگار خواهند بود. در نتیجه داده های جدید باید قبل از این که با داده های موجود در پایگاه داده RDF ترکیب شوند اصلاح گردد. یک راهکار جایگزین جدید برای استفاده از هستی شناسی ها به منظور مدل سازی داده ها، استفاده از زبان مقیدSHApes یا همان SHACL برای ارزیابی گرافهای RDF در برابر مجموعهای از قیدها می باشد .یک قالب SHApes در واقع فراداده هایی را در رابطه با نوع یک منبع ایجاد می کند که اطلاعاتی شامل:
به این نحو، SHACL مشابه با OWL می تواند به منظور ارزیابی داده ها اعمال گردد.هرچند SHACL برخلاف OWL میتواند به داده هایی که قبلا درون پایگاه داده RDF موجود هستند اعمال گردد. به بیانی دیگر SHACL به داده های ناسازگار اجازه بارگذاری در پایگاه داده را می دهد.
نمونه مورد استفاده از آنتولوژی ها :
از آنجایی که هستی شناسی ها اصطلاحاتی را که برای توصیف نمایش حوزه ای از دانش مورد استفاده قرار می گیرند را تعریف می کند، در برنامه ها و کاربردهای متعددی برای ثبت ارتباطات و سرعت بخشیدن به مدیریت دانش مورد استفاده قرار می گیرد.
تطبیق هستان شناسی ها در حوزه پزشکی به منظور پیدا کردن علت بیماری ها با دسته بندی ارتباطات این علائم و بیماری های مختلف صورت می گیرد همچنین از هستان شناسی ها برای وب کاوی معنایی، پردازش اطلاعات بیماران، تشخیص کلاهبرداری و غیره استفاده می شود. به طور خلاصه از هستی شناسی ها برای بیان ساختارهایی برای نمایش دانش در یک حوزه معین به صورتی که قابلیت استفاده مجدد و اشتراک گذاری داشته باشد استفاده می شود. قابلیت آنها برای بیان ارتباطات و توانمندی بسیار بالای آن ها در بیان ارتباطات تودرتو، آنها را به عنوان یک زیربنا برای مدل سازی با کیفیت، پیوندی و منسجم داده ها مطرح می کند.
در سالهای اخیر توسعه و ساخت هستان شناسی ها( بیان مشخص و واضح ویژگی ها و مشخصات اعضا و موجودیت ها در یک حوزه و ارتباطات بین آنها) از قلمرو آزمایشگاه های هوش مصنوعی به حوزه متخصصان زمینه های مختلف وارد شده.هستی شناسی ها به یک امر رایج در در حوزه وب تبدیل شده اند. انتولوژی ها در حوزه ها و زمینه های گوناگون نظیر دسته بندی موضوعی وب سایت ها تا دسته بندی محصولات برای فروش و دسته بندی ویژگی های آن ها( مانند آنچه در سایت آمازون می باشد) به کار رفته اند.کنسرسیوم w3c چارچوب توصیف منبع یا همان rdf را که یک زبان برای بیان کردن دانش در صفحات وب می باشد ایجاد کرده است تا داده ها را برای سرورهایی که عملیات جستجوی اطلاعات را انجام می دهند قابل فهم کند.
کنسرسیوم w3c در حال ساخت زبان DAML می باشد که در واقع زبانی بر مبنای توسعه زبان RDF با ساختارهای توصیفی بیشتر است که با هدف تسهیل تعامل بین ابزار های تحت وب می باشد.سازمان ها و نهادهای مختلف آنتولوژی های استانداردسازی شده ای را تولید کرده اند که متخصصین حوزه های مربوطه میتوانند برای استفاده و به اشتراک گذاری اطلاعات در آن حوزه ها از آن ها استفاده کنند.برای مثال در حوزه پزشکی آنتولوژی و فرهنگ اصطلاحاتی نظیر SNOMED و همچنین اشبکه ای معنایی از سیستم زبانی یکپارچه پزشکی طراحی شده است.همچنین انتولوژی های چند منظوره و بزرگی نیز در حال ظهور و طراحی هستند.برای مثال سازمان توسعه برنامه ایالات متحده و شرکتهای Dun & Bradstreet با همکاری یکدیگر آنتولوژی ای تحت عنوان UNSPSC طراحی کردند که اطلاعات جامعی را در رابطه با اصطلاحات مرتبط با محصولات و خدمات آنها ارائه می کنند (www.unspsc.org).
یک آنتولوژی در واقع یک فرهنگ لغت مشترک برای محققین مهیا می کند تا بتوانند اطلاعات خود در یک حوزه واحد را برای یکدیگر به اشتراک گذاری کنند.آنتولوژی باید شامل مفاهیم پایه و ارتباطات بین انها در حوزه موردنظر باشد به نحوی که این تعاریف برای کامپیوتر قابل تفسیر و فهم باشد.
اکنون سوال این است که چرا باید یک آنتولوژی طراحی کنیم؟ بخشی از دلایل شامل موارد زیر می باشد :
اشتراک گذاری یک درک مشترک از ساختار اطلاعات در رابطه با نرم افزارها یا مردم یکی از اهداف رایج در توسعه آنتولوژی ها می باشد. برای مثال فرض کنید چند وب سایت متفاوت شامل اطلاعات پزشکی باشند یا خدمات پزشکی را ارائه دهند. اگر این وبسایت ها از یک آنتولوژی مشترک به عنوان زیربنای ساختار اصطلاحات استفاده شده بهره ببرم آنگاه کامپیوترها می توانند اطلاعات را از سایتهای مختلف به دست آورند و یکپارچه سازی کنند آنگاه کامپیوتر ها می توانند از اطلاعات به دست آمده برای پاسخگویی به درخواست های کاربر یا به عنوان داده های ورودی برای سایر برنامه ها استفاده کنند .
فراهم کردن قابلیت استفاده مجدد از دانش حوزه یکی از موضوعات مهم در تحقیقات مختلف انتولوژی ها در سال های اخیر بوده است .برای مثال مدل هایی برای حوزه های مختلف لازم است که مفهوم زمان را نمایش دهند.این نمایش شامل مفاهیم وقفه های زمانی نقاط مشخص زمانی اندازه گیری های نسبی زمان و غیره می باشد. اگر یک گروه از محققان آنتولوژی را با جزئیات طراحی کنند سایرین میتوانند به سادگی از آن برای حوزههای مدنظر خود استفاده کنند. اگر نیازمند ساختن یک آنتولوژی بزرگ باشیم می توانیم از چندین آنتولوژی کوچک که هر کدام بخشی از آن حوزه بزرگ را توضیح میدهند استفاده کرده و آنها را تجمیع و یکپارچه سازی کنیم.همچنین می توانیم از یک انتولوژی عمومی نظیر UNSPSC استفاده کنیم و آن را برای توصیف حوزه مورد نظر خود را توسعه دهیم.
با طراحی یک حوزه شامل پیش فرض های صریح چنانچه در آینده پیش فرضهای ما تغییر کند می توانیم به سادگی دانش خود را در رابطه با ان حوزه را تغییر دهیم.ثبت پیش فرض ها در فضای برنامه نویسی نه تنها باعث می شود که درک و پیدا کردن پیش فرض ها دشوار شود بلکه تغییر دادن آنها را هم سخت می کند ،به خصوص برای کسی که تجربه برنامه نویسی ندارد .علاوه بر این مشخصات صریح دانش حوزه برای کاربران جدید که لازم است بدانند چه اصطلاحاتی در آن حوزه چه معانی دارند مفید می باشد.جدا کردن دانش دامنه از دانش عملیاتی یکی دیگر از کاربرد های رایج آنتولوژی ها می باشد .ما میتوانیم یک وظیفه را به صورت پیکربندی کردن یک محصول از اجزای آن به یک مشخصات خواسته شده توصیف کنیم و یک برنامه را پیاده سازی کنیم که این پیکربندی را مستقل از محصولات و اجزای آن ها انجام می دهد.آن گاه میتوانیم یک آنتولوژی از اجزای کامپیوتر و ویژگی های آنها طراحی کنیم و یک الگوریتم را برای کامپیوترهای سفارشی (کاستومایز شده) پیکربندی کنیم.همچنین همزمان می توانیم از همان الگوریتم برای پیکربندی آسانسورها استفاده کنیم در صورتی که آنتولوژی اجزای یک آسانسور را به آن بدهیم.
تحلیل دانش دامنه زمانی امکانپذیر است که ویژگی های توصیفی اصطلاحات موجود باشد.تحلیل رسمی اصطلاحات هنگامی که تلاش برای استفاده مجدد از آنتولوژی ها و توسعه آن ها صورت میگیرد بسیار ارزشمند است.غالبا داشتن یک آنکولوژی از یک حوزه به خودی خود هدف محسوب نمی شود.توسعه یک انتولوژی به تعریف مجموعه ای از داده ها و ساختار آنها برای سایر برنامه ها به منظور استفاده کردن وابسته است .روش های حل مسئله، برنامه های مستقل از دامنه و عامل های نرم افزاری از آنتولوژی ها و پایگاه های دانش ( که از آنتولوژی ها به عنوان داده ساخته شده اند) استفاده می کنند .برای مثال در این مقاله ما یک انتولوژی از نوشیدنی و غذاها و ترکیبات متناسب نوشیدنی را توسعه میدهیم.این آنتولوژی میتواند سپس به عنوان یک پایه برای برخی برنامه ها در مجموعه از ابزارهای مدیریت رستوران مورد استفاده قرار گیرد :یک برنامه می تواند پیشنهادات نوشیدنی برای منوی روز را ارائه دهد یا به درخواست ها و سوالات پیش خدمت ها و مشتری ها پاسخ دهد.برنامه دیگر می تواند لیستی از نوشیدنی ها را تحلیل کند و پیشنهاد دهد که کدام دسته از نوشیدنی ها را افزایش دهیم و مشخصا کدام نوشیدنی ها را برای منوهای روزهای آتی خریداری کنیم .
از آنجایی که برنامه های معنایی به سرعت در حال تبدیل به موضوعات مهم در صنعت می شوند، سوالاتی غالباً در رابطه با آنتولوژی ها و گراف های معنایی پیش می آید به خصوص در رابطه با تفاوت این دو.
آیا آنتولوژی ها و گراف های دانش یکسان هستند؟ اگر نیستند تفاوتشان چیست؟ ارتباط بین این دو چیست؟
در این مطلب می خواهم به هر دو بحث بپردازم و برای شما توضیح دهم که تفاوت این دو چیست و چگونه با یکدیگر کار می کنند تا حجم زیادی از اطلاعات را سازماندهی کنند .
آنتولوژی چیست ؟
آنتولوژی ها مدلهای داده معنایی هستند که نوع اشیایی که در حوزه مورد نظر ما وجود دارند و ویژگی هایی که میتوانند برای توصیف آنها مورد استفاده قرار بگیرند را تعریف می کنند. در واقع میتوان گفت آنتولوژی ها مدلهای داده عمومی یا کلی هستند. به این معنی که آنتولوژی ها فقط به توصیف کلی یا عمومی چیزهایی که ویژگیهای معینی دارند میپردازد، اما به اطلاعات مشخص در رابطه با اعضا و موجودیتهای حاضر در آن حوزه نمی پردازد.
برای مثال به جای توصیف یک سگ و همه مشخصات آن سگ موردنظر، یک آنتولوژی باید بر روی مفاهیم عمومی سگها متمرکز شود. یعنی سعی کند ویژگی های را مطرح کند که اکثر سگ ها دارند. این کار به ما اجازه استفاده مجدد از آنتولوژی برای توصیف سایر سگ ها در آینده را می دهد.
آنتولوژی از سه بخش اصلی تشکیل شده است که به صورت زیر توصیف میشود:
برای مثال در نظر بگیرید ما اطلاعات زیر را در رابطه با کتاب ها نویسندگان و منتشر کنندگان داریم :
در ابتدا ما میخواهیم کلاس های مان را مشخص کنیم( یعنی انواع یکتا از چیزهایی که در دادههای ما وجود دارند) این داده ها اطلاعات را در رابطه با کتاب ها ارائه می دهد، بنابراین کتاب گزینه مناسبی برای کلاس می باشد. به طور مشخص داده های نمونه ما، انواع مشخصی از چیزها در رابطه با کتاب در بردارند، نظیر نویسندگان و انتشارات. اگر کمی دقیق تر شویم متوجه می شویم که این داده ها همچنین اطلاعاتی را در رابطه با انتشارات و نویسندگان نیز دارد، نظیر موقعیت مکانی آنها بنابراین در نهایت با چهار کلاس زیر طرف هستیم:
در مرحله بعدی لازم است که ارتباطات و مشخصه های ویژگی ها را تعیین کنیم( برای سادگی ما ارتباطات و مشخصه ها را به عنوان ویژگی در نظر می گیریم). با استفاده از کلاس هایی که ما قبلا مطرح کردیم می توانیم به داده ها نگاه کنیم و ویژگی هایی را که برای هر کلاس می بینیم لیست کنیم. برای مثال با نگاه به کلاس کتاب ویژگی هایی مانند موارد زیر مطرح میشود:
برخی از این ویژگی ها ارتباطی هستند که دو کلاس را به همدیگر متصل می کنند. برای مثال ویژگی “کتاب ها نویسندگانی دارند”، ارتباطی است که کتاب را به نویسنده متصل میکند و سایر ویژگی ها نظیر “متصل می کنند.. لازم است که مد نظر داشته باشید که این ویژگی ها می تواند به هر کلاسی نسبت داده شود اما الزاماً قرار نیست که به هر کتابی نسبت داده شود. برای مثال خیلی از کتاب ها به سایر کتابها ارجاع نداده اند. ما هیچ مشکلی نداریم و این امری طبیعی است، چرا که ما فقط می خواهم اطمینان حاصل کنیم که ویژگی های ممکن که ممکن است به بسیاری از کتاب ها و الزاما نه همه آنها اعمال شود را در آنتولوژی مطرح کرده ایم.
همچنان که ویژگی های بالا به راحتی قابل درک و خواندن می باشد می توانیم آنها را به شیوه شهودی تری که کلاس ها و ویژگی ها از هم مجزا باشند نمایش دهیم. برای مثال “کتابها نویسندگانی دارند” می تواند به صورت زیر نوشته شود
Book → has author → Author
اگر چه خیلی ویژگی های دیگری هم هستند که میتوانید در انتولوژی لحاظ کنید که البته این موضوع به نیاز مندی های شما و مورد کاربردی شما بستگی دارد. در این آموزش صرفاً به بیان ویژگیهای زیر بسنده می کنم:
به خاطر داشته باشید که آنتولوژی ما یک مدل داده کلی می باشد به این معنی که ما قصد نداریم اطلاعاتی را در رابطه با کتاب های مشخصی در آن توجه خود قرار دهیم، به جای آن میخواهیم یک چارچوب با قابلیت استفاده مجدد ایجاد کنیم که از آن بتوانیم برای توصیف سایر کتاب ها در آینده نیز استفاده کنیم وقتی ما کلاس ها و ارتباط آن را با یکدیگر ترکیب می کنیم .می توانیم آنتولوژی را به شکل یک گراف مانند تصویر زیر تصور کنیم:
گراف دانش چیست ؟
با در نظر گرفتن استفاده از آنتولوژی به عنوان یک چارچوب می توانیم داده های واقعی را در رابطه با کتاب های مشخص، نویسندگان، انتشارات و موقعیت مکانی آنها ایجاد کنیم تا یک گراف دانش را تولید کنیم.
با توجه به اطلاعاتی که در جدول بالا داشتیم همچنین با در نظر گرفتن آنتولوژی می توانیم نمونه های مشخصی از هر کدام از ارتباطات هستی شناسانه خود را ایجاد کنیم. برای مثال ما ارتباطی به صورت
Book → hasauthor → Author
در آنتولوژی خود داریم یک نمونه از این ارتباط به صورت شکل زیر می باشد :
اگر ما همه اطلاعات موردی را در رابطه با یکی از کتابهای داریم ایجاد کنیم گراف دانشی مشابه تصویر زیر خواهیم داشت:
گر این کار را با تمام داده های خود انجام دهیم در نهایت با گرافی روبرو می شویم که تمام داده های آن بر مبنای آنتولوژی شکل گرفته است. با استفاده از این گراف دانش میتوانیم داده های خود را به صورت شبکه ای از ارتباطات ببینیم به جای آن که آنها را به صورت جداول جداگانه داشته باشیم. با استفاده از زبانSPARQL می توانیم از این داده هاquery بگیریم و با استفاده از استنتاج، گراف دانش ما تباطاتی را برای ما ایجاد میکند که قبلاً تعریف نشده بودند.
بنابراین تفاوت آنتولوژی با گراف دانش چیست ؟
همانطور که در مثال بالا ملاحظه کردید یک گراف دانش هنگامی ایجاد می شود که شما یک آنتولوژی ( همان دیتا مدل ما) را به یک دیتاست از داده های معین (داده های مربوط به کتاب، نویسنده و انتشارات) اعمال کنید. به بیان دیگر می توان گفت :
ontology + data = knowledge graph
برای کسانی که علاقه مند هستند به تحولاتی که در حوزه وب صورت گرفته است و همچنین مشخصا برای کسانی که علاقه مند به حوزه وب معنای می باشند آنتولوژی ها موضوع جذابی است. اما هرچند آنتولوژی ها موضوع مهمی در زمان کنونی است، سوالاتی در این رابطه وجود دارد که آنتولوژی ها چه هستند و نقش آنها در حوزه وب معنایی چیست .انتولوژی ها عمدتاً برای اهداف دسته بندی ساختارهای سلسله مراتبی، طراحی فرهنگ لغات، اصطلاحشناسی ها و دیکشنری ها مورد استفاده قرار می گیرد.کلمه آنتولوژی در واقع شاخهای از فلسفه می باشد که در رابطه با ماهیت موجودات و ساختار جهان صحبت می کند. اما تعریف بهتری هم برای درک عملکرد آنتولوژی ها در حوزه وب معنای وجود دارد. در واقع می توان گفت آنتولوژی دسته بندی کردن موجودیت هایی که وجود دارند یا ممکن است وجود داشته باشند و بیان ارتباطات بین آنها در یک حوزه یا دامنه مشخص است.
واژه آنتولوژی غالباً برای بیان درک معنایی، یعنی بیان چارچوب مفهومی دانش بین اعضایی که در یک حوزه مشخص وجود دارند به کار می رود .در حوزه وب معنایی آنتولوژی ساختاری است که معانی و مفاهیم آن حوزه را مشخص می کند. یعنی یک چارچوب مفهومی به زبانی که برای ماشین قابل فهم باشد.
رایج ترین تعریف برای آنتولوژی تعریفی است که Tom Gruber ارائه کرده است. او آنتولوژی ها را به عنوان “ساختاری برای بیان ویژگی های دقیق و مشخص از یک مفهوم ” تعریف کرده است .این تعریف کوتاه و زیباست اما تعریفی ناقص است چرا که از بیرون حوزه به ان نگاه شده است .در واقع می توان انتولوژی ها را به صورت یک ساختار مفهوم سازی شده ساده از جهان موجود نامید که به صورت رسمی و قابل درک برای ماشین و کامپیوتر ایجاد شده است.
چرا به آنتولوژی نیاز داریم ؟
به دلیل آنکه در حال حاضر وب به نحوی طراحی شده است که به مردم یا همان انسان ها سرویس دهی کند ، بنابراین تگ های متا دیتا برای سیستم های کامپیوتری نامفهوم است است. در حال حاضر زبان xml به سرعت در حال رشد است تا جای زبان html را به عنوان زبان وب بگیرد. اما زبان xml اساساً با ساختار فیزیکی صفحات وب سر و کار دارد و اسامی تگ های XML برای ماشین ها و کامپیوتر ها قابل درک نیست. اگر هدف وب معنایی را فراهم کردن بستر و شرایطی برای ایجاد درک ماشینی از از صفحات بدانیم، بنابراین این کامپیوتر ها باید بتوانند معانی منبع یا صفحه را یا موجودیت را درک کنند. بنابراین صرفاً نشان دادن محتویات صفحات وب کافی نیست، بلکه نیاز به عملیات استنتاج و کشف دانش از محتویات صفحات وب را داریم.
در فضای وب معنایی انتولوژی را میتوان مفهوم سازی از یک حوزه دانش دانست که توسط مجموعه ای از کاربران ایجاد شده است است و به نحوی با یک دیگر تعامل دارند و برای درک توسط کامپیوتر ها طراحی شده است. آنتولوژی مفاهیم معنایی و دقیقی در رابطه با منابع ارائه می دهد .انتولوژی میتواند مفاهیم حوزه های مرتبط را نیز مشخص کند، همچنین ویژگی ها، محدوده مقادیر یا مجموعه مشخص از موارد مرتبط با ویژگی ها را و همین طور ارتباطات ممکن که می توان بین مفاهیم برقرار کرد را تعیین می کند. به دلیل آنکه یک آنتولوژی مفاهیم مرتبط را تعریف می کند و این یعنی بیان موجودیت ها و ویژگی های آنها و ارتباطات معنایی که بین این مفاهیم به دست می آید، بنابراین آنتولوژی امکان پردازش کردن منابع را مبتنی بر تفسیری معنادار از محتویات، به جای صرفا نمایش یا بیان ساختار فیزیکی منابع امکان پذیر می سازد.
نمونه ای از یک آنتولوژی :
آنتولوژی ها در حوزه وب مفهوم جدیدی نیست در واقع می توان گفت هر متادیتایی در واقع یک آنتولوژی هست که یک ویژگی مفهومی از منابعی که در حوزه مشخصی تعریف شده است را بیان می کند. بنابراین برای مثال مجموعه عناصری که در یک حوزه مشخص انتخاب و تعریف شده اند ، خودشان در واقع یک آنتولوژی هستند.
نقش RDF/RDFS :
اگرچه ساختار سلسله مراتبی به عنوان یک ویژگی مشخص و منحصر به فرد در آنتولوژی ها محسوب نمی شود اما این قابلیت به عنوان موضوع اصلی در ساختارهای RDF و RDFS به حساب می آید .این دو زبان توسط بنیاد W3C به وجود آمدند تا به عنوان یک ابزار کلی برای نمایش دانش مورد استفاده قرار گیرد، که در واقع روشی است برای توصیف موجودیت ها یا تعریف یک آنتولوژی یا متادیتا .RDF/RDFS در رابطه با محتوا هیچ پیش فرضی ندارد همچنین مفاهیم و معانی هیچ حوزه به خصوصی را مد نظر قرار نمی دهد و به مقادیر هیچ مجموعه از پیش تعیین شده ای وابسته نیست.
اگرچه استفاده مجدد عناصر یا موجودیت ها در یک آنتولوژی یا ساختار متادیتا را پشتیبانی می کند. RDF یک مدل را تعریف میکند یعنی مجموعه ای از عناصر برای توصیف منابع با استفاده از ویژگی های معین و مقادیری که به انها تعلق می گیرد. از این مهمتر اینکه این زبان ساختاری به وجود می آورد که این امکان را می دهد تا بتوانیم یک شماتیک یا ساختار معینی را از یک حوزه به خصوص ایجاد کنیم. از این زبان می توان برای کد کردن اطلاعات به نحوی که برای کامپیوترها قابل درک باشد استفاده کنیم تا بتوانیم داده ها را بین برنامه های مختلف تبادل کنیم تا امکان پردازش اطلاعات معنایی فراهم شود .
RDFS به منظور توسعه RDF ایجاد شده است که یک زبان توصیفی و قابل پردازش برای ماشین می باشد. از این زبان می توانیم استفاده کنیم برای توصیف رسمی یک آنتولوژی یا ساختار متادیتا، به عنوان مجموعه ای از کلاس ها و ویژگی های آنها، تا مفاهیم بین کلاس ها و ویژگی ها را تعیین کنیم و همچنین ارتباطات بین کلاس ها را مشخص کنیم. همچنین ارتباطات بین ویژگی ها و بین کلاسها و همچنین امکان اعمال قید بر روی ویژگی ها را به ما می دهد. RDF و RDFS با همدیگر یک مدل معنایی قابل فهم توسط ماشین ایجاد می کند که امکان هماهنگی، ایجاد ارتباط بین ساختارهای ناهمگن در حوزههای مختلف را به وجود می آورد.
تعریف RDFS :
برای اینکه به طور واضح تر ساختار و عملیات آنتولوژی ها را درک کنید بهتر است که نگاه دقیق تری به ساختار RDFS داشته باشیم .درحالی که یک ساختار XML قیدهای معین بر روی ساختار یک سند XML تعیین می کند، می توان گفت یک ساختار RDFS در واقع اطلاعات ضروری را برای یک سیستم کامپیوتری فراهم میکند تا بتوانند عبارات بیان شده به زبان کلاس ها، ویژگی ها و مقادیر تعبیه شده در ساختار را درک کند. یکی از مکانیسم های مهم در RDFS ایجاد یک ساختار استنتاج معنایی می باشد که در واقع منجر به یک وب متشکل از دانش می گردد که در مقایسه با ساختار های قدیمی می تواند نسبت موجودیت ها در مقایسه با یکدیگر و ارتباطات بین آنها را درک کند.
ساخت ارتباطات از طریق ساختارهای تو در تو قابلیت مهمی است، به این صورت که یک زیر کلاس یا زیر ویژگی، تعاریف ویژگی ها و قیدهای والد خود را به ارث می برد .باید گفت یک آنتولوژی RDFS از یک ساختار با قابلیت صرفاً دسته بندی متفاوت است.هر عنصر در آن نوعی کلاس یا ویژگی است. علاوه بر این ارتباطات بین ویژگی ها یا کلاس ها چند سلسله مراتبی(polyhierarchical) است.بنابراین برای مثال می توان گفت یک کلاس می تواند زیر کلاس یک دو سه یا تعداد بیشتری از سوپر کلاس باشد.یک سیستم دسته بندی یا کلاس بندی سنتی از حداقل ویژگی ها استفاده می کند و یک ساختار سلسله مراتبی ایجاد می کند. در مقابل آنتولوژی RDFS به نحوی موجودیت ها و عناصر را ایجاد میکند که آنها توسط مفاهیم و ویژگیها شناخته شوند و برخلاف یک دسته بندی سنتی انتولوژی ها میتوانند از مجموعهای از قواعد استنتاج استفاده کنند که به سیستم کامپیوتری امکان استنتاج در رابطه با دانش ارائه شده را می دهد تا بتواند ارتباطات بین موجودیت ها را کشف کرده و به دانش جدیدی دسترسی پیدا کند.
در یک آنتولوژی RDFS ارتباطات بین کلاس ها و ویژگی ها با تعیین کردن دامنه یک ویژگی تعیین می شود که این کار با مقید کردن کلاس یا مجموعهای از کلاس ها که ویژگی با آنها اعمال می شود صورت می گیرد .همچنین میتوان مجموعه یا کلاس هایی را به عنوان RANGE انتخاب کرد که مقادیر ویژگی ها باید از درون آنها انتخاب شود .بنابراین RANGE معین میکند که مقادیر ویژگی نمونهای است از یک کلاس یا موجودیت مشخص باشد
آنتولوژی را نمیتوان صرفاً یک دسته بندی و یک دیکشنری از لغات دانست در واقع آنتولوژی روش های دسته بندی سنتی را توسعه داده است و از قابلیت های ساختارهای سلسله مراتبی و ساختار واژگان کنترل شده تشکیل شده است. ساختار معنایی، زیربنایی را برای شماتیک های متادیتا فراهم می کند و امکان برقراری ارتباط بین سیستم های مختلف را ایجاد می کند که این کار با استفاده از تعریف یک مدل مفهومی استاندارد برای یک مجموعه از کاربران ایجاد می شود. بنابراین می توان گفت آنتولوژی ها یک ساختار زیربنایی مفهومی ایجاد می کنند که بدون آن دستیابی به هدف وب معنایی غیر ممکن خواهد بود.
مسیرهای پیش رو در آینده :
هنوز کارهای زیادی باید صورت بگیرد تا قابلیت و اثرگذاری انتولوژی های کنونی توسعه پیدا کند. در حالی که تلاش هایی برای بهینه کردن مدل های RDF/RDFS در حال انجام است از سوی دیگر ساختارهای نظیر DAML+OIL و OWL در حال توسعه هستند تا بر روی چهارچوب و بنایی که توسط RDF و RDFS پایه گذاری شده است خود را توسعه دهند.
وظیفه آنتولوژی فراهم آوردن محتوای معنایی می باشد. شناسایی موجودیت ها در متن ساخت نیافته تمام کاری که باید انجام دهیم نیست .مدلهای آنتولوژی با نمایش این که چگونه موجودیت ها به سایر موجودیت ها (چه در همان متن و چه در یک حوزه کلی ) مرتبط می شوند ساختار را تکمیل می کنند.
همانطور که در تصویر بالا مشاهده می کنید این عبارت علامت گذاری شده است و کمان هایی به رنگ قرمز در تصویر مشخص می باشد. ما فقط دو کلمه را در این متن علامت گذاری کرده ایم. ویلیام شکسپیر به عنوان یک نمایشنامه نویس و هملت به عنوان یک نمایش نامه.اما به عمق دانشی که در این متن داریم توجه کنید.در این تصویر ما یک مدل را رسم کرده ایم .طبق تصویر مشخص است که ۶ عدد علامت گذاری توسط کمان ها صورت گرفته است .این علامت گذاری ها توسط موتورNLP صورت گرفته است و مدل سازی شده است.این مدل سازی درون یک آنتولوژی انجام شده است. در واقع ما توسط هستان شناسی میفهمیم که چگونه یک کتاب(Book) با یک تاریخ(Date) یا یک زبان (Language) و همچنین یک زبان با یک کشور(Country) و آن هم با یک نویسنده(Author) و غیره مرتبط است .هر کدام از علامت گذاری ها توسط یک دیکشنری پشتیبانی می شود داده های این دیکشنری در خارج از حیطه آنتولوژی مربوطه ساخته شده است.آنتولوژی فقط ارتباطات بین علامت گذاری ها با یکدیگر را نمایش می دهد .علامت گذاری ویلیام شکسپیر به عنوان یک نویسنده یک ساختار سه تایی ضمنی محسوب می شود:
ویلیام شکسپیر یک نویسنده است.
گذار به داده های ساخت یافته (استخراج سه تایی ها) :
هم اکنون ما در ابتدای مرحله انتقال از حالت ساخت نیافته به قلمرو دادههای ساختیافته می باشیم اگر بدانیم که ویلیام شکسپیر یک نویسنده است همچنین می دانیم که هر نویسنده در کشوری زندگی می کند و همچنین نویسنده ها کتاب هایی را می نویسند که در تاریخ های مشخصی منتشر می شود و به زبان مشخصی هم نوشته شده است و غیره.
یک زنجیره معنایی کامل از اطلاعات داریم که میتوانند از این عبارت استخراج شود و نکته اصلی همین جاست .علاوه بر این هستی شناسی به ما کمک میکند تا بفهمیم چه داده هایی را نداریم .اگر موتور NLP بتواند نویسنده و عنوان را تشخیص دهد چه چیزی را تشخیص نداده است؟
به نظر می رسد که همه کتاب ها در در یک تاریخ معینی انتشار می یابند بنابراین به دنبال این تاریخ بگردیم همچنین به نظر می رسد که در موضوع نوشتن کتاب یک زبان هم مطرح است بنابراین میتوانیم آن را هم بیابیم .به طور خلاصه آنتولوژی ارتباطاتی را که بین موجودیت ها یا علامت گذاری ها وجود دارد را به ما میدهد .آنتولوژی به ما کمک میکند که هر علامت گذاری را در یک حوزه وسیع تر ( حوزه زنجیره معنایی و شبکه معنایی) داشته باشیم. همچنین کمک می کند تا بدانیم چه اطلاعاتی را نداریم و باید دنبال کدام اطلاعات در متن بگردیم.
وب معنایی در واقع نسخه توسعه یافته ای از وب کنونی محسوب می شود ، که می تواند از داده هایی که برای کامپیوتر قابل درک و تفسیر می باشد،کاربردها و قابلیت های خاصی را ارائه دهد. به بیان دیگر ما یک سری داده های اضافی به محتوا یا داده های موجود در وب سایت ها اضافه می کنیم.در نتیجه کامپیوتر ها می توانند از این داده های اضافی استفاده کنند و معانی دقیق تری را از جملات استنباط کنند. مثل حالتی که ما انسان ها از اطلاعات مختلف استفاده میکنیم تا موضوعی را درک کنیم.به مثال زیر دقت کنید:
<code>
<div vocab="http://schema.org/" typeof="Person">
<span property="name">Paul Schuster</span> was born in
<span property="birthPlace" typeof="Place" href="http://www.wikidata.org/entity/Q1731"
<span property="name">Dresden</span>
</span>
</div>
</code>
به کلمات property=name
و property=birthPlace
توجه کنید . یک سیستم کامپیوتری از این مشخصه ها می فهمد کهPaul Schuster نام فرد است و Dresden محل تولد اوست.
هدف نهایی وب معنایی درک بهتر اطلاعات توسط کامپیوتر ها می باشد.کلمه “معنایی” یا“semantic” اشاره به داده هایی دارد که یک کامپیوتر توان پردازش و درک آن را دارد، و کلمه “وب” یا “web” اشاره به یک فضایی دارد که منابع(وب سایت) مختلف از طریق آدرس ها یا همان URI به هم متصل شده اند.
آینده پیش روی وب معنایی :
سه موضوع یا هدف به عنوان مساعل اصلی در حوزه وب معنایی مطرح بوده است :
بازیابی خودکار اطلاعات
به مرور زمان این موضوعات تبدیل به دو عنوان جدید شد :
داده های باز پیوندی : مسیری به سوی ساختارهای پیچیده داده ها :
برای آن که وب معنایی کاربرد داشته باشد،کامپیوتر ها باید به مجموعه های ساخت یافته اطلاعات و همچنین مجموعه های قوانین استنتاجی که می تواند نتایج استنتاج شده خودکار را فراهم کند دسترسی داشته باشند.
داده های باز پیوندی در واقع داده های ساخت یافته هستند که به صورت یک گراف مدل سازی شده اند به نحوی که امکان برقراری ارتباطات داخلی بین سرور های مختلف را فراهم می آورند.
4 قانون داده های باز پیوندی عبارت اند از :
از URI به عنوان نام اشیا استفاده شود
داده های باز پیوندی شامل موارد زیر می گردد :
داده های بدیهی در رابطه با موجودیت ها و مفاهیم مشخص (مثلاً در رابطه با تئوری گرم شدن اب و هوای جهان )
پیچیدگی و تنوع دانش و اصطلاحات پزشکی یکی از معضلات مطالعات حوزه های تحقیقاتی و دانشگاهی می باشد. پیدا کردن و انتخاب داده های ارزشمند اغلب به خاطر فرمت های گوناگون و معانی متعددی که دارند دشوار است . در این مقاله می خواهیم بگوییم که آنتولوژی ها و تکنولوژی های وب معنایی نظیرOWL,RDF و SPARQL میتوانند ساختارهای ضروری برای حوزه ههای مختلف پزشکی را فراهم کند و همچنین به عنوان ابزاری برای ارائه راهکارهایی برای معضلات پیش رو به کار رود ..
یکی از مسائل مهم در در زمینه سلامت، اطمینان از تعامل بین سیستم های سلامت و مراقبت می باشد .آنتولوژی یا همان هستی شناسی قابلیت تعامل در سیستمهای مبتنی بر سلامت را بهبود می بخشد. در این حوزه ها تعامل بین سیستم ها نسبت به سایر حوزه ها مانند حوزه اقتصاد با دشواری بیشتری روبرو است و به همین دلیل استفاده از هستان شناسی گزینه بهتر می باشد.هستان شناسی کمک می کند سیستم های اطلاعات قوی تر و با تعامل پذیری بیشتری ساخته شود .اینگونه سیستم ها می توانند نیازمندی های مختلف نظیر پردازش های مبتنی بر سلامت برای استفاده مجدد ،انتقال و اشتراک دادههای شخصی بیماران و موارد متعدد دیگری را پشتیبانی کنند.استفاده از این تکنولوژی در پزشکی غالبا بر روی نمایش و سازماندهی و همچنین سازماندهی مجدد اصطلاحات علمی پزشکی متمرکز شده است .در واقع در حال حاضر هستان شناسی یک بخش اصلی و اساسی برای ارائه هرگونه راهکار مرتبط با اصطلاحات علمی پزشکی می باشد .
این مقاله قصد دارد به بررسی نقش هستان شناسی و شبکه های معنایی در حوزه پزشکی بپردازد.به نقش تکنولوژی اطلاعات در این حوزه و خصوصیات و ویژگی هایی که برای راهکارهای مبتنی بر تکنولوژی مورد نیاز است می پردازیم.به طور مشخص در این مطالعه اطلاعات پزشکی تعدادی بیمار مورد بررسی قرار گرفته است.هستان شناسی که اینجا مطرح شده است تنها بخش کوچکی از آن چیزی است که می تواند برای داده های پزشکی صورت پذیرد.
مشخصه های وب معنایی :
در حال حاضر وب به بخش جدایی ناپذیر از زندگی ما تبدیل شده است و حجم اطلاعات آنلاین به طور مداوم رو به رشد می باشد. علاوه بر متن ساده که وب را پر کرده است سایر اطلاعات نظیر تصاویر و ویدیو بخش رایج در این حوزه شده اند.اینجا سوال این است که چگونه در میان این حجم عظیم است اطلاعات،بتوانیم اطلاعات مفید و مورد نظر خود را پیدا کنیم؟این به این معنی است که چیزی که مورد نیاز مان هست را بدون جستجوی زیاد پیدا کنیم در حالی که اطلاعات بی شماری در رابطه با موضوع مورد نظر وجود دارد.موتور های جستجوی سنتی هنگامی که قرار است مفاهیم متون را درک کنند با مشکل و محدودیت روبرو می شوند. اینجاست که وب معنایی به کمک ما می آید. “تیم برنرزلی” دو هدف برای وب که باید تامین شود را تعریف کرده است :
اولین هدف امکان دادن به مردم برای کار کردن و تعامل با همدیگر به وسیله فراهم کردن شرایطی به منظور اشتراک دانش بین آنها است
هدف دوم فراهم کردن ابزار هایی که بتواند به مردم برای تحلیل و مدیریت کردن اطلاعاتی که به اشتراک می گذارند به نحوی معنی دار کمک کند.
این رویکرد به عنوان وب معنایی شناخته شد(SW). پس در ابتدا اصطلاح وب معنایی توسط “تیم برنرزلی” مطرح شد که البته از مطالعات فراوانی که در این حوزه صورت پذیرفت الهام گرفته است . از زمان مطرح شدن این موضوع، توسعه تکنولوژی های وب معنایی به شکل فزایندهای در حوزه مرتبط با وب (WWW) مطرح شد. ,وب معنایی در واقع یک نسخه توسعه یافته از وب سنتی می باشد، به این معنی که اطلاعاتی که در متون معمولی وجود دارد توسط معانی مبتنی بر ساختارهای دانش تکمیل می شود .وب معنایی همچنین به عنوان یک بسط یا توسعه از وب(WWW) می باشد که به کامپیوترها اجازه جستجو، ترکیب کردن و پردازش هوشمندانه محتوا به را مبتنی بر مفهوم و درکی که انسان ها از این متون دارند ارائه می دهد.در غیاب هوش مصنوعی در سطح درک انسان، این نتیجه فقط در صورتی به دست می آید که منابع به طور واضح به فرمی که برای کامپیوتر ها قابل پردازش باشد تعریف شده باشد.
در واقع برای رسیدن به این نتیجه صرفاً ذخیره کردن داده ها در یک ساختار قابل خواندن برای ماشین کافی نیست بلکه لازم است که این داده ها با معانی و مفاهیمی که به طور واضح نتایجی که باید از اطلاعات در دسترس به دست آید را ارائه دهد .غالباً برای مردم پذیرش اعتبار و صحت محتوای یک سند دشوار است و به همین نسبت، فرموله کردن آن سند برای آن که برای کامپیوتر قابل درک باشد به مراتب دشوارتر است.بنابراین این یک تلاش غیر ممکن است.هدف وب معنایی توانمند کردن ماشین هاست تا نسبت به گذشته که به زمان و توجه انسان ها نیاز بوده است، اطلاعات بیشتری داشته باشند.به عنوان یک نتیجه گیری معانی و مفاهیم وب مربوط به بسط و توسعه مشخصی از www نمی شود بلکه به عنوان یک هدف ایده آل در رابطه با رشد روز افزون فضای شبکه مطرح است .ضمنا هر پیشرفتی در این حوزه می تواند همچنین نیز در کاربردهایی که الزاما مربوط به وب نیست، نیز مفید باشد.
دورنمای وب معنایی شامل اضافه کردن یک ساختار، به صورتی که منابع به صورت ساده تری توسط نرم افزار ها و کامپیوتر ها قابل درک و فهم باشد می باشد.همانطور که قبلا اشاره شد وب معنایی یک دور نما از آینده وب می باشد که اطلاعات، معانی واضحی دارند و در نتیجه پردازش آنها برای ماشین ها ساده تر می شود و امکان تجمیع و ترکیب اطلاعات در فضای وب به صورت خودکار فراهم می شود.در واقع برای درک بهتر وب معنایی ،معماری طراحی شده توسط “تیم برنرزلی”، که “پشته وب معنایی” یا “کیک لایه وب معنایی” نامیده می شود،مفید به نظر می رسد.
چرا معناشناسی برای ما مهم است :
زبان طبیعی شگفت انگیز است، پیدا کردن یک واسط بهتر از این، دور از تصور است.بدون تلاش زیاد ،می توانیم از یک خارجی مکانی را که به دنبال آن هستیم سوال کنیم،می توانیم دانش خود در رابطه با موضوعات مختلف را در جمع دوستان مطرح کرده و به اشتراک بگذار یم،می توانیم به یک کتابخانه برویم یک کتاب را برداریم و از نویسنده ای که صدها سال قبل از ما می زیسته است بیاموزیم.معنی شناسی فرآیند برقراری ارتباط معنادار به منظور رسیدن به نتیجه برای انجام یک کار می باشد.مجموعه ای از نمادها میتواند برای رساندن مفهوم مورد استفاده قرار گیرد و این ارتباط می تواند بر نحوه رفتار تاثیر بگذارد.
برای مثال هنگامی که این اسناد را می خوانیم کاری که انجام می دهیم این است که نظراتی که در این عبارات بیان شده است را با هر آنچه که از قبل می دانستیم یکپارچه سازی می کنیم.اگر مفاهیم نوشته شده در مقاله واضح باشد به خواننده کمک میکند تا ایدهای و تصوری در رابطه با آنتولوژی و معناشناسی وب پیدا کند تا به عنوان نقطه شروعی برای سایر هدف ها و فعالیت ها به کار رود.اگر به هدف معناشناسی نرسیم، خواننده اطلاعات مفید زیادی از این مطالعه به دست نمی آورد.بنابراین معناشناسی موضوع بسیار مهمی است و موضوع محوری در رابطه با هرکاری می باشد. اساس تکنولوژی های وب معنایی ساختارهای داده ه ای هستند که میتوانند برای کد کردن دانش به منظور پردازش کامپیوتری مورد استفاده قرار گیر، .اگر چه تمرکز بر روی شکل های مختلف دانش می باشد .
اکنون سه موضوع کلیدی که ساختار مفهومی برای وب معنایی فراهم می کند را به اختصار بیان می کنیم:
ساخت مدل، یعنی تلاش برای تشریح یا توصیف جهان به نحوی انتزاعی، تا امکان درک آسان تر یک موضوع واقعیت پیچیده را امکان پذیر سازد.
محاسبات مبتنی بر دانش، تلاش برای ساختن ماشین ها و کامپیوترهای استنتاجی که می توانند نتایج با معنی از دانش نامفهوم به دست آورند.
تبادل اطلاعات، ارسال منبع پیچیده اطلاعات بین کامپیوتر ها و فراهم کردن این امکان که بتوانیم دانش را در یک مقیاس جهانی انتشار و پیونددهی کنیم.
محدوده وب معنایی :
تکنولوژی های وب معنایی و معناشناسی راه جدیدی را برای مدیریت اطلاعات و پردازش آنها که قاعده اصلی تولید و استفاده از فراداده های معنایی می باشد، پیش روی پای ما می گذارد.قرار دادن مجموعه ای از داده ها می باشد که اطلاعاتی را در رابطه با سایر داده ها ارائه می کند. فراداده در دو سطح وجود دارد.
از یک سو فراداده ها می توانند یک سند را تشریح کنند، برای مثال یک وبسایت، یا بخشی از یک سند مثلاً یک پاراگراف. از سوی دیگر فراداده ها می توانند موضوعاتی یا چیزهایی را در یک سند تشریح کنند، برای مثال یک شخص،کشور یا شرکت.در هر دو مورد مسئله مهم این است که فرا داده موجودیتی معنا دار است.بنابراین می تواند در رابطه با محتوای یک سند و پیوند آن با سایر اسناد یا حتی در رابطه با یک موجودیت درون آن سند مطالبی را به ما بگوید.این مساله با چیزی که در حال حاضر در رابطه با وب سایت ها به کار میرود در تضاد است، چرا که در ساختار وب سایت ها از فراداه ها صرفا برای چگونگی نمایش داده ها استفاده می شودبرای مثال با استفاده از HTML از فراداده استفاده میکنیم تا بگوییم که مثلا یک عبارت باید به صورت برجسته با رنگ قرمز نمایش داده شود اما نمیتوانیم بگوییم که آن عبارت در واقع معرف قیمت آن محصول یا نام آن و سایر می باشد .
برخی خدمات و کاربردهای دیگری هستند که فرا داده می تواند از عهده آن برآید.در ابتدا با توجه به معنای اطلاعات می توانیم نه تنها متن که اطلاعات را دسته بندی و پیدا کنیم.سیستم ها با استفاده از معناشناسی می تواند تعیین کنند در چه موقعیت هایی کلمات و عبارت با یکدیگر معادل هستند.هنگامی که ما به جستجوی “George W Bush” می پردازیم، می توانیم سندی به دست آوریم که ما را ارجاع می دهد به سندی در رابطه با رئیس جمهوری ایالات متحده . به طور معکوس سیستم ها تشخیص متفاوتی می دهند در زمانی که همین کلمه با معانی متفاوتی استفاده می شود.اگر به دنبال مراجعی برای کلمه “پلنگ خال دار” در متن یا محتوای صنعت موتور جستجو کنیم،سیستم ممکن است ارجاعاتی که به گربه های بزرگ یا سیستم های عملیاتی با این نوع اسم وجود دارد را از نتایج خود حذف کند و در نظر نگیرد.روشی که اطلاعات نمایش داده می شود می تواند با استفاده از معناشناسی بهبود یابد.به جای یک جستجو که یک لیست خطی از نتایج را برمی گرداند، نتایج می تواند بر مبنای معانی جمع آوری شود. بنابراین یک جستجو برای پلنگ خالدار می تواند اسنادی را برگرداند که مربوط به نوعی ماشین، گربه های بزرگ، سیستم های عملیاتی و سایر موارد باشد که همگی آنها را به صورت یک جا بر می گرداند. اگر چه ما می توانیم با استفاده از روش معنی شناسی جلوتر رویم، که این کار به صورت ترکیب اطلاعات از همه اسناد مرتبط،حذف موارد زائد و جمع آوری داده های متناسب صورت گیرد.
ارتباط بین موجودیت های اصلی در اسناد می تواند به صورت گرافیکی نمایش داده شود.تمامی این کارها به این خاطر است که بتوانیم از دانش موجود، دانش جدیدی را ایجاد کنیم.کاربرد فراداده معنایی برای یکسان سازی اطلاعات از منابع ناهمگن که درون یک سازمان یا بین سازمان های متفاوت وجود دارد ضروری است. شماتیک های متعددی برای توصیف و دسته بندی کردن اطلاعات استفاده می شود، و همچنین اصلاح علمی متعددی به همراه اطلاعات استفاده می شود. با ایجاد شماهای مختلف، امکان ایجاد یک نمای یکسان،و برقراری تعامل بین پردازش هایی که از اطلاعات استفاده می کنند فراهم می شود. توصیفات معناشناسی همچنین میتواند به فرایند هایی که در سرویس ها و خدمات وب وجود دارد اعمال گردد. زمانی که عملیات یک سرویس اینترنتی به صورت معنایی توصیف شود، وب سرویس مربوطه بسیار ساده تر پیدا خواهد شد.هنگامی که سرویسهای موجود توسط فراداد هایی که عملیات و محتوای آن ها را توصیف می کنند فراهم شده باشند، آن گاه سرویس های جدید می توانند به صورت خودکار از ترکیب سرویس های موجود ایجاد شوند.
هستان شناسی :
تکنولوژی معنا شناسی پتانسیل فراهم کردن راهکارهایی برای بسیاری از محدودیت ها را دارد، نظیر فراهم کردن دسترسی پیشرفته به دانش با اتکا به فراداده های پردازش شده توسط کامپیوتر ها.با استفاده از معناشناسی می توانیم روش یا نحوه ای که اطلاعات نمایش داده می شوند را بهبود بخشیم. اساساً در همه برنامه های مبتنی بر وب معناشناسی، صحبت در مورد چگونگی استفاده از آنتولوژی می باشد.هستی شناسی ها اشتراک گذاری و استفاده مجدد از دانش رابین مصرف کننده های مختلف تسهیل می کنند، این مصرف کننده می تواند انسان یا کامپیوتر باشد.کلمه هستی شناسی در واقع علم شناخت موجودیت ها می باشد.در علوم کامپیوتر هستی شناسی نمایش رسمی دانش از مفاهیم متنوع درون یک حوزه و روابط بین این مفاهیم می باشد.فراگیرترین تعریف مربوط به Gruber می باشد.Gruber هستی شناسی را به عنوان “ذکر واضح مشخصات یک مفهوم سازی ” نامید.از ابتدا در رابطه با این تعریف مطرح بوده و تصور بر این بوده است که این تعریف کامل نیست. بنابراین نویسنده های دیگر در طول سالیان سعی کردند این تعریف را را تکمیل کنند در سال ۱۹۹۷، Borst هستی شناسی را ” ذکر مشخصات رسمی از یک مفهوم سازی مشترک نامید”.چندین سال بعد Studer این تعریف را با معرفی یک تعریف کامل تر توسعه داد:” هستی شناسی ذکر مشخصات واضح و رسمی از یک مفهوم سازی مجزا می باشد” .این توصیف به مطرح کردن موضوع خوانا بودن هستیشناسی برای کامپیوتر پرداخت.واضح بودن یعنی نوع مفاهیم استفاده شده و محدودیت ها آنها به طور واضح تعریف شدهاند بنابراین ابهام را از بین می برد.درواقع مفهوم سازی یک انتزاع می باشد، یعنی در واقع یک تصویر ساده شده از جهانی که می خواهیم معرفی کنیم.مفهوم سازی دانش را در یک حوزه توصیف می کند.آنتولوژی باید شامل دانش به دست آورده شده است از گروههای مختلف به جای صرفاً یک شخص باشد.