پاسخ به پرس‌و‌جو جایگزین می‌شود: دانش درخواست شده بازیابی، استخراج و به طرز کاربر‌پسندانه‌ای ارائه می‌شود.
• پاسخ به پرس‌و‌جو بر روی چندین سند پشتیبانی خواهد شد.
• تعیین افرادی که قابلیت دسترسی به بخش‌های مشخصی از اطلاعات (حتی بخش‌هایی از سندها) را دارند، امکان‌پذیر خواهد بود.
۲-۲- RDF: وب معنایی جهت هرچه غنیتر سازی محتوای خود از دادههای پیوندی بهره میگیرد. بدین منظور از RDFها استفاده میگردد. مفاهیم اساسی RDF عبارتند از منابع۲۶ و ویژگیها۲۷ و عبارات۲۸.
I. منابع : هر منبع را میتوان به عنوان یک شی یا المانی که ما میخواهیم راجع به آن صحبت کنیم در نظر میگیریم. منابع میتوانند نویسندگان ، کتابها، ناشران، مکانها، افراد، هتلها، اتاقها، پرسشها و … باشند. هر منبع یک شناسه یکتای منبع۲۹ دارد. یک URI ممکن است یک URL(Uniform resource Locator) یا آدرس وب باشد یا نوع دیگری از شناسه یکتا باشد.توجه کنید که شناسه ضرورتا دسترسی به منبع را ممکن نمیسازد. شماهای URI نه تنها برای مکانهای وب تعریف شده اند بلکه برای اشیایی مثل شماره تلفن ، شماره ISBN و مکانهای جغرافیایی هم تعریف شده اند. بطور کلی فرض میکنیم که URI شناسه یک منبع موجود در وب است.
II. ویژگیها : ویژگیها انواع خاصی از منابع هستند که روابط بین منابع را توصیف میکنند مثلا “نوشته شده توسط”، “سن”، “عنوان” و ….. ویژگیها در RDF همچنین توسط URI شناسایی می شوند. ایده ی شناسایی اشیا و روابط فیمابین آنها با استفاده از URI بسیار مهم است که منجر به شمای نامگذاری یکتا و سراسری می شود. استفاده از این شما به میزان زیادی مسئله متشابهات ،که تاکنون نمایشهای داده های توزیع شده را دچار مشکل کرده ، حل میکند.
III. عبارات۳۰ : عبارات، ویژگیهای منابع را بیان میکنند. یک عبارت یک سه تایی شی-ویژگی-مقدار استکه شامل یک منبع یک خصیصه و مقدار آن است. مقادیر میتوانند منبع یا لیترال باشند. لیترال مقادیر یکتا(رشته ای) هستند که ساختار آن را بیشتر مورد بحث قرار نمیدهیم.
IV. سه دیدگاه از یک عبارت: مثالی از یک عبارت
David Billington is the owner of the web page http://www.cit.gu.edu.au/~db
ساده ترین روش برای تفسیر این عبارت استفاده از تعریف و فهم سه تایی
(http://www.cit.gu.edu.au/~db,http://www.mydomain.org/site-owner,#DavidBillington).
است.میتوان این سه تایی (x, P, y) را به صورت فرمول منطقی P(x, y) نیز در نظر گرفت که مسند دوتایی P شی x را به شی y مرتبط میسازد. در حقیقت در RDF فقط مسندهای دوتایی وجود دارد که ویژگی نامیده می شوند.
شکل ۲-۱- نمایش گرافیکی یک سه تایی
توجه کنید که ویژگی “site-owner” و هر دو شی توسط URL ها شناسایی می شوند.
دیدگاه دوم، دیدگاه بر اساس گراف است. گراف متناظر با عبارت قبلی را نشان میدهد گه یک گراف جهتدار با نودها و یالهای برچسب دار است. جهت یالها از منبع (subject عبارت ) به مقدار(object عبارت ) است. این نوع گرافها در جامعه هوش مصنوعی “شبکه مفهومی۳۱” نامیده می شوند.(شکل ۲-۱)
گفته بودیم که مقدار یک عبارت ممکن است یک منبع باشد. بنابراین آن ممکن است به سایر منابع متصل شود. سه تایی زیر را در نظر بگیرید:
(http://www.cit.gu.edu.au/~db,http://www.mydomain.org/site-owner,#DavidBillington)
(#DavidBillington,http://www.mydomain.org/phone,”3875507″)
(DavidBillington,http://www.mydomain.org/uses,http://www.cit.gu.edu.au/~arock/defeasible/Defeasible.cgi)
(http://www.cit.gu.edu.au/~arock/defeasible/Defeasible.cgi,http://www.mydomain.org/site-owner,”Andrew Rock”)
نمایش گرافیکی در شکل ۲-۲- نشان داده شده است.
گرافها ابزارهای قوی برای فهم انسانها است.اما دیدگاه وب معنایی نیاز به نمایشهای قابل خواندن و قابل پردازش توسط ماشین دارد. بنابراین یک حالت ممکن برای نمایش بر اساس XML نیز وجود دارد.در این روش یک سند RDF با المان XML که با تگ rdf:RDF نشان داده می شود. محتوی این المان تعدادی توصیف۳۲ است که از تگ rdf:description استفاده میکند. هر توصیف شامل یک عبارت راجع به یک منبع است که این منبع به یکی از سه روش متفاوت زیر شناسایی شده است:
* با ویژگی about که به یک منبع موجود ارجاع میکند.
شکل ‏۰۲-۲- یک شبکه مفهومی
* یک ویژگی ID که ایجاد کننده ی یک منبع جدید است.
* بدون نام که ایجاد کننده یک منبع بدون نام است.
می توان یک نحو بر اساس XML برای RDF معرفی کرد، اما در اینجا فقط نمایش عبارت اول را ذکر کرده ایم.
?xml version=”1.0″ encoding=”UTF-16″?





خط اول بیان میکند که ما از XML استفاده میکنیم. در مثالهای بعدی این خط را ذکر نمیکنیم.
المانrdf:Description یک عبارت راجع به منبع http://www.cit.gu.edu.au/~db ایجاد کرده است. در توصیف، ویژگی به عنوان تگ استفاده شده است و محتوی مقدار ویژگی است.
توصیفات به ترتیب خاصی ارائه شده اند؛ بعبارت دیگر، نحو XML یک نوع پشت سر هم سازی۳۳ را ایفا میکند. ترتیب توصیفها(یا منابع) با توجه به مدل انتزاعی RDF اهمیتی ندارد. این موضوع موکد بر این است که مدل گراف مدل داده واقعی RDF است و XML صرفا یک نمایش سری ممکن از گراف است.
۲-۳- هستی شناسی۳۴
آنتولوژی از دو واژه Ontoبه معنای هستی و logia به معنای مطالعه و بررسی، بوجود آمده است و اصطلاحاً به آن هستی شناسی می گویند. در واقع آنتولوژی یک خصوصیت و تعریف رسمی از مفاهیم به اشتراک گذاشته است[Gua09] . آنتولوژی در وب معنایی شامل واژه ها وارتباط بین آنها در دامنه ای که استفاده می شوند را نشان می دهد .مفاهیم، ارتباط بین مفاهیم و خصوصیات آنها از عناصر اصلی تشکیل دهنده آنتولوژی می باشند. به عبارت دیگر آنتولوژی ارتباط بین مفاهیم در اسناد و دیگر داده ها را مشخص می کند. (در بخش قبل توضیح داده شد) با این کار اسناد مربوطه توسط ماشین ها قابل پردازش و فهم شده و اشتراک گذاری اطلاعات بین عامل ها نیز تسهیل می شود. به عبارت دیگر می توان گفت :
Vocabulary + Structure = Taxonomy
Taxonomy + Relationships, Constraints and rules = Ontology
Ontology + Instances = Knowledgebase
هستی‌شناسی یا وجودشناسی شاخه‌ایست از فلسفه که به مطالعه بودن، هستی یا وجود می‌پردازد. دانش هستی‌شناسی در پی تشخیص و شرح رده‌های بنیادین و ارتباطات آنها در هستی یا عالم وجود برمی‌آید، تا بدین وسیله به تعریف موجودات و انواع آنها درآن چارچوب قادر گردد.هستی‌شناسی مطالعه فلسفی سرشت بودن، وجود یا واقعیت به طورکلی ونیز مقوله‌های عمده بودن وروابط آنهاست. به صورت سنتی بخشی از شاخه عمده فلسفه متافیزیک به حساب می آید که با پرسش‌های مربوط به چیستی موجودات، انواع، مقوله بندی؛ سلسه مراتب و زیرشاخه ها، تفاوتها و شباهتهای موجودات سروکار دارد[Wik12]. هدف از هستی شناسی مفهوم سازی مجموعه ای از مفاهیم در قالب تعریف آنها بهمراه ذکر روابط هر یک با دیگری می باشد [Noy01]. در سال ????، مجمع هوش مصنوعی از لغت هستی شناسی برای دو منظور استفاده کرد: نظریه‌ای در مورد جهان مدل شده و مؤلفه‌ای از سیستم‌های دانش. این مجمع از این وسیله برای اثبات خودکار بهره گرفت. هستی شناسی در هوش مصنوعی و همچنین علوم کامپیوتر به مجموعه‌ای از لغات و فرضیات (عموماً در منطق مرتبه‌ی اول) گفته می‌شود که با توجه به معنی آن لغات ایجاد شده‌اند و به منظور توصیف یک واقعیت خاص طراحی شده‌اند. استفاده از این مفهوم در سال‌های اخیر بسیار رواج یافته است و دلیل این امر را می‌توان افزایش ارتباطات و اطلاعات دانست.[IEE96]
با توجه به اینکه اطلاعات و منابع موجود در وب بصورت فزآینده ایی رو به رشد هستند و استفاده کنندگان وب نیازمند یک درک مشترک از آنها می باشند. هستی شناسی نقش اصلی را در مبادله اطلاعات و توسعه وب لغوی بسمت وب معنایی دارد. هستی شناسی یک مدل مفهومی است که موجودیتهای واقعی در یک دامنه خاص و روابط بین آنها را به صورت صریح و رسمی مدلسازی می کند. مشکل اساسی کار ، تهیه دستی هستی شناسی است که وقت گیر، خسته کننده و دارای خطا می باشد و به دانش کافی در زمینه دامنه کاربرد و زبان توصیف هستی شناسی نیاز دارد. تولید اتوماتیک شبه-هستی شناسی به روش استخراج مفاهیم از وب توسعه و رشد وب معنایی مشوق اصلی تولید هستی شناسی در دامنه های متفاوت میباشد. تولید هستی شناسی معمولا وقت گیر، خسته کننده، خطادار و وابسته به دانش مهندس دامنه است . یکی از مشکلات اصلی در این زمینه ، دسترسی به مجموعه واژگان معتبر و کامل برای تولید هستی شناسی است .
۲-۴- استفاده از تکنولوژی معنایی برای استخراج و یکپارچه سازی محتوا
فرایند استخراج اطلاعات ۳۵(IE) بخش کلیدی تکنولوژی های پردازش زبان طبیعی برای استخراج خودکار انواع خاصی از اطلاعات از مستندات و دیگر منابع و تبدیل آنها به رکوردهای پایگاه داده یا فیلدهای اشیاء در پایگاه دانش هستند. بدون فرایند استخراج اطلاعات باید استخراج و مطالعه هزاران سند متنی، وب سایت و داده های جدولی که حاوی اطلاعات مورد نیاز مدل ها و ابزارهای آموزش الکترونیکی است، بصورت دستی انجام شود.
یکی از تکیک های متداول و پرطرفدار استخراج اطلاعات، که در این پژوهش نیز مورد توجه قرار گرفته است استخراج اطلاعات مبتنی بر آنتولوژی (OBIE)36 است. OBIE فرایند شناسایی مفاهیم مناسب، ویژگی ها و روابط بین آنها )که در آنتولوژی بیان شده است( از متون و سایر منابع مشابه می باشد. تحلیل و کشف نام ها و مفاهیم هم مرجع در بین مستندات متعدد نیز همواره مورد توجه محققان این زمینه بوده است[Bag98] [Bag00] [Goo04]. فانک موفق به طراحی یک روش معنایی شد که در آن با بهره گیری از آنتولوژی، مفاهیم و نام های هم مرجع در یک مجموعه مستندات۳۷ تا حد قابل توجهی کشف شدند [Fun07].
سایگون سعی در خلاصه سازی و ادغام مفاهیم و اسامی هم مرجع در بین چند سند، بوسیله خوشه بندی معنایی نمود[Sag08]. در همین زمینه، مان و یاروسکی از اطلاعات معنایی ۳۸افراد که در مستندات مختلف موجود می باشد، برای الگوریتم های خوشه بندی سلسله مراتبی جهت استخراج و خلاصه سازی مفاهیم، استفاده کرده اند[Man03]. اصطلاح “اطلاعات معنایی” به کار برده شده توسط آنها به اطلاعات واقعی یک فرد از قبیل تاریخ تولد، اطلاعات شغلی یا تحصیلی فرد که در مستندات و منابع مختلف وجود دارد، اشاره می کند. در سیستم پیشنهاد شده در [Asw06]که برای یکسان سازی اشیاء و مفاهیم طراحی شده است، بطور مشابه از اطلاعات مختلفی که صفحات وب درباره دو فرد وجود دارد، شباهت یا ارتباط آنها کشف می شود. در

این مطلب رو هم توصیه می کنم بخونین:   منابع پایان نامه ارشد دربارهمحتوای آموزشی، تکنولوژی، مدیریت آموزش، شخصی سازی
دسته‌ها: No category

دیدگاهتان را بنویسید