تعداد نشریات | 161 |
تعداد شمارهها | 6,573 |
تعداد مقالات | 71,033 |
تعداد مشاهده مقاله | 125,502,605 |
تعداد دریافت فایل اصل مقاله | 98,766,766 |
طراحی صفات دادهای مستند مبتنی بر روش دادههای خرد و بررسی واکنش موتورهای کاوش وب به پیشینههای مبتنی بر آن | ||
تحقیقات کتابداری و اطلاعرسانی دانشگاهی | ||
دوره 56، شماره 4، دی 1401، صفحه 69-88 اصل مقاله (959.63 K) | ||
نوع مقاله: مقاله پژوهشی | ||
شناسه دیجیتال (DOI): 10.22059/jlib.2023.356370.1675 | ||
نویسندگان | ||
سیدمهدی طاهری* 1؛ سمیرا آقاده ده زاده1؛ محمدرضا تقوا2؛ منیره قاسمی3؛ نگین شکرزاده هشترودی4 | ||
1گروه علم اطلاعات و دانش شناسی،دانشکده روان شناسی و علوم تربیتی، دانشگاه علامه طباطبایی، تهران، ایران. | ||
2گروه مدیریت صنعتی، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبایی، تهران. ایران. | ||
3کتابخانه مرکزی و مرکز اسناد، دانشگاه علامه طباطبائی، تهران، ایران. | ||
4گروه علم اطلاعات و دانش شناسی، دانشکده روانشناسی و علوم تربیتی، دانشگاه الزهرا، تهران، ایران. | ||
چکیده | ||
هدف: پژوهش حاضر با هدف طراحی صفات دادههای مستند مبتنی بر روش دادههای خرد و تبیین واکنش موتورهای کاوش وب به پیشینههای مبتنی بر آن انجام شد. روش پژوهش: این پژوهش به روش تجربی انجام شد. جامعه پژوهش شامل 400 پیشینه فرادادهای مستند مبتنی بر روش دادههای خرد و بستر نحوی جیسان-ال.دی. از کتابخانه دیجیتالی دانشگاه علامه طباطبائی بود. گروه گواه را 200 پیشینه، شامل 100 پیشینه مربوط به توصیف کتاب در قالب دادههای خرد و 100 پیشینه مشابه دیگر در قالب جیسان-اِل.دی. تشکیل میدادند، و گروه آزمون را 200 پیشینه، دارای 100 پیشینه با گسترشهای دادههای مستند در قالب دادههای خرد و 100 پیشینه مشابه دیگر در قالب جیسان-اِل.دی.، (که 50 نمونه برای مستند نامها و 50 نمونه دیگر مستند موضوعات) بود. پیشینههای یاد شده بر روی وبگاهی مستقل به نشانی www.aghadeh.ir منتشر و به موتورهای کاوش طراح فرانمای تولید دادههای ساختارمند (اسکیما.اُرگ) معرفی گردید. سپس از طریق جستجو در موتورهای کاوش یاد شده با استفاده از ابزار گردآوری دادهها یعنی سیاهه وارسی تهیه شده توسط پژوهشگران، چگونگی نمایهسازی و بازیافتپذیری پیشینههای فرادادهای گروههای گواه و آزمون در نتایج جستجوی موتورهای کاوش منتخب مورد ارزیابی قرار گرفت. یافتهها: یافتهها حاکی از آن است که موتورهای کاوش قادر به نمایهسازی و بازیافتپذیرسازی تمامی پیشینههای جامعه پژوهش و ارزشهای گسترشهای مرتبط با دادههای مستند طراحی شده بودند. چنین امکانی برای پیشینههای دادههای مستند نام و دادههای مستند موضوعی وضعیت یکسانی داشت. نتیجهگیری: با ایجاد امکان نمایهپذیری و پدیدارنمایی معنایی هر یک از ارزشهای صفات ناگزیده در پیشینههای گروه آزمون، افزون بر ارزشهای مرجح نام و اصطلاحات موضوعی، جامعیت بازیابی در موتورهای کاوش افزایش، و کنترل مستندات در مهمترین ابزارهای کاوش وب بهبود خواهد یافت. | ||
کلیدواژهها | ||
گسترش دادههای مستند؛ پیشینههای فرادادهای؛ فرانمای تولید دادههای ساختارمند؛ دادههای خرد؛ موتورهای کاوش وب | ||
عنوان مقاله [English] | ||
Designing Authority Data Properties Based on Microdata Method and Study of Web Search Engines’ Reaction to Them | ||
نویسندگان [English] | ||
Seyed Mahdi Taheri1؛ Samira Aghadehdehzadeh1؛ MohammadReza Taghva2؛ Monireh Qasemi3؛ Negin Shokrzadeh Hashtroudi4 | ||
1Department of Knowledge and Information Science, Faculty of Psychology and Education, Allameh Tabatabaei University, Tehran, Iran | ||
2Department of Industrial Management, Faculty of Management and Accounting, Allameh Tabatabaei University, Tehran, Iran | ||
3Central Library and Documentation Center, Allameh Tabatabaei University, Tehran, Iran | ||
4Department of Information Science, Faculty of Education and Psychology, Alzahra University, Tehran, Iran | ||
چکیده [English] | ||
Objective: The purpose of this research was to study the Search Engine’s responses to authority data properties embedded into schema.org-based metadata on the Microdata syntax. Methods: The experimental method was used in this research. The research population comprised 400 records of authority metadata based on the Microdata method from the digital library of Allameh Tabataba'i University. The examination group consisted of 200 metadata records, 100 records with authority data extensions embedded into schema.org-based metadata in the Microdata syntax and 100 other similar records in the JSON-LD syntax (50 samples of name authority, and 50 other subject authority) And the control group consisted of 200 Records, including 100 Records related to the description of the book in the Microdata syntax and 100 other similar records in the JSON-LD syntax. The records have been published on the independent website at www.Aghadeh.ir and have been introduced to the Google, Bing, Yahoo, and Yandex search engines as designers of the schema.org standard. Then, through searching the search engines, using the data gathering tool, the checklist provided by the researchers, the indexing and retrieval of the metadata records of the control groups and experimental groups were evaluated in the search results of the selected search engines. Results: The results of this study showed that search engines were able to index and retrieve all of the metadata records and values of added extensions associated with authority data. Such a possibility had the same status for the name authority records and the subject authority data. Conclusions: By retrieving each of the variant properties’ values of examination group’s records, in addition to the authorized values of the name and subject terms, a suitable platform for the comprehensiveness of the retrieve process, and the authority control in the Web search tools will be improved. | ||
کلیدواژهها [English] | ||
Authority data extension, Metadata records, Microdata syntax, Schema.org, Web search engines | ||
مراجع | ||
بابالحوائجــى، فهیمــه؛ ســیدمهدى طاهــرى و زهــرا آقاعابــدى (1394). بررســى تطبیقــى کیفیــت نمایهســازى و رتبهبنــدى پیشــینههاى فــرادادهاى هســته دابلین و مــارک 21 توســط موتورهــاى کاوش عمومــى. مطالعات دانششناسی، 1(3)، 43-59 جمالـى مهموئـى، حمیدرضـا (1382). وب معنایـى: شـیوهاى رو بـه تکامـل بـراى ذخیـره و بازیابـى کارآمدتـر اطلاعـات روى اینترنـت. اطلاعشناسـى، 1(2)، 47-66. حریری، نجلا؛ طاهری، سید مهدی (1393). بررسی کاربرد روش جزیره دادهها در تولید پیشینههای فرادادهای با قابلیت نمایه پذیری و پیدانمایی نامهای برچسب عناصر در محیط موتورهای کاوش وب: بهبود دسترسی به اشیای محتوایی. پژوهشنامه کتابداری و اطلاعرسانی، 4(1)، 91-73 حریری، نجلا؛ طاهری، سید مهدی (1394). بررسی تأثیر حذف خط اعلان زبان نشانهگذاری گسترشپذیر (XML) و تغییر پسوند فایل بر افزایش نمایهپذیری و پیدانمایی پیشینههای فرادادهای در محیط موتورهای کاوش وب. پژوهشنامه کتابداری و اطلاعرسانی، 5(1)، 21-10. دری، راحله (1393). مقایسه و ارزیابی موتورهای جستجوی معنایی، پردازش ومدیریت اطلاعات، 30(2)، 467-490. طاهری، سیدمهدی (1393). کارگاه آموزشی "خردههای غنی: دادههای خرد، قالبهای خرد، و چهارچوب توصیف منبع (خصایص)." برای موسسه خانه کتاب. تهران: بیست و هفتمین نمایشگاه بینالمللی کتاب، سرای اهل قلم، 12 اردیبهشت 1393. طاهری، سیدمهدی (1394). کارگاه آموزشی "پژوهش در محیط وب (5)". برای دانشکده روانشناسی دانشگاه علامه طباطبایی (ره). تهران، 30 اردیبهشت 1394. طاهــرى، ســیدمهدى؛ حریری، نجــلا و فتاحی، رحمتالله (1388). بررســى تطبیقــى کیفیــت نمایهســازى و رتبهبنــدى اشــیاى محتوایــى حــاوى عناصــرفــرادادهاى هســته دابلین و مــارک 21 توســط موتورهــاى کاوش عمومــى. کتابــدارى و اطلاعرســانى، 12(4)، 141-162. طاهری، سید مهدی؛ ذوالقدر، سارا و صمیعی، میترا (1397). مقایسه عملکرد موتورهای کاوش وب در نمایهسازی و پیدانمایی پیشینههای فرادادهای مبتنی بر روش دادههای خرد. بازیابی دانش و نظامهای معنایی، 4(16)، 83-101. طاهری، سید مهدی؛ نیکزاد بهله، رضا؛ صمیعی، میترا (1396). بررسی واکنش موتورهای کاوش وب به پیشینههای فرادادهای مبتنی بر روش ترکیبی دادههای خرد و روش دادههای پیوندی. پژوهشنامه پردازش و مدیریت اطلاعات، ۳۳(2)، ۶۵۸-۶۳۹. طباطبایــى امیــرى، فائزهالســادات؛ طاهــرى، ســیدمهدى؛ فرجپهلــو، عبدالحســین؛ عصــاره، فریــده و معــرفزاده، عبدالحمیــد (1391). موتورهــاى کاوش وب و نمایهســازى و رتبهبنــدى اشــیاى محتوایــى حــاوى عناصــر فــرادادهاى دســترسپذیر در محیطهــاى اطلاعاتــى پیوســته پویــا. پژوهشنامه پــردازش ومدیریــت اطلاعــات، 27(4)، 907-920. فتاحی، رحمتالله (1385). از آرمانها تا واقعیت؛ تحلیلی از مهمترین چالشها و رویکردهای سازماندهی اطلاعات در عصر حاضر. کتابداری و اطلاعرسانی، 40(10)، 22 – 37 فردحسینی، مهسا؛ طاهری، سیدمهدی؛ حریری، نجلا؛ بابالحوائجی، فهیمه و نوشینفرد، فاطمه (1399). بازنمایی صفات و روابط میان موجودیتهای آثار خلاقانه فرانمای تولید دادههای ساختارمند مبتنی بر الگوی مرجع کتابخانهای (الآراِم). پژوهشنامه پردازش و مدیریت اطلاعات، 36(2)، 533-562. نوکاریزی، محسن، و زینالی تازهکندی، مهدی. (1396). ارزیابی همپوشانی و پوشش چهار موتور جستجوی بومی اصلی: پارسی جو, یوز, پارسیک و ریسمون. تعامل انسان و اطلاعات، 4(3)، 48-59. References Aldaej, A. A. (2015). An enhanced semantic VLE based on schema.org and social media (Doctoral dissertation, University of Surrey). Retrieved 28 March 2021 from https://epubs.surrey.ac.uk/807070/1/Aldaej%20PhD%20Thesis.pdf Azizan, Z. Baker, A. Ismail, N., & Amran M. (2013). Interface Features of Semantic Web Search Engine. IEEE Conference on e-Learning, e-Management and e-Services, December 2–4, Sarawak, Malaysia. Babolhavaeji, F., Taheri, S. M., & AghaAbedi, Z. (2015). A comparative Study of Indexing Quality and Ranking of Metadata Records of Dublin Core and MARC 21 by Search Engines. Quarterly of Knowledge Studies, 1(3). 43-59 (in Persian). Dorri, R. (2015). Comparison and Evaluation of Semantic Search Engines. Iranian Journal of Information Processing and Management. 30(2), 467-490 (in Persian). Fardehosseini, M., Taheri, S.M., Hariri, N., Babalhavaeji, F., & Nooshinfard, F. (2020). Representing Properties and Relationships between Entities of Creative Works in Schema.org Based on Library Reference Model (LRM). Iranian Journal of Information Processing and Management, 36(2), 533-562 (in Persian). Fattahi, S. R. (2007). From ideals to reality; an analysis of the most important challenges and approaches to organizing information in today's era. Library and Information Sciences, 40(10), 22-37. (in Persian). Gorman, M. (2004). Authority control in the context of bibliographic control in the electronic environment. Cataloging & classification quarterly, 38(3-4), 11-22. Hariri, N. & Taheri, S.M. (2014). Study on the Use of “Data Island Method “for Creating Metadata Records with Access Improvement to Content Objects by Web Search Engines. Library and Information Science Quarterly, 4(1), 73-91 (in Persian). Hariri, N. & Taheri, S. M. (2015). Study of the Effect of Discarding XML Declaration and Changing the File Extension on Increasing the Indexability and Visibility of Metadata Records in the Web Search Engines Environment. Library and Information Science Quarterly, 5 (1), 10-21 (in Persian). Hogenboom, F. Frasinca, F. & Damir, V. (2011). Automatically Annotating Web pages using Google Rich Snippets. Econometric institute, Erasmus University Rotterdam, Amsterdam, the Netherlands. Iliadis, A., Acker, A., Stevens, W., & Kavakli, S. B. (2022). One schema to rule them all: How Schema. org models the world of search. Journal of the Association for Information Science and Technology. https://doi.org/10.1002/asi.24744 MohammadiOstani, M., CheshmehSohrabi, M., Taheri, S. M., Shabani, A., & Asemi, A. (2022). Localization of Schema.org for Manuscript Description in the Iranian-Islamic Information Context. Knowledge Organization, 48(5), 345-356. Negi, Y., & Kumar, S. (2014). A comparative analysis of keyword- and semantic-based search engines. Intelligent Computing, Networking, and Informatics, (243), 727-736. Nowkarizi, M., & Zeinali, M. (2017). The overlap and coverage of 4 local search engines: Parsijoo, Yooz, Parseek and Rismoun. Human Information Interaction, 4(3), 48-59 (in Persian). Tabatabaei Amiri, F.S., Taheri, S.M., & Farajpahlu, H. (2012). Web search engines, indexing and Ranking of content objects including metadata elements in dynamic environment. Iranian Journal of Information Processing and Management. 27(4), 907-920. (in Persian) Taheri, S. M. (2014). Rich snippets: Macro data, macro formats, and resource description framework (attributes) Workshop. For the Khaneye Ketab Institute. Tehran: 27th International Book Fair, Sarai Ahl Qalam, May, 2014 (in Persian) Taheri, S. M. (2015). Research in the web environment (5)" Workshop. The Faculty of Psychology of Allameh Tabatabae’i University, Tehran, May, 2015 (in Persian) Taheri, S. M.; Hariri, N., & Fattahi, S. R. (2009). A comparative study of the quality of indexing and ranking of content objects including Dublin Core metadata elements and MARC 21 by general search engines. Library and Information Sciences, 12(4), 141-162 (in Persian). Taheri, S. M., Nikzad, R., & Samiee, M. (2015). Study of Response of web-based search engines to metadata based on combined method of rich snippets and linked data: A case study of national content consortium. Iranian Journal of Information Processing and Management, 33(2), 639-658. (in Persian). Taheri, S. M., Zolghadr, S., & Hariri, N. (2018). Comparing the function of web search engines in indexing and finding the metadata records based on the microdata method. Knowledge Retrieval and Semantic Systems, 5(16), 83-101 (in Persian). https://doi.org/10.22054/jks.2019.38110.1210 Turner, D., M. Shah, A., & Bitirim, Y. (2009). An empirical evaluation on semantic search performance of keyword-based and semantic search engines: Google, Yahoo, MSN and Hakia. In proceedings of Fourth international conference on internet monitoring and protection, 24-28. Venice, Mestre. https://doi.org/10.1109/ICIMP.2009.16 Van, T. (2012). How to implement video microdata for Google & Schema.org. Retrieved 10 June 2021, from https://www.searchenginewatch.com/2012/02/28/how-to-implement-video-microdata-for-google-schema-org/ W3Schools (2017). HTML5 History. Retrieved 15 May 2017, from: https://www.w3schools.com/html/html5.asp | ||
آمار تعداد مشاهده مقاله: 284 تعداد دریافت فایل اصل مقاله: 196 |