تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی

<strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانه‎ای پدید آورده است. رسم‌الخط فارسی نیز از یک‌سو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، به‎هنگام ذخیره، جستجو و بازیابی چالشهای متع...

Full description

Bibliographic Details
Main Authors: سمیه آخشیک سادات, رحمت الله فتاحی
Format: Article
Language:fas
Published: Central Library of Astan Quds Razavi 2012-09-01
Series:کتابداری و اطلاع‌رسانی
Online Access:http://lis.aqr-libjournal.ir/article_42907_949673d969a2d7e63c61f8d44e79744b.pdf
id doaj-92140610e4aa4fc495cd05e0cb9abea4
record_format Article
spelling doaj-92140610e4aa4fc495cd05e0cb9abea42020-11-25T02:58:09ZfasCentral Library of Astan Quds Razaviکتابداری و اطلاع‌رسانی1680-96372676-59772012-09-0115شماره 3 (پیاپی 59)93042907تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتیسمیه آخشیک سادات0رحمت الله فتاحی1دانشجوی دورة دکترای کتابداری و اطلاع‌رسانی، دانشگاه فردوسی مشهد.استاد گروه کتابداری و اطلاع‌رسانی، دانشگاه فردوسی مشهد<strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانه‎ای پدید آورده است. رسم‌الخط فارسی نیز از یک‌سو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، به‎هنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایه‎سازان پایگاه‌ها، کاربران و پدیدآورندگان منابع به‌وجود آورده است.<br /> <strong>روش بررسی:</strong> این پژوهش به روش تحلیل محتوا انجام شد.100 عنوان از پایان‎نامه‎های موجود رشته کتابداری و اطلاع‌رسانی به منزله نمونه‌ای از متون فارسی در پایگاه‌های اطلاعاتی پژوهشگاه‌های علوم و فناوری اطلاعات ایران و مرکز منطقه‎ای اطلاع‌رسانی علوم و فناوری و از هر پایگاه 50 عنوان به‎صورت تصادفی انتخاب شد. با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاه‌ها، ارزیابی و مقایسه شد.<br /> <strong>یافته</strong><strong>‎</strong><strong>ها:</strong> نتایج این بررسی نشان داد 2/71% از کلمات عنوانها به صورت درست و 8/28% نادرست نگارش شده‎اند. همچنین، مشخص شد 6/51% این کلمات، دو جزئی و 5/47% سه جزئی هستند و اغلب نویسندگان پایان‎نامه‎ها، در مورد نحوة نگارش کلماتی که 2 جزئی و مشتق می‎باشند، دچار خطا شده‎اند. در پایگاه اطلاعاتی مرکز منطقه‎ای اطلاع‌رسانی علوم و فناوری، تنها حالت ثبت شده عنوانها به بازیابی عنوان مورد نظر ‎انجامید و در پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران، تنها 58% عنوانها با تغییر رسم‌الخط همچنان بازیابی شدند.<br /> <strong>نتیجه‎گیری:</strong> این پژوهش نشان داد پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران نسبت به پایگاه اطلاعاتی مرکز منطقه‎ای اطلاع‌رسانی علوم و فناوری، در بازیابی عنوان پایان نامه‌ها در حالتهای مختلف پیوسته و جدا نوشته شده، بهتر عمل می‎کند. همچنین، باید به نویسندگان پایان‌نامه‌ها، استفاده از قواعد یکدست ملی بویژه در نگارش کلمات 2 جزئی و مشتق تأکید شود.http://lis.aqr-libjournal.ir/article_42907_949673d969a2d7e63c61f8d44e79744b.pdf
collection DOAJ
language fas
format Article
sources DOAJ
author سمیه آخشیک سادات
رحمت الله فتاحی
spellingShingle سمیه آخشیک سادات
رحمت الله فتاحی
تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی
کتابداری و اطلاع‌رسانی
author_facet سمیه آخشیک سادات
رحمت الله فتاحی
author_sort سمیه آخشیک سادات
title تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی
title_short تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی
title_full تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی
title_fullStr تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی
title_full_unstemmed تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی
title_sort تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی
publisher Central Library of Astan Quds Razavi
series کتابداری و اطلاع‌رسانی
issn 1680-9637
2676-5977
publishDate 2012-09-01
description <strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانه‎ای پدید آورده است. رسم‌الخط فارسی نیز از یک‌سو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، به‎هنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایه‎سازان پایگاه‌ها، کاربران و پدیدآورندگان منابع به‌وجود آورده است.<br /> <strong>روش بررسی:</strong> این پژوهش به روش تحلیل محتوا انجام شد.100 عنوان از پایان‎نامه‎های موجود رشته کتابداری و اطلاع‌رسانی به منزله نمونه‌ای از متون فارسی در پایگاه‌های اطلاعاتی پژوهشگاه‌های علوم و فناوری اطلاعات ایران و مرکز منطقه‎ای اطلاع‌رسانی علوم و فناوری و از هر پایگاه 50 عنوان به‎صورت تصادفی انتخاب شد. با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاه‌ها، ارزیابی و مقایسه شد.<br /> <strong>یافته</strong><strong>‎</strong><strong>ها:</strong> نتایج این بررسی نشان داد 2/71% از کلمات عنوانها به صورت درست و 8/28% نادرست نگارش شده‎اند. همچنین، مشخص شد 6/51% این کلمات، دو جزئی و 5/47% سه جزئی هستند و اغلب نویسندگان پایان‎نامه‎ها، در مورد نحوة نگارش کلماتی که 2 جزئی و مشتق می‎باشند، دچار خطا شده‎اند. در پایگاه اطلاعاتی مرکز منطقه‎ای اطلاع‌رسانی علوم و فناوری، تنها حالت ثبت شده عنوانها به بازیابی عنوان مورد نظر ‎انجامید و در پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران، تنها 58% عنوانها با تغییر رسم‌الخط همچنان بازیابی شدند.<br /> <strong>نتیجه‎گیری:</strong> این پژوهش نشان داد پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران نسبت به پایگاه اطلاعاتی مرکز منطقه‎ای اطلاع‌رسانی علوم و فناوری، در بازیابی عنوان پایان نامه‌ها در حالتهای مختلف پیوسته و جدا نوشته شده، بهتر عمل می‎کند. همچنین، باید به نویسندگان پایان‌نامه‌ها، استفاده از قواعد یکدست ملی بویژه در نگارش کلمات 2 جزئی و مشتق تأکید شود.
url http://lis.aqr-libjournal.ir/article_42907_949673d969a2d7e63c61f8d44e79744b.pdf
work_keys_str_mv AT smyhậkẖsẖyḵsạdạt tḥlylcẖạlsẖhạypywsthnwysywjdạnwysywạzẖgạnfạrsydrdẖkẖyrhwbạzyạbyạṭlạʿạtdrpạygạhhạyạṭlạʿạty
AT rḥmtạllhftạḥy tḥlylcẖạlsẖhạypywsthnwysywjdạnwysywạzẖgạnfạrsydrdẖkẖyrhwbạzyạbyạṭlạʿạtdrpạygạhhạyạṭlạʿạty
_version_ 1724708214443868160