تحلیل چالشهای پیوسته‎نویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه‌های اطلاعاتی

<strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانه‎ای پدید آورده است. رسم‌الخط فارسی نیز از یک‌سو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، به‎هنگام ذخیره، جستجو و بازیابی چالشهای متع...

Full description

Bibliographic Details
Main Authors: سمیه آخشیک سادات, رحمت الله فتاحی
Format: Article
Language:fas
Published: Central Library of Astan Quds Razavi 2012-09-01
Series:کتابداری و اطلاع‌رسانی
Online Access:http://lis.aqr-libjournal.ir/article_42907_949673d969a2d7e63c61f8d44e79744b.pdf
Description
Summary:<strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانه‎ای پدید آورده است. رسم‌الخط فارسی نیز از یک‌سو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، به‎هنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایه‎سازان پایگاه‌ها، کاربران و پدیدآورندگان منابع به‌وجود آورده است.<br /> <strong>روش بررسی:</strong> این پژوهش به روش تحلیل محتوا انجام شد.100 عنوان از پایان‎نامه‎های موجود رشته کتابداری و اطلاع‌رسانی به منزله نمونه‌ای از متون فارسی در پایگاه‌های اطلاعاتی پژوهشگاه‌های علوم و فناوری اطلاعات ایران و مرکز منطقه‎ای اطلاع‌رسانی علوم و فناوری و از هر پایگاه 50 عنوان به‎صورت تصادفی انتخاب شد. با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاه‌ها، ارزیابی و مقایسه شد.<br /> <strong>یافته</strong><strong>‎</strong><strong>ها:</strong> نتایج این بررسی نشان داد 2/71% از کلمات عنوانها به صورت درست و 8/28% نادرست نگارش شده‎اند. همچنین، مشخص شد 6/51% این کلمات، دو جزئی و 5/47% سه جزئی هستند و اغلب نویسندگان پایان‎نامه‎ها، در مورد نحوة نگارش کلماتی که 2 جزئی و مشتق می‎باشند، دچار خطا شده‎اند. در پایگاه اطلاعاتی مرکز منطقه‎ای اطلاع‌رسانی علوم و فناوری، تنها حالت ثبت شده عنوانها به بازیابی عنوان مورد نظر ‎انجامید و در پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران، تنها 58% عنوانها با تغییر رسم‌الخط همچنان بازیابی شدند.<br /> <strong>نتیجه‎گیری:</strong> این پژوهش نشان داد پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران نسبت به پایگاه اطلاعاتی مرکز منطقه‎ای اطلاع‌رسانی علوم و فناوری، در بازیابی عنوان پایان نامه‌ها در حالتهای مختلف پیوسته و جدا نوشته شده، بهتر عمل می‎کند. همچنین، باید به نویسندگان پایان‌نامه‌ها، استفاده از قواعد یکدست ملی بویژه در نگارش کلمات 2 جزئی و مشتق تأکید شود.
ISSN:1680-9637
2676-5977