تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی
<strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانهای پدید آورده است. رسمالخط فارسی نیز از یکسو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، بههنگام ذخیره، جستجو و بازیابی چالشهای متع...
Main Authors: | , |
---|---|
Format: | Article |
Language: | fas |
Published: |
Central Library of Astan Quds Razavi
2012-09-01
|
Series: | کتابداری و اطلاعرسانی |
Online Access: | http://lis.aqr-libjournal.ir/article_42907_949673d969a2d7e63c61f8d44e79744b.pdf |
Summary: | <strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانهای پدید آورده است. رسمالخط فارسی نیز از یکسو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، بههنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایهسازان پایگاهها، کاربران و پدیدآورندگان منابع بهوجود آورده است.<br /> <strong>روش بررسی:</strong> این پژوهش به روش تحلیل محتوا انجام شد.100 عنوان از پایاننامههای موجود رشته کتابداری و اطلاعرسانی به منزله نمونهای از متون فارسی در پایگاههای اطلاعاتی پژوهشگاههای علوم و فناوری اطلاعات ایران و مرکز منطقهای اطلاعرسانی علوم و فناوری و از هر پایگاه 50 عنوان بهصورت تصادفی انتخاب شد. با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاهها، ارزیابی و مقایسه شد.<br /> <strong>یافته</strong><strong></strong><strong>ها:</strong> نتایج این بررسی نشان داد 2/71% از کلمات عنوانها به صورت درست و 8/28% نادرست نگارش شدهاند. همچنین، مشخص شد 6/51% این کلمات، دو جزئی و 5/47% سه جزئی هستند و اغلب نویسندگان پایاننامهها، در مورد نحوة نگارش کلماتی که 2 جزئی و مشتق میباشند، دچار خطا شدهاند. در پایگاه اطلاعاتی مرکز منطقهای اطلاعرسانی علوم و فناوری، تنها حالت ثبت شده عنوانها به بازیابی عنوان مورد نظر انجامید و در پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران، تنها 58% عنوانها با تغییر رسمالخط همچنان بازیابی شدند.<br /> <strong>نتیجهگیری:</strong> این پژوهش نشان داد پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران نسبت به پایگاه اطلاعاتی مرکز منطقهای اطلاعرسانی علوم و فناوری، در بازیابی عنوان پایان نامهها در حالتهای مختلف پیوسته و جدا نوشته شده، بهتر عمل میکند. همچنین، باید به نویسندگان پایاننامهها، استفاده از قواعد یکدست ملی بویژه در نگارش کلمات 2 جزئی و مشتق تأکید شود. |
---|---|
ISSN: | 1680-9637 2676-5977 |