تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی
<strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانهای پدید آورده است. رسمالخط فارسی نیز از یکسو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، بههنگام ذخیره، جستجو و بازیابی چالشهای متع...
Main Authors: | , |
---|---|
Format: | Article |
Language: | fas |
Published: |
Central Library of Astan Quds Razavi
2012-09-01
|
Series: | کتابداری و اطلاعرسانی |
Online Access: | http://lis.aqr-libjournal.ir/article_42907_949673d969a2d7e63c61f8d44e79744b.pdf |
id |
doaj-92140610e4aa4fc495cd05e0cb9abea4 |
---|---|
record_format |
Article |
spelling |
doaj-92140610e4aa4fc495cd05e0cb9abea42020-11-25T02:58:09ZfasCentral Library of Astan Quds Razaviکتابداری و اطلاعرسانی1680-96372676-59772012-09-0115شماره 3 (پیاپی 59)93042907تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتیسمیه آخشیک سادات0رحمت الله فتاحی1دانشجوی دورة دکترای کتابداری و اطلاعرسانی، دانشگاه فردوسی مشهد.استاد گروه کتابداری و اطلاعرسانی، دانشگاه فردوسی مشهد<strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانهای پدید آورده است. رسمالخط فارسی نیز از یکسو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، بههنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایهسازان پایگاهها، کاربران و پدیدآورندگان منابع بهوجود آورده است.<br /> <strong>روش بررسی:</strong> این پژوهش به روش تحلیل محتوا انجام شد.100 عنوان از پایاننامههای موجود رشته کتابداری و اطلاعرسانی به منزله نمونهای از متون فارسی در پایگاههای اطلاعاتی پژوهشگاههای علوم و فناوری اطلاعات ایران و مرکز منطقهای اطلاعرسانی علوم و فناوری و از هر پایگاه 50 عنوان بهصورت تصادفی انتخاب شد. با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاهها، ارزیابی و مقایسه شد.<br /> <strong>یافته</strong><strong></strong><strong>ها:</strong> نتایج این بررسی نشان داد 2/71% از کلمات عنوانها به صورت درست و 8/28% نادرست نگارش شدهاند. همچنین، مشخص شد 6/51% این کلمات، دو جزئی و 5/47% سه جزئی هستند و اغلب نویسندگان پایاننامهها، در مورد نحوة نگارش کلماتی که 2 جزئی و مشتق میباشند، دچار خطا شدهاند. در پایگاه اطلاعاتی مرکز منطقهای اطلاعرسانی علوم و فناوری، تنها حالت ثبت شده عنوانها به بازیابی عنوان مورد نظر انجامید و در پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران، تنها 58% عنوانها با تغییر رسمالخط همچنان بازیابی شدند.<br /> <strong>نتیجهگیری:</strong> این پژوهش نشان داد پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران نسبت به پایگاه اطلاعاتی مرکز منطقهای اطلاعرسانی علوم و فناوری، در بازیابی عنوان پایان نامهها در حالتهای مختلف پیوسته و جدا نوشته شده، بهتر عمل میکند. همچنین، باید به نویسندگان پایاننامهها، استفاده از قواعد یکدست ملی بویژه در نگارش کلمات 2 جزئی و مشتق تأکید شود.http://lis.aqr-libjournal.ir/article_42907_949673d969a2d7e63c61f8d44e79744b.pdf |
collection |
DOAJ |
language |
fas |
format |
Article |
sources |
DOAJ |
author |
سمیه آخشیک سادات رحمت الله فتاحی |
spellingShingle |
سمیه آخشیک سادات رحمت الله فتاحی تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی کتابداری و اطلاعرسانی |
author_facet |
سمیه آخشیک سادات رحمت الله فتاحی |
author_sort |
سمیه آخشیک سادات |
title |
تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی |
title_short |
تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی |
title_full |
تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی |
title_fullStr |
تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی |
title_full_unstemmed |
تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی |
title_sort |
تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی |
publisher |
Central Library of Astan Quds Razavi |
series |
کتابداری و اطلاعرسانی |
issn |
1680-9637 2676-5977 |
publishDate |
2012-09-01 |
description |
<strong>مقدمه:</strong> ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانهای پدید آورده است. رسمالخط فارسی نیز از یکسو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، بههنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایهسازان پایگاهها، کاربران و پدیدآورندگان منابع بهوجود آورده است.<br /> <strong>روش بررسی:</strong> این پژوهش به روش تحلیل محتوا انجام شد.100 عنوان از پایاننامههای موجود رشته کتابداری و اطلاعرسانی به منزله نمونهای از متون فارسی در پایگاههای اطلاعاتی پژوهشگاههای علوم و فناوری اطلاعات ایران و مرکز منطقهای اطلاعرسانی علوم و فناوری و از هر پایگاه 50 عنوان بهصورت تصادفی انتخاب شد. با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاهها، ارزیابی و مقایسه شد.<br /> <strong>یافته</strong><strong></strong><strong>ها:</strong> نتایج این بررسی نشان داد 2/71% از کلمات عنوانها به صورت درست و 8/28% نادرست نگارش شدهاند. همچنین، مشخص شد 6/51% این کلمات، دو جزئی و 5/47% سه جزئی هستند و اغلب نویسندگان پایاننامهها، در مورد نحوة نگارش کلماتی که 2 جزئی و مشتق میباشند، دچار خطا شدهاند. در پایگاه اطلاعاتی مرکز منطقهای اطلاعرسانی علوم و فناوری، تنها حالت ثبت شده عنوانها به بازیابی عنوان مورد نظر انجامید و در پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران، تنها 58% عنوانها با تغییر رسمالخط همچنان بازیابی شدند.<br /> <strong>نتیجهگیری:</strong> این پژوهش نشان داد پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران نسبت به پایگاه اطلاعاتی مرکز منطقهای اطلاعرسانی علوم و فناوری، در بازیابی عنوان پایان نامهها در حالتهای مختلف پیوسته و جدا نوشته شده، بهتر عمل میکند. همچنین، باید به نویسندگان پایاننامهها، استفاده از قواعد یکدست ملی بویژه در نگارش کلمات 2 جزئی و مشتق تأکید شود. |
url |
http://lis.aqr-libjournal.ir/article_42907_949673d969a2d7e63c61f8d44e79744b.pdf |
work_keys_str_mv |
AT smyhậkẖsẖyḵsạdạt tḥlylcẖạlsẖhạypywsthnwysywjdạnwysywạzẖgạnfạrsydrdẖkẖyrhwbạzyạbyạṭlạʿạtdrpạygạhhạyạṭlạʿạty AT rḥmtạllhftạḥy tḥlylcẖạlsẖhạypywsthnwysywjdạnwysywạzẖgạnfạrsydrdẖkẖyrhwbạzyạbyạṭlạʿạtdrpạygạhhạyạṭlạʿạty |
_version_ |
1724708214443868160 |