Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości

Multilingual information retrieval system of Slavic linguistics iSybislaw: challenges, achievements and opportunities In multilingual information retrieval (IR) system iSybislaw we introduce a number of solutions enlarging its efficiency and effectiveness with the main tool, which presents the keywo...

Full description

Bibliographic Details
Main Author: Zofia Rudnik-Karwatowa
Format: Article
Language:Belarusian
Published: Institute of Slavic Studies, Polish Academy of Sciences 2014-12-01
Series:Studia z Filologii Polskiej i Słowiańskiej
Subjects:
Online Access:https://ispan.waw.pl/journals/index.php/sfps/article/view/484
id doaj-d2bb6a73b852496294f49d07443c7d2d
record_format Article
collection DOAJ
language Belarusian
format Article
sources DOAJ
author Zofia Rudnik-Karwatowa
spellingShingle Zofia Rudnik-Karwatowa
Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości
Studia z Filologii Polskiej i Słowiańskiej
database
iSybislaw
keyword
multilingual information retrieval system
Slavic languages
Slavic linguistics
author_facet Zofia Rudnik-Karwatowa
author_sort Zofia Rudnik-Karwatowa
title Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości
title_short Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości
title_full Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości
title_fullStr Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości
title_full_unstemmed Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości
title_sort wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego isybislaw: wyzwania, osiągnięcia i możliwości
publisher Institute of Slavic Studies, Polish Academy of Sciences
series Studia z Filologii Polskiej i Słowiańskiej
issn 2392-2435
publishDate 2014-12-01
description Multilingual information retrieval system of Slavic linguistics iSybislaw: challenges, achievements and opportunities In multilingual information retrieval (IR) system iSybislaw we introduce a number of solutions enlarging its efficiency and effectiveness with the main tool, which presents the keyword language. In this paper the applicability and consistency of the accepted approach in the presentation of the content of documents and IR is being discussed. We use natural language (professional language based on linguistic terminology) in the construction of the keyword language and implementation of the tools of semantic organization and access to multilingual informational database. The core task is to make allowance in the retrieval database for relations of equivalence between the keywords in different Slavic languages and in the English language, which will enable the simultaneous search in different languages. Implementation of the natural language enables optimization of the IR language but on the other hand it creates problems connected with synonymy and polysemy of the terms used as keywords. Such problems are being solved with implementation of the classes of equivalent keywords, pairs and more complicated units of monosemantic keywords presenting the terms linked with each other by semantic relations. Burst-type increase of written documents in the field of linguistics requires taking effort in speeding up the processing of the growing number of repre­sentations of these documents into search database. So we decided to call upon the users (the authors of the works considered in the system) to take part in creation of the IR language in the iSybislaw system through tagging.   Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości Zgodnie z koncepcją użytkownikami wielojęzycznego systemu iSybislaw są przede wszystkim językoznawcy slawiści, w mniejszym zakresie badacze języków niesłowiańskich, historycy, literaturoznawcy. Budowany system informacji bibliograficznej powinien więc zaspokajać potrzeby informacyjne tej grupy specjalistów. W systemie iSybislaw zastosowano szereg rozwiązań umożliwiających zwiększenie jego efektywności i sprawności podstawowego narzędzia informacyjno-wyszukiwawczego, jakim jest język słów kluczowych. W artykule przedstawiona została przydatność i spójność przyjętej metodologii w opisie treści dokumentów i wyszukiwaniu informacji, czyli wykorzystanie języka naturalnego (języka specjalistycznego opartego na terminologii językoznawczej) do budowy języka słów kluczowych, oraz zastosowanie narzędzi semantycznej organizacji i dostępu do wielojęzycznego zasobu informacyjnego. Zadaniem kluczowym jest  uwzględnienie w zbiorze wyszukiwawczym relacji równoważności (ekwiwalencji) między słowami kluczowymi z różnych języków słowiańskich, a także z języka angielskiego, co umożliwi przeszukiwanie jednocześnie w wielu językach. Wykorzystanie języka naturalnego daje możliwości optymalizacji języka informacyjno-wyszukiwawczego, ale z drugiej strony stwarza problemy związane z synonimicznością i wieloznacznością terminów, przetwarzanych w słowa kluczowe. Problemy takie są rozwiązywane poprzez stosowanie klas ekwiwalentnych słów kluczowych oraz par lub więcej jednoznacznych słów kluczowych reprezentujących terminy, połączone ze sobą relacją znaczeniową (pojęć). Lawinowy przyrost piśmiennictwa z dziedziny językoznawstwa wymaga usprawnienia działań przyspieszających proces opracowywania coraz większego zbioru opisów tych dokumentów do zbioru wyszukiwawczego. Dlatego podjęliśmy decyzję włączenia autorów prac uwzględnianych w systemie do współtworzenia języka informacyjno-wyszukiwawczego w systemie iSybislaw poprzez możliwość tagowania.
topic database
iSybislaw
keyword
multilingual information retrieval system
Slavic languages
Slavic linguistics
url https://ispan.waw.pl/journals/index.php/sfps/article/view/484
work_keys_str_mv AT zofiarudnikkarwatowa wielojezycznysysteminformacyjnowyszukiwawczyjezykoznawstwaslawistycznegoisybislawwyzwaniaosiagnieciaimozliwosci
_version_ 1725597140783202304
spelling doaj-d2bb6a73b852496294f49d07443c7d2d2020-11-24T23:13:41ZbelInstitute of Slavic Studies, Polish Academy of SciencesStudia z Filologii Polskiej i Słowiańskiej2392-24352014-12-01490284310.11649/sfps.2014.006276Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwościZofia Rudnik-Karwatowa0Instytut Slawistyki PAN [Institute of Slavic Studies, Polish Academy of Sciences], Warszawa [Warsaw]Multilingual information retrieval system of Slavic linguistics iSybislaw: challenges, achievements and opportunities In multilingual information retrieval (IR) system iSybislaw we introduce a number of solutions enlarging its efficiency and effectiveness with the main tool, which presents the keyword language. In this paper the applicability and consistency of the accepted approach in the presentation of the content of documents and IR is being discussed. We use natural language (professional language based on linguistic terminology) in the construction of the keyword language and implementation of the tools of semantic organization and access to multilingual informational database. The core task is to make allowance in the retrieval database for relations of equivalence between the keywords in different Slavic languages and in the English language, which will enable the simultaneous search in different languages. Implementation of the natural language enables optimization of the IR language but on the other hand it creates problems connected with synonymy and polysemy of the terms used as keywords. Such problems are being solved with implementation of the classes of equivalent keywords, pairs and more complicated units of monosemantic keywords presenting the terms linked with each other by semantic relations. Burst-type increase of written documents in the field of linguistics requires taking effort in speeding up the processing of the growing number of repre­sentations of these documents into search database. So we decided to call upon the users (the authors of the works considered in the system) to take part in creation of the IR language in the iSybislaw system through tagging.   Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości Zgodnie z koncepcją użytkownikami wielojęzycznego systemu iSybislaw są przede wszystkim językoznawcy slawiści, w mniejszym zakresie badacze języków niesłowiańskich, historycy, literaturoznawcy. Budowany system informacji bibliograficznej powinien więc zaspokajać potrzeby informacyjne tej grupy specjalistów. W systemie iSybislaw zastosowano szereg rozwiązań umożliwiających zwiększenie jego efektywności i sprawności podstawowego narzędzia informacyjno-wyszukiwawczego, jakim jest język słów kluczowych. W artykule przedstawiona została przydatność i spójność przyjętej metodologii w opisie treści dokumentów i wyszukiwaniu informacji, czyli wykorzystanie języka naturalnego (języka specjalistycznego opartego na terminologii językoznawczej) do budowy języka słów kluczowych, oraz zastosowanie narzędzi semantycznej organizacji i dostępu do wielojęzycznego zasobu informacyjnego. Zadaniem kluczowym jest  uwzględnienie w zbiorze wyszukiwawczym relacji równoważności (ekwiwalencji) między słowami kluczowymi z różnych języków słowiańskich, a także z języka angielskiego, co umożliwi przeszukiwanie jednocześnie w wielu językach. Wykorzystanie języka naturalnego daje możliwości optymalizacji języka informacyjno-wyszukiwawczego, ale z drugiej strony stwarza problemy związane z synonimicznością i wieloznacznością terminów, przetwarzanych w słowa kluczowe. Problemy takie są rozwiązywane poprzez stosowanie klas ekwiwalentnych słów kluczowych oraz par lub więcej jednoznacznych słów kluczowych reprezentujących terminy, połączone ze sobą relacją znaczeniową (pojęć). Lawinowy przyrost piśmiennictwa z dziedziny językoznawstwa wymaga usprawnienia działań przyspieszających proces opracowywania coraz większego zbioru opisów tych dokumentów do zbioru wyszukiwawczego. Dlatego podjęliśmy decyzję włączenia autorów prac uwzględnianych w systemie do współtworzenia języka informacyjno-wyszukiwawczego w systemie iSybislaw poprzez możliwość tagowania.https://ispan.waw.pl/journals/index.php/sfps/article/view/484databaseiSybislawkeywordmultilingual information retrieval systemSlavic languagesSlavic linguistics