Méthodes d'acquisition terminologique en arabe : Application au domaine médical

L'objectif de cette thèse est de lever les verrous que constituent le manque de disponibilité de ressources ou d'outils TAL pour la langue arabe dans les domaines de spécialité en proposant des méthodes permettant l'extraction de termes à partir de textes en arabe standard moderne. Da...

Full description

Bibliographic Details
Main Author: Neifar, Wafa
Other Authors: Paris Saclay
Language:fr
Published: 2019
Subjects:
Online Access:http://www.theses.fr/2019SACLS085/document
id ndltd-theses.fr-2019SACLS085
record_format oai_dc
spelling ndltd-theses.fr-2019SACLS0852020-01-30T03:26:46Z Méthodes d'acquisition terminologique en arabe : Application au domaine médical Terminology acquisition methods in Arabic : Application in the medical domain Acquisition terminologique Transfert multilangue Langue arabe Corpus parallèle Translittération Terminology Acquisition Multilingual transfer Arabic language Parallel Corpus Transliteration L'objectif de cette thèse est de lever les verrous que constituent le manque de disponibilité de ressources ou d'outils TAL pour la langue arabe dans les domaines de spécialité en proposant des méthodes permettant l'extraction de termes à partir de textes en arabe standard moderne. Dans ce contexte, nous avons d'abord construit un corpus parallèle anglais-arabe dans un domaine de spécialité. Il s'agit d'un ensemble de textes médicaux produits par la bibliothèque nationale de médecine américaine (NLM). Par la suite, nous avons proposé des méthodes d'acquisition terminologique, permettant d'extraire des termes ou d'acquérir des relations entre ces termes, pour la langue arabe en se basant sur: i)adaptation d'un extracteur terminologique existant pour la languefrançaise ou anglaise, ii) l'exploitation de la translittération des termes anglais en caractères arabes et iii) l'application de la la notion de transfert translingue. Appliqué au niveau terminologique, le transfert consiste à mettre en œuvre un processus d'extraction de termes ou d'acquisition de relations entre termes sur des textes d'une langue source (ici, le français ou l'anglais) puis à transférer les informations extraites sur des textes d'une langue cible (ici, l’arabe standard moderne) pour ainsi identifier le même type d'informations terminologiques. Nous avons évalué les listes de termes monolingues et bilingues obtenues lors des différentes expériences que nous avons réalisées, suivant une méthode transparente, directe et semi-automatique: les termes candidats extraits sont confrontés à une terminologie de référence avant d'être vérifiés manuellement. Cette évaluation suit un protocole que nous avons proposé. The goal of this thesis is to reduce the lack of available resources and NLP tools for Arabic language in specialised domains by proposing methods allowing the extraction of terms from texts in Modern Standard Arabic. In this context, we first constructed an English-Arabic parallel corous in a specific domain.It is a set of medical texts produced by the US National Library of Medicine (NLM). Thereafter, we have proposed terminological acquisition methods, toextract terms or acquire relations between these terms, for Arabic based on: i) the adaptation of an existing terminology extractor for French or English, ii) the transliteration of English terms in Arabic characters and iii) cross-lingual transfer. Applied at the terminological level, transfer aims to implement a process of term extraction or relationship acquisition between terms in the texts of a source language (here, French or English) and then to transfer the extracted information to target language texts (in this case, Modern Standard Arabic), thereby identifying the same type of terminologicalinformation. We have evaluated the monolingual and bilingual term lists that we have obtained by the experiments we carried out, according to a transparent, direct and semi-automatic method: the extracted term candidates are confronted with a reference terminology before being validated manually. This evaluation follows a protocol that we proposed. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2019SACLS085/document Neifar, Wafa 2019-03-18 Paris Saclay Université de Sfax (Tunisie). Faculté des Sciences économiques et de gestion Zweigenbaum, Pierre Hadrich Belguith, Lamia
collection NDLTD
language fr
sources NDLTD
topic Acquisition terminologique
Transfert multilangue
Langue arabe
Corpus parallèle
Translittération
Terminology Acquisition
Multilingual transfer
Arabic language
Parallel Corpus
Transliteration

spellingShingle Acquisition terminologique
Transfert multilangue
Langue arabe
Corpus parallèle
Translittération
Terminology Acquisition
Multilingual transfer
Arabic language
Parallel Corpus
Transliteration

Neifar, Wafa
Méthodes d'acquisition terminologique en arabe : Application au domaine médical
description L'objectif de cette thèse est de lever les verrous que constituent le manque de disponibilité de ressources ou d'outils TAL pour la langue arabe dans les domaines de spécialité en proposant des méthodes permettant l'extraction de termes à partir de textes en arabe standard moderne. Dans ce contexte, nous avons d'abord construit un corpus parallèle anglais-arabe dans un domaine de spécialité. Il s'agit d'un ensemble de textes médicaux produits par la bibliothèque nationale de médecine américaine (NLM). Par la suite, nous avons proposé des méthodes d'acquisition terminologique, permettant d'extraire des termes ou d'acquérir des relations entre ces termes, pour la langue arabe en se basant sur: i)adaptation d'un extracteur terminologique existant pour la languefrançaise ou anglaise, ii) l'exploitation de la translittération des termes anglais en caractères arabes et iii) l'application de la la notion de transfert translingue. Appliqué au niveau terminologique, le transfert consiste à mettre en œuvre un processus d'extraction de termes ou d'acquisition de relations entre termes sur des textes d'une langue source (ici, le français ou l'anglais) puis à transférer les informations extraites sur des textes d'une langue cible (ici, l’arabe standard moderne) pour ainsi identifier le même type d'informations terminologiques. Nous avons évalué les listes de termes monolingues et bilingues obtenues lors des différentes expériences que nous avons réalisées, suivant une méthode transparente, directe et semi-automatique: les termes candidats extraits sont confrontés à une terminologie de référence avant d'être vérifiés manuellement. Cette évaluation suit un protocole que nous avons proposé. === The goal of this thesis is to reduce the lack of available resources and NLP tools for Arabic language in specialised domains by proposing methods allowing the extraction of terms from texts in Modern Standard Arabic. In this context, we first constructed an English-Arabic parallel corous in a specific domain.It is a set of medical texts produced by the US National Library of Medicine (NLM). Thereafter, we have proposed terminological acquisition methods, toextract terms or acquire relations between these terms, for Arabic based on: i) the adaptation of an existing terminology extractor for French or English, ii) the transliteration of English terms in Arabic characters and iii) cross-lingual transfer. Applied at the terminological level, transfer aims to implement a process of term extraction or relationship acquisition between terms in the texts of a source language (here, French or English) and then to transfer the extracted information to target language texts (in this case, Modern Standard Arabic), thereby identifying the same type of terminologicalinformation. We have evaluated the monolingual and bilingual term lists that we have obtained by the experiments we carried out, according to a transparent, direct and semi-automatic method: the extracted term candidates are confronted with a reference terminology before being validated manually. This evaluation follows a protocol that we proposed.
author2 Paris Saclay
author_facet Paris Saclay
Neifar, Wafa
author Neifar, Wafa
author_sort Neifar, Wafa
title Méthodes d'acquisition terminologique en arabe : Application au domaine médical
title_short Méthodes d'acquisition terminologique en arabe : Application au domaine médical
title_full Méthodes d'acquisition terminologique en arabe : Application au domaine médical
title_fullStr Méthodes d'acquisition terminologique en arabe : Application au domaine médical
title_full_unstemmed Méthodes d'acquisition terminologique en arabe : Application au domaine médical
title_sort méthodes d'acquisition terminologique en arabe : application au domaine médical
publishDate 2019
url http://www.theses.fr/2019SACLS085/document
work_keys_str_mv AT neifarwafa methodesdacquisitionterminologiqueenarabeapplicationaudomainemedical
AT neifarwafa terminologyacquisitionmethodsinarabicapplicationinthemedicaldomain
_version_ 1719310470303711232