The constitution of an oral corpus of Tunisian Arabic : an essential resource for part-of-speech tagging ; Constitution d'un corpus oral de l'arabe tunisien : une ressource essentielle pour l'étiquetage morphosyntaxique
In: TALAf 2018 : Traitement automatique des langues africaines (écrit et parole) ; https://shs.hal.science/halshs-03520893 ; TALAf 2018 : Traitement automatique des langues africaines (écrit et parole), Sep 2018, Grenoble, France, 2018
Online
Konferenz
Zugriff:
International audience ; The constitution of an oral corpus of Tunisian Arabic for the analysis of the expressions of future raised several problems : datacollection, transcription and annotation. After presenting the theoretical and methodological stakes for each step of the process,we will show how our corpus can be used as a resource for the creation of a morphosyntactic tagger of transliterated TunisianArabic. Giving access to such corpora and tools will facilitate the research on a poorly documented language and will opennew perspectives of language processing. ; La constitution d'un corpus oral d'arabe tunisien pour l'analyse des expressions du futur a soulevé plusieurs problématiques : collecte des données, transcription et annotation. Après avoir exposé les enjeux théoriques et méthodologiques de chaque phase de traitement nous montrerons en quoi notre corpus servira de ressource pour la création d'un étiqueteur morphosyntaxique de l'arabe tunisien translittéré. Disposer et rendre accessible de tels corpus et outil faciliteront les recherches sur cette langue peu dotée et ouvriront de nouvelles perspectives de traitement.
Titel: |
The constitution of an oral corpus of Tunisian Arabic : an essential resource for part-of-speech tagging ; Constitution d'un corpus oral de l'arabe tunisien : une ressource essentielle pour l'étiquetage morphosyntaxique
|
---|---|
Autor/in / Beteiligte Person: | Ben Ahmed, Yossra ; Badin, Flora ; Hriba, Linda ; Laboratoire Ligérien de Linguistique (LLL) ; Bibliothèque nationale de France (BnF)-Université d'Orléans (UO)-Université de Tours (UT)-Centre National de la Recherche Scientifique (CNRS) ; Université d'Orléans (UO) |
Link: | |
Zeitschrift: | TALAf 2018 : Traitement automatique des langues africaines (écrit et parole) ; https://shs.hal.science/halshs-03520893 ; TALAf 2018 : Traitement automatique des langues africaines (écrit et parole), Sep 2018, Grenoble, France, 2018 |
Veröffentlichung: | HAL CCSD, 2018 |
Medientyp: | Konferenz |
Schlagwort: |
|
Sonstiges: |
|