Ricerca: Sviluppo di una metodologia trasversale per l’analisi e l’annotazione di corpora misti, al fine di compilare un glossario corpus-based per termini in arabo standard e in dialetto egiziano. (Titolo provvisorio)
ABSTRACT PROGETTO DI RICERCA)
Tradizionalmente, l'arabo è descritto come l’esempio tipico di una situazione di “diglossia”, in cui, cioè, i parlanti scelgono tra due varietà distinte, considerate una superiore e una inferiore - l’arabo standard e i dialetti - o le mescolano in modi diversi.
Questo approccio si riflette anche nelle risorse lessicografiche disponibili, sia in formato cartaceo che elettronico. Inoltre, i lavori sui corpora in lingua araba sono limitati e si concentrano in due direzioni opposte: l’analisi di testi, spesso di origine giornalistica, in Modern Standard Arabic; oppure l’analisi di testi orali in varietà dialettali.
Lo scopo del progetto è dunque quello di incentivare un cambio di paradigma, al fine di iniziare a considerare l’arabo “as one language” (M. Al-Batal (2018)). Per questo, si rivela utile accogliere nella ricerca i corpora misti (dove scritto e parlato si fondono) e/o i corpora in dialetto tout court, rappresentativi della realtà multiforme e variegata del mondo arabo.
Tale studio verrà dunque portato avanti procedendo all’analisi e all’annotazione di testi in MSA e in dialetto sulla base degli stessi principi, partendo da Universal Dependencies e ripensandone le categorie morfologiche e sintattiche per codificare al meglio le informazioni.
L’intento è quello di compilare in maniera semi-automatica un glossario di parole sia in arabo standard sia in dialetto egiziano, contribuendo a sviluppare una metodologia trasversale, eventualmente applicabile anche ad altri testi, letterari e non.
---
CURRICULUM VITAE)
11/2023 - oggi: Dottoranda in Civiltà dell'Asia e dell'Africa presso l'Istituto Italiano di Studi Orientali (ISO) – Sapienza Università di Roma.
2020 - 2023: Laurea Magistrale in Lingue Moderne per la Comunicazione Internazionale (LM-38) – Università degli Studi Roma Tre.
Titolo della tesi: "Analisi computazionale di un’opera in arabo egiziano: annotazione Universal Dependencies e compilazione di un glossario".
2016 - 2020: Laurea Triennale in Lingue e Mediazione Linguistico-Culturale (L-12) – Università degli Studi Roma Tre.
Titolo della tesi: "Analisi di un corpus parallelo bilingue italo-arabo: annotazione UD e marcatura degli equivalenti traduttivi".