Soutenance de thèse

Le Lundi, 4. novembre 2024 -
14:30 - 19:00
Salle des Actes à l’Université Paul-Valéry Montpellier 3 - Site Saint Charles

Mme Carine KOTOB

Soutiendra lundi 4 novembre 2024 à 14 h 30

Salle des Actes n° 011 à l’Université Paul-Valéry Montpellier 3, Site Saint-Charles 1

une thèse de DOCTORAT

Discipline : Études culturelles spécialité Études arabes

Titre de la thèse : Contraintes et limites de la traduction automatique en accès libre. Analyse des problèmes liés à la traduction bi ou trilingue des noms propres (arabe/français/anglais) sur Internet.

Composition du jury :

  • Mme Solange CRUVEILLÉ, Professeure, Université Paul-Valéry Montpellier 3
  • M. Mohamed EMBARKI, Professeur, Université de Franche-Comté
  • Mme Saba FARES, Professeure, Université Toulouse - Jean Jaurès
  • M. Abdenbi LACHKAR, Professeur, Université Paul-Valéry Montpellier 3, directeur de thèse
  • M. Akram ODEH, Professeur, Université de Jordanie
  • Mme Madeleine VOGA, Professeure, Université Paul-Valéry Montpellier 3

Résumés de la thèse

A l'ère de la mondialisation et des technologies de l'information et de l’intelligence artificielle, la traduction automatique (TA) est devenue un outil de première nécessité dans la transmission des savoirs. Cette thèse a pour objet l’examen de la TA des entités nommées dont les noms propres (NP) de l’arabe vers le français et vice-versa. La traduction du nom propre joue un rôle crucial dans le processus de la traduction, puisqu'elle permet l’identification précise des personnes, des lieux, des organisations, etc. à travers les langues. Malgré un grand nombre d'études et des résultats significatifs concernant la reconnaissance des entités nommées, dans la communauté du TAL dans le monde, il manque encore des recherches sur la traduction automatique des noms propres (TANP) pour l’arabe. En raison des caractéristiques différentes d'écriture de NP, la translittération ou la transcription et la traduction de l’arabe vers le français et inversement et l’immensité de la superficie du Monde Arabe (22 pays), la question de l’entité nommée est particulièrement riche et complexe et mérite beaucoup de recherches.
Cette étude se concentre sur la compréhension des problèmes générés par de TANP en arabe et braque la lumière sur la traduisibilité des anthroponymes et des toponymes et de leurs dérivés. Si les résultats obtenus sont parfois décevants, cependant, nous avons noté, au cours de trois années de recherches, une nette amélioration à ce niveau. Un corpus linguistique parallèle constitué de noms de personnes et de lieux, nous a permis de décrire l’état des lieux de la TANP en arabe dans le souci d’associer, dans le futur, nos efforts  à ceux des spécialistes en TAL et pour contribuer à l’amélioration de la TANP du et vers l’arabe.

__________________________________

In the era of globalization and information technology and artificial intelligence, machine translation (MT) has become an essential tool in the transmission of knowledge. This thesis aims to examine the MT of named entities including proper nouns (PN) from Arabic into French and vice versa. The translation of proper names plays a crucial role in the translation process since it allows the precise identification of people, places, organizations, etc. across languages. Despite a great number of studies and significant results regarding named entity recognition, in the natural language processing (NPL) community worldwide, there is still a lack of research on machine translation of proper names (MTPN) for Arabic. Due to the different characteristics of PN writing, transliteration or transcription, translation from Arabic into French, and the vastness of the Arab World (22 countries), the question of named entities is particularly rich and complex and it deserves much research.
This study focuses on understanding the problems generated by MTPN in Arabic and sheds light on the translatability of anthroponyms and toponyms and their derivatives. If the results obtained are sometimes disappointing, however, we have noted during three years of research a clear improvement at this level. A parallel linguistic corpus made up of the names of people and places allowed us to describe the state of MTPN in Arabic to associate, in the future, our efforts with the NLP specialists and to contribute to the improvement of MTPN from and into Arabic.

Dernière mise à jour : 25/09/2024