Le système d’écriture de l’arabe dans le codage informatique : besoins et contraintes Arabic Writing System in Computer Coding: Needs and Constraints

Main Article Content

Mahmoud Fawzi MAMMERI

Abstract

ABSTRACT: The writing system of any language is encoded on computer in two main parts: one of which concerns alphabetical graphemes, the other, non-alphabetical graphemes (ponctuations and other typographical signs). The first part is always language specific (script). The second, given the universal character of non-alphabetical signs, is shared by all the scripts and languages of the world. This article discusses the needs of the Arabic writing system in relation to the coding of these two types of graphemes in digital systems and some of the constraints that guided its implementation in the Unicode standard. This work leads to a discussion of gaps in some aspects of this implementation and possible improvements.


RÉSUMÉ : Le système d’écriture de toute langue est codé sur ordinateur en deux grandes parties : une partie qui concerne les graphèmes alphabétiques et une autre qui concerne les graphèmes ponctuo-typographiques. La première partie est toujours spécifique à une langue (script). La seconde, étant donnée le caractère universel des signes ponctuo-typographiques, est partagée par l’ensemble des scripts et langues du monde. Cet article parle des besoins du système d’écriture de l’arabe par rapport au codage de ces deux types de graphèmes dans les systèmes numériques et de quelques unes des contraintes qui ont conditionnées son implémentation dans le standard Unicode. Ce travail nous mène à une discussion sur des lacunes concernant certains aspects de cette implémentation et les améliorations possibles.


 

Article Details

How to Cite
MAMMERI, M. F. (2024). Le système d’écriture de l’arabe dans le codage informatique : besoins et contraintes. ALTRALANG Journal, 6(2), 199-212. https://doi.org/10.52919/altralang.v6i2.479
Section
Articles
Author Biography

Mahmoud Fawzi MAMMERI, Ecole Supérieure de Commerce ESC Alger, Algérie

Biographie de l’auteur

MAMMERI Mahmoud Fawzi est professeur à l’ESC Alger. Il a un doctorat en science en traitement automatique des langues. Il enseigne depuis plus de vingt ans l’informatique aux informaticiens et aux non informaticiens, notamment aux élèves de l’ESC Alger. Ses travaux de recherche portent essentiellement sur le TAL et la syntaxe de l’arabe. Il s’intéresse aussi au système d’écriture de l’arabe à l’ère du numérique. Il a été chercheur associé au CRSTDLA pendant une dizaine d’année et a participé à plusieurs projets de recherche dont un projet TASSILI de 2014 à 2017.

References

• ANDRIES, P. (2002). « Introduction à Unicode et à l'ISO 10646 », Document numérique, 3(3-4), 51-88. Disponible sur [https://doi.org/10.3166/dn.6.3-4.51-88], consulté le 28/5/2021.
• THE UNICODE CONSORTIUM. (2020). « The Unicode Standard, Version 13.0 – Core Specification », Mountain View, CA. ISBN 978-1-936213-26-9, Disponible sur [https://www.unicode.org/versions/Unicode13.0.0/], consulté le 28/5/2021.
• AḤMAD, Zakī. (2013). « Al-tarqīmu wa ‘alāmātuhu fī al-luġati al-‘arabiyyat », 1912, Le Caire : Kalimāt li-al-ṭarǧamati wa al-našri.