Identificateur

En programmation informatique, un identificateur ou identifiant est un mot choisi par le programmeur et qui, tel une étiquette, désigne un élément du programme : variable, constante, procédure, type, etc.

On peut distinguer les langages de programmation suivant les règles d'écriture des identificateurs, et notamment les jeux de caractères autorisés : ASCII uniquement, jeux de caractères locaux, ou Unicode.

Langages à identificateurs Unicode

Unicode définit dans une de ses annexes^[1], une base pour spécifier les identificateurs, tout en permettant à chaque langage de fonctionner sur des variantes de cette base.

Les langages Ada, Java, Microsoft .NET, Perl 5.16, Perl 6, StarOffice Basic sont compatibles avec des identificateurs Unicode.

Pour le langage C, la norme ISO/IEC 9899:1999 définit dans son annexe normative D les caractères autorisés dans les identificateurs, en reprenant la norme ISO/IEC TR 10176:1998^[2]. Sont notamment permis des ensembles de caractères latins, grecs, cyrilliques, tibétains, et CJK. 14 plages de chiffres, en plus de la plage ASCII, ainsi que certains caractères spéciaux sont également autorisés.

Le langage Python ambitionne de pouvoir supporter des identificateurs dans des langues autres que la seule langue anglaise avec le PEP 3131 ^[3].

Règles de nommage

Les développeurs ont parfois besoin d’exprimer les concepts qu’ils utilisent avec des mots et des symboles qui leur sont familiers, en particulier pour les non anglophones.

Par ailleurs, avec l’usage croissant d’Internet, l’usage d’Unicode se répand. En programmation, il est présent :

dans les chaînes de caractères des langages, en particulier Java et .NET représentent par défaut toutes les chaînes en Unicode ;
dans les systèmes d’exploitations, en particulier dans Microsoft Windows.

Les langages s’interfaçant avec Java et .NET nécessitent le support d’identificateurs Unicode, pour être interopérables. Sans cela, une portion de l’espace de noms ne serait pas accessible.

Exemples

En Delphi les anciens identificateurs commençaient par a..z ou tiret bas (_), suivi de a..z, 0..9, ou tiret bas.
Avec Unicode : suite de caractères alphabétiques Unicode ou tirets bas.

Relation avec les métadonnées

Dans les langages de balisage, mais également dans tous les types de ressources informatiques et tous les types d’application, on peut employer des métadonnées pour décrire les données. L’identifiant est l’un des éléments couramment employés pour l’accès aux ressources (URI). L’identifiant peut faire l’objet de règles de nommage.

Voir aussi

Notes et références

↑ (en)UAX #31: Identifier and Pattern Syntax
↑ ISO/IEC TR 10176:1998, Technologies de l’information — Lignes directrices pour la préparation des normes des langages de programmation
↑ (en) « PEP 3131 - Supporting Non-ASCII Identifiers », sur python.org (consulté le 25 décembre 2023).

Liens externes

(en) https://www.unicode.org/reports/tr31/
(en) http://www.adahome.com/rm95/rm9x-02-01.html
(en) http://clisp.sourceforge.net/impnotes.html#encoding

v · m Programme informatique
Compilation	Analyse lexicale Analyse syntaxique Assemblage Fichier objet Code source Compilateur Décompilateur Édition de liens Identificateur Moteur de production Précompilateur Préprocesseur
Exécution	Configuration Interprète Machine virtuelle Offset Portabilité Processus Point d'arrêt Thread Segmentation
Bug	Débogueur Dépassement d'entier Soupassement arithmétique Dépassement de pile Dépassement de tampon Dépassement de tas Effet de bord Erreur de segmentation Exception Fuite de mémoire Plantage Test
Catégorie Compilateur Bug