FR:Noms multilingues

From OpenStreetMap Wiki
Jump to navigation Jump to search
Logo. Élément cartographique : Noms multilingues
One example for Élément cartographique : Noms multilingues
Description
Clés et attributs utilisés avec des suffixes de langue
Attributs

Cas de multilinguisme des noms géographiques

Dans un certains nombre de cas, il n'y a pas de noms uniques pour un même endroit (toponymes) ou une même dénomination (chemins, routes, rues, places, lieux-dits, etc.). Cela peut être du à différentes raisons :

  • une ou deux langues sont utilisées au niveau local. Dans certains cas, les noms apparaissent sur les plaques de rues et/ou les panneaux indicateurs.

Généralement, les noms multiples apparaissent dans un ordre déterminé, le premier étant soit le nom local, soit le nom considéré comme officiel dans la zone concernée (dans la langue officielle de l'État ou dans celle de la région administrative).

  • Des manières spécifiques de doubler ou tripler les noms peuvent venir de la nécessité de faire des translittérations (utilisation conjointe d'alphabets différents, lesquels sont latins ou non-latins)
  • De manière controversée, certains souhaitent ajouter de manière visible sur la carte glissante le nom en alphabet non-latin suivi de la translittération habituellement admise en anglais, qu'il s'agisse des noms de lieu ou des routes ou des rues.

Les codes ISO 639

Sur OpenStreetMap, les étiquettes de langue BCP 47 (standard web) essentiellement basées sur les codes de la norme ISO 639 (avec des extensions possibles par écriture, région ou variante), sont utilisés pour codifier les langues, dans 3 séries :

  • Les codes langue de la série ISO 639-1 couvrent les langues les plus répandues et un certain nombre de moins répandues. Chaque code comporte 2 lettres latines minuscules. Ex. : bo = tibétain, br = breton
  • Les autres langues sont couvertes, soit par la série ISO 639-2 (T), soit par la série ISO 639-3 qui comportent des codes à trois lettres.

Note : les langues de la série 1 ont aussi des codes dans les séries 2 et 3. Par ex. pour le tibétain : ISO 639-1 "bo" - ISO 639-2 (T) "bod" - ISO 639-2 (B) "tiv" - ISO 639-3 "bod". La série ISO 639-2 (T) à usage technique qui reprend le nom dans la langue originelle est préférée sur OSM à la série ISO 639-2 (B) à usage bibliographique: le code préféré pour BCP 47 est celui de la ISO 639-1 ("bo") et sera utilisé en priorité sur OSM. Toutefois tous les codes ISO 639 ne sont pas acceptés (parce certains sont interdits dans BCP 47 du fait qu’ISO 639 a des versions incompatibles entre elles et n'assure par la stabilité des codes avec le temps).

Pour plus de détail sur BCP 47, consultez la RFC 4646 ou ses successeurs dans la série BCP 47 (laquelle contient également une description exacte des codes ISO 639 qui ont été retenus comme valides), ainsi que le registre IANA des étiquettes et sous-étiquette de langue pour BCP 47, qui liste les codes valides avec leurs propriétés (et qui répertorie les étiquettes dépréciées pour lesquels il suggère des étiquettes de remplacement). Ensuite consulter la norme ISO 639-3 pour la classification de toutes les langues : ne pas utiliser les codes ISO 639 spéciaux qui ne désignent pas une langue individuelle (ou macro-langue) mais des groupes de langue ou des pseudo-langues, ni les codes ISO 639 qui ont été retirés de la norme 639 (le standard BCP 47 donne des substitutions possibles de certains de ces anciens codes afin d'assurer une compatibilité ascendante). Consulter la norme ISO 15924 pour les codes d'écriture, et les normes ISO 3166 on UN M.49 pour les régions géographiques qui sont admis dans le registre IANA pour désigner des spécialisations ou variante d'une même langue.

Bien que les étiquettes de langue dans BCP 47 (comme dans ISO 649) n'ont pas de casse significative, dans OSM, les étiquettes doivent écrire les codes langue en minuscule, les codes région en capitales, sous leur forme canonique décrite dans BCP 47, afin de pouvoir distinguer les clés spécialisées par langue de celles spécialisées par région. Quand une étiquette de langue comprend plusieurs sous-étiquette, le séparateur standard à utiliser est uniquement le trait d'union (-) même si la norme BCP 47 admet aussi le soulignement (_) comme équivalent.

Enfin ne pas confondre les codes langue et codes pays (pour le japonais le code est "jp" : "JA" désigne le Japon) ; et ne pas utiliser les codes langues non standards utilisés comme liens interwiki dans Wikipédia. Par exemple, "en-simple" n'est même pas une étiquette BCP 47 valide pour désigner cette variante de l'anglais spécifique à Wikipédia, non pas comme une langue différente mais comme un style grammatical et de présentation orthographique des articles ou de son interface : OSM préfère les noms anglais standards dans l'attribut "name:en=*" (les noms "anglais simplifiés" sont des noms alternatifs dans OSM, à indiquer dans l'attribut "alt_name:en=*", s'ils sont différents du nom standard).

La translittération

Évitez la translittération (en) sauf dans des cas particuliers.

Si nécessaire, utilisez ces méthodes de translittération pour les langues non-latines.

Arabe : DIN 31635

Chinois : La translittération officielle du chinois mandarin est le pinyin. Codes zh_py (pas de tons) et zh_pyt (avec tons)

Japonais : 3 systèmes sont en discussion

Les attributs (tags)

La liste complète des attributs qui sont la clé de niveau du nom (key) et la valeur (value) indiquant le nom est ici dans FR:Mapfeatures Le principe général est de réserver la clé name au nom officiel (qui peut être dans des langues différentes à l'intérieur d'un État) et de coder la langue second avec la valeur name:codeISO639delalangue. La clé alt_name ne concerne qu'une seconde manière de dénommer, mais s'il s'agit d'une ancienne appellation, on utilise old_name.
reg_name est à utiliser, si aucun code ISO 639 n'est disponible.

Conventions admises par pays

Belgique

Le pays comprend 5 zones linguistiques :

  • La zone dont la langue officielle est l'allemand (régions d'Eupen et de Saint-Vith au Sud-Est)
  • La zone dont la langue officielle est le français, appelée Wallonie, au Sud
  • La zone dont la langue officielle est le néerlandais, appelée Flandre, au Nord
  • La zone où le français et le néerlandais sont à parité officielle à Bruxelles et dans 18 communes alentours, au centre du pays.
  • Les zones considérées comme "des communes à facilités" : la langue officielle est soit l'allemand, le français ou le néerlandais et où une deuxième langue est acceptée administrativement.

Dans les 3 premières zones, la clé "name" est dans la langue officielle et les autres versions dans les autres langues de Belgique ("name:de", "name:fr" et "name:nl" selon les cas).

A Bruxelles et alentours, on utilise au moins la clé "name" contenant la version en français et celle en néerlandais, puis les 2 clés des langues co-officielles.

Exemple :

  1. name=Avenue Louise - Louizalaan
  2. name:fr=Avenue Louise
  3. name:nl=Louizalaan

Dans les communes à facilités, on utilise au moins la clé "name" contenant la version de la première langue officielle et celle de la deuxième langue, puis les 2 clés des langues.

Exemple :

  1. name=Rue du Plavitout - Plavitoutstraat
  2. name:fr=Rue du Plavitout
  3. name:nl=Plavitoutstraat

Canada

France

Plaque de rue bilingue français + catalan à Perpignan.
name=Rue de la Poissonnerie
name:ca=Carrer de la Peixoneria

En dehors du français qui est la langue officielle, d'autres langues sont utilisées. Pour les noms de voie et les panneaux indicateurs routiers, le français ou la version en langue locale parfois francisée, tels qu'ils sont reconnus par l'administration (INSEE et IGN) sont toujours en tête. Le nom officiel, tel qu'il figure dans le COG de l'INSEE ou le cadastre doit être sous l'attribut name.

  • Les noms du niveau inférieur à la commune et les noms des voies peuvent être dans différentes langues seuls ou en composition bilingue, voire trilingue.
  • La situation évolue beaucoup en fonction des politiques locales qui amènent à remplacer des formes françaises ou francisées par des formes en langue locale ou à rectifier l'orthographe de noms locaux au profit de graphies plus modernes.

Il est nécessaire de rappeler que les langues locales apparaissent fréquemment dans le nom officiel taggé en name et dans ce cas, il convient de doubler par le tag name:[code ISO] en répétant la même dénomination. Dans certains cas, on aura une orthographe officielle ancienne en name et une orthographe modernisée en name:[code ISO], si celle-ci est approuvée par un organisme public.

Codes ISO des langues de France :

  • Alsacien gsw (code de l'allemand du Sud-Ouest qui inclut également les différents dialectes alémanique du Pays de Bade et de la Suisse)
  • Arpitan (appelé antérieurement franco-provençal) frp (zones géographiques du Jura et de la Savoie)
  • Basque, voir Euskara
  • Breton br - Page spécifique sur les noms géographiques et les toponymes en breton
  • Catalan ca
  • Corse co
  • Créoles guadeloupéen, guyanais, martiniquais, réunionnais : cpf en ISO 639-2 - En ISO 639-3 (anglais) : créole guadeloupéen gcf, créole guyanais gyn, créole réunionnais gcr
  • Euskara (appelé aussi basque) eu
  • Flamand vls
  • Français fr (ne doit pas être utilisé sur le territoire de la République française)
  • Francique frk (Nord et Est Moselle)
  • Franco-provençal, voir Arpitan
  • Occitan oc (concerne l'auvergnat, le béarnais, le bigourdan, le gascon et le provençal)
  • Tahitien ty (tah en ISO 639-3)

Pour les langues romanes du Nord-Ouest, le gallo et le normand, il est possible d'utiliser les codes BCP 47, name:fr-x-gallo et name:fr-x-norman. Cela permet des cartes de visualisation, mais, pas une interopérabilité avec les autres codes, puisque qu'aucun document d'accord international n'a été élaboré.

Luxembourg

Maroc

Par consensus de la communauté, les noms des villes et autres zones administratives (du pays dans son ensemble jusqu'aux arrondissements) sont écrits en français, tamazight (berbère) et arabe, dans cet ordre.

name=Casablanca ⵜⴰⴷⴷⴰⵔⵜ ⵜⵓⵎⵍⵉⵍⵜ الدار البيضاء
name:ar=الدار البيضاء
name:fr=Casablanca
name:zgh=ⵜⴰⴷⴷⴰⵔⵜ ⵜⵓⵎⵍⵉⵍⵜ

NOTE: ce qui suit est acceptable comme alternative pour la balise name:zgh=* :
name:ber=ⵜⴰⴷⴷⴰⵔⵜ ⵜⵓⵎⵍⵉⵍⵜ

Les panneaux de signalisation au Maroc sont principalement écrits en arabe, certains incluant également le français et / ou le tamazight. Si les noms français ou tamazight sont connus (même s'ils ne sont pas sur un panneau particulier), la balise préférée les inclut. L'ordre est la même que pour les villes.

name=Avenue Rabat شارع الرباط
name:ar=شارع الرباط
name:fr=Avenue Rabat

Comme pour les noms de villes, si la version berbère (ou tamazight) est incluse, elle apparaît entre les versions française et arabe dans le nom complet, avec une clé name:zgh=* ou name:ber=*.

À propos de la "règle du premier mappeur"

Notez que la "règle du premier mappeur" est maintenant obsolète. Le consensus dans la communauté .ma est d'utiliser "fr - ar" (or "fr - zgh - ar") pour toutes balises name=* et addr:street=*, si connues, et inclure des langues spécifiques dans les sous-balises. La cohérence des données est plus importante que qui est venu en premier et quelles sont ses préférences.

À propos de "mappez ce qui se trouve sur le terrain"

Si les noms français ou tamazight sont connus (même s'ils ne sont pas sur un panneau particulier), la balise préférée les inclut. En général, les termes arabes sont traduits (et non translittérés) en leurs équivalents français: "Rue" et non "Zanqat" (pour زنقة) et "Avenue" (ou "Boulevard") et non "Chari" (pour شارع). Cependant, si le panneau sur le terrain utilise un mot qui a été translittéré en écriture latine, suivez cela.

Suisse

Pour les villes bilingues ou ceux qui utilisent (partiellement) des inscriptions dans deux langues, on utilise au moins la clé "name" contenant la version en français et celle en allemand, puis les 2 clés des langues co-officielles.

Exemple :

  1. name=Rue des Alpes / Alpengasse
  2. name:fr=Rue des Alpes
  3. name:de=Alpengasse
  • Fribourg: L'ordre est en général français / allemand. Dans les parties rive droite de la Sarine et les quartiers traditionnellement alémanique (Neuveville, Auge), c'est allemand / français. (voir: [1])
  • Bienne: L'ordre est en général allemand / français. (voir: [2] ou [3])
  • Gurin L'ordre est en général allemand / italien.