Sk:MinvSKAddress
MinvSKAddress je import adries poskytnutých Ministerstvom vnútra (ďalej MV) Slovenskej republiky. Myšlienka na zrealizovanie importu sa začala materializovať v roku 2017 po tom, ako si členovia komunity všimli, že dáta boli prelicencované pod OSM-kompatibilnou licenciou CC-0. Komunita import odsúhlasila a konkrétnejšie kroky a príprava na import začala v decembri 2017.
Zdôvodnenie
Presnosť a úplnosť adresných dát je veľmi dôležitým prvkom pri navigovaní v mestách. To, že je o takéto dáta záujem možno často pozorovať napr. v užívateľských recenziách navigácii využívajúcich OSM podklady (MapFactor Free, maps.me).
Okrem toho kompletnejšie adresy umožnia alebo aspoň uľahčia importovať mnohé ďalšie dáta, pri ktorých z rôznych dôvodov (často nejasný alebo licenčne nepoužiteľný zdroj) nie je možné použiť geografické súradnice.
Licencia
Údaje pochádzajú z https://data.gov.sk/dataset a sú dostupné pod licenciou CC0, ktorá je plne kompatibilná s licenciou ODbL (pozri Import/ODbL_Compatibility). Zmeny budú označené nasledovne:
comment = $NAZOV OBCE$ - minvskaddress (by $USER$) source = minvskaddress YYYY-MM
Predpokladá sa výhradné použitie editora JOSM.
Základné princípy
- Už existujúce (zmapované) čísla (súpisné či orientačné) v OSM majú väčšiu váhu ako dáta z MV. Toto však neplatí, ak adresa pochádza z importu KaporSKAddress.
- Obecné úrady spravidla disponujú presnejšími a aktuálnejšími údajmi týkajúcich sa názvoslovia ulíc. V prípade pochybnosti, navštívte webstránky obce (príp. ich priamo kontaktujte).
- Kombinácia reštaurácia, obchod, úrad a podobne + adresa nie je považovaná za adresný bod.
- Je neprípustné, aby jedna obec používala rozdielnu formu zápisu toho istého mena, teda rôzne formy zápisu názvu (B. Němcovej vs B. Nemcovej).
- Všetky úpravy budú vykonávané pod vyhradeným účtom minvskaddress_bot (meno užívateľa bude obsiahnuté v komentári ku zmene).
- Pre diskusiu nejasností je ideálnym miestom google skupina osm_sk.
- Pri vývoji skriptov je snaha o minimalizovanie závislosti na "tretej osobe". Maperi podieľajúci sa na importe ho tak budú mať možnosť pripraviť si dáta "doma".
- KaporSKAddress je považovaný za predchodcu tohto importu. Nakoľko obsahuje viac chýb a nie je naďalej aktualizovaný, postupne ho nahradí MinvSKAddress.
Popis vstupných dát
Štruktúra vstupných dát je popísaná na stránkach data.gov.sk:
Rozsah a kvalita vstupných dát
Dáta z MV obsahujú približne 1 112 000 adresných bodov, z toho 574 000 je orientačných. Vizuálnou kontrolou bolo zistené, že približne 9 000 bodov z nich má prehodenú zemepisnú šírku a výšku - súradnice takýchto bodov budú počas spracovania opravené. Niekoľko adries obsahuje súradnice mimo územia SR - tieto budú použité len na prípadné doplnenie chýbajúcich súpisných čísiel.
Na prvý pohľad vyzerajú dáta kompletne, no približšom skúmaní a porovnaní s OSM možno nájsť:
- Ulice, ktorých čísla takmer úplne absentujú,
- chýbajúce súpisné čísla záhradkárskych oblastí (tie poväčšinou možno nájsť v KaporSKAddress),
- chýbajúce adresné body pre obce Čamovce a Podrečany,
- gramatické a typografické chyby a preklepy v názvoch ulíc.
Tagovanie
Import sa týka nasledovných tagov:
addr:street
Pôvodné meno ulice/námestia, tak ako ho sprístupňuje MV, je upravené nasledovne:
- slovo Ulica/Ul. je odstránená (Ul. Májová -> Májová)
- slovo nám. je rozvinuté na námestie (Nám. slobody -> Námestie slobody)
- za bodku je vložená medzera (1.mája -> 1. mája)
- medzera na začiatku a konci je odstránená ("Tehelná " -> "Tehelná")
- slová ako námestie, mieru, svätého, partizánov, park, cesta.. sú prepísané malými písmenami, ak sa nejedná o prvé slovo v názve (Námestie Mieru -> Námestie mieru)
- zjavné gramatické chyby a preklepy sú opravené - to sa týka predovšetkým nesprávne použitých diakritických znamienok (Dlha -> Dlhá, Hájská -> Hájska)
Takto upravený názov je považovaný za oficiálny.
Hodnota addr:street musí byť zároveň použitá v kľúči name prislúchajúcej cesty.
addr:conscriptionnumber
Súpisné číslo stavby tak, ako ho zverejňuje MV (cisla budov).
addr:streetnumber
Orientačné číslo vchodu tak, ako ho zverejňuje MV (vchody).
addr:housenumber
Pre obce, ktoré majú pomenované ulice a domy osadené orientačnými číslami je hodnota tohto kľúča:
addr:conscriptionnumber / addr:streetnumber
Pre zvyšné obce tento tag duplikuje hodnotu addr:conscriptionnumber.
Hromadná úprava hodnôt tohto kľúča bude vykonaná v záverečných fázach importu, dovtedy bude slúžiť ako podklad pri vypĺňaní hodnôt pre súpisné a orientačné čísla.
name / alt_name
Názvy ulíc po úpravách (pozri addr:street). V prípade, že v OSM má cesta rozvinutejší tvar s pridanou informáciou (Janka Kráľa miesto J. Kráľa, Ivana Krasku miesto I. Krasku), táto sa prekopíruje do alt_name.
source:addr:* / source:name
Pre nové/upravené tagy na existujúcich elementoch bude pridaný príslušný tag source:addr:* alebo source:name vyplnený hodnotou minvskaddress. Pre nové elementy bude použitá kombinácia source=minvskaddress.
Fázy importu
Prípravná fáza
4Q 2017 + 1Q 2018 (dokončená)
V rámci príprav sa zisťujú nasledovné skutočnosti:
- importu sa plánuje aktívne účastniť zopár jednotlivcov - skúsených maperov
- súradnice umiestnenia vchodov nie sú natoľko presné, aby mohli slúžiť ako ukazateľ skutočnej polohy vchodu (niekedy vstup do garáže a pod.)
- údaje na niektorých miestach zaostávajú za realitou aj o niekoľko rokov
- databáza môže obsahovať niekoľko verzii názvu objektu, toto je treba zohľadniť a do úvahy vziať vždy najaktuálnejšiu revíziu
- názvy ulíc obsahujú mnoho chýb (diakritika, nesprávne veľké/malé písmená, rozdiely medzi obcami, ale aj v rámci jednej obce)
Nakoľko je v záujme OSM komunity dbať na kvalitu importovaných dát, je vyvinutá snaha o opravu problematických názvov ulíc podľa kľúča uvedeného v sekcii o tagovaní addr:streetnumber. Na zreteľ však je brané aj to, ako veľmi konkrétna obec na názve trvá (najvyššiu váhu pritom ma VZN na stránke obce). Ak to vyzerá tak, že sa sama obec nevie dohodnúť, ako má názov ulice znieť, je vybraný gramaticky správny a/alebo častejšie používaný, prípadne ten, ktorý už je použitý v OSM.
Ujednotenie názvov ulíc
1Q 2018--2020 (prebieha)
Pre ďalší postup je nevyhnutné, aby bolo možné použiť addr:street, resp. názov ulice ako spoločný kľúč identifikujúci ulicu medzi OSM a údajmi z MV. Je teda potrebné, aby sa napr. ulica J. Kráľa udávala takto v oboch zdrojoch (a nie napr. Janka Kráľa vs J. Kráľa). Pre tento účel sú vytvorené zoznamy, ktoré obsahujú body pomenované podľa názvu ulice, ku ktorej prislúchajú.
Úlohou mapera je skontrolovať či addr:street (adresné body) i name (ulica) obsahuje rovnakú hodnotu ako pripravené dáta. Následne nezrovnalosti buď opraviť alebo - v prípade pochybností - nahlásiť do mailing listu. Úpravy budú prebiehať postupne - po obci.
Pôvodné názvy ulíc sú presunuté do tagu alt_name, ak obsahujú užitočnú informáciu (typicky "rozbalené" krstné meno osobnosti).
Tagovanie
- name - upravený názov z dát MV
- alt_name - (voliteľne) pôvodný obsah name v prípadoch, kedy obsahuje dodatočnú informáciu
- source:name - nastavený na minvskaddress
Doplnenie chýbajúcich tagov
2020 (plánovaná)
Využitím spoločného kľúča medzi dátami OSM a MV a príbuznosťou podľa hranice obce sú doplnené nasledovné tagy:
- addr:conscriptionnumber (spoločný kľúč addr:street a addr:streetnumber)
- addr:street (spoločný kľúč addr:conscriptionnumber a addr:streetnumber)
- addr:streetnumber (spoločný addr:conscriptionnumber a addr:street)
- v prípade budovy s viacerými vchodmi v tejto fáze nie sú vchody do OSM pridávané (pridávame tagy, nie nové elementy)
Riešenie konfliktných tagov
2020 (plánovaná)
Vygenerované zoznamy kolidujúcich tagov (napr. addr:street + addr:streetnumber ukazuje v oboch datasetoch na iný addr:conscriptionnumber) sú podrobené kontrole jednotlivca. V prípade, že konflikt nie je možné vyriešiť, údaje v OSM ostanu bez zmeny.
Kontrola/oprava výrazných polohových rozdielov
2021/2021
Pridávanie nových elementov
2021
Team
- Jose Riha (koordinátor)
- Malin (website s prehľadom importu)
- Durko_freemap
- elfenlied
- segi
- synalik
Poďakovanie takisto patrí:
- Poťovi za kontrolu a konzultáciu
- pánovi Radovi Garabíkovi a pani Jarmile Čásarovej za konzultáciu pri opravovaní gramaticky nesprávnych názvov ulíc
Prispievanie
Záujem o pomoc s importom vyjadruje maper v diskusnej skupine osm_sk@googlegroups.com. Následne mu bude zaslané heslo k uploadovaciemu účtu minvskaddress_bot a ďalšie inštrukcie. Od mapera sa očakáva dobrá znalosť editoru JOSM.