Integracja danych CRFOP
Cele
Integracja danych Centralnego Rejestru Form Ochrony Przyrody z bazą danych OSM w zakresie integracji pomników przyrody
Harmonogram
Dane zostaną wprowadzone do końca 2019 roku
Dane Importowane
Linki do danych
Data source site: http://www.gdos.gov.pl/dane-i-metadane
Data license: http://crfop.gdos.gov.pl/CRFOP/faq.jsf
Dane Projektu
https://github.com/openstreetmap-polska/CRFOP.git
Typ importu
Dane w większości są danymi punktowymi. Po weryfikacji danych, by uniknąć dublowania zostaną wprowadzone przez import JOSM
Przygotowanie danych
Uproszczenie
Dane są dostępne na stronie https://www.gdos.gov.pl/dane-i-metadane w postaci spakowanego pliku SHP z podziałem na województwa. W każdej paczce są dostępne następujące warstwy danych:
- PomnikiPrzyrodyMPoint - zawiera pkt. pomocnicze dla pozostałych obiektów, mogą to być np. inne wejścia do jaskini (tej warstwy nie integrujemy po ustaleniach z pracownikami CRFOP - mogą być tam błędy, lub zdublowane pkt. z warstwą Point)
- PomnikiPrzyrodyPoint - zawiera pkt. z współrzędnymi pojedynczych obiektów przyrodniczych.
- PomnikiPrzyrodyPolygon - zawiera poligony całych obszarów chronionych jak np. las
Dane dostępne są jako pkt. nie wymagają uproszczenia. Konieczna weryfikacja danych z warstw Polygon.
Tagowanie
- ref:gid - numer z rejestru CRFOP pozwalający jednoznacznie określić obiekt
- ref:INSPIRE - jw. dotyczy rejestru inspire
- natural - wartość definiowana w zależności od obiektu
- tree - dla drzewa (Uwagaǃ Zgodnie z metodologią CRFOP jałowce, cyprysiki oraz żywotniki w przypadku większych okazów są oznaczane jak drzewa, konieczna weryfikacja po gatunku)
- leaf_type=broadleaved - dla drzew liściastych
- leaf_type=needleleaved - dla drzew iglastych
- shrub - dla krzaków
- stone - dla głazów lub kamienie
- rock - dla skał i skałek
- spring - dla żródeł
- tree - dla drzewa (Uwagaǃ Zgodnie z metodologią CRFOP jałowce, cyprysiki oraz żywotniki w przypadku większych okazów są oznaczane jak drzewa, konieczna weryfikacja po gatunku)
- name - nazwa jeśli występuje
- species - gatunek, nazwa łacińska, jeśli występuje
- species:pl - gatunek, nazwa polska, jeśli występuje
- url:cfop - link do strony obiektu w rejestrze CRFOP
Dla wszystkich obiektów:
- denotation=natural_monument
- protected=yes
Obróbka danych informacje
Dane wymagają zmiany układu współrzędnych na WGS84
Dany warstw "Point" wymagają rozdzielenia dla poszczególnych wartości klucza natural - należy je integrować osobno.
Dane warstw "Polygon" konieczne wprowadzenie indywidualne.
Przydatne oprogramowanie
- http://openrefine.org/ - oprogramowanie do czyszczenia i edytowania danych
- https://www.qgis.org/pl/site/ - oprogramowanie GiS
Folder "data" w repozytorium Github-a zawiera następujące plikiː
- nazwawojewództwa ̠all.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do analizy, niezawierają tagów związanych z typem listowia, dokonana korekta kwalfikowania Jałowca, Cyprysika jako drzewa.
- nazwawojewództwa ̠tree.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm
- nazwawojewództwa ̠stone.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm.
- nazwawojewództwa ̠shrub.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm.
- nazwawojewództwa ̠rock.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm.
- nazwawojewództwa ̠spring.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm.
- nazwawojewództwa ̠inne.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do weryfikacji, te wartości trzeba będzie ręcznie zweryfikować. Zawiera oprócz obiektów oznaczonych jako inne również jaskinie, jary oraz wodospady.
Folder "shp" w repozytorium Github-a zawiera następujące plikiː
- nazwawojewództwa ̠tree.csv - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do konwersji na osm (Konwersja poprzez JOSM)
Folder "osm" w repozytorium Github-a zawiera następujące plikiː
- nazwawojewództwa ̠tree.osm - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do zweryfikowania czy niewprowadzamy zdublowanych obiektów.
- nazwawojewództwa ̠stone.osm - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do zweryfikowania czy niewprowadzamy zdublowanych obiektów.
- nazwawojewództwa ̠shrub.osm - UTF-8; WGS84 (wkt geom) - Nagłowki mają nazwy klucze, w komórkach wartości. Plik przygotowany do zweryfikowania czy niewprowadzamy zdublowanych obiektów.
Procedura obróbki danych
- Qgis - zmiana układu współrzędnych z EPSGː2180 na EPSGː4326 - import to pliku wojewodztwa ̠ all.csv
- OpenRefine - edycja danych
- Dodanie kolumnː "protected" oraz "denotation"
- Zmiana nazw nagłówków
- Usunięcie niepotrzebnych kolumn
- Wprowadzenie danych do JOSM, weryfikacja już istniejących danych w OSM tab by nie zdublować importu. (Dane z CRFOP, już wprowadzone usuwamy z pliku do importu)
QA
Add your QA plan here.
See also
The email to the Imports mailing list was sent on October 2019 and can be found in the archives of the mailing list at https://lists.openstreetmap.org/pipermail/imports/2019-October/006112.html
PL forum thread (where Polish community communicates) is at https://forum.openstreetmap.org/viewtopic.php?id=66070