ES:Tenerife Bus Transport Import
Objetivo
Los servicios regulares de autobuses urbanos e interurbanos en la isla de Tenerife son ofrecidos mayoritariamente por Transportes Interurbanos de Tenerife (TITSA), una sociedad anónima propiedad del Cabildo Insular de Tenerife (administración insular). Nuestro objetivo es incorporar la información de paradas y líneas de la red del operador TITSA a OSM.
Planificación
El proyecto consta de dos fases
- Importar paradas. Sujeto a la aprobación de la lista imports, se espera que esta fase comience en marzo y durará unas dos semanas (o menos dependiendo del número de colaboradores que se apunten).
- Importar rutas. Esta fase comienza al terminar la anterior y necesitará otro anuncio en la lista. La duración estimada es un mes.
Datos a importar
Antecedentes
Sitio web del origen de los datos: http://www.titsa.com
Licencia de los datos: http://www.titsa.com/index.php?accion=avisolegal
Enlace a autorización: http://lists.openstreetmap.org/pipermail/talk-es/2013-February/011341.html
Atribución en OSM: Se proporcionará en etiquetas de los conjuntos de cambios y cuenta de usuario específica de la importación: titsa-import.
Se ha verificado la conformidad con la ODbL: Sí
Autorización
En el apartado "Nuestros servicios" de la página web se puede obtener información sobre las paradas de autobús o rutas específicas bajo el siguiente aviso de copyright. No se ofrece la posibilidad de descargar el conjunto completo de datos.
"Se autoriza su reproducción siempre que se cite la fuente, salvo que si indique lo contrario. En aquellos casos en que sea necesaria una autorización previa para la reproducción o el uso de datos textuales o multimedia (sonidos, imágenes, programas, etc.), dicha autorización cancelará la autorización general antes citada y mencionará las posibles restricciones de uso."
Cuando se remitió a través de su formulario web una solicitud basada en este modelo, TITSA contestó afirmativamente remitiéndonos al Departamento de Informática para proporcionarnos los datos. Dicho departamento nos ha mostrado toda su colaboración, remitiendo los datos.
Descripción de los datos
Datos en formato GTFS conteniendo:
- 3653 paradas con los siguientes atributos: id, código (código==id), nombre, latitud, longitud.
- 166 rutas con id, nombre corto y nombre largo.
- Datos sobre viajes y tiempos de parada permiten derivar las rutas que componen una ruta maestra con todas sus variantes así como información completa de horarios.
Los datos se espera que estén actualizados, como muy tarde, a fecha de mayo de 2012. Una revisión de las posiciones de algunas paradas contra ortofoto de alta resolución permite estimar una precisión de unos 50 m, siendo en general mejor la de OSM.
Tipo de importación
Se trata de una importación única, aunque serán necesarias revisiones periódicas para mantener la información actualizada. Las herramientas de software que se prevé utilizar son GO-Sync para las paradas de autobuses y código propio Python para las rutas. Josm se utilizará para la verificación, validación, cargar y revertir conjuntos de cambios si es necesario.
Preparación de los datos
Simplificación y reducción de los datos
Los datos de las paradas a importar son suficientemente simples y no necesitan ningún plan de reducción. Incorporaremos todas las direcciones y variantes de un servicio. Se incluirá información sobre horarios en una etiqueta operating_hours para diferenciar las variantes.
Plan de etiquetado
Se va a utilizar el esquema Public transport schema 2 para etiquetado. Esta es la correlación entre atributos originales y etiquetas OSM.
Paradas
Archivo | Atributo GTFS | Etiqueta OSM |
---|---|---|
stops.txt | stop_id | ref=* |
stops.txt | stop_name | name=* |
highway=bus_stop | ||
public_transport=platform | ||
bus=yes | ||
route_ref=* | ||
operator=TITSA |
Rutas
Archivo | Atributo GTFS | Etiqueta OSM |
---|---|---|
routes.txt | route_short_name | ref=* |
routes.txt | route_long_name | name=* |
* | * | operating_hours=* |
type=route | ||
route=bus | ||
colour=#79b51d | ||
operator=TITSA |
La etiqueta operating_hours sería similar a opening_hours=*, por ejemplo:
operating_hours= Mo-Su 07:35
O incluso:
operating_hours=Mo-Su 14:05,18:00,19:05,20:00; Sa 13:05,20:50; Mo-Fr 20:55; Sa-Su 12:00; Su 09:00,09:45,15:00,16:00
Servicios
Archivo | Atributo GTFS | Etiqueta OSM |
---|---|---|
routes.txt | route_id | gtfs_id=* |
routes.txt | route_short_name | ref=* |
routes.txt | route_long_name | name=* |
description=* | ||
network=* | ||
type=route_master | ||
route_master=bus | ||
colour=#79b51d | ||
operator=TITSA |
Los valores de la etiqueta network serían uno o varios de estos: urban; metropolitan; touristic; express.
Etiquetas para conjunto de cambios
Se usarán las siguientes etiquetas para conjunto de cambios.
- comment=*
- created_by=JOSM/version
- source=TITSA
- type=import
- url=http://wiki.openstreetmap.org/wiki/Tenerife_Bus_Transport_Import
Transformación de los datos
Para las paradas se va a utilizar una versión modificada de GO-Sync para transformar los datos GTFS a OSM XML. Código Python propio generará las rutas y servicios. Enlace al código.
Resultados de la transformación de datos
Este es un ejemplo de paradas con un pequeño fragmento del conjunto de datos.
- OSM_UPLOAD_before.osm. OSM_UPLOAD_before.osm. Transformado a OSM con GO_Sync.
- OSM_UPLOAD_after.osm. OSM_UPLOAD_after.osm. El resultado después de la revisión humana con GO_Sync.
- OSM_UPLOAD_final.osm. OSM_UPLOAD_final.osm. Los datos finales para subir después de una segunda revisión con JOSM.
Y dos rutas.
Estos ficheros sólo contienen relaciones.
Flujo de trabajo para combinación de datos
Enfoque de equipo
El equipo está formado actualmente por Javiersanp, tiger, jsaga, migoga y g0ldfish. Se necesita ayuda de la comunidad para realizar el trabajo. Por favor, mándame un mensaje si deseas colaborar.
Este proyecto se ha anunciado en la lista Talk-es. También se ha contactado con los usuarios más activos o con ediciones recientes de transporte público en la zona.
Referencias
Este proyecto se ha anunciado en la lista Talk-es y en imports.
Flujo de trabajo
Paradas
- Cada colaborador recibirá un fragmento del conjunto de datos GTFS.
- Usando GO_Sync lo fusiona con los datos OSM y envía los resultados a un compañero.
- El compañero abre el archivo con Josm para comprobar las decisiones tomadas al revisar cada nodo. Adicionalmente se debe usar imágenes de alta resolución (Ortofotos_de_Grafcan#OrtoExpress_Urbana / PNOA) para mejorar las posiciones y detectar marquesinas.
- Finalmente, valida y sube los datos.
Grupo | Zona | 1ª revisión GO_Sync | 2ª revisión Josm | Conjunto de cambios |
---|---|---|---|---|
1 | Sureste | Javier Sanchez | migoga | 15293602 (a, l) |
2 | Suroeste | migoga | Javier Sanchez | 15346872 (a, l) |
3 | Noroeste | migoga | tiger | 15415172 (a, l) |
4 | Noreste | jsaga | g0ldfish | 15567282 (a, l) |
Rutas
- Cada colaborador recibirá algunos archivos XML de OSM con todas las rutas y comprueba los errores globales.
- Las rutas se fusionan con las ya existentes conservando el historial de la relación.
- Todas las rutas serán subidos por el usuario titsa-import con el fin de dar el crédito apropiado.
- Cada colaborador selecciona algunas rutas y las reserva añadiendo su identificador de usuario a la columna de notas de la página Bus Routes in Tenerife.
- El colaborador descarga las relaciones de las rutas seleccionadas y les añade las vías que siguen las rutas (la relación originalmente sólo incluye las plataformas). Estos datos se cargan con su propia cuenta de usuario.
- Al acabar con cada ruta, el colaborador borra su nombre de la fila de la ruta en la página Bus Routes in Tenerife.
Debido a que la cantidad de datos a importar no es muy grande, el tamaño del conjunto de cambios a subir no supone una preocupación. Si algo sale man, se usará el complemento JOSM/Plugins/Reverter para revertir el conjunto de cambios.
Fusionado
Paradas
OSM tiene 1480 nodos con la etiqueta highway=bus_stop en el área de la importación. El conjunto de datos de TITSA tiene 3653 paradas. GO_Sync ayuda al usuario a detectar duplicados y fusionarlos. El programa descarga nodos bus_stop en el área de la importación, compara cada parada GTFS con las de OSM en un rádio de 100 metros y empareja por código de parada. Cada parada GTFS queda asignada en una de estas cuatro categorías para revisión humana usando una tabla de etiquetas y una vista de mapa.
- 1246 paradas GTFS nuevas con con posibles coincidentes en OSM. Existen una o más paradas en OSM candidatas a ser un posible duplicado. El usuario debe detectarlas si realmente es un duplicado y combinar las etiquetas.
- 2018 paradas GTFS nuevas sin coincidencias en OSM. No hay que hacer nada en particular.
- 389 paradas existentes en OSM con actualización de datos. El usuario combina las etiquetas.
- 0 paradas ya existentes.
Fusión de etiquetas
Etiqueta | Valor seleccionado por defecto | Nota |
---|---|---|
lat, lon | OSM | Normalmente mejor posicionado |
route_ref | TITSA | Mejor por que han habido cambios recientes en la red |
name | TITSA | Deben ser similares, necesita comprobarse |
Respecto a la etiqueta ref, si los nodos están cerca y los códigos de parada son diferentes, lo más probable es que no sean la misma parada. Excepto si son tan similares que puede sospecharse un error por parte del editor del mapa.
Rutas
Teniendo en cuenta una ruta por cada dirección, el conjunto de datos de TITSA producirá 166 relaciones route_master=bus y unas 332 relaciones route=bus. Actualmente existen relaciones 19 route=bus y 1 relación route_master=bus en el área de la importación. Esta cantidad puede ser fusionada a mano.
Aseguramiento de la calidad
Cada archivo OSM se revisará con Josm por un compañero antes de subirlo. Las imágenes de alta resolución disponibles (Ortofotos_de_Grafcan#OrtoExpress_Urbana / PNOA) deben usarse para mejorar las posiciones de las paradas.