JA talk:Import Bus stop from 国土数値情報
試しにやってみた
神奈川県のデータをGPXファイルに変換し、JOSMでバス停を"トレース"出来るかどうか検証してみた。
- ためしにGPXファイルへ変換してみた
- 基盤地図情報「地名」と同じ技法にて変換。
- トレース方法も同じ。
- データが多すぎてJOSMが動かない!
- とりあえず動くがとても遅い!
- 作業ができないほど遅い!
- (神奈川県で約8500ノード)
- ゆえに、分割が必要
- バス路線毎?
- バス会社毎?
- 分割するならインデックス情報も作成する必要あり。
- インポートデータはどんな感じか?
- ノードはひとつしか無い
- 通常、2つあるバス停の中間の位置にポイントが設定してあるようだ
- 「100m以内に複数のバス停がある場合にはひとつにまとめた」という説明書きがあった。意識してデータをひとつにまとめているようです。
- OSMの位置とはずれている(30mぐらいかな)
- バス停の「名前」と、ここを経由する「バス路線」の情報がある
- 「シェルター」や「退避帯」などの情報はない
- もちろん、時刻表や料金もない
既存のバス停データへの配慮
- バス停はBingでは描けないので、既存のバス停は全てsurver or knowledge によるものと考えられる。
- 既存データの有無は、半径50mほどの範囲に他のバス停が存在するかどうかを目視でチェックするしかないようだ。
- 「妥当性」のチェックでは検知できない。
- なにかいい方法はないか?
- OSMサーバーにアクセスして直接OSMデータをダウンロードすることに成功した。インポートするバス停の周囲100m以内のOSMデータをダウンロードして、「bus_stop」を含むノードがあれば”既存データあり”と判断することが可能となった。
評価試験
変換プログラム(2015-02-21版)を使って神奈川県のデータをインポートすると、 8,466件のデータがインポートされることになります。(busstop8466.osm)
JOSMで表示すると、
この状態だと既存のバス停データの付近に新たにバス停を作ってしますので、インポートNODEの付近300m四方にバス停ノードが存在していたらインポート対象から外す処理を加えてみました。
その結果が下記の画像。インポートデータは3,810件に減ります。(busstop3810.osm)
神奈川県中央部から東側にかけての地域が活発に活動されているマッパーがいるようでインポートの必要がなくなっているのがわかります。
しかし、すでにバス停が入力されているはずの中央部(大和市付近)地域にもところどころインポートデータが残っているのでZoomしてよく見てみると、 常泉寺入口 (1277019896)の172m離れた位置にインポートしようとしているのがわかりました。
他のインポートデータも殆どが150m以上離れている場所にバス停タグが存在しているのがわかりました。
ならば、チェック範囲を300m四方から広げて500m四方〜600m四方に広げると、今度はインポートの必要があるデータまで対象外にしてしまう恐れが出てきてしまう。
そこで、
- 300m四方に既存バス停がある場合はインポート対象から外す。
- 600m四方に同一名称のバス停がある場合にはインポート対象から外す。
の二本立てでチェックをかけてみます。
なぜ最初から名称チェックを行わないかというと、名称にカッコ書きでローマ字表記がわざわざ追記されている場合(例:"駒大高校裏 (Komadai Koukou Ura)")が多く見受けられるからです。
(やめてほしいものです。name:enなりname:roを使ってください)
では、前方一致でチェックすればいいじゃないか? この場合は、「〇〇駅」と「〇〇駅北口」があるとか、「〇〇」と「〇〇裏」とかいろいろと問題があるので、位置が近いものは名称にかかわらず同一バス停とみなすことにしました。
その結果、インポートデータは3,770件になり、40件減りました。(busstop3770.osm)
いい感じになっていると思います。
私の近所の海老名市はコンプリートしたと思っていましたが、2件の入力漏れがあることも、ここからわかりました。
みなさんの入力地域のバス停はいかがでしょうか?
神奈川県版は、「busstop3810.osm」からダンロードできます。
神奈川県以外の地域でも、変換プログラム(2015-02-22版)を使って簡単にチェックできますので興味のある方は是非トライしてみてください。
インポートでもOKなのか?
- 基盤地図情報が"トレース"なのに、国土数値情報は"インポート(変換)"OKの出典元はどこ?
--> 「国土数値情報ダウンロードサービス」の利用約款<http://nlftp.mlit.go.jp/ksj/other/yakkan.html>によると、
重大な警告(著作権・財産権・無償の労力提供の前提等への理解と配慮)【必読】 (略) 「商用可能な指標については、その表示をしますので、その表示の無い指標については、 引き続き公共公益的な用途となり、原則として商用での利用はできませんのでご理解く ださい。」 (略)
とあり、「バス停留所データ」のページを調査したところ、どこにも「商用可能」との表示が見当たりませんでしたので、利用約款の重大な警告にあるとおり、商用での利用はできないものと理解いたします。
インポートファイルをOSMメンバーに配布できないか?
既存の「バス停」と二重に登録されることを回避するために、例によって人力による力技が必要になる?
- 国土数値情報の"ダウンロードとデータ変換"の作業は、煩雑・めんどくさい・楽しくない。
- どんなファイル?
- バス路線ごとにOSMファイルを作成することは可能
- バス路線ごとにカバレッジ率をWEB上に公開するのは可能だ!
- (1) まだマッピングされていない路線を見つける!
- (2) 数値情報をダウンロード
- (3) GPXファイルに変換
- (4) GPXのウェイポイントをトレースする
- (5') バスルートをマッピング
評価試験の結果
変換プログラム(2015-02-22版)によって上記の問題はクリアされます。
- 既存バス停付近をインポート対象から外す機能により、人力による力技が必要ありません。
- ダウンロードとデータ変換"の作業は、非常に簡単になりました。
- 実はバス路線ごとにOSMファイルを作成する機能が昨年の6月から追加されていました。バス停だけでなく、バスルートのトレースも可能です。
誰がやるのか?
- マッピングジャンキー(likes me)
- 特殊な人々、絶対数が少ないのが問題
- 地元のマッパー
- 大多数は自分の領域外までインポートしようとは考えない
- バスマニア
- まだOSMの存在を知らないようだ
- バス運営者(バス会社、自治体など)
- マッパーになってくれれば理想的
いまのところはジャンキーに頼るしか無いが、OSMの「ビジネス利用促進」の観点から「バス運営者自身」で自らのバス路線を描いてもらうのが理想的ではないか?
特に、自治体やコミュニティバスは路線図の作成費や印刷費に悩んでいるのではないだろうか?
WinWinの関係が成立する関係になると考える。(たぶんバス運営者は地図の精度やらカバー率など面倒なことはいわないとおもう)
評価試験の結果
変換プログラムによって既存データのチェックも含めて高速に処理できるようになった(神奈川県8,466件のデータをCore2マシンで3分ぐらいで処理できます。)ので、1人で47都道府県のすべてをインポートすることも可能になりました。
既存データとのチェックがあるので、入力が最も少なくなると思われる日の出前ぐらいの時間に実行するのが良いと思います。