責任を持ってダウンロードする
(blog.geofabrik.de)- 今月、ダウンロードサーバーのインフラアップグレードにより、より高速なダウンロード体験を提供
- “…latest” ファイルのリクエスト方式が HTTP リダイレクトに変更
- すべての利用者が便利に最新の OSM データへアクセスできるよう取り組んでいる
- 大容量ファイルを繰り返し過剰にダウンロードする異常な利用例が、サービス全体の性能低下につながっている
- 効率的で責任あるダウンロードのために、3つの具体的な推奨事項を提示
ダウンロードサーバーの更新と責任ある利用のお願い
今月は、ダウンロードサーバーのインフラ強化作業を実施した。
これにより、ダウンロードをより速く、より早く提供できる環境の構築が可能になった。
技術的な変更として、“…latest” ファイルを要求した際、従来の直接配信方式ではなくHTTP リダイレクト方式で最新バージョンのファイルへ案内するようになった。
責任あるダウンロードが必要な理由
すべての利用者が快適に最新の OSM(OpenStreetMap) データへアクセスできるよう、サーバーを運用している。
しかし、一部の利用者が同じ大容量ファイル(例: 20GB)を1日に数百〜数千回繰り返しダウンロードするケースが発生している。
- 例として、ある利用者が24時間以内に italy-latest.osm.pbf ファイルをほぼ10,000回ダウンロードした事例があった。
- また別の利用者は、サーバー内のすべてのファイルを毎日すべてダウンロードする行為を繰り返している
このような行動は、サーバーの帯域幅の限界により、利用者全体の速度低下を引き起こす。
IP帯域の遮断が避けられない場合、無関係な利用者まで被害を受ける可能性がある。
サーバー利用者への3つの具体的な推奨事項
- 全世界のデータが必要なら、サーバーから分割して受け取るのではなく、planet.openstreetmap.org から planet ファイルを一度に取得する方法を推奨する。
- 大陸または広域データ(例: Europe, North America)を毎日更新したい場合は、pyosmium-up-to-date プログラムを使用して差分のみを取得すれば、全体トラフィックの 98% を削減でき、速度も向上する。
- 自動化スクリプトを活用する場合は、何がダウンロードされているかを監視するか、適切なエラー処理を入れて、同じファイルを無限に繰り返しダウンロードするようなミスを防ぐ必要がある。
結論
より責任あるダウンロード習慣を通じて、誰もが快適に最新データを利用できる環境づくりへの協力をお願いしたい。
1件のコメント
Hacker Newsの意見
curlコマンド一発で済ませたいと思っている<br>シードしなければならないという誤解が非常に多く、そのせいで不安を感じる人も多い<br>結局、イメージの悪さとcurlだけで何でも済む現状のせいで、BitTorrentが過小評価されているのは残念だ<br>ビデオゲームクライアントが更新にBTを使ったり、PeerTubeがwebtorrentを使ったりする例はあるが、それでもまだあまり広く使われていないのが惜しいcURLでファイルを受け取るにはまず会員登録を求め、過度にダウンロードするユーザーは遮断するか課金するのがよいと思うapt-getでセットアップすると時間の無駄が大きすぎる