Геоданные МВД

Материал из GIS-Lab
Перейти к: навигация, поиск
Эта страница является черновиком статьи.


Геоданные Министерства внутренних дел

Содержание

Источники данных

Данные размещенные здесь получены с сайтов http://112.ru, http://mvd.ru.

Методика

Для районирования данных источники используют административно-территориальное деление и коды ОКАТО. Классификатор этих кодов на некоторых источниках данных устарел (112.ru) и поэтому свежий классификатор использоваться не может. Поэтому сначала получается копия классификатора.

Далее поготовка данных заключается в получении данных из источников в структурированном табличном виде для каждого интересующего кода ОКАТО, данные разбиваются на две таблицы:

  • участковые
  • сфера ответственности - таблица с перечнем адресов. Эта таблица в дальнейшем проходит процедуру геокодирования.

Геокодирование производится с помощью геокодера http://openstreetmap.ru, для геокодирование может использоваться модуль для свободной ГИС QGIS - Ru-geocoder или набор скриптов для Python (Автор: Евгений Никулин).

Базы данных

Производные базы данных (описание см. ниже) можно скачать по: ссылке

Москва - версия 1 - 112.ru

  • RU-MOW-loc - база адресов, 42127 шт. (CSV)
  • RU-MOW-loc_geo - геокодированная база адресов, 42127 шт. (ESRI Shape)
  • RU-MOW-loc_geo_building - выборка домов из OpenStreetMap по геокодированной базе адресов, 14821 шт. (ESRI Shape)
  • RU-MOW-man - база участковых 2592 шт. (CSV)

Москва - версия 2 - mvd.ru

  • RU-MOW-v2-loc_src - база исходных строк адресов, 45451 шт. (CSV)
  • RU-MOW-v2-loc - база адресов, 7147 шт. (CSV)
  • RU-MOW-v2-loc_geo - геокодированная база адресов, 45451 шт. (ESRI Shape)
  • RU-MOW-v2-loc_geo_building - выборка домов из OpenStreetMap по геокодированной базе адресов, 21140 шт. (ESRI Shape)
  • RU-MOW-v2-man - база участковых 2237 шт. (CSV)

РФ целиком - версия 1 - 112.ru

  • RU-RU_loc - база адресов, не геокодирована, 371738 шт. (CSV)
  • RU-RU_man - база участковых, не геокодирована, 39175 шт. (CSV)
  • RU-RU_photo - фотографии всех участковых РФ - 39641 шт. (JPG)
  • RU-RU_mvd - база организаций, геокодированы только адреса по Москве - 19051 шт. (CSV)

Проблемы исходных данных

  1. Данные плохо структурированы
  2. Для поиска региона используются устаревшие коды ОКАТО
  3. В исходной базе данных отсутствуют многочисленные дома
  4. Большое количество ошибок и опечаток в исходных данных мешающих их точному геокодированию

Недостатки представленных разработок

Качество обнаружения и определения сферы ответственности участкового целиком зависит от качества основы OpenStreetMap используемой для геокодирования адресов указанных в сфере ответственности. Рисуйте карты!

Следующие недоработки в представленном ПО было бы неплохо исправить в будущем.

  1. При парсинге не учитываются улицы указанные целиком, без домов.
  2. С улиц указанных целиком в базу данных результатов должны попадать все дома.
  3. При парсинге не обрабатываются диапазоны номеров домов (например: 1-24)
  4. Диапазон домов должен превращаться в набор домов
  5. При парсинге не обрабатываются совсем плохо структурированные данные (пример, полный список ошибочных файлов)

Аналогичные базы данных

База данных предоставленная организаторами конкурса "Открытая полиция". Не содержит важной части данных - адресной информации о сфере ответственности участковых.

Персональные инструменты
Пространства имён

Варианты
Действия
Статьи
Спецпроекты
Инструменты