Типовой проект по местоположению УИКов
Эта страница описывает типовой проект по созданию слоя данных с местоположениями Участковых избирательных комиссий (УИКов). Этот слой может использоваться для визуализации данных результатов выборов (пример), координации работы и географического анализа данных. К сожалению, официально данные в виде пригодном для использованию в ГИС не предоставляются.
Сбор адресных данных об участках
На первом этапе необходимо найти официальный источник или источники данных об адресах участков.
Найденные данные, обычно это HTML страницы или списки в форматах MS Word, Excel, PDF, нужно обязательно сохранить локально и загрузить в вики. Опыт показывает, что эти документы, как правило, пропадают впоследствии. Пропавшие первоисточники делают проблематичным восстановление географической картины прошлых выборов.
У каждого УИКа таких адреса обычно два: адрес места для голосования и адрес расположения комиссии.
Если этих данных много, для них удобно создать отдельную страницу. Пример - Перечни участков Москва. Данные можно разбить по годам и районам.
Приведение данных к структурированному виду
После получения официальных данных нужно преобразовать их к табличному виду, создав таблицу, например в формате CSV. Если вы хотите хранить данные в формате MS Excel (XLS) учтите, что в дальнейшем их все равно придется сохранять в более простом CSV, поэтому не перебарщивайте с оформлением, сложной структурой и т.д. Карты на базе XLS делать сложнее.
Таблицу можно разбить по районам или по числу участков, если вы считаете это целесообразным.
CSV файлы также стоит загрузить в вики в виде приложений.
Формат
Требования к названиям полей таблиц: названия полей могут быть любыми, но название не должно содержать кириллицы, знаков препинания и пробелов, длина названий полей должна быть не больше 10 символов.
Возможная, минимально необходимая структура:
number
: номер УИКа
place
: населенный пункт
addr_vote
: адрес места для голосования
addr_com
: адрес расположения комиссии. Обратите внимание, что он отличается от адреса места для голосования. Адрес расположения комиссии, как правило, не показывают на карте и это поле является не обязательным.
Подготовка к работе
В зависимости от того, ближе ли вам ГИС или OSM, таблицу нужно преобразовать в формат, пригодный для геокодирования и дальнейшей работы.
В проекте по УИК Москвы данные хранятся в ESRI Shape и работа ведется в ГИС QGIS, в проекте по Санкт-Петербургу - формат хранения данных - OSM XML и работа идет в редакторе JOSM.
Выбор пути не принципиален и зависит от того, какие инструменты вы лучше знаете. Данное описание старается не зависеть от используемого ПО.
Автоматическое геокодирование
Используя специальные инструменты, нужно прогнать этот список через процедуру геокодирования. Геокодирование поможет автоматически найти координаты для части УИКов. Не стоит надеяться, что это будет сделано автоматически для них всех, в зависимости от основы, процент автоматически найденных точек может быть любым.
Имейте в виду, что многие сервисы (например Google Maps) запрещают пакетное геокодирование.
В принципе, этот шаг является необязательным, но он может помочь начать работу.
Один из инструментов, который может помочь выполнить геокодирование - расширение RuGeocoder (описание).
Проверка
Основной этап, обычно занимает больше всего времени.
Полученные после геокодирования или сырые данные нужно проверить, наложив их на картографическую основу.
Проверка делается для всех точек и геокодированных (найденных на карте) и тех, которые геокодировать не получилось. Процесс уточнения заключается в редактировании - перетаскивании точки в более точное место на карте (пример того, как уточняются данные в QGIS).
Для этого этапа обычно создается еще одна страница, где данные делятся на части и они распределяются между желающими поучаствовать в уточнении. Пример - Проект Проверка УИКов г. Москвы
В процессе работы обычно выясняется, что для некоторого количества точек местоположения найти сложно или невозможно, из-за неточностей картографической основы или ошибок в самих списках. Поэтому страница проекта сопровождается отдельным списком УИКов, для которых существует неуверенность в их положении.