Типовой проект по местоположению УИКов: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
 
(не показаны 3 промежуточные версии этого же участника)
Строка 2: Строка 2:


== Сбор адресных данных об участках ==
== Сбор адресных данных об участках ==
На первом этапе необходимо найти официальный источник данных об адресах участков.
На первом этапе необходимо найти официальный источник или источники данных об адресах участков.
 
Найденные данные, обычно это HTML страницы или списки в форматах MS Word, Excel, PDF, нужно обязательно сохранить локально и загрузить в вики. Опыт показывает, что эти документы, как правило, пропадают впоследствии. Пропавшие первоисточники делают проблематичным восстановление географической картины прошлых выборов.  


У каждого УИКа таких адреса обычно два: адрес места для голосования и адрес расположения комиссии.
У каждого УИКа таких адреса обычно два: адрес места для голосования и адрес расположения комиссии.


Найденные данные, обычно это HTML страницы или списки в PDF, нужно обязательно сохранить локально и загрузить в вики. Они обязательно пропадут в будущем, официальные сайты НЕ умеют работать с информацией.
Если этих данных много, для них удобно создать отдельную страницу. Пример - [[Перечни участков Москва]]. Данные можно разбить по годам и районам.
 
Если этих данных много, для них удобно создать отдельную страницу. Пример - [[Перечни участков Москва]]


== Приведение данных к структурированному виду ==
== Приведение данных к структурированному виду ==


После получения официальных данных нужно преобразовать их к табличному виду, создав таблицу например в формате CSV.
После получения официальных данных нужно преобразовать их к табличному виду, создав таблицу, например в формате CSV. Если вы хотите хранить данные в формате MS Excel (XLS) учтите, что в дальнейшем их все равно придется сохранять в более простом CSV, поэтому не перебарщивайте с оформлением, сложной структурой и т.д. Карты на базе XLS делать сложнее.


Таблицу можно разбить по районам или по числу участков, если вы считаете это целесообразным.
Таблицу можно разбить по районам или по числу участков, если вы считаете это целесообразным.
Строка 37: Строка 37:
В проекте по УИК Москвы данные хранятся в ESRI Shape и работа ведется в ГИС QGIS, в проекте по Санкт-Петербургу - формат хранения данных - OSM XML и работа идет в редакторе JOSM.
В проекте по УИК Москвы данные хранятся в ESRI Shape и работа ведется в ГИС QGIS, в проекте по Санкт-Петербургу - формат хранения данных - OSM XML и работа идет в редакторе JOSM.


Выбор пути не принципиален и зависит от того, какие инструменты вы лучше знаете.
Выбор пути не принципиален и зависит от того, какие инструменты вы лучше знаете. Данное описание старается не зависеть от используемого ПО.


== Автоматическое геокодирование ==
== Автоматическое геокодирование ==
Строка 54: Строка 54:
Полученные после геокодирования или сырые данные нужно проверить, наложив их на картографическую основу.
Полученные после геокодирования или сырые данные нужно проверить, наложив их на картографическую основу.


Проверка делается для всех точек и геокодированных (найденных на карте) и не геокодированных. Процесс представляет собой перетаскивание точки на нужное место на карте.
Проверка делается для всех точек и геокодированных (найденных на карте) и тех, которые геокодировать не получилось. Процесс уточнения заключается в редактировании - перетаскивании точки в более точное место на карте (пример того, как уточняются данные [[Редактирование местоположений точечных объектов в QGIS по координатам|в QGIS]]).


Для этого этапа обычно создается еще одна страница, где данные делятся на части и они распределяются между желающих поучаствовать. Пример - [[Проект Проверка УИКов г. Москвы]]
Для этого этапа обычно создается еще одна страница, где данные делятся на части и они распределяются между желающими поучаствовать в уточнении. Пример - [[Проект Проверка УИКов г. Москвы]]


В процессе работы обычно выясняется, что для некоторого количества точек местоположения найти сложно или невозможно, из-за неточностей картографической основы или ошибок в самих списках. Поэтому страница проекта сопровождается списком УИКов, для которых существует неуверенность в их положении.
В процессе работы обычно выясняется, что для некоторого количества точек местоположения найти сложно или невозможно, из-за неточностей картографической основы или ошибок в самих списках. Поэтому страница проекта сопровождается отдельным списком УИКов, для которых существует неуверенность в их положении.


[[Категория:Уточнение расположения УИКов]]
[[Категория:Уточнение расположения УИКов]]

Текущая версия от 22:10, 4 октября 2012

Эта страница описывает типовой проект по созданию слоя данных с местоположениями Участковых избирательных комиссий (УИКов). Этот слой может использоваться для визуализации данных результатов выборов (пример), координации работы и географического анализа данных. К сожалению, официально данные в виде пригодном для использованию в ГИС не предоставляются.

Сбор адресных данных об участках

На первом этапе необходимо найти официальный источник или источники данных об адресах участков.

Найденные данные, обычно это HTML страницы или списки в форматах MS Word, Excel, PDF, нужно обязательно сохранить локально и загрузить в вики. Опыт показывает, что эти документы, как правило, пропадают впоследствии. Пропавшие первоисточники делают проблематичным восстановление географической картины прошлых выборов.

У каждого УИКа таких адреса обычно два: адрес места для голосования и адрес расположения комиссии.

Если этих данных много, для них удобно создать отдельную страницу. Пример - Перечни участков Москва. Данные можно разбить по годам и районам.

Приведение данных к структурированному виду

После получения официальных данных нужно преобразовать их к табличному виду, создав таблицу, например в формате CSV. Если вы хотите хранить данные в формате MS Excel (XLS) учтите, что в дальнейшем их все равно придется сохранять в более простом CSV, поэтому не перебарщивайте с оформлением, сложной структурой и т.д. Карты на базе XLS делать сложнее.

Таблицу можно разбить по районам или по числу участков, если вы считаете это целесообразным.

CSV файлы также стоит загрузить в вики в виде приложений.

Формат

Требования к названиям полей таблиц: названия полей могут быть любыми, но название не должно содержать кириллицы, знаков препинания и пробелов, длина названий полей должна быть не больше 10 символов.

Возможная, минимально необходимая структура:

number : номер УИКа

place : населенный пункт

addr_vote : адрес места для голосования

addr_com : адрес расположения комиссии. Обратите внимание, что он отличается от адреса места для голосования. Адрес расположения комиссии, как правило, не показывают на карте и это поле является не обязательным.

Подготовка к работе

В зависимости от того, ближе ли вам ГИС или OSM, таблицу нужно преобразовать в формат, пригодный для геокодирования и дальнейшей работы.

В проекте по УИК Москвы данные хранятся в ESRI Shape и работа ведется в ГИС QGIS, в проекте по Санкт-Петербургу - формат хранения данных - OSM XML и работа идет в редакторе JOSM.

Выбор пути не принципиален и зависит от того, какие инструменты вы лучше знаете. Данное описание старается не зависеть от используемого ПО.

Автоматическое геокодирование

Используя специальные инструменты, нужно прогнать этот список через процедуру геокодирования. Геокодирование поможет автоматически найти координаты для части УИКов. Не стоит надеяться, что это будет сделано автоматически для них всех, в зависимости от основы, процент автоматически найденных точек может быть любым.

Имейте в виду, что многие сервисы (например Google Maps) запрещают пакетное геокодирование.

В принципе, этот шаг является необязательным, но он может помочь начать работу.

Один из инструментов, который может помочь выполнить геокодирование - расширение RuGeocoder (описание).

Проверка

Основной этап, обычно занимает больше всего времени.

Полученные после геокодирования или сырые данные нужно проверить, наложив их на картографическую основу.

Проверка делается для всех точек и геокодированных (найденных на карте) и тех, которые геокодировать не получилось. Процесс уточнения заключается в редактировании - перетаскивании точки в более точное место на карте (пример того, как уточняются данные в QGIS).

Для этого этапа обычно создается еще одна страница, где данные делятся на части и они распределяются между желающими поучаствовать в уточнении. Пример - Проект Проверка УИКов г. Москвы

В процессе работы обычно выясняется, что для некоторого количества точек местоположения найти сложно или невозможно, из-за неточностей картографической основы или ошибок в самих списках. Поэтому страница проекта сопровождается отдельным списком УИКов, для которых существует неуверенность в их положении.