Данные УИКов из вeб-выборов 2012: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
Строка 90: Строка 90:
Как можно заметить из цифр данные не содержат информации о всех участковых избирательных комиссиях. По данным Центризбиркома [http://www.vybory.izbirkom.ru/region/region/izbirkom?action=show&root=1&tvd=100100031793509&vrn=100100031793505&region=0&global=1&sub_region=0&prver=0&pronetvd=null&vibid=100100031793509&type=238] УИКов 95416, выкачано 91185, то есть не хватает около 4 тысяч избирательных участков (4%). Причины отсутствия этих участков окончательно не ясны. Возможные объяснения отсутствию следующие:
Как можно заметить из цифр данные не содержат информации о всех участковых избирательных комиссиях. По данным Центризбиркома [http://www.vybory.izbirkom.ru/region/region/izbirkom?action=show&root=1&tvd=100100031793509&vrn=100100031793505&region=0&global=1&sub_region=0&prver=0&pronetvd=null&vibid=100100031793509&type=238] УИКов 95416, выкачано 91185, то есть не хватает около 4 тысяч избирательных участков (4%). Причины отсутствия этих участков окончательно не ясны. Возможные объяснения отсутствию следующие:


#Нет участков на которых веб-камеры не были установлены намеренно (больницы и роддома, СИЗО, временные участки на вокзалах и предприятиях) и по причине неуспевания или технической невозможности. Так например, действительно отсутствуют УИК УИК 3317 – ФКУ СИЗО-6 УФСИН России по Москве («Марьино») и УИК 3308 – ФГУ СИЗО-2 ФСИН России (следственный изолятор «Лефортово»).
#Нет участков на которых веб-камеры не были установлены намеренно (больницы и роддома, СИЗО, временные участки на вокзалах и предприятиях) и по причине неуспевания или технической невозможности. Так например, действительно отсутствуют УИК 3317 – ФКУ СИЗО-6 УФСИН России по Москве («Марьино») и УИК 3308 – ФГУ СИЗО-2 ФСИН России (следственный изолятор «Лефортово»).
#Другие причины связанные с процессом получения json-файлов.
#Другие причины связанные с процессом получения json-файлов.



Версия от 18:22, 11 марта 2012

Эта страница опубликована в основном списке статей сайта
по адресу http://gis-lab.info/qa/webvybory2012.html


Здесь вы можете получить данные о расположении участковых избирательных комиссий, полученные с сайта http://webvybory2012.ru.

Так или иначе проект по установке веб-камер на избирательных участках для голосования 4 марта 2012 был реализован. Целесообразность, способ реализации и прочие детали этого проекта в этой статье обсуждаться не будут. Но на данные использованные при построении карты избирательных участков представляют ценность.

Несмотря на то, что лицензионный статус, первоначальные источники и способ создания этого набора данных еще предстоит выяснить, в данном проекте используется, в некотором смысле, уникальный по покрытию набор данных о расположении помещений для голосования участковых избирательных комиссий в рамках всей страны в машинно-читаемом виде. Эти данные могут быть так или иначе использованы для анализа результатов выборов.

Что касается машинно-читаемости, то данные о УИКах в формате json расположены в папке http://webvybory2012.ru/json/ и извлечь их довольно просто: файл http://webvybory2012.ru/json/districts.json содержит информацию о федеральных округах и субъектах входящих в их состав. Данные по субъектам расположены в отдельных файлах, например, http://webvybory2012.ru/json/areas/0/1.json. И так далее до мест голосования и УИКов дислоцированных на них. Ну а подробности можно увидеть запустив Firebug в Firefox и пройти процедуру пошагового поиска.

Естественно все это можно автоматизировать, что и было сделано. В результате чего был получен набор json-файлов. После чего данные были загружены в БД PostgreSQL и экспортированы оттуда в разные форматы.

Данные

Набор json-файлов webvybory2012-json.7z 27 M
Набор csv-файлов webvybory2012-csv.7z 5.3 M
Дамп БД PostgreSQL (PostgreSQL 8.4, PostGIS 1.5) webvybory2012-sql.7z 8.8 M
Точки УИКов в виде shape-файла webvybory2012-shp.7z 3.0 M

Описание структуры данных

Таблица Описание Кол-во записей
district Федеральные округа 8
area Регионы, ссылаются федеральные округа полем district_id. Москва и Санкт-Петербург не выделены в отдельные регионы, а размещены в таблице locality 81
sub_area Районы, ссылаются на вышестоящие уровни иерархии полями district_id, area_id 2279
locality Населенные пункты, ссылаются на вышестоящие уровни иерархии полями district_id, area_id, sub_area_id 44927
street Улицы, на которых расположены места для голосования, ссылаются на вышестоящие уровни иерархии полями district_id, area_id, sub_area_id, locality_id 61643
location Места для голосования с координатами (lon, lat), ссылаются на вышестоящие уровни иерархии полями district_id, area_id, sub_area_id, locality_id, street_id 81652
voting_station Участковые избирательные комиссии, привязанные к местам для голосования. То есть УИКки, у которых помещение для голосования расположены по одному адресу ссылаются на одно и то же место для голосования. 91185

Для подготовки итогового shape-файлы использовался следующий запрос:

SELECT voting_station.id, voting_station.name as name,
    voting_station.address,
    location.district_id, district.name AS district_name,
    location.area_id, area.name AS area_name,
    location.sub_area_id, sub_area.name AS sub_area_name,
    location.locality_id, locality.name AS locality_name,
    location.street_id, street.name AS street_name,
    location.point AS point
FROM voting_station
    LEFT JOIN location ON voting_station.location_id = location.id
    LEFT JOIN district ON location.district_id = district.id
    LEFT JOIN area ON location.area_id = area.id
    LEFT JOIN sub_area ON location.sub_area_id = sub_area.id
    LEFT JOIN locality ON location.locality_id = locality.id
    LEFT JOIN street ON location.street_id = street.id

Качество данных

Количество УИКов

Как можно заметить из цифр данные не содержат информации о всех участковых избирательных комиссиях. По данным Центризбиркома [1] УИКов 95416, выкачано 91185, то есть не хватает около 4 тысяч избирательных участков (4%). Причины отсутствия этих участков окончательно не ясны. Возможные объяснения отсутствию следующие:

  1. Нет участков на которых веб-камеры не были установлены намеренно (больницы и роддома, СИЗО, временные участки на вокзалах и предприятиях) и по причине неуспевания или технической невозможности. Так например, действительно отсутствуют УИК 3317 – ФКУ СИЗО-6 УФСИН России по Москве («Марьино») и УИК 3308 – ФГУ СИЗО-2 ФСИН России (следственный изолятор «Лефортово»).
  2. Другие причины связанные с процессом получения json-файлов.

Наложение точек УИКов

УИКи с одним и тем же адрес не разведены в разные части здания и имеют абсолютно одинаковые координаты. Для адекватного отображения этих данных может понадобится дополнительная обработка (как например описано тут).

Пример: УИК 1511, 1512, 1513 г. Москва, Москва, Полбина, 68с1, школа №918

Ошибки в координатах

В данных присутствуют достаточно серьезные ошибки в координатах. В г. Москва попадают УИКи Новосибирской области, Владимирской области и возможно другие.