Данные УИКов из вeб-выборов 2012: различия между версиями
Нет описания правки |
Kalenkov (обсуждение | вклад) Нет описания правки |
||
(не показано 16 промежуточных версий 2 участников) | |||
Строка 1: | Строка 1: | ||
{{Статья| | {{Статья|Опубликована|webvybory2012}} | ||
{{Аннотация|Здесь вы можете получить данные о расположении участковых избирательных комиссий, полученные с сайта http://webvybory2012.ru.}} | {{Аннотация|Здесь вы можете получить данные о расположении участковых избирательных комиссий, полученные с сайта http://webvybory2012.ru.}} | ||
'''Внимание: Эти данные устарели! Актуальные (2013 г.) данные по УИК собираются в проекте УИК ГЕО, [http://uikgeo.gis-lab.info присоединяйтесь], нам нужно ваше участие.''' | |||
Несмотря на то, что лицензионный статус, первоначальные источники и способ создания этого набора данных еще предстоит выяснить, в данном проекте используется, в некотором смысле, уникальный по покрытию набор данных о расположении помещений для голосования участковых избирательных комиссий в рамках всей страны в машинно-читаемом виде. | Так или иначе проект по установке веб-камер на избирательных участках для голосования 4 марта 2012 был реализован. Целесообразность, способ реализации и прочие детали этого проекта в этой статье обсуждаться не будут. Но на данные использованные при построении карты избирательных участков представляют ценность. | ||
Несмотря на то, что лицензионный статус, первоначальные источники и способ создания этого набора данных еще предстоит выяснить, в данном проекте используется, в некотором смысле, уникальный по покрытию набор данных о расположении помещений для голосования участковых избирательных комиссий в рамках всей страны в машинно-читаемом виде. Эти данные могут быть так или иначе использованы для анализа результатов выборов. | |||
Что касается машинно-читаемости, то данные о УИКах в формате json расположены в папке <nowiki>http://webvybory2012.ru/json/</nowiki> и извлечь их довольно просто: файл <nowiki>http://webvybory2012.ru/json/districts.json</nowiki> содержит информацию о федеральных округах и субъектах входящих в их состав. Данные по субъектам расположены в отдельных файлах, например, <nowiki>http://webvybory2012.ru/json/areas/0/1.json</nowiki>. И так далее до мест голосования и УИКов дислоцированных на них. Ну а подробности можно увидеть запустив Firebug в Firefox и пройти процедуру пошагового поиска. | Что касается машинно-читаемости, то данные о УИКах в формате json расположены в папке <nowiki>http://webvybory2012.ru/json/</nowiki> и извлечь их довольно просто: файл <nowiki>http://webvybory2012.ru/json/districts.json</nowiki> содержит информацию о федеральных округах и субъектах входящих в их состав. Данные по субъектам расположены в отдельных файлах, например, <nowiki>http://webvybory2012.ru/json/areas/0/1.json</nowiki>. И так далее до мест голосования и УИКов дислоцированных на них. Ну а подробности можно увидеть запустив Firebug в Firefox и пройти процедуру пошагового поиска. | ||
Строка 14: | Строка 16: | ||
{|class="wikitable" | {|class="wikitable" | ||
| Набор json-файлов | | Набор json-файлов | ||
| [http:// | | [http://gis-lab.ru/data/webvybory2012/webvybory2012-json.7z webvybory2012-json.7z] | ||
| 27 M | |||
|- | |- | ||
| Набор csv-файлов | | Набор csv-файлов | ||
| [http:// | | [http://gis-lab.ru/data/webvybory2012/webvybory2012-csv.7z webvybory2012-csv.7z] | ||
| 5.3 M | |||
|- | |- | ||
| Дамп БД PostgreSQL (PostgreSQL 8.4, PostGIS 1.5) | | Дамп БД PostgreSQL (PostgreSQL 8.4, PostGIS 1.5) | ||
| [http:// | | [http://gis-lab.ru/data/webvybory2012/webvybory2012-sql.7z webvybory2012-sql.7z] | ||
| 8.8 M | |||
|- | |||
| Точки УИКов в виде shape-файла | |||
| [http://gis-lab.ru/data/webvybory2012/webvybory2012-shp.7z webvybory2012-shp.7z] | |||
| 3.0 M | |||
|} | |} | ||
== Описание структуры данных == | |||
{|class="wikitable" | |||
! Таблица | |||
! Описание | |||
! Кол-во записей | |||
|- | |||
| district | |||
| Федеральные округа | |||
| align="right" | 8 | |||
|- | |||
| area | |||
| Регионы, ссылаются федеральные округа полем district_id. Москва и Санкт-Петербург не выделены в отдельные регионы, а размещены в таблице locality | |||
| align="right" | 81 | |||
|- | |||
| sub_area | |||
| Районы, ссылаются на вышестоящие уровни иерархии полями district_id, area_id | |||
| align="right" | 2279 | |||
|- | |||
| locality | |||
| Населенные пункты, ссылаются на вышестоящие уровни иерархии полями district_id, area_id, sub_area_id | |||
| align="right" | 44927 | |||
|- | |||
| street | |||
| Улицы, на которых расположены места для голосования, ссылаются на вышестоящие уровни иерархии полями district_id, area_id, sub_area_id, locality_id | |||
| align="right" | 61643 | |||
|- | |||
| location | |||
| Места для голосования с координатами (lon, lat), ссылаются на вышестоящие уровни иерархии полями district_id, area_id, sub_area_id, locality_id, street_id | |||
| align="right" | 81652 | |||
|- | |||
| voting_station | |||
| Участковые избирательные комиссии, привязанные к местам для голосования. То есть УИКки, у которых помещение для голосования расположены по одному адресу ссылаются на одно и то же место для голосования. | |||
| align="right" | 91185 | |||
|} | |||
Для подготовки итогового shape-файлы использовался следующий запрос: | |||
<syntaxhighlight lang="sql"> | |||
SELECT voting_station.id, voting_station.name as name, | |||
voting_station.address, | |||
location.district_id, district.name AS district_name, | |||
location.area_id, area.name AS area_name, | |||
location.sub_area_id, sub_area.name AS sub_area_name, | |||
location.locality_id, locality.name AS locality_name, | |||
location.street_id, street.name AS street_name, | |||
location.point AS point | |||
FROM voting_station | |||
LEFT JOIN location ON voting_station.location_id = location.id | |||
LEFT JOIN district ON location.district_id = district.id | |||
LEFT JOIN area ON location.area_id = area.id | |||
LEFT JOIN sub_area ON location.sub_area_id = sub_area.id | |||
LEFT JOIN locality ON location.locality_id = locality.id | |||
LEFT JOIN street ON location.street_id = street.id | |||
</syntaxhighlight> | |||
== Качество данных == | |||
===Количество УИКов=== | |||
Как можно заметить из цифр данные не содержат информации о всех участковых избирательных комиссиях. По данным Центризбиркома [http://www.vybory.izbirkom.ru/region/region/izbirkom?action=show&root=1&tvd=100100031793509&vrn=100100031793505®ion=0&global=1&sub_region=0&prver=0&pronetvd=null&vibid=100100031793509&type=238] УИКов 95416, выкачано 91185, то есть не хватает около 4 тысяч избирательных участков (4%). Причины отсутствия этих участков окончательно не ясны. Возможные объяснения отсутствию следующие: | |||
#Нет участков на которых веб-камеры не были установлены намеренно (больницы и роддома, СИЗО, временные участки на вокзалах и предприятиях) и по причине неуспевания или технической невозможности. В г. Москва отсутствуют все УИК с номером более 3188, т.е. более 150 штук. Более конкретно, например, отсутствуют УИК 3317 – ФКУ СИЗО-6 УФСИН России по Москве («Марьино») и УИК 3308 – ФГУ СИЗО-2 ФСИН России (следственный изолятор «Лефортово»). | |||
#Другие причины связанные с процессом получения json-файлов. | |||
===Наложение точек УИКов=== | |||
УИКи с одним и тем же адрес не разведены в разные части здания и имеют абсолютно одинаковые координаты. Для адекватного отображения этих данных может понадобится дополнительная обработка (как например [http://gis-lab.info/qa/point-displacement.html описано тут]). | |||
Пример: УИК 1511, 1512, 1513 г. Москва, Москва, Полбина, 68с1, школа №918 | |||
===Ошибки в координатах=== | |||
В данных присутствуют достаточно серьезные ошибки в координатах. В г. Москва попадают УИКи Новосибирской области, Владимирской области и возможно другие. | |||
[[Категория:Уточнение расположения УИКов]] |
Текущая версия от 13:57, 17 января 2018
по адресу http://gis-lab.info/qa/webvybory2012.html
Здесь вы можете получить данные о расположении участковых избирательных комиссий, полученные с сайта http://webvybory2012.ru.
Внимание: Эти данные устарели! Актуальные (2013 г.) данные по УИК собираются в проекте УИК ГЕО, присоединяйтесь, нам нужно ваше участие.
Так или иначе проект по установке веб-камер на избирательных участках для голосования 4 марта 2012 был реализован. Целесообразность, способ реализации и прочие детали этого проекта в этой статье обсуждаться не будут. Но на данные использованные при построении карты избирательных участков представляют ценность.
Несмотря на то, что лицензионный статус, первоначальные источники и способ создания этого набора данных еще предстоит выяснить, в данном проекте используется, в некотором смысле, уникальный по покрытию набор данных о расположении помещений для голосования участковых избирательных комиссий в рамках всей страны в машинно-читаемом виде. Эти данные могут быть так или иначе использованы для анализа результатов выборов.
Что касается машинно-читаемости, то данные о УИКах в формате json расположены в папке http://webvybory2012.ru/json/ и извлечь их довольно просто: файл http://webvybory2012.ru/json/districts.json содержит информацию о федеральных округах и субъектах входящих в их состав. Данные по субъектам расположены в отдельных файлах, например, http://webvybory2012.ru/json/areas/0/1.json. И так далее до мест голосования и УИКов дислоцированных на них. Ну а подробности можно увидеть запустив Firebug в Firefox и пройти процедуру пошагового поиска.
Естественно все это можно автоматизировать, что и было сделано. В результате чего был получен набор json-файлов. После чего данные были загружены в БД PostgreSQL и экспортированы оттуда в разные форматы.
Данные
Набор json-файлов | webvybory2012-json.7z | 27 M |
Набор csv-файлов | webvybory2012-csv.7z | 5.3 M |
Дамп БД PostgreSQL (PostgreSQL 8.4, PostGIS 1.5) | webvybory2012-sql.7z | 8.8 M |
Точки УИКов в виде shape-файла | webvybory2012-shp.7z | 3.0 M |
Описание структуры данных
Таблица | Описание | Кол-во записей |
---|---|---|
district | Федеральные округа | 8 |
area | Регионы, ссылаются федеральные округа полем district_id. Москва и Санкт-Петербург не выделены в отдельные регионы, а размещены в таблице locality | 81 |
sub_area | Районы, ссылаются на вышестоящие уровни иерархии полями district_id, area_id | 2279 |
locality | Населенные пункты, ссылаются на вышестоящие уровни иерархии полями district_id, area_id, sub_area_id | 44927 |
street | Улицы, на которых расположены места для голосования, ссылаются на вышестоящие уровни иерархии полями district_id, area_id, sub_area_id, locality_id | 61643 |
location | Места для голосования с координатами (lon, lat), ссылаются на вышестоящие уровни иерархии полями district_id, area_id, sub_area_id, locality_id, street_id | 81652 |
voting_station | Участковые избирательные комиссии, привязанные к местам для голосования. То есть УИКки, у которых помещение для голосования расположены по одному адресу ссылаются на одно и то же место для голосования. | 91185 |
Для подготовки итогового shape-файлы использовался следующий запрос:
SELECT voting_station.id, voting_station.name as name,
voting_station.address,
location.district_id, district.name AS district_name,
location.area_id, area.name AS area_name,
location.sub_area_id, sub_area.name AS sub_area_name,
location.locality_id, locality.name AS locality_name,
location.street_id, street.name AS street_name,
location.point AS point
FROM voting_station
LEFT JOIN location ON voting_station.location_id = location.id
LEFT JOIN district ON location.district_id = district.id
LEFT JOIN area ON location.area_id = area.id
LEFT JOIN sub_area ON location.sub_area_id = sub_area.id
LEFT JOIN locality ON location.locality_id = locality.id
LEFT JOIN street ON location.street_id = street.id
Качество данных
Количество УИКов
Как можно заметить из цифр данные не содержат информации о всех участковых избирательных комиссиях. По данным Центризбиркома [1] УИКов 95416, выкачано 91185, то есть не хватает около 4 тысяч избирательных участков (4%). Причины отсутствия этих участков окончательно не ясны. Возможные объяснения отсутствию следующие:
- Нет участков на которых веб-камеры не были установлены намеренно (больницы и роддома, СИЗО, временные участки на вокзалах и предприятиях) и по причине неуспевания или технической невозможности. В г. Москва отсутствуют все УИК с номером более 3188, т.е. более 150 штук. Более конкретно, например, отсутствуют УИК 3317 – ФКУ СИЗО-6 УФСИН России по Москве («Марьино») и УИК 3308 – ФГУ СИЗО-2 ФСИН России (следственный изолятор «Лефортово»).
- Другие причины связанные с процессом получения json-файлов.
Наложение точек УИКов
УИКи с одним и тем же адрес не разведены в разные части здания и имеют абсолютно одинаковые координаты. Для адекватного отображения этих данных может понадобится дополнительная обработка (как например описано тут).
Пример: УИК 1511, 1512, 1513 г. Москва, Москва, Полбина, 68с1, школа №918
Ошибки в координатах
В данных присутствуют достаточно серьезные ошибки в координатах. В г. Москва попадают УИКи Новосибирской области, Владимирской области и возможно другие.