Данные по избирательным комиссиям РФ из ГАС Выборы: различия между версиями
Kalenkov (обсуждение | вклад) |
Kalenkov (обсуждение | вклад) Нет описания правки |
||
Строка 281: | Строка 281: | ||
==Примеры SQL запросов== | ==Примеры SQL запросов== | ||
<span style="color:#ff0000">'''NB''' В программе '''sqlite''' по умолчанию не включена поддержка сопоставления кириллических символов.</span> По умолчанию не работают функции перевода строки в нижний и верхний регистр и не работает регистронезависимый поиск. Как исправить этот недостаток описано [[ | <span style="color:#ff0000">'''NB''' В программе '''sqlite''' по умолчанию не включена поддержка сопоставления кириллических символов.</span> По умолчанию не работают функции перевода строки в нижний и верхний регистр и не работает регистронезависимый поиск. Как исправить этот недостаток описано [[#Подключение регистронезависимого поиска для sqlite|ниже]]. | ||
Запрос к базе данных выглядит следующим образом | Запрос к базе данных выглядит следующим образом |
Версия от 18:40, 28 августа 2019
по адресу http://gis-lab.info/qa/cik-data.html
Данные об избирательных комиссиях в машиночитаемом виде
На региональных сайтах избирательных комиссий (субодомены сайта ЦИК) появилась информация о всех территориальных и участковых избирательных комиссиях (например Алтайский край). К сожалению, исходно информация предоставляется не в машиночитаемом виде, что препятствует эффективному ее использованию для анализа данных и картографии. Нами были написали скрипты для скачивания всех данных о комиссиях и здесь можно получить полную БД в машиночитаемом виде.
Общая информация
Для каждой избирательной комиссии предоставляется следующая информация:
- Наименование избирательной комиссии
- Адрес комиссии
- Телефон
- Факс
- Адрес электронной почты
- Срок окончания полномочий
Для подавляющего большинства участковых избирательных комиссий факс и адрес электронной почты не указаны.
Также указана информация по каждому члену избирательной комиссии и по резерву в участковые избирательные комиссии:
- Фамилия Имя Отчество
- Должность (председатель/зам. председателя/секретарь/член)
- субъект, предложивший данную кандидатуру в состав комиссии
Скачать данные
Ниже представлены данные, скачанные с сайтов избирательных комиссий субъектов РФ.
Актуальность: 17.06.2019
- Единая БД по всем данным ЦИК в формате SQLite
- Адреса, телефоны и пр. избирательных комиссий (CSV)
- Составы комиссий (CSV)
- Резерв участковых избирательных комиссий (CSV)
- Исходные данные: html-страницы (файл)
Архив
Чтобы скачать предыдущие версии данных, необходимо поменять дату в ссылках на другую, имеющуюся в архиве. Доступны следующие даты:
- 20140404
- 20140629
- 20141119
- 20150915
- 20160229
- 20160629
- 20170121
- 20170719
- 20180215
- 20180709
- 20180906
- 20190101
- 20190313
Структура данных
Таблица адресов избирательных комиссий (cik_uik):
Код поля | Название поля | Примечания | Пример |
---|---|---|---|
id | id избирательной комиссии | Если для записи из резерва не удается найти подходящую комиссию, то в таблице адресов избирательных комиссий создается фейковая запись, которой назначается отрицательное значение id. | 45766 |
iz_id | id избирательной комиссии, используемый в ГАС Выборы | 442401997889 | |
reserve_iz_id | id резерва участковой избирательной комиссии, используемый в ГАС Выборы | 828 | |
parent_id | id "вышестоящей" избирательной комиссии | 45764 | |
type_ik | тип избирательной комиссии | type_ik=ik – избирательная комиссия субъекта РФ type_ik=tik – территориальная избирательная комиссия |
uik |
region | субъект РФ, к которой относится избирательная комиссия | kemerovo | |
url | URL интернет страницы с информацией об избирательной комиссии | http://www.kemerovo.vybory.izbirkom.ru/region/kemerovo?action=ik&vrn=442401997889 | |
name | название избирательной комиссии | Участковая избирательная комиссия №545 | |
address | адрес избирательной комиссии | 652840, Кемеровская область, Мысковский городской округ, Чувашка поселок, улица Алтын Шор, дом 4, Дом культуры поселка Чувашка | |
address_voteroom | адрес помещения для голосования | Это поле появилось в выгрузке начиная с 15.02.2018 | 652840, Кемеровская область, Мысковский городской округ, Чувашка поселок, улица Алтын Шор, дом 4, Дом культуры поселка Чувашка |
lat_ik, lon_ik | координаты избирательной комиссии | Эти поля появились в выгрузке начиная с 15.02.2018 | 53.597575, 87.818478 |
lat_voteroom, lon_voteroom | координаты помещения для голосования | Эти поля появились в выгрузке начиная с 15.02.2018 | 53.597575, 87.818478 |
phone | телефон избирательной комиссии | 8-(384-74)-95-6-46 | |
phone_voteroom | телефон помещения для голосования | Это поле появилось в выгрузке начиная с 15.02.2018 | 8-(384-74)-95-6-46 |
fax | номер факса избирательной комиссии | (38474) | |
адрес электронной почты избирательной комиссии | |||
end_date | дата окончания полномочий избирательной комиссии | 26.03.2018 |
Таблица составов избирательных комиссий (cik_people):
Код поля | Название поля | Примечания | Пример |
---|---|---|---|
id | id записи | 683770 | |
ik_id | id избирательной комиссии | этот id указывает на комиссию из таблицы адресов комиссии | 78161 |
number | номер в списке членов избирательной комиссии | никакого смысла это поле не имеет | 10 |
fio | Фамилия Имя Отчество члена избирательной комиссии | Якимова Татьяна Валерьевна | |
post | должность | Член | |
party | субъект, предложивший данную кандидатуру в состав комиссии | Свердловское региональное отделение политической партии "Российская объединенная демократическая партия "ЯБЛОКО" |
Таблица резервов участковых избирательных комиссий (cik_people_reserve):
Код поля | Название поля | Примечания | Пример |
---|---|---|---|
id | id записи | 457646 | |
ik_id | id избирательной комиссии | этот id указывает на комиссию из таблицы адресов комиссии. Если для записи из резерва не удается найти подходящую комиссию, то в таблице адресов избирательных комиссий создается фейковая запись, которой назначается отрицательное значение id. | 81578 |
number | номер в списке членов резерва участковой избирательной комиссии | никакого смысла это поле не имеет | 1 |
fio | Фамилия Имя Отчество члена резерва участковой избирательной комиссии | Васькина Юлия Николаевна | |
post | должность | Зачислен в резерв составов УИК | |
party | субъект, предложивший данную кандидатуру в состав комиссии | собрание избирателей по месту работы - ГБОУ НПО "Профессиональный лицей №10", г.Тверь |
Недостатки
У представленных данных есть несколько недостатков
1. Неполная адресная информация об УИК
Адрес участковой избирательной комиссии (УИК) определяется постановлением главы соответствующего муниципального образования или решением ТИК. Обычно в этих документах указывают не только почтовый адрес УИК, но также и название соответствующего здания (школа, дом культуры, клуб, и пр.). В представленных на сайтах избирательных комиссий субъектов РФ информация о типе здания во многих случаях опускается. Кроме того, там не делается различий между адресом помещения для голосования и адресом избирательной комиссии.
2. Актуальность информации
Непонятна актуальность информации. Составы комиссий и адреса УИК время от времени меняются. Из представленных данных неясно, какие из этих изменений учтены.
3. Территории избирательных участков
Отсутствует информация о территории избирательных участков.
4. Непостоянство структуры записи адреса избирательной комиссии Встречаются разные вариации записи адреса избирательного участка
- индекс, область, район, населенный пункт, улица (название места голосования), дом
- индекс, область, район, населенный пункт (название места голосования), улица, дом
- индекс, область, район, населенный пункт, улица, дом, название места голосования
- и множество других
Название любого компонента адреса может фигурировать в разных вариантах, содержать опечатки или вообще отсутствовать. В середине адресной строки могут присутствовать неожиданные вставки вида
- Адрес УИК и помещения для голосования:
- адрес УИК
- адрес помещения для голосования
Скрипты
Для получения данных служат следующие скрипты:
- down.py - скачивание исходных данных
- cik.py - парсинг исходных данных в SQLite базу
Для преобразование SQLite -> CSV используются следующие команды:
sqlite3 -header -csv cik.sqlite "select * from cik_people order by id" > cik_people.csv
sqlite3 -header -csv cik.sqlite "select * from cik_uik order by id" > cik_uik.csv
sqlite3 -header -csv cik.sqlite "select * from cik_people_reserve order by id" > cik_people_reserve.csv
Примеры использования
- Скачать данные об адресах и составах избирательных комиссий Башкортостана
python down.py --region=bashkortostan
- Скачать данные об адресах, составах избирательных комиссий и резервов участковых избирательных комиссий Орловской области
python down.py --with-reserve --region=orel
Список используемых наименований субъектов РФ можно посмотреть в файле cik.py
Примеры SQL запросов
NB В программе sqlite по умолчанию не включена поддержка сопоставления кириллических символов. По умолчанию не работают функции перевода строки в нижний и верхний регистр и не работает регистронезависимый поиск. Как исправить этот недостаток описано ниже.
Запрос к базе данных выглядит следующим образом
sqlite3 -header -csv cik.sqlite "sql запрос" > result.csv
Примеры простых sql запросов:
- Выгрузить из SQLite базы списочный состав всех избирательных комиссий Москвы с указанием названий комиссий
select
cik_uik.name,
cik_people.*
from
cik_people
inner join
cik_uik
on cik_people.ik_id = cik_uik.id
where
cik_uik.region = 'moscow_city'
- Выгрузить из SQLite базы списочный состав всех участковых избирательных комиссий Московской области с указанием названий самой комиссии и вышестоящей
select
cik_uik2.name as "parent_name",
cik_uik1.region,
cik_uik1.url,
cik_uik1.name,
cik_people.fio,
cik_people.post,
cik_people.party
from
cik_uik as cik_uik1
inner join
cik_uik as cik_uik2
on cik_uik1.parent_id = cik_uik2.id
join
cik_people
on cik_people.ik_id = cik_uik1.id
where
cik_uik1.type_ik = 'uik'
and cik_uik1.region = 'moscow_reg'
- Выгрузить из SQLite базы адреса всех участковых комиссий Ярославской области
select
cik_uik.*
from
cik_uik
where
cik_uik.region = 'yaroslavl'
and cik_uik.type_ik = 'uik'
and cik_uik.iz_id > 0
- Выгрузить из SQLite состав резервов участковых комиссий Тамбовской области
select
cik_uik.name,
cik_people_reserve.*
from
cik_people_reserve
inner join
cik_uik
on cik_people_reserve.ik_id = cik_uik.id
where
cik_uik.region = 'tambov'
- Выгрузить из SQLite состав резервов участковых комиссий Московской области с указанием названия самой комиссии, а также вышестоящей
select
cik_uik2.name as "parent_name",
cik_uik1.region,
cik_uik1.url,
cik_uik1.name,
cik_people_reserve.fio,
cik_people_reserve.post,
cik_people_reserve.party
from
cik_uik as cik_uik1
left outer join
cik_uik as cik_uik2
on cik_uik1.parent_id = cik_uik2.id
join
cik_people_reserve
on cik_people_reserve.ik_id = cik_uik1.id
where
cik_uik1.region = 'moscow_reg'
- Найти данные по УИКам Брянского района Брянской области
Сначала с помощью запроса
select
cik_uik.name,
cik_uik.id
from
cik_uik
where
type_ik = 'ik'
and cik_uik.name LIKE '%Брянск%'
найдем id комиссии Брянской области. Результатом выполнения этой команды будет следующий текст
Избирательная комиссия Брянской области|91193
Так как ТИКи Брянской области имеют parent_id=91193, то их находим командой
select
cik_uik.name,
cik_uik.id
from
cik_uik
where
parent_id = '91193'
and cik_uik.name LIKE '%Брянск%'
Из вывода этой команды
name|id
Брянск, Бежицкая|91194
Брянск, Володарская|91258
Брянск, Советская|91288
Брянск, Фокинская|91338
Брянская|91461
находим, что УИКи Брянского района Брянской области имеют parent_id=91461. Используя этот результат несложно выбрать нужную информацию по этим УИКам.
NB. Это лишь пример работы со срезом от 01.01.2019. В срезах за другие даты значения id могут отличаться.
- Если известно название вышестоящей комиссии, то составы непосредственно нижестоящих комиссий можно выгрузить одной командой. Например, следующая команда выдает составы всех УИК района Южное Тушино Города Москвы
select
cik_uik.parent_id,
cik_uik.name,
cik_people.*
from
cik_people
inner join
cik_uik
on cik_people.ik_id = cik_uik.id
where
cik_uik.parent_id in
(
select
cik_uik.id
from
cik_uik
where
cik_uik.name like '%Южное Тушино%'
)
- Поиск члена комиссии по фамилии по всем комиссиям
select
cik_uik.name,
cik_uik.address,
cik_people.*
from
cik_people
inner join
cik_uik
on cik_people.ik_id = cik_uik.id
where
cik_people.fio LIKE '%Иванов Иван%'
Подключение регистронезависимого поиска для sqlite
По умолчанию sqlite умеет переводить символы в верхний или нижний регистр и искать строки без учета регистра только для ASCII символов. Для поддержки этих операций для символов вне этого диапазона необходимо подключить специальное расширение. Для этого
- Необходимо скачать исходные тексты sqlite.
- Распаковать архив с исходными текстами и перейти в директорию ext/icu/.
- Скомпилировать расширение icu.
- Регистронезависимый поиск по базе данных осуществляется командой
sqlite3 -header -csv cik.sqlite '.load /PATH/TO/ICU/EXTENSION/libSqliteIcu.so sqlite3_icu_init' "sql запрос" > result.csv
Альтернативные машиночитаемые источники данных
- УИК ГЕО – данные об адресах участковых избирательных комиссий и географических координат помещений для голосования.
- WikiУИКи - данные об избирательных комиссиях и их составах.
- Мосгоризбирком