Открытый набор геоданных по архитектурному наследию Москвы: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
Строка 137: Строка 137:
* в каталог попали только 407 из 800 геокодированных объектов Москомнаследия, попавших в зону интереса иследования.
* в каталог попали только 407 из 800 геокодированных объектов Москомнаследия, попавших в зону интереса иследования.


=== Улучшить данные ===
=== Как улучшить данные ===
черновик
Данные неполны. Там не вся Москва. Чтобы их улучшить, надо поступать так:
Данные неполны. Там не вся Москва. Чтобы их улучшить, есть 2 варианта
* Занести в базу OSM не найденные здания с адресами. Это можно делать только из тех источников, при использовании которых не будут нарушаться условия лицензии OSM, и скорее всего, все доступные адреса из них уже взяли. Предпочтительный вариант - сьездить самому на местность, и посмотреть эти дома.
* Занести в базу OSM не найденные здания с адресами. Это можно делать только из тех источников, что не нарушать авторские права, или же сьездить самому, и посмотреть эти дома.
* Сделать то же самое для памятников, оград, и парков.
* Уточнять координаты точек в этом наборе данных.
* Уточнять координаты точек в этом наборе данных.
* Если будут новые данные, то связаться со мной, и я пересоберу данные.
* Если будут новые данные, то связаться со мной, и я пересоберу данные.
* Могу выложить скрипт для составления слоя полигонов, но им всё равно никто пользоваться не будет.
* Могу выложить скрипт для составления слоя полигонов, но им всё равно никто пользоваться не будет.

Версия от 13:33, 14 января 2014

Эта страница является черновиком статьи.


Открытые геоданные по архитектурному наследию Москвы

Департамент культурного наследия города Москвы выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (id 530, источник). Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.

В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.

Здесь представлены результаты нашего труда.

Создано в Nextgis.png Веб ГИС для вашей организации по доступной цене
Полигональный слой в историческом районе.

Данные

В наборе данных на сайте Московского правительства содержатся адреса памятников архитектуры, то есть зданий и сооружений на которых есть городские таблички "памятник архитектуры". В него входят:

  • Жилые, конторские и промышленные здания. Самые новые дома - конца 1950-х годов.
  • Усадебные комплексы, с разбивкой по отдельным зданиям.
  • Храмы и монастыри.
  • Памятники на улицах, и отдельные памятники на кладбищах.
  • Вокзалы и станционные постройки.
  • Археологические объекты.

Однако в списке нет федеральных памятников.

http://www.panoramio.com/photo/87439874

Описание структуры набора данных

Исходные данные состояли из списка адресов объектов взятых из соответствующего набора. Для каждой записи было произведено автоматическое геокодирование по базе данных OpenStreetMap для получения координат, и взят окружающий его полигон здания из Openstreetmap, при его наличии.

Часть записей попавших в зону интереса была выверена вручную по данным OpenStreetMap и открытым источникам.

Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания ансамбля.

Актуальность данных - октябрь 2013 года. Геометрия зданий взята из дампа OSM от 9 января 2014 года.

Ограничения:

  1. В списке есть записи не только по зданиям, но и по паркам, оградам, памятникам, а так же недавно снесённым зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
  2. Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек и их статусы могут быть неверными.
  3. Некоторые точки не попадают в дома OSM, поэтому полигонов меньше, чем точек.
  4. Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в таблице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
  5. Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это объясняется структурой данных OSM.
  6. Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это объясняется отсутствием адресной информации по зданиям в Openstreetmap.
  7. В Shape-файлах длинна полей ограничена 254 символами.
Распределение по территории города

Объектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.

Результаты:

Форматы

Данные распространяются в виде трёх файлов в формате ESRI Shapefile и CSV. Кодировка UTF-8. Система координат EPSG:4326

Точки

Это точечный слой, каждая запись в нём представляет один объект из оригинального набора данных. Координаты получены автоматическим геокодированием. Точки, для которых не нашёлся дом, имеют координаты одной точки в центре города.

Код поля Название поля Примечание Пример
id Код объекта
addr_full Исходный адрес Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому. Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
ensemble Название архитектурного ансамбля, не всегда
name Название объекта Комплекс студенческих общежитий в Аненгофской роще
g_geocoded Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки
g_status Точность автоматической выверки
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1
moved Точность ручной выверки.
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1
class Обозначает что этот объект представляет собой парк, ограду, памятник, либо недавно снесённое здание.
is_multiobject Обозначает, что это мультиобъект, и в таблице мультиточек находится множество точек для каждого отдельного здания.

Мультиточки

Одна запись - один из элементов мультиобъекта. Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания из ансамбля. В таком случае, в таблице точек есть одна запись, а в таблице мультиточек - несколько записей с одинаковым полем id.

Код поля Название поля Примечание Пример
id Код объекта
addr_part1 Адрес (из 2 частей) Москва, Энергетическая улица,
addr_part2 Адрес (из 2 частей) 8 к4
g_status Точность автоматической выверки
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1

Полигоны

Полигонов меньше чем объектов, потому что в OSM нет всех зданий Москвы, и у некоторых существующих не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией.

Код поля Название поля Примечание Пример
id Код объекта
name Название объекта
source Название таблицы-источника
addr_orig Оригинальный адрес из набора данных Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
addr_local Адрес исправленный вручную, по которому производился геокодирование Москва, Энергетическая улица, 8 к4

Применение данных

Данные использованы в исследовании к "Московскому урбанистическому форуму 2013".

  • Археология периферии. Серия "Библиотека Суперпарка". М.: Московский урбанистический форум, 2013. - 32 с.: илл.
  • Каталог нового наследия. Исследование для московского урбанистического форума 2013 "Мегаполисы: Развитие за пределами центра", стр. 443.


Публикуемый здесь набор отличается от использованного в материалах форума:

  • набор для скачивания приведён к лицензии ODBL
  • нумерация отличается от того, что было опубликовано в публикациях
  • в каталог попали только 407 из 800 геокодированных объектов Москомнаследия, попавших в зону интереса иследования.

Как улучшить данные

Данные неполны. Там не вся Москва. Чтобы их улучшить, надо поступать так:

  • Занести в базу OSM не найденные здания с адресами. Это можно делать только из тех источников, при использовании которых не будут нарушаться условия лицензии OSM, и скорее всего, все доступные адреса из них уже взяли. Предпочтительный вариант - сьездить самому на местность, и посмотреть эти дома.
  • Сделать то же самое для памятников, оград, и парков.
  • Уточнять координаты точек в этом наборе данных.
  • Если будут новые данные, то связаться со мной, и я пересоберу данные.
  • Могу выложить скрипт для составления слоя полигонов, но им всё равно никто пользоваться не будет.