Открытый набор геоданных по архитектурному наследию Москвы: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
Строка 53: Строка 53:


=== Лицензия ===
=== Лицензия ===
[http://opendatacommons.org/licenses/odbl/1.0/ ODBL]. Смесь данных с портала правительства Москвы и Openstreetmap.
[http://opendatacommons.org/licenses/odbl/1.0/ ODBL].


Предлагаемое цитирование:
Предлагаемое цитирование:

Версия от 19:28, 3 февраля 2014

Эта страница является черновиком статьи.


Открытые геоданные по архитектурному наследию Москвы

Департамент культурного наследия города Москвы выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (id 530, источник). Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.

В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.

Здесь представлены результаты нашего труда.

Создано в Nextgis.png Веб ГИС для вашей организации по доступной цене
Фрагмент слоя зданий в историческом районе.

Данные

В исходном наборе данных на сайте Московского правительства содержатся адреса памятников архитектуры, то есть зданий и сооружений на которых есть городские таблички "памятник архитектуры". В него входят:

  • Жилые, конторские и промышленные здания. Самые новые дома - конца 1950-х годов.
  • Усадебные комплексы, с разбивкой по отдельным зданиям.
  • Храмы и монастыри.
  • Памятники на улицах, и отдельные памятники на кладбищах.
  • Вокзалы и станционные постройки.
  • Археологические объекты.

В списке нет федеральных памятников.

http://www.panoramio.com/photo/87439874

Описание структуры набора данных

Исходные данные состояли из списка адресов объектов взятых из соответствующего набора. Для каждой записи было произведено автоматическое геокодирование по базе данных OpenStreetMap для получения координат, и взят окружающий его полигон здания из Openstreetmap, при его наличии.

Большая часть записей попавших в зону интереса была выверена вручную по данным OpenStreetMap и открытым источникам.

Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания ансамбля.

Актуальность данных - октябрь 2013 года. Геометрия зданий взята из дампа OSM от 9 января 2014 года.

Ограничения:

  1. В списке есть записи не только по зданиям, но и по паркам, оградам, памятникам, а так же недавно снесённым зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
  2. Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек и их статусы могут быть менее точными.
  3. Некоторым точкам не соответствуют дома из OSM, поэтому полигонов меньше, чем точек.
  4. Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в таблице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
  5. Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это объясняется структурой данных OSM.
  6. Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это объясняется отсутствием адресной информации по зданиям в Openstreetmap.
  7. В Shape-файлах длинна полей ограничена 254 символами.
Распределение по территории города

Объектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.

Результаты:

Форматы

Система координат данных: EPSG: 4326 (latlon/WGS84) Формат данных: CSV или ESRI Shapefile Кодировка: UTF-8 Формат хранения геометрий: WKT или пара полей с координатами.

Лицензия

ODBL.

Предлагаемое цитирование:

Набор геоданных по архитектурному наследию г. Москвы, 2013, ODBL.
       © Портал открытых данных г. Москва, http://data.mos.ru
       © Участники OpenStreetMap
       © NextGIS

Точки

Это точечный слой, каждая запись в нём представляет один объект из оригинального набора данных. Координаты получены автоматическим геокодированием. Точки, для которых не нашёлся дом, имеют координаты одной точки в центре города.

Код поля Название поля Примечание Пример
id Код объекта
addr_full Исходный адрес Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому. Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
ensemble Название архитектурного ансамбля, не всегда
name Название объекта Комплекс студенческих общежитий в Аненгофской роще
g_geocoded Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки
g_status Точность автоматической выверки
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1
moved Точность ручной выверки.
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1
class Обозначает что этот объект представляет собой парк, ограду, памятник, либо недавно снесённое здание.
is_multiobject Обозначает, что это мультиобъект, и в таблице мультиточек находится множество точек для каждого отдельного здания.

Мультиточки

Одна запись - один из элементов мультиобъекта. Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания из ансамбля. В таком случае, в таблице точек есть одна запись, а в таблице мультиточек - несколько записей с одинаковым полем id.

Код поля Название поля Примечание Пример
id Код объекта
addr_part1 Адрес (из 2 частей) Москва, Энергетическая улица,
addr_part2 Адрес (из 2 частей) 8 к4
g_status Точность автоматической выверки
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1

Полигоны

Полигонов меньше чем объектов, потому что в OSM нет всех зданий Москвы, и у некоторых существующих не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией.

Код поля Название поля Примечание Пример
id Код объекта
name Название объекта
source Название таблицы-источника
addr_orig Оригинальный адрес из набора данных Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
addr_local Адрес исправленный вручную, по которому производился геокодирование Москва, Энергетическая улица, 8 к4

Применение данных

Данные использованы в исследовании к "Московскому урбанистическому форуму 2013".

  • Археология периферии. Серия "Библиотека Суперпарка". М.: Московский урбанистический форум, 2013. - 32 с.: илл.
  • Каталог нового наследия. Исследование для московского урбанистического форума 2013 "Мегаполисы: Развитие за пределами центра", стр. 443.

В обоих публикациях вы можете найти выверенные экспертами списки объектов с печатными картами и фотографиями.

Публикуемый здесь набор отличается от использованного в материалах форума и является предварительной его версией:

  • набор для скачивания приведён к лицензии ODBL
  • нумерация отличается от использованной в публикациях выше
  • в публикации не попали 393 из 800 геокодированных объектов Москомнаследия, так как они не вошли в зону интереса иследования.
  • в публикации были включены несколько дополнительных экспертных списков объектов, которые не приводятся здесь.

Как улучшить данные

Наши результаты неполны, так как недостаточно точна та картографическая основа которую мы использовали для привязки. Другими словами, не все объекты из списков можно найти на карте. Чтобы улучшить этот набор геоданных, нужно:

  • Занести в базу OSM не найденные здания с адресами. Пожалуйста, перед загрузкой, убедитесь, что ваши данные лицензионно чисты, вы получили их по открытым источникам или источникам, для которых вы имеете право переводить в их векторную форму. Карты геосервисов Google, Microsoft и подобных такими данными - не являются! Скорее всего, все доступные адреса из таких источников уже взяли. Предпочтительный вариант - сьездить самому на местность, и посмотреть эти дома.
  • Сделать то же самое для памятников, оград, и парков.
  • Уточнять координаты точек в этом наборе данных.
  • Если будут новые данные, то связаться со мной, (trolleway@yandex.ru) и я пересоберу данные.