Открытый набор геоданных по архитектурному наследию Москвы: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
 
(не показано 14 промежуточных версий этого же участника)
Строка 1: Строка 1:
{{Статья|Черновик}}
{{Статья|Опубликована|heritage}}
{{Аннотация|Открытые геоданные по архитектурному наследию Москвы}}
{{Аннотация|Открытые геоданные по архитектурному наследию Москвы}}


Департамент культурного наследия города Москвы выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (id 530, [http://data.mos.ru/datasets/530 источник]). Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.
Цель - создать слой геоданных по архитектурному наследию Москвы.
 
Источник данных: [http://dkn.mos.ru/contacts/register-of-objects-of-cultural-heritage/memorial/ Реестр объектов культурного наследия] Департамента культурного наследия города Москвы - список из 11617 объектов, по каждому из которых приводятся следующие параметры:
*Наименование объекта
*Наименование ансамбля
*Историческая территория
*Категория историко-культурного значения
*Охранный статус объекта
*Общий адрес
 
Исходные данные в виде единого CSV файла можно скачать [http://gis-lab.info/data/heritage/moscomnasledie_objects_csv.7z здесь], скрипты для получения данных с сайта Москомнаследия - [https://github.com/simgislab/moscomnasledie здесь].
 
Необходимо иметь в виду, что Департамент культурного наследия Москвы также выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (старый id 550, текущий id 530, [http://data.mos.ru/datasets/530 источник]). Список включает только 6104 объекта. Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.


В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.
В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.
Строка 9: Строка 21:


{{NextGIS}}
{{NextGIS}}
[[Файл:Nextgis heritage preview.png|thumb|756px|center|Полигональный слой в историческом районе.]]
[[Файл:Nextgis heritage preview.png|thumb|700px|center|Фрагмент слоя зданий в историческом районе.]]
== Данные ==
== Данные ==
В наборе данных на сайте Московского правительства содержатся адреса памятников архитектуры, то есть зданий и сооружений на которых есть городские таблички "памятник архитектуры". В него входят:
В исходном наборе данных на сайте Москомнаследия содержатся адреса памятников архитектуры, то есть зданий и сооружений на которых есть городские таблички "памятник архитектуры". В него входят:
* Жилые, конторские и промышленные здания. Самые новые дома - конца 1950-х годов.  
* Жилые, конторские и промышленные здания. Самые новые дома - конца 1950-х годов.  
* Усадебные комплексы, с разбивкой по отдельным зданиям.  
* Усадебные комплексы, с разбивкой по отдельным зданиям.  
Строка 18: Строка 30:
* Вокзалы и станционные постройки.
* Вокзалы и станционные постройки.
* Археологические объекты.
* Археологические объекты.
Однако в списке нет федеральных памятников.
В списке нет федеральных памятников.


http://www.panoramio.com/photo/87439874
http://www.panoramio.com/photo/87439874
Строка 25: Строка 37:
Исходные данные состояли из списка адресов объектов взятых из соответствующего набора. Для каждой записи было произведено автоматическое геокодирование по базе данных OpenStreetMap для получения координат, и взят окружающий его полигон здания из Openstreetmap, при его наличии.
Исходные данные состояли из списка адресов объектов взятых из соответствующего набора. Для каждой записи было произведено автоматическое геокодирование по базе данных OpenStreetMap для получения координат, и взят окружающий его полигон здания из Openstreetmap, при его наличии.


Часть записей попавших в зону интереса была выверена вручную по данным OpenStreetMap и открытым источникам.
Большая часть записей попавших в зону интереса была выверена вручную по данным OpenStreetMap и открытым источникам.


Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания ансамбля.
Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания ансамбля.
Строка 33: Строка 45:
== Ограничения: ==
== Ограничения: ==
# В списке есть записи не только по зданиям, но и по паркам, оградам, памятникам, а так же недавно снесённым зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
# В списке есть записи не только по зданиям, но и по паркам, оградам, памятникам, а так же недавно снесённым зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
# Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек и их статусы могут быть неверными.  
# Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек и их статусы могут быть менее точными.  
# Некоторые точки не попадают в дома OSM, поэтому полигонов меньше, чем точек.
# Некоторым точкам не соответствуют дома из OSM, поэтому полигонов меньше, чем точек.
# Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в таблице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
# Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в таблице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
# Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это объясняется структурой данных OSM.
# Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это объясняется структурой данных OSM.
# Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это объясняется отсутствием адресной информации по зданиям в Openstreetmap.
# Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это объясняется отсутствием адресной информации по зданиям в Openstreetmap.
# В Shape-файлах длинна полей ограничена 254 символами.
# В Shape-файлах длина полей ограничена 254 символами.


[[Файл:Nextgis heritage moscowmap2.png|thumb|500px|right|Распределение по территории города]]
[[Файл:Nextgis heritage moscowmap2.png|thumb|500px|right|Распределение по территории города]]


Объектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.  
Объектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.
 
== Результаты: ==
== Результаты: ==
=== Форматы ===
=== Форматы ===
Строка 52: Строка 65:


=== Лицензия ===
=== Лицензия ===
ODBL. Смесь данных с портала правительства Москвы и Openstreetmap.
[http://opendatacommons.org/licenses/odbl/1.0/ ODBL].
This data is made available under the Open Database License: http://opendatacommons.org/licenses/odbl/1.0/. Any rights in individual contents of the database are licensed under the Database Contents License: http://opendatacommons.org/licenses/dbcl/1.0/ - See more at: http://opendatacommons.org/licenses/odbl/#sthash.3AUR4Yf1.dpuf
 
Предлагаемое цитирование:
 
<pre>Набор геоданных по архитектурному наследию г. Москвы, 2013, ODBL.
      © Москомнаследие, http://dkn.mos.ru/contacts/register-of-objects-of-cultural-heritage/memorial/
      © Участники OpenStreetMap
      © NextGIS</pre>
 
=== Точки ===
=== Точки ===
Это точечный слой, каждая запись в нём представляет один объект из оригинального набора данных. Координаты получены автоматическим геокодированием. Точки, для которых не нашёлся дом, имеют координаты одной точки в центре города.
Это точечный слой, каждая запись в нём представляет один объект из оригинального набора данных. Координаты получены автоматическим геокодированием. Точки, для которых не нашёлся дом, имеют координаты одной точки в центре города.
Строка 137: Строка 157:
*Каталог нового наследия. Исследование для московского урбанистического форума 2013 "Мегаполисы: Развитие за пределами центра", стр. 443.
*Каталог нового наследия. Исследование для московского урбанистического форума 2013 "Мегаполисы: Развитие за пределами центра", стр. 443.


В обоих публикациях вы можете найти выверенные экспертами списки объектов с печатными картами и фотографиями.


Публикуемый здесь набор отличается от использованного в материалах форума:
Публикуемый здесь набор отличается от использованного в материалах форума и является предварительной его версией:
* набор для скачивания приведён к лицензии ODBL
* набор для скачивания приведён к лицензии ODBL
* нумерация отличается от того, что было опубликовано в публикациях
* нумерация отличается от использованной в публикациях выше
* в каталог попали только 407 из 800 геокодированных объектов Москомнаследия, попавших в зону интереса иследования.
* в публикации не попали 393 из 800 геокодированных объектов Москомнаследия, так как они не вошли в зону интереса иследования.
* в публикации были включены несколько дополнительных экспертных списков объектов, которые не приводятся здесь.


=== Как улучшить данные ===
=== Как улучшить данные ===
Данные неполны. Там не вся Москва. Чтобы их улучшить, надо поступать так:
Наши результаты неполны, так как недостаточно точна та картографическая основа которую мы использовали для привязки. Другими словами, не все объекты из списков можно найти на карте. Чтобы улучшить этот набор геоданных, нужно:
 
* Занести в базу OSM не найденные здания с адресами. Пожалуйста, перед загрузкой, убедитесь, что ваши данные лицензионно чисты, вы получили их по открытым источникам или источникам, для которых вы имеете право переводить в их векторную форму. Карты геосервисов Google, Microsoft и подобных такими данными - не являются! Скорее всего, все доступные адреса из таких источников уже взяли. Предпочтительный вариант - сьездить самому на местность, и посмотреть эти дома.
* Занести в базу OSM не найденные здания с адресами. Пожалуйста, перед загрузкой, убедитесь, что ваши данные лицензионно чисты, вы получили их по открытым источникам или источникам, для которых вы имеете право переводить в их векторную форму. Карты геосервисов Google, Microsoft и подобных такими данными - не являются! Скорее всего, все доступные адреса из таких источников уже взяли. Предпочтительный вариант - сьездить самому на местность, и посмотреть эти дома.
* Сделать то же самое для памятников, оград, и парков.
* Сделать то же самое для памятников, оград, и парков.
* Уточнять координаты точек в этом наборе данных.
* Уточнять координаты точек в этом наборе данных.
* Если будут новые данные, то связаться со мной, (trolleway@yandex.ru) и я пересоберу данные.
* Если будут новые данные, то связаться со мной, (trolleway@yandex.ru) и я пересоберу данные.

Текущая версия от 21:20, 15 февраля 2014

Эта страница опубликована в основном списке статей сайта
по адресу http://gis-lab.info/qa/heritage.html


Открытые геоданные по архитектурному наследию Москвы

Цель - создать слой геоданных по архитектурному наследию Москвы.

Источник данных: Реестр объектов культурного наследия Департамента культурного наследия города Москвы - список из 11617 объектов, по каждому из которых приводятся следующие параметры:

  • Наименование объекта
  • Наименование ансамбля
  • Историческая территория
  • Категория историко-культурного значения
  • Охранный статус объекта
  • Общий адрес

Исходные данные в виде единого CSV файла можно скачать здесь, скрипты для получения данных с сайта Москомнаследия - здесь.

Необходимо иметь в виду, что Департамент культурного наследия Москвы также выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (старый id 550, текущий id 530, источник). Список включает только 6104 объекта. Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.

В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.

Здесь представлены результаты нашего труда.

Создано в Nextgis.png Веб ГИС для вашей организации по доступной цене
Фрагмент слоя зданий в историческом районе.

Данные

В исходном наборе данных на сайте Москомнаследия содержатся адреса памятников архитектуры, то есть зданий и сооружений на которых есть городские таблички "памятник архитектуры". В него входят:

  • Жилые, конторские и промышленные здания. Самые новые дома - конца 1950-х годов.
  • Усадебные комплексы, с разбивкой по отдельным зданиям.
  • Храмы и монастыри.
  • Памятники на улицах, и отдельные памятники на кладбищах.
  • Вокзалы и станционные постройки.
  • Археологические объекты.

В списке нет федеральных памятников.

http://www.panoramio.com/photo/87439874

Описание структуры набора данных

Исходные данные состояли из списка адресов объектов взятых из соответствующего набора. Для каждой записи было произведено автоматическое геокодирование по базе данных OpenStreetMap для получения координат, и взят окружающий его полигон здания из Openstreetmap, при его наличии.

Большая часть записей попавших в зону интереса была выверена вручную по данным OpenStreetMap и открытым источникам.

Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания ансамбля.

Актуальность данных - октябрь 2013 года. Геометрия зданий взята из дампа OSM от 9 января 2014 года.

Ограничения:

  1. В списке есть записи не только по зданиям, но и по паркам, оградам, памятникам, а так же недавно снесённым зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
  2. Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек и их статусы могут быть менее точными.
  3. Некоторым точкам не соответствуют дома из OSM, поэтому полигонов меньше, чем точек.
  4. Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в таблице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
  5. Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это объясняется структурой данных OSM.
  6. Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это объясняется отсутствием адресной информации по зданиям в Openstreetmap.
  7. В Shape-файлах длина полей ограничена 254 символами.
Распределение по территории города

Объектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.

Результаты:

Форматы

Система координат данных: EPSG: 4326 (latlon/WGS84) Формат данных: CSV или ESRI Shapefile Кодировка: UTF-8 Формат хранения геометрий: WKT или пара полей с координатами.

Лицензия

ODBL.

Предлагаемое цитирование:

Набор геоданных по архитектурному наследию г. Москвы, 2013, ODBL.
       © Москомнаследие, http://dkn.mos.ru/contacts/register-of-objects-of-cultural-heritage/memorial/
       © Участники OpenStreetMap
       © NextGIS

Точки

Это точечный слой, каждая запись в нём представляет один объект из оригинального набора данных. Координаты получены автоматическим геокодированием. Точки, для которых не нашёлся дом, имеют координаты одной точки в центре города.

Код поля Название поля Примечание Пример
id Код объекта
addr_full Исходный адрес Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому. Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
ensemble Название архитектурного ансамбля, не всегда
name Название объекта Комплекс студенческих общежитий в Аненгофской роще
g_geocoded Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки
g_status Точность автоматической выверки
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1
moved Точность ручной выверки.
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1
class Обозначает что этот объект представляет собой парк, ограду, памятник, либо недавно снесённое здание.
is_multiobject Обозначает, что это мультиобъект, и в таблице мультиточек находится множество точек для каждого отдельного здания.

Мультиточки

Одна запись - один из элементов мультиобъекта. Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания из ансамбля. В таком случае, в таблице точек есть одна запись, а в таблице мультиточек - несколько записей с одинаковым полем id.

Код поля Название поля Примечание Пример
id Код объекта
addr_part1 Адрес (из 2 частей) Москва, Энергетическая улица,
addr_part2 Адрес (из 2 частей) 8 к4
g_status Точность автоматической выверки
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1

Полигоны

Полигонов меньше чем объектов, потому что в OSM нет всех зданий Москвы, и у некоторых существующих не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией.

Код поля Название поля Примечание Пример
id Код объекта
name Название объекта
source Название таблицы-источника
addr_orig Оригинальный адрес из набора данных Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
addr_local Адрес исправленный вручную, по которому производился геокодирование Москва, Энергетическая улица, 8 к4

Применение данных

Данные использованы в исследовании к "Московскому урбанистическому форуму 2013".

  • Археология периферии. Серия "Библиотека Суперпарка". М.: Московский урбанистический форум, 2013. - 32 с.: илл.
  • Каталог нового наследия. Исследование для московского урбанистического форума 2013 "Мегаполисы: Развитие за пределами центра", стр. 443.

В обоих публикациях вы можете найти выверенные экспертами списки объектов с печатными картами и фотографиями.

Публикуемый здесь набор отличается от использованного в материалах форума и является предварительной его версией:

  • набор для скачивания приведён к лицензии ODBL
  • нумерация отличается от использованной в публикациях выше
  • в публикации не попали 393 из 800 геокодированных объектов Москомнаследия, так как они не вошли в зону интереса иследования.
  • в публикации были включены несколько дополнительных экспертных списков объектов, которые не приводятся здесь.

Как улучшить данные

Наши результаты неполны, так как недостаточно точна та картографическая основа которую мы использовали для привязки. Другими словами, не все объекты из списков можно найти на карте. Чтобы улучшить этот набор геоданных, нужно:

  • Занести в базу OSM не найденные здания с адресами. Пожалуйста, перед загрузкой, убедитесь, что ваши данные лицензионно чисты, вы получили их по открытым источникам или источникам, для которых вы имеете право переводить в их векторную форму. Карты геосервисов Google, Microsoft и подобных такими данными - не являются! Скорее всего, все доступные адреса из таких источников уже взяли. Предпочтительный вариант - сьездить самому на местность, и посмотреть эти дома.
  • Сделать то же самое для памятников, оград, и парков.
  • Уточнять координаты точек в этом наборе данных.
  • Если будут новые данные, то связаться со мной, (trolleway@yandex.ru) и я пересоберу данные.