Открытый набор геоданных по архитектурному наследию Москвы: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
 
(не показано 50 промежуточных версий 2 участников)
Строка 1: Строка 1:
{{Статья|Черновик}}
{{Статья|Опубликована|heritage}}
{{Аннотация|Открытые геоданные по архитектурному наследию Москвы}}
{{Аннотация|Открытые геоданные по архитектурному наследию Москвы}}


Департамент культурного наследия города Москвы выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (id 530, [http://data.mos.ru/datasets/530 источник]). Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.
Цель - создать слой геоданных по архитектурному наследию Москвы.
 
Источник данных: [http://dkn.mos.ru/contacts/register-of-objects-of-cultural-heritage/memorial/ Реестр объектов культурного наследия] Департамента культурного наследия города Москвы - список из 11617 объектов, по каждому из которых приводятся следующие параметры:
*Наименование объекта
*Наименование ансамбля
*Историческая территория
*Категория историко-культурного значения
*Охранный статус объекта
*Общий адрес
 
Исходные данные в виде единого CSV файла можно скачать [http://gis-lab.info/data/heritage/moscomnasledie_objects_csv.7z здесь], скрипты для получения данных с сайта Москомнаследия - [https://github.com/simgislab/moscomnasledie здесь].
 
Необходимо иметь в виду, что Департамент культурного наследия Москвы также выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (старый id 550, текущий id 530, [http://data.mos.ru/datasets/530 источник]). Список включает только 6104 объекта. Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.


В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.
В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.
Строка 9: Строка 21:


{{NextGIS}}
{{NextGIS}}
[[Файл:Nextgis heritage preview.png|thumb|700px|center|Фрагмент слоя зданий в историческом районе.]]
== Данные ==
В исходном наборе данных на сайте Москомнаследия содержатся адреса памятников архитектуры, то есть зданий и сооружений на которых есть городские таблички "памятник архитектуры". В него входят:
* Жилые, конторские и промышленные здания. Самые новые дома - конца 1950-х годов.
* Усадебные комплексы, с разбивкой по отдельным зданиям.
* Храмы и монастыри.
* Памятники на улицах, и отдельные памятники на кладбищах.
* Вокзалы и станционные постройки.
* Археологические объекты.
В списке нет федеральных памятников.
http://www.panoramio.com/photo/87439874


== Описание структуры набора данных ==
== Описание структуры набора данных ==
Исходные данные состояли из списка адресов обьектов взятых из соответствующего набора. Для каждой записи было произведено автоматическое геокодирование по базе данных OpenStreetMap для получения координат, взят окружающий его полигон здания из Openstreetmap, при его наличии.
Исходные данные состояли из списка адресов объектов взятых из соответствующего набора. Для каждой записи было произведено автоматическое геокодирование по базе данных OpenStreetMap для получения координат, и взят окружающий его полигон здания из Openstreetmap, при его наличии.


Часть записей попавших в зону интереса была выверена вручную по данным OpenStreetMap и открытым источникам.
Большая часть записей попавших в зону интереса была выверена вручную по данным OpenStreetMap и открытым источникам.


Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания ансамбля.
Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания ансамбля.


Актуальность данных - октябрь 2013 года.
Актуальность данных - октябрь 2013 года. Геометрия зданий взята из дампа OSM от 9 января 2014 года.


== Ограничения: ==
== Ограничения: ==
# В списке есть записи по паркам, оградам, памятникам, и недавно снесёным зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
# В списке есть записи не только по зданиям, но и по паркам, оградам, памятникам, а так же недавно снесённым зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
# Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек, и их статусы могут быть неверными.  
# Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек и их статусы могут быть менее точными.  
# Некоторые точки не попадают в дома OSM, поэтому полигонов меньше, чем точек.
# Некоторым точкам не соответствуют дома из OSM, поэтому полигонов меньше, чем точек.
# Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в табице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
# Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в таблице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
# Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это обьясняется структурой данных OSM.
# Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это объясняется структурой данных OSM.
# Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это обьясняется отсутствием адресной информации по зданиям в Openstreetmap.
# Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это объясняется отсутствием адресной информации по зданиям в Openstreetmap.
# В Shape-файлах длина полей ограничена 254 символами.
 
[[Файл:Nextgis heritage moscowmap2.png|thumb|500px|right|Распределение по территории города]]
 
Объектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.
 
== Результаты: ==
=== Форматы ===
 
Система координат данных: EPSG: 4326 (latlon/WGS84)
Формат данных: CSV или ESRI Shapefile
Кодировка: UTF-8
Формат хранения геометрий: WKT или пара полей с координатами.
 
=== Лицензия ===
[http://opendatacommons.org/licenses/odbl/1.0/ ODBL].
 
Предлагаемое цитирование:


<pre>Набор геоданных по архитектурному наследию г. Москвы, 2013, ODBL.
      © Москомнаследие, http://dkn.mos.ru/contacts/register-of-objects-of-cultural-heritage/memorial/
      © Участники OpenStreetMap
      © NextGIS</pre>


Обьектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.
== Описание полей: ==
=== Точки ===
=== Точки ===
Одна запись - один обьект.  
Это точечный слой, каждая запись в нём представляет один объект из оригинального набора данных. Координаты получены автоматическим геокодированием. Точки, для которых не нашёлся дом, имеют координаты одной точки в центре города.
* ogc_fid integer,
{| class="wikitable"
* wkb_geometry geometry(Point,4326),
|-
* id Код обьекта.
! Код поля !! Название поля !! Примечание !! Пример
* addr_full Исходный адрес. Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому.
|-
* ensemble  
| id || Код объекта ||  ||
* name Название
|-
* g_geocoded Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге. Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки.
| addr_full || Исходный адрес ||  Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому. || Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
* g_status Точность автоматической выверки. Если в поле 'moved' есть значение, то это значит что зта запись была выверена вручную, и поле g_status не следует принимать во внимание.
|-
* moved Точность ручной выверки. 1: Точка указывает в правильное здание. 2: Точка указывает в правильный квартал. 3 и больше: точность до района города.
| ensemble || Название архитектурного ансамбля, не всегда ||  ||
* class character varying. Обозначает что этот обьект представляет собой парк, ограду, памятник, либо недавно снесёное здание.
|-
* is_multiobject boolean. Обозначает, что это мультиобьект, и в таблице мультиточек находится множество точек для каждого отдельного здания.
| name || Название объекта  ||  || Комплекс студенческих общежитий в Аненгофской роще
|-
| g_geocoded || Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге || Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки ||
|-
| g_status || Точность автоматической выверки ||
* 1: Точка указывает в правильное здание.  
* 2: Точка указывает в правильный квартал.
* 3 и больше: точность до района города.  
|| 1
|-
| moved || Точность ручной выверки. ||
* 1: Точка указывает в правильное здание.  
* 2: Точка указывает в правильный квартал.  
* 3 и больше: точность до района города.  
|| 1
|-
| class || Обозначает что этот объект представляет собой парк, ограду, памятник, либо недавно снесённое здание. || ||
|-
| is_multiobject ||  || Обозначает, что это мультиобъект, и в таблице мультиточек находится множество точек для каждого отдельного здания. ||
|}
 
* http://gis-lab.info/data/heritage/heritage_cadaster_points.zip
   
   
=== Мультиточки ===
=== Мультиточки ===
Одна запись - один из элементов мультиобьекта.   
Одна запись - один из элементов мультиобъекта.   
Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания из ансамбля. В таком случае, в таблице точек есть одна запись, а в таблице мультиточек - несколько записей с одинаковым полем id.


* ogc_fid integer,
{| class="wikitable"
*   wkb_geometry geometry(Point,4326),
|-
*   id character varying,
! Код поля !! Название поля !! Примечание !! Пример
*   addr_part1 character varying,
|-
*   addr_part2 character varying,
| id  || Код объекта ||  ||
*   g_status text
|-
| addr_part1 || Адрес (из 2 частей) ||   || Москва, Энергетическая улица,
|-
| addr_part2 || Адрес (из 2 частей) ||   || 8 к4
|-
| g_status  || Точность автоматической выверки ||
* 1: Точка указывает в правильное здание.
* 2: Точка указывает в правильный квартал.
* 3 и больше: точность до района города.
|| 1
|}
    
    
* http://gis-lab.info/data/heritage/heritage_cadaster_pointsofmultiopbjects.zip
=== Полигоны ===
=== Полигоны ===
Полигонов меньше чем обьектов, потому что в OSM нет всех зданий Москвы, либо у них не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией.
Полигонов меньше чем объектов, потому что в OSM нет всех зданий Москвы, и у некоторых существующих не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией.
(
 
* id character(6),
{| class="wikitable"
*   way geometry,
|-
*   name character varying,
! Код поля !! Название поля !! Примечание !! Пример
*   source character varying,
|-
*   addr_orig character varying,
| id || Код объекта ||  ||
*  addr_local character varying
|-
| name  || Название объекта  ||  ||
|-
| source|| Название таблицы-источника||  ||
|-
| addr_orig || Оригинальный адрес из набора данных ||  || Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
|-
| addr_local || Адрес исправленный вручную, по которому производился геокодирование ||  || Москва, Энергетическая улица,  8 к4
|}
 
* http://gis-lab.info/data/heritage/heritage_cadaster_polygons.zip
== Применение данных ==
Данные использованы в исследовании к "[http://mosurbanforum.ru Московскому урбанистическому форуму 2013]".
 
*Археология периферии. Серия "Библиотека Суперпарка". М.: Московский урбанистический форум, 2013. - 32 с.: илл.
*Каталог нового наследия. Исследование для московского урбанистического форума 2013 "Мегаполисы: Развитие за пределами центра", стр. 443.
 
В обоих публикациях вы можете найти выверенные экспертами списки объектов с печатными картами и фотографиями.
 
Публикуемый здесь набор отличается от использованного в материалах форума и является предварительной его версией:
* набор для скачивания приведён к лицензии ODBL
* нумерация отличается от использованной в публикациях выше
* в публикации не попали 393 из 800 геокодированных объектов Москомнаследия, так как они не вошли в зону интереса иследования.
* в публикации были включены несколько дополнительных экспертных списков объектов, которые не приводятся здесь.
 
=== Как улучшить данные ===
Наши результаты неполны, так как недостаточно точна та картографическая основа которую мы использовали для привязки. Другими словами, не все объекты из списков можно найти на карте. Чтобы улучшить этот набор геоданных, нужно:


== Форматы файлов ==
* Занести в базу OSM не найденные здания с адресами. Пожалуйста, перед загрузкой, убедитесь, что ваши данные лицензионно чисты, вы получили их по открытым источникам или источникам, для которых вы имеете право переводить в их векторную форму. Карты геосервисов Google, Microsoft и подобных такими данными - не являются! Скорее всего, все доступные адреса из таких источников уже взяли. Предпочтительный вариант - сьездить самому на местность, и посмотреть эти дома.
Данные распространяются в виде нескольких файлов в формате ESRI Shapefile и CSV.
* Сделать то же самое для памятников, оград, и парков.
* Уточнять координаты точек в этом наборе данных.
* Если будут новые данные, то связаться со мной, (trolleway@yandex.ru) и я пересоберу данные.

Текущая версия от 21:20, 15 февраля 2014

Эта страница опубликована в основном списке статей сайта
по адресу http://gis-lab.info/qa/heritage.html


Открытые геоданные по архитектурному наследию Москвы

Цель - создать слой геоданных по архитектурному наследию Москвы.

Источник данных: Реестр объектов культурного наследия Департамента культурного наследия города Москвы - список из 11617 объектов, по каждому из которых приводятся следующие параметры:

  • Наименование объекта
  • Наименование ансамбля
  • Историческая территория
  • Категория историко-культурного значения
  • Охранный статус объекта
  • Общий адрес

Исходные данные в виде единого CSV файла можно скачать здесь, скрипты для получения данных с сайта Москомнаследия - здесь.

Необходимо иметь в виду, что Департамент культурного наследия Москвы также выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (старый id 550, текущий id 530, источник). Список включает только 6104 объекта. Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.

В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.

Здесь представлены результаты нашего труда.

Создано в Nextgis.png Веб ГИС для вашей организации по доступной цене
Фрагмент слоя зданий в историческом районе.

Данные

В исходном наборе данных на сайте Москомнаследия содержатся адреса памятников архитектуры, то есть зданий и сооружений на которых есть городские таблички "памятник архитектуры". В него входят:

  • Жилые, конторские и промышленные здания. Самые новые дома - конца 1950-х годов.
  • Усадебные комплексы, с разбивкой по отдельным зданиям.
  • Храмы и монастыри.
  • Памятники на улицах, и отдельные памятники на кладбищах.
  • Вокзалы и станционные постройки.
  • Археологические объекты.

В списке нет федеральных памятников.

http://www.panoramio.com/photo/87439874

Описание структуры набора данных

Исходные данные состояли из списка адресов объектов взятых из соответствующего набора. Для каждой записи было произведено автоматическое геокодирование по базе данных OpenStreetMap для получения координат, и взят окружающий его полигон здания из Openstreetmap, при его наличии.

Большая часть записей попавших в зону интереса была выверена вручную по данным OpenStreetMap и открытым источникам.

Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания ансамбля.

Актуальность данных - октябрь 2013 года. Геометрия зданий взята из дампа OSM от 9 января 2014 года.

Ограничения:

  1. В списке есть записи не только по зданиям, но и по паркам, оградам, памятникам, а так же недавно снесённым зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
  2. Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек и их статусы могут быть менее точными.
  3. Некоторым точкам не соответствуют дома из OSM, поэтому полигонов меньше, чем точек.
  4. Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в таблице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
  5. Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это объясняется структурой данных OSM.
  6. Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это объясняется отсутствием адресной информации по зданиям в Openstreetmap.
  7. В Shape-файлах длина полей ограничена 254 символами.
Распределение по территории города

Объектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.

Результаты:

Форматы

Система координат данных: EPSG: 4326 (latlon/WGS84) Формат данных: CSV или ESRI Shapefile Кодировка: UTF-8 Формат хранения геометрий: WKT или пара полей с координатами.

Лицензия

ODBL.

Предлагаемое цитирование:

Набор геоданных по архитектурному наследию г. Москвы, 2013, ODBL.
       © Москомнаследие, http://dkn.mos.ru/contacts/register-of-objects-of-cultural-heritage/memorial/
       © Участники OpenStreetMap
       © NextGIS

Точки

Это точечный слой, каждая запись в нём представляет один объект из оригинального набора данных. Координаты получены автоматическим геокодированием. Точки, для которых не нашёлся дом, имеют координаты одной точки в центре города.

Код поля Название поля Примечание Пример
id Код объекта
addr_full Исходный адрес Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому. Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
ensemble Название архитектурного ансамбля, не всегда
name Название объекта Комплекс студенческих общежитий в Аненгофской роще
g_geocoded Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки
g_status Точность автоматической выверки
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1
moved Точность ручной выверки.
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1
class Обозначает что этот объект представляет собой парк, ограду, памятник, либо недавно снесённое здание.
is_multiobject Обозначает, что это мультиобъект, и в таблице мультиточек находится множество точек для каждого отдельного здания.

Мультиточки

Одна запись - один из элементов мультиобъекта. Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания из ансамбля. В таком случае, в таблице точек есть одна запись, а в таблице мультиточек - несколько записей с одинаковым полем id.

Код поля Название поля Примечание Пример
id Код объекта
addr_part1 Адрес (из 2 частей) Москва, Энергетическая улица,
addr_part2 Адрес (из 2 частей) 8 к4
g_status Точность автоматической выверки
  • 1: Точка указывает в правильное здание.
  • 2: Точка указывает в правильный квартал.
  • 3 и больше: точность до района города.
1

Полигоны

Полигонов меньше чем объектов, потому что в OSM нет всех зданий Москвы, и у некоторых существующих не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией.

Код поля Название поля Примечание Пример
id Код объекта
name Название объекта
source Название таблицы-источника
addr_orig Оригинальный адрес из набора данных Энергетическая ул., д.6, к.1-3, д.8, к.4,5,7; д.10, к.1,2; д.14. к.1-4
addr_local Адрес исправленный вручную, по которому производился геокодирование Москва, Энергетическая улица, 8 к4

Применение данных

Данные использованы в исследовании к "Московскому урбанистическому форуму 2013".

  • Археология периферии. Серия "Библиотека Суперпарка". М.: Московский урбанистический форум, 2013. - 32 с.: илл.
  • Каталог нового наследия. Исследование для московского урбанистического форума 2013 "Мегаполисы: Развитие за пределами центра", стр. 443.

В обоих публикациях вы можете найти выверенные экспертами списки объектов с печатными картами и фотографиями.

Публикуемый здесь набор отличается от использованного в материалах форума и является предварительной его версией:

  • набор для скачивания приведён к лицензии ODBL
  • нумерация отличается от использованной в публикациях выше
  • в публикации не попали 393 из 800 геокодированных объектов Москомнаследия, так как они не вошли в зону интереса иследования.
  • в публикации были включены несколько дополнительных экспертных списков объектов, которые не приводятся здесь.

Как улучшить данные

Наши результаты неполны, так как недостаточно точна та картографическая основа которую мы использовали для привязки. Другими словами, не все объекты из списков можно найти на карте. Чтобы улучшить этот набор геоданных, нужно:

  • Занести в базу OSM не найденные здания с адресами. Пожалуйста, перед загрузкой, убедитесь, что ваши данные лицензионно чисты, вы получили их по открытым источникам или источникам, для которых вы имеете право переводить в их векторную форму. Карты геосервисов Google, Microsoft и подобных такими данными - не являются! Скорее всего, все доступные адреса из таких источников уже взяли. Предпочтительный вариант - сьездить самому на местность, и посмотреть эти дома.
  • Сделать то же самое для памятников, оград, и парков.
  • Уточнять координаты точек в этом наборе данных.
  • Если будут новые данные, то связаться со мной, (trolleway@yandex.ru) и я пересоберу данные.