Открытый набор геоданных по архитектурному наследию Москвы: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
Строка 70: Строка 70:
== Форматы файлов ==
== Форматы файлов ==
Данные распространяются в виде нескольких файлов в формате ESRI Shapefile и CSV.
Данные распространяются в виде нескольких файлов в формате ESRI Shapefile и CSV.
http://gis-lab.info/data/heritage/heritage_cadaster_points.zip
http://gis-lab.info/data/heritage/heritage_cadaster_pointsofmultiopbjects.zip
http://gis-lab.info/data/heritage/heritage_cadaster_polygons.zip

Версия от 14:53, 10 января 2014

Эта страница является черновиком статьи.


Открытые геоданные по архитектурному наследию Москвы

Департамент культурного наследия города Москвы выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (id 530, источник). Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.

В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.

Здесь представлены результаты нашего труда.

Создано в Nextgis.png Веб ГИС для вашей организации по доступной цене
Полигональный слой в историческом районе.

Данные использованы в исследовании к "Московскому урбанистическому форуму 2013", и изданы в его материалах. Публикуемый набор отличается от использованного в материалах форума: он приведён к лицензии ODBL.

Описание структуры набора данных

Исходные данные состояли из списка адресов обьектов взятых из соответствующего набора. Для каждой записи было произведено автоматическое геокодирование по базе данных OpenStreetMap для получения координат, и взят окружающий его полигон здания из Openstreetmap, при его наличии.

Часть записей попавших в зону интереса была выверена вручную по данным OpenStreetMap и открытым источникам.

Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания ансамбля.

Актуальность данных - октябрь 2013 года. Геометрия зданий взята из дампа OSM от 9 января 2014 года.

Ограничения:

  1. В списке есть записи не только по зданиям, но и по паркам, оградам, памятникам, а так же недавно снесённым зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
  2. Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек и их статусы могут быть неверными.
  3. Некоторые точки не попадают в дома OSM, поэтому полигонов меньше, чем точек.
  4. Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в таблице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
  5. Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это объясняется структурой данных OSM.
  6. Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это объясняется отсутствием адресной информации по зданиям в Openstreetmap.
  7. В Shape-файлах длинна полей ограничена 254 символами.
Распределение по территории города

Объектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.

Описание полей:

Точки

Одна запись - один объект.

  • ogc_fid
  • wkb_geometry
  • id Код объекта.
  • addr_full Исходный адрес. Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому.
  • ensemble
  • name Название объекта.
  • g_geocoded Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге. Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки.
  • g_status Точность автоматической выверки. Если в поле 'moved' есть значение, то это значит что эта запись была выверена вручную, и поле g_status не следует принимать во внимание.
  • moved Точность ручной выверки. 1: Точка указывает в правильное здание. 2: Точка указывает в правильный квартал. 3 и больше: точность до района города.
  • class Обозначает что этот объект представляет собой парк, ограду, памятник, либо недавно снесённое здание.
  • is_multiobject Обозначает, что это мультиобъект, и в таблице мультиточек находится множество точек для каждого отдельного здания.

Мультиточки

Одна запись - один из элементов мультиобъекта.

  • ogc_fid
  • wkb_geometry
  • id Код объекта.
  • addr_part1 varying Адрес (из 2 частей)
  • addr_part2 varying Адрес (из 2 частей)
  • g_status Точность автоматической выверки.

Полигоны

Полигонов меньше чем объектов, потому что в OSM нет всех зданий Москвы, либо у них не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией. (

  • id Код объекта.
  • way geometry
  • name character varying
  • source character varying "cadaster_mp" означает, что эта запись - один из мультиобьектов.
  • addr_orig character varying Оригинальный адрес из набора данных.
  • addr_local character varying Адрес исправленный вручную, по которому производился геокодинг.

)

Форматы файлов

Данные распространяются в виде нескольких файлов в формате ESRI Shapefile и CSV.


http://gis-lab.info/data/heritage/heritage_cadaster_points.zip http://gis-lab.info/data/heritage/heritage_cadaster_pointsofmultiopbjects.zip http://gis-lab.info/data/heritage/heritage_cadaster_polygons.zip