Открытый набор геоданных по архитектурному наследию Москвы: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
(Новая страница: «{{Статья|Черновик}} == Описание структуры набора данных == В них представлен список обьект…»)
 
(нет различий)

Версия от 12:44, 10 января 2014

Эта страница является черновиком статьи.



Описание структуры набора данных

В них представлен список обьектов архитектурного наследия, переданных компанией *** для составления визуализации. Исходные данные состояли из списка адресов обьектов. Для каждой записи автоматически геокодированы координаты по базе данных Openstreetmap в октябре 2013 года, и взят окружающий его полигон здания из Openstreetmap, при наличии. Часть записей так же была выверена вручную по данным Openstreetmap и открытым источникам. Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания. Данные составлены в октябре 2013 года.

Ограничения:

  1. В списке есть записи по паркам, оградам, памятникам, и недавно снесёным зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
  2. Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек, и их статусы могут быть неверными.
  3. Некоторые точки не попадают в дома OSM, поэтому полигонов меньше, чем точек.
  4. Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в табице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
  5. Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это обьясняется структурой данных OSM.
  6. Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это обьясняется отсутствием адресной информации по зданиям в Openstreetmap.


Обьектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.

Описание полей:

Точки

Одна запись - один обьект.

  • ogc_fid integer,
  • wkb_geometry geometry(Point,4326),
  • id Код обьекта.
  • addr_full Исходный адрес. Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому.
  • ensemble
  • name Название
  • g_geocoded Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге. Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки.
  • g_status Точность автоматической выверки. Если в поле 'moved' есть значение, то это значит что зта запись была выверена вручную, и поле g_status не следует принимать во внимание.
  • moved Точность ручной выверки. 1: Точка указывает в правильное здание. 2: Точка указывает в правильный квартал. 3 и больше: точность до района города.
  • class character varying. Обозначает что этот обьект представляет собой парк, ограду, памятник, либо недавно снесёное здание.
  • is_multiobject boolean. Обозначает, что это мультиобьект, и в таблице мультиточек находится множество точек для каждого отдельного здания.

Мультиточки

Одна запись - один из элементов мультиобьекта.

  • ogc_fid integer,
  • wkb_geometry geometry(Point,4326),
  • id character varying,
  • addr_part1 character varying,
  • addr_part2 character varying,
  • g_status text

Полигоны

Полигонов меньше чем обьектов, потому что в OSM нет всех зданий Москвы, либо у них не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией. (

  • id character(6),
  • way geometry,
  • name character varying,
  • source character varying,
  • addr_orig character varying,
  • addr_local character varying

)

Форматы файлов

Данные распространяются в виде нескольких файлов в формате ESRI Shapefile и CSV.