Открытый набор геоданных по архитектурному наследию Москвы: различия между версиями
Trolleway (обсуждение | вклад) (Новая страница: «{{Статья|Черновик}} == Описание структуры набора данных == В них представлен список обьект…») |
Версия от 12:44, 10 января 2014
Описание структуры набора данных
В них представлен список обьектов архитектурного наследия, переданных компанией *** для составления визуализации. Исходные данные состояли из списка адресов обьектов. Для каждой записи автоматически геокодированы координаты по базе данных Openstreetmap в октябре 2013 года, и взят окружающий его полигон здания из Openstreetmap, при наличии. Часть записей так же была выверена вручную по данным Openstreetmap и открытым источникам. Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания. Данные составлены в октябре 2013 года.
Ограничения:
- В списке есть записи по паркам, оградам, памятникам, и недавно снесёным зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
- Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек, и их статусы могут быть неверными.
- Некоторые точки не попадают в дома OSM, поэтому полигонов меньше, чем точек.
- Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в табице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
- Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это обьясняется структурой данных OSM.
- Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это обьясняется отсутствием адресной информации по зданиям в Openstreetmap.
Обьектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.
Описание полей:
Точки
Одна запись - один обьект.
- ogc_fid integer,
- wkb_geometry geometry(Point,4326),
- id Код обьекта.
- addr_full Исходный адрес. Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому.
- ensemble
- name Название
- g_geocoded Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге. Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки.
- g_status Точность автоматической выверки. Если в поле 'moved' есть значение, то это значит что зта запись была выверена вручную, и поле g_status не следует принимать во внимание.
- moved Точность ручной выверки. 1: Точка указывает в правильное здание. 2: Точка указывает в правильный квартал. 3 и больше: точность до района города.
- class character varying. Обозначает что этот обьект представляет собой парк, ограду, памятник, либо недавно снесёное здание.
- is_multiobject boolean. Обозначает, что это мультиобьект, и в таблице мультиточек находится множество точек для каждого отдельного здания.
Мультиточки
Одна запись - один из элементов мультиобьекта.
- ogc_fid integer,
- wkb_geometry geometry(Point,4326),
- id character varying,
- addr_part1 character varying,
- addr_part2 character varying,
- g_status text
Полигоны
Полигонов меньше чем обьектов, потому что в OSM нет всех зданий Москвы, либо у них не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией. (
- id character(6),
- way geometry,
- name character varying,
- source character varying,
- addr_orig character varying,
- addr_local character varying
)
Форматы файлов
Данные распространяются в виде нескольких файлов в формате ESRI Shapefile и CSV.