Открытый набор геоданных по архитектурному наследию Москвы: различия между версиями
Нет описания правки |
|||
Строка 1: | Строка 1: | ||
{{Статья|Черновик}} | {{Статья|Черновик}} | ||
{{Аннотация|Открытые геоданные по архитектурному наследию Москвы}} | |||
Департамент культурного наследия города Москвы выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (id 530, [http://data.mos.ru/datasets/530 источник]). Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет. | |||
В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались. | |||
Здесь представлены результаты нашего труда. | |||
== Описание структуры набора данных == | == Описание структуры набора данных == | ||
Исходные данные состояли из списка адресов обьектов. Для каждой записи автоматически геокодированы координаты по базе данных Openstreetmap в октябре 2013 года, и взят окружающий его полигон здания из Openstreetmap, при наличии. | |||
Часть записей так же была выверена вручную по данным Openstreetmap и открытым источникам. | Часть записей так же была выверена вручную по данным Openstreetmap и открытым источникам. | ||
Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания. | Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания. |
Версия от 12:56, 10 января 2014
Открытые геоданные по архитектурному наследию Москвы
Департамент культурного наследия города Москвы выложил на портале открытых данных г. Москвы набор данных "Объекты культурного наследия и Выявленные объекты культурного наследия" (id 530, источник). Согласно общей информации о наборе на портал он является геоданными. Это, однако, не соответствует действительности, поскольку никаких координат в данных нет.
В Департаменте культурного наследия города Москвы нам посоветовали обратиться к геодезистам, чтобы они "разметили" объекты. Поскольку мы знаем более быстрые способы, мы ими и воспользовались.
Здесь представлены результаты нашего труда.
Описание структуры набора данных
Исходные данные состояли из списка адресов обьектов. Для каждой записи автоматически геокодированы координаты по базе данных Openstreetmap в октябре 2013 года, и взят окружающий его полигон здания из Openstreetmap, при наличии. Часть записей так же была выверена вручную по данным Openstreetmap и открытым источникам. Некоторые записи представляют архитектурные ансамбли, и у них в поле адреса указан список адресов. В этом случае были созданы отдельные точки для каждого здания. Данные составлены в октябре 2013 года.
Ограничения:
- В списке есть записи по паркам, оградам, памятникам, и недавно снесёным зданиям. Координаты таких записей не выверялись, и поэтому могут находится в любом месте города. Такие неточные записи можно отфильтровать: "class" IS NULL
- Все данные выверялись только для зоны между 3 транспортным кольцом и Московской кольцевой автомобильной дорогой, а набор данных охватывает всю Москву. Поэтому внутри 3ТК и за МКАДом координаты точек, и их статусы могут быть неверными.
- Некоторые точки не попадают в дома OSM, поэтому полигонов меньше, чем точек.
- Для зданий П и Г-образной формы точки были автоматически помещены в центральную точку, которая может не попадать в фигуру здания, а находится во дворе. Поэтому при правильно определённом адресе, их нет в табице полигонов. Для зоны между 3ТК и МКАДом эта ошибка была исправлена вручную.
- Если здание сложной формы заведено в Openstreetmap как множество отдельных полигонов с тегом building, то бралась геометрия только одного полигона. Это обьясняется структурой данных OSM.
- Установлено, что больше всего ошибок на территории усадебных и религиозных комплексов. Это обьясняется отсутствием адресной информации по зданиям в Openstreetmap.
Обьектом может быть как одно здание либо сооружение, так и комплекс отдельных зданий.
Описание полей:
Точки
Одна запись - один обьект.
- ogc_fid integer,
- wkb_geometry geometry(Point,4326),
- id Код обьекта.
- addr_full Исходный адрес. Некоторые улицы могут иметь названия многолетней давности, и сейчас называться по-другому.
- ensemble
- name Название
- g_geocoded Адрес места из базы OSM, в который автоматически была помещена точка при геокодинге. Из-за неполноты адресной информации в OSM около трети записей геокодировалось неправильно, и в этом поле могут быть не адреса домов, а улицы, или автобусные остановки.
- g_status Точность автоматической выверки. Если в поле 'moved' есть значение, то это значит что зта запись была выверена вручную, и поле g_status не следует принимать во внимание.
- moved Точность ручной выверки. 1: Точка указывает в правильное здание. 2: Точка указывает в правильный квартал. 3 и больше: точность до района города.
- class character varying. Обозначает что этот обьект представляет собой парк, ограду, памятник, либо недавно снесёное здание.
- is_multiobject boolean. Обозначает, что это мультиобьект, и в таблице мультиточек находится множество точек для каждого отдельного здания.
Мультиточки
Одна запись - один из элементов мультиобьекта.
- ogc_fid integer,
- wkb_geometry geometry(Point,4326),
- id character varying,
- addr_part1 character varying,
- addr_part2 character varying,
- g_status text
Полигоны
Полигонов меньше чем обьектов, потому что в OSM нет всех зданий Москвы, либо у них не проставлены адреса, и поэтому нельзя найти конкретный полигон здания по данным под нужной лицензией. (
- id character(6),
- way geometry,
- name character varying,
- source character varying,
- addr_orig character varying,
- addr_local character varying
)
Форматы файлов
Данные распространяются в виде нескольких файлов в формате ESRI Shapefile и CSV.