Глобальная база данных по биоразнообразию – GBIF. Введение
по адресу http://gis-lab.info/qa/gbif-intro.html
Описание портала GBIF, поставляющего данные по биоразнообразию с пространственной привязкой.
О GBIF
GBIF – глобальная база данных по биоразнообразию.
Основная цель ресурса – предоставить специалистам из разных областей удобный инструмент для поиска данных по биоразнообразию. В контексте GBIF под термином «данные по биоразнообразию» подразумеваются точки встреч видов растений и животных, а также данные по систематике видов. Особенный интерес для ГИС-сообщества представляют данные, для которых в базе GBIF существуют географические координаты. Доля таких данных велика и на данный момент составляет более 70%. Такие данные могут быть использованы для решения широкого круга задач связанных с природопользованием, охраной природы и наукой.
Структура GBIF
Головной офис инициативы располагается в Университете Копенгагена, Дания. Однако, центральный офис инициативы только координирует действия различных организаций входящих в консорциум проекта. Большая часть ресурсов GBIF была предоставлена и поставляется сторонними организациями. Начиная с 2003, к инициативе GBIF присоединились более 100 различных организаций по всему миру. В список партнеров GBIF (и, как следствие, поставщиков данных) входят крупнейшие гербарии, университеты, федеральные исследовательские институты и центры, некоммерческие организации. Каждый участник обязуется поставлять данные в соответствии со стандартом Darwin Core 1.4 или ABCD. Для этого инициативой GBIF были разработаны специальные инструменты, позволяющие участникам проекта загружать свои данные и приводить их в соответствие со стандартом общей базы данных.
Получение и предоставление данных
По большому счету, «донором» данных может стать и отдельный пользователь, если у него есть такой интерес. Для этого необходимо загрузить с сайта специальный пакет, и пройти регистрацию. После этого данные могут быть загружены в общую базу и через несколько дней (после индексации) появятся в общем поиске. Наибольший объем данных, однако, поставляется в процессе электронизации каталогов крупных гербариев, а также при переводе в цифровой формате данных различных атласов. Данные базы предоставляются в рамках GBIF Data Sharing Agreement (для автора данных) и GBIF Data Use Agreement (для пользователя данных), и каждый новый участник добавляющий свои данные в базу или загружающий их должен принять условия предоставления данных.
Вкратце, предоставляя данные, вы соглашаетесь, что (выборочный перевод):
- Данные доступные через GBIF - открыты и доступны всем пользователям в рамках Соглашения по использованию данных GBIF (Data Use Agreement) и условий определенных провайдером данных и описанных в метаданных.
- GBIF не обладает никакими интеллектуальными правами на распространяемые данные.
- Провайдер данных гарантирует, что он заключил необходимые соглашения с оригинальными авторами.
- Провайдер данных делает все возможное чтобы обеспечить точность данных.
- Ответственность на ограничение распространения чувствительных данных лежит на провайдере.
- Провайдер данных добавляет постоянные и уникальные идентификаторы для данных, так что при необходимости можно определить принадлежность данных.
- Секретариат GBIF может сохранять копию и передавать данные другим пользователями вместе с условиями заданными провайдером. Секретариат GBIF передаёт поступающие запросы по этим данным провайдеру.
- Секретариат GBIF не несет ответственности за содержание данных и потери с ними связанные.
Поставляемые данные
Основой данных в системе GBIF является таксономическая классификация. Данные базы доступны в полном объеме, абсолютно бесплатно для любого пользователя. Скачивание данных регистрации не требует, однако существуют ограничения на количество единовременно загружаемых записей. Так как данные из GBIF могут быть загружены в различных форматах — то правильнее будет сказать, что данные ограничения накладывают разработчики форматов. Например, при загрузке записей в формате Excel максимально возможное число строк в таблице – 65535. Кроме того, возможна загрузка данных в формате CSV с разделителем «запятая» или символом табуляции (максимальный размер 250000 строк). Также, данные можно скачивать в формате XML стандарт Darwin Core (максимум 100000 записей), а также (для геопривязанных точек) – в формате Google Earth (максимум 50000) (см. пример файла kml для рода Ovibos).
В состав конечного файла с данными может входить различный набор информации, что также задается пользователем перед загрузкой данных с сайта. Так, таблица с результатами поиска может включать до 45 колонок, в которых указывается не только информация о таксономии вида, но и детальная информация об организации, предоставившей данные, расширенный набор географической информации (включая широту, долготу, высоту над уровнем море и др.), а также различные вспомогательные данные
Качество пространственной привязки точек в базе GBIF очень сильно меняется и может отличаться в несколько раз (от нескольких метров до нескольких десятков километров). Так, для некоторых записей информация о пространственной привязке может быть получена с помощью приемника GPS, для других – определена по описанию на бумажной карте, для третьих – вообще быть условно нанесена по принадлежности к региону. К сожалению, точность данных загруженных в базу далеко не всегда можно оценить по точности самих координат, так как большинство точек не зависимо от метода их получения будут иметь точно от 4 до 6 знаков после запятой (в географической системе координат). В настоящее время GBIF пытается решить эту проблему с двух сторон: с одной стороны, было введено специальное поле «Coordinate precision» (Точность координат), куда вводится расчетное значение погрешности с которой были определены координаты, и с другой – объяснение участникам инициативы особенностей с помощью детальных руководств посвященных пространственной обработке данных по биоразнообразию.
В целом можно сказать, что данные GBIF представляют несомненный интерес для широкого круга специалистов и особенно для специалистов знакомых с геоинформационными системами и работающих в таких областях как охрана природы, исследование животного и растительного мира и т.д. Во многом база GBIF — уникальный источник информации. Удивляет тот факт, что в России до недавнего времени данные ресурс был практически неизвестен и на данный момент в инициативу GBIF не входит ни одного российского участника. Мы надеемся, что популяризация знания о базе GBIF в рамках GIS-Lab изменит эту ситуацию в лучшую сторону. Мы в свою очередь, продолжим рассказывать более детально о работе с GBIF в следующих заметках на сайте.