Глобальная база данных по биоразнообразию – GBIF. Введение: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
(Новая страница: «{{Статья|Опубликована|gbif-intro}} {{Аннотация|Описание портала GBIF, поставляющего данные по би…»)
 
Нет описания правки
 
Строка 26: Строка 26:
# Ответственность на ограничение распространения чувствительных данных лежит на провайдере.
# Ответственность на ограничение распространения чувствительных данных лежит на провайдере.
# Провайдер данных добавляет постоянные и уникальные идентификаторы для данных, так что при необходимости можно определить принадлежность данных.
# Провайдер данных добавляет постоянные и уникальные идентификаторы для данных, так что при необходимости можно определить принадлежность данных.
# Секретариат GBIF может сохранять копию и передавать данные другим пользователями вместе с условиями заданными провайдером. Секретариат GBIF передаёт поступающие запросы по этим данных провайдеру.
# Секретариат GBIF может сохранять копию и передавать данные другим пользователями вместе с условиями заданными провайдером. Секретариат GBIF передаёт поступающие запросы по этим данным провайдеру.
# Секретариат GBIF не несет ответственности за содержание данных и потери с ними связанные.
# Секретариат GBIF не несет ответственности за содержание данных и потери с ними связанные.


=== Поставляемые данные ===
=== Поставляемые данные ===


Основой данных в системе GBIF является таксономическая классификация. Данные базы доступны в полном объеме, абсолютно бесплатно для любого пользователя. Скачивание данные не требует даже регистрации. Единственные ограничения, налагаемые системой на доступ к записям базы – это ограничения на количество единовременно загружаемые записей. Так как данные из GBIF могут быть загружены в различных форматах — то правильнее будет сказать, что данные ограничения накладывают разработчики форматов. Например, при загрузке записей в формате Excel максимально возможное число строк в таблице – 65535. Кроме того, возможна загрузка данных в формате CSV с разделителем «запятая» или символом табуляции (максимальный размер 250000 строк). Также, данные можно скачивать в формате XML стандарт Darwin Core (максимум 100000 записей), а также (для геопривязанных точек) – в формате Google Earth (максимум 50000) (см. пример файла kml для рода [http://gis-lab.info/data/samples/gbif-ovibos-kml.7z Ovibos]).
Основой данных в системе GBIF является таксономическая классификация. Данные базы доступны в полном объеме, абсолютно бесплатно для любого пользователя. Скачивание данных регистрации не требует, однако существуют ограничения на количество единовременно загружаемых записей. Так как данные из GBIF могут быть загружены в различных форматах — то правильнее будет сказать, что данные ограничения накладывают разработчики форматов. Например, при загрузке записей в формате Excel максимально возможное число строк в таблице – 65535. Кроме того, возможна загрузка данных в формате CSV с разделителем «запятая» или символом табуляции (максимальный размер 250000 строк). Также, данные можно скачивать в формате XML стандарт Darwin Core (максимум 100000 записей), а также (для геопривязанных точек) – в формате Google Earth (максимум 50000) (см. пример файла kml для рода [http://gis-lab.info/data/samples/gbif-ovibos-kml.7z Ovibos]).


[[Файл:gbif-intro-02.gif|center]]
[[Файл:gbif-intro-02.gif|center]]
Строка 37: Строка 37:
В состав конечного файла с данными может входить различный набор информации, что также задается пользователем перед загрузкой данных с сайта. Так, таблица с результатами поиска может включать до 45 колонок, в которых указывается не только информация о таксономии вида, но и детальная информация об организации, предоставившей данные, расширенный набор географической информации (включая широту, долготу, высоту над уровнем море и др.), а также различные вспомогательные данные
В состав конечного файла с данными может входить различный набор информации, что также задается пользователем перед загрузкой данных с сайта. Так, таблица с результатами поиска может включать до 45 колонок, в которых указывается не только информация о таксономии вида, но и детальная информация об организации, предоставившей данные, расширенный набор географической информации (включая широту, долготу, высоту над уровнем море и др.), а также различные вспомогательные данные


Качество пространственной привязки точек в базе GBIF очень сильно меняется и может отличаться в несколько раз (от нескольких метров до нескольких десятков километров). Так, для некоторых записей информация о пространственной привязке может быть получена с помощью GPS-приемника, для других – определена по описанию на бумажной карте, для третьих – вообще быть условно нанесена по принадлежности к региону. К сожалению, точность данных загруженных в базу далеко не всегда можно оценить по точности самих координат, так как большинство точек не зависимо от метода их получения будут иметь точно от 4 до 6 знаков после запятой (в географической системе координат). В настоящее время GBIF пытается решить эту проблему с двух сторон: с одной стороны, было введено специальное поле «Coordinate precision» (Точность координат), куда вводится расчетное значение погрешности с которой были определены координаты, и с другой – объяснение участникам инициативы особенностей с помощью детальных руководств посвященных пространственной обработке данных по биоразнообразию.
Качество пространственной привязки точек в базе GBIF очень сильно меняется и может отличаться в несколько раз (от нескольких метров до нескольких десятков километров). Так, для некоторых записей информация о пространственной привязке может быть получена с помощью приемника GPS, для других – определена по описанию на бумажной карте, для третьих – вообще быть условно нанесена по принадлежности к региону. К сожалению, точность данных загруженных в базу далеко не всегда можно оценить по точности самих координат, так как большинство точек не зависимо от метода их получения будут иметь точно от 4 до 6 знаков после запятой (в географической системе координат). В настоящее время GBIF пытается решить эту проблему с двух сторон: с одной стороны, было введено специальное поле «Coordinate precision» (Точность координат), куда вводится расчетное значение погрешности с которой были определены координаты, и с другой – объяснение участникам инициативы особенностей с помощью детальных руководств посвященных пространственной обработке данных по биоразнообразию.


В целом можно сказать, что данные GBIF представляют несомненный интерес для широкого круга специалистов и особенно для специалистов знакомых с геоинформационными системами и работающих в таких областях как охрана природы, исследование животного и растительного мира и т.д. Во многом база GBIF — уникальный источник информации. Удивляет тот факт, что в России до недавнего времени данные ресурс был практически неизвестен и на данный момент в инициативу GBIF не входит ни одного российского участника. Мы надеемся, что популяризация знания о базе GBIF в рамках GIS-Lab изменит эту ситуацию в лучшую сторону. Мы в свою очередь, продолжим рассказывать более детально о работе с GBIF в следующих заметках на сайте.
В целом можно сказать, что данные GBIF представляют несомненный интерес для широкого круга специалистов и особенно для специалистов знакомых с геоинформационными системами и работающих в таких областях как охрана природы, исследование животного и растительного мира и т.д. Во многом база GBIF — уникальный источник информации. Удивляет тот факт, что в России до недавнего времени данные ресурс был практически неизвестен и на данный момент в инициативу GBIF не входит ни одного российского участника. Мы надеемся, что популяризация знания о базе GBIF в рамках GIS-Lab изменит эту ситуацию в лучшую сторону. Мы в свою очередь, продолжим рассказывать более детально о работе с GBIF в следующих заметках на сайте.

Текущая версия от 09:56, 27 января 2013

Эта страница опубликована в основном списке статей сайта
по адресу http://gis-lab.info/qa/gbif-intro.html


Описание портала GBIF, поставляющего данные по биоразнообразию с пространственной привязкой.

О GBIF

GBIF – глобальная база данных по биоразнообразию.

Основная цель ресурса – предоставить специалистам из разных областей удобный инструмент для поиска данных по биоразнообразию. В контексте GBIF под термином «данные по биоразнообразию» подразумеваются точки встреч видов растений и животных, а также данные по систематике видов. Особенный интерес для ГИС-сообщества представляют данные, для которых в базе GBIF существуют географические координаты. Доля таких данных велика и на данный момент составляет более 70%. Такие данные могут быть использованы для решения широкого круга задач связанных с природопользованием, охраной природы и наукой.

Gbif-intro-01.gif

Структура GBIF

Головной офис инициативы располагается в Университете Копенгагена, Дания. Однако, центральный офис инициативы только координирует действия различных организаций входящих в консорциум проекта. Большая часть ресурсов GBIF была предоставлена и поставляется сторонними организациями. Начиная с 2003, к инициативе GBIF присоединились более 100 различных организаций по всему миру. В список партнеров GBIF (и, как следствие, поставщиков данных) входят крупнейшие гербарии, университеты, федеральные исследовательские институты и центры, некоммерческие организации. Каждый участник обязуется поставлять данные в соответствии со стандартом Darwin Core 1.4 или ABCD. Для этого инициативой GBIF были разработаны специальные инструменты, позволяющие участникам проекта загружать свои данные и приводить их в соответствие со стандартом общей базы данных.

Получение и предоставление данных

По большому счету, «донором» данных может стать и отдельный пользователь, если у него есть такой интерес. Для этого необходимо загрузить с сайта специальный пакет, и пройти регистрацию. После этого данные могут быть загружены в общую базу и через несколько дней (после индексации) появятся в общем поиске. Наибольший объем данных, однако, поставляется в процессе электронизации каталогов крупных гербариев, а также при переводе в цифровой формате данных различных атласов. Данные базы предоставляются в рамках GBIF Data Sharing Agreement (для автора данных) и GBIF Data Use Agreement (для пользователя данных), и каждый новый участник добавляющий свои данные в базу или загружающий их должен принять условия предоставления данных.

Вкратце, предоставляя данные, вы соглашаетесь, что (выборочный перевод):

  1. Данные доступные через GBIF - открыты и доступны всем пользователям в рамках Соглашения по использованию данных GBIF (Data Use Agreement) и условий определенных провайдером данных и описанных в метаданных.
  2. GBIF не обладает никакими интеллектуальными правами на распространяемые данные.
  3. Провайдер данных гарантирует, что он заключил необходимые соглашения с оригинальными авторами.
  4. Провайдер данных делает все возможное чтобы обеспечить точность данных.
  5. Ответственность на ограничение распространения чувствительных данных лежит на провайдере.
  6. Провайдер данных добавляет постоянные и уникальные идентификаторы для данных, так что при необходимости можно определить принадлежность данных.
  7. Секретариат GBIF может сохранять копию и передавать данные другим пользователями вместе с условиями заданными провайдером. Секретариат GBIF передаёт поступающие запросы по этим данным провайдеру.
  8. Секретариат GBIF не несет ответственности за содержание данных и потери с ними связанные.

Поставляемые данные

Основой данных в системе GBIF является таксономическая классификация. Данные базы доступны в полном объеме, абсолютно бесплатно для любого пользователя. Скачивание данных регистрации не требует, однако существуют ограничения на количество единовременно загружаемых записей. Так как данные из GBIF могут быть загружены в различных форматах — то правильнее будет сказать, что данные ограничения накладывают разработчики форматов. Например, при загрузке записей в формате Excel максимально возможное число строк в таблице – 65535. Кроме того, возможна загрузка данных в формате CSV с разделителем «запятая» или символом табуляции (максимальный размер 250000 строк). Также, данные можно скачивать в формате XML стандарт Darwin Core (максимум 100000 записей), а также (для геопривязанных точек) – в формате Google Earth (максимум 50000) (см. пример файла kml для рода Ovibos).

Gbif-intro-02.gif

В состав конечного файла с данными может входить различный набор информации, что также задается пользователем перед загрузкой данных с сайта. Так, таблица с результатами поиска может включать до 45 колонок, в которых указывается не только информация о таксономии вида, но и детальная информация об организации, предоставившей данные, расширенный набор географической информации (включая широту, долготу, высоту над уровнем море и др.), а также различные вспомогательные данные

Качество пространственной привязки точек в базе GBIF очень сильно меняется и может отличаться в несколько раз (от нескольких метров до нескольких десятков километров). Так, для некоторых записей информация о пространственной привязке может быть получена с помощью приемника GPS, для других – определена по описанию на бумажной карте, для третьих – вообще быть условно нанесена по принадлежности к региону. К сожалению, точность данных загруженных в базу далеко не всегда можно оценить по точности самих координат, так как большинство точек не зависимо от метода их получения будут иметь точно от 4 до 6 знаков после запятой (в географической системе координат). В настоящее время GBIF пытается решить эту проблему с двух сторон: с одной стороны, было введено специальное поле «Coordinate precision» (Точность координат), куда вводится расчетное значение погрешности с которой были определены координаты, и с другой – объяснение участникам инициативы особенностей с помощью детальных руководств посвященных пространственной обработке данных по биоразнообразию.

В целом можно сказать, что данные GBIF представляют несомненный интерес для широкого круга специалистов и особенно для специалистов знакомых с геоинформационными системами и работающих в таких областях как охрана природы, исследование животного и растительного мира и т.д. Во многом база GBIF — уникальный источник информации. Удивляет тот факт, что в России до недавнего времени данные ресурс был практически неизвестен и на данный момент в инициативу GBIF не входит ни одного российского участника. Мы надеемся, что популяризация знания о базе GBIF в рамках GIS-Lab изменит эту ситуацию в лучшую сторону. Мы в свою очередь, продолжим рассказывать более детально о работе с GBIF в следующих заметках на сайте.

Ссылки по теме