AIST, 2012

Материал из GIS-Lab
Перейти к навигации Перейти к поиску

Географические информационные системы (ГИС) - это информационные системы, которые работают с особым видом данных - геоданными (называемых также пространственными, географическими, геопространственными данными). Основными особенностями геоданных являются:

  • привязка к системам координат, позволяющим устанавливать местоположение любых элементов в глобальном географическом пространстве;
  • большие объемы;
  • тесная связь геометрической и атрибутивной информации.

Геоданные и их анализ позволяют решать множество практических задач, включая задачи природно-ресурсного картографирования. Однако обычно природа объекта анализа достаточно сложна. Дешифрируемые объекты как правило отличаются большой вариабельностью и мультимодальностью, и для их выделения лучше использовать непараметрические методы, т.е. методы, не накладывающие ограничений на статистическое распределение треннировочных данных. До недавних пор непараметрические классификаторы и другие методы машинного обучения были недоступны из-за банального недостатка вычислительной мощности и плохой методологической интеграции ГИС с другими областями (таких как медицинская диагностика и компьютерное зрение). Прогресс последних лет позволил наконец применить эти методы к большим массивам геоданных включая данные дистанционного зондирования. Такие методы, как деревья классификации и регрессии, метод опорных векторов и нейронные сети получили достаточно широкое распространение в науке, но до сих пор не очень активно используются на практике.

В мини-курсе мы кратко рассмотрим с какими геоданными и задачами приходится сталкиваться ГИС-аналитику, разберем несколько практических примеров применения деревьев классификации для выделения интересующих объектов или явлений, а также метод максимальной энтропии применительно к ситуации, когда у исследователя нет данных об отсутствии объекта, а есть только данные о присутствии.

План:

  1. Геоданные: задачи, источники, методы, ПО для работы с ними
  2. Непараметрические классификаторы для анализа данных дистанционного зондирования
  3. Метод максимальной энтропии для пространственного нишевого анализа

Материалы мини-курса можно найти здесь: http://gis-lab.info/docs/aist

Геоданные: задачи, источники, методы, ПО для работы с ними

Основные источники данных

Непараметрические классификаторы для анализа данных дистанционного зондирования

Теория

Деревья классификации (classification and regression trees, CART, random forests)

Метод опорных векторов

Нейронные сети

Практика

Выделение сгореших территорий по данным AVHRR в R с помощью GDAL, tree

Детектирования вырубок по многовременной съемке в DTClassifier/QGIS

Метод максимальной энтропии для пространственного нишевого анализа

Bioclim

GARP

MaxEnt