AIST, 2012
Географические информационные системы (ГИС) - это информационные системы, которые работают с особым видом данных - геоданными (называемых также пространственными, географическими, геопространственными данными). Основными особенностями геоданных являются:
- привязка к системам координат, позволяющим устанавливать местоположение любых элементов в глобальном географическом пространстве;
- большие объемы;
- тесная связь геометрической и атрибутивной информации.
Геоданные и их анализ позволяют решать множество практических задач, включая задачи природно-ресурсного картографирования. Однако обычно природа объекта анализа достаточно сложна. Дешифрируемые объекты как правило отличаются большой вариабельностью и мультимодальностью, и для их выделения лучше использовать непараметрические методы, т.е. методы, не накладывающие ограничений на статистическое распределение треннировочных данных. До недавних пор непараметрические классификаторы и другие методы машинного обучения были недоступны из-за банального недостатка вычислительной мощности и плохой методологической интеграции ГИС с другими областями (таких как медицинская диагностика и компьютерное зрение). Прогресс последних лет позволил наконец применить эти методы к большим массивам геоданных включая данные дистанционного зондирования. Такие методы, как деревья классификации и регрессии, метод опорных векторов и нейронные сети получили достаточно широкое распространение в науке, но до сих пор не очень активно используются на практике.
В мини-курсе мы кратко рассмотрим с какими геоданными и задачами приходится сталкиваться ГИС-аналитику, разберем несколько практических примеров применения деревьев классификации для выделения интересующих объектов или явлений, а также метод максимальной энтропии применительно к ситуации, когда у исследователя нет данных об отсутствии объекта, а есть только данные о присутствии.
План:
- Геоданные: задачи, источники, методы, ПО для работы с ними
- Непараметрические классификаторы для анализа данных дистанционного зондирования
- Метод максимальной энтропии для пространственного нишевого анализа
Материалы мини-курса можно найти здесь: http://gis-lab.info/docs/aist
Геоданные: задачи, источники, методы, ПО для работы с ними
Основные источники данных
Непараметрические классификаторы для анализа данных дистанционного зондирования
Деревья классификации (classification and regression trees, CART, random forests)
Метод опорных векторов
Нейронные сети
Метод максимальной энтропии для пространственного нишевого анализа
Bioclim
GARP
MaxEnt