AIST, 2012
по адресу http://gis-lab.info/qa/../docs/aist/index.html.html
Материалы для самостоятельной работы и ознакомления
Географические информационные системы (ГИС) - это информационные системы, которые работают с особым видом данных - геоданными (называемых также пространственными, географическими, геопространственными данными). Основными особенностями геоданных являются:
- привязка к системам координат, позволяющим устанавливать местоположение любых элементов в глобальном географическом пространстве;
- большие объемы;
- тесная связь геометрической и атрибутивной информации.
Геоданные и их анализ позволяют решать множество практических задач, включая задачи природно-ресурсного картографирования. Однако обычно природа объекта анализа достаточно сложна. Дешифрируемые объекты как правило отличаются большой вариабельностью и мультимодальностью, и для их выделения лучше использовать непараметрические методы, т.е. методы, не накладывающие ограничений на статистическое распределение треннировочных данных. До недавних пор непараметрические классификаторы и другие методы машинного обучения были недоступны из-за банального недостатка вычислительной мощности и плохой методологической интеграции ГИС с другими областями (таких как медицинская диагностика и компьютерное зрение). Прогресс последних лет позволил наконец применить эти методы к большим массивам геоданных включая данные дистанционного зондирования. Такие методы, как деревья классификации и регрессии, метод опорных векторов и нейронные сети получили достаточно широкое распространение в науке, но до сих пор не очень активно используются на практике.
В мини-курсе мы кратко рассмотрим с какими геоданными и задачами приходится сталкиваться ГИС-аналитику, разберем несколько практических примеров применения деревьев классификации для выделения интересующих объектов или явлений, а также метод максимальной энтропии применительно к ситуации, когда у исследователя нет данных об отсутствии объекта, а есть только данные о присутствии.
План:
- Геоданные: задачи, источники, методы, ПО для работы с ними
- Непараметрические классификаторы для анализа данных дистанционного зондирования
- Метод максимальной энтропии для пространственного нишевого анализа
Материалы мини-курса можно найти здесь: http://gis-lab.info/docs/aist Презентации будут появляться по мере их показа.
Программное обеспечение необходимое для примеров
Пример 1.
- QGIS (как установить в Windows, Linux, MacOS, Android)
- DTClassifier (как установить)
- Набор тестовых данных (скачать)
Пример 2.
- QGIS (как установить в Windows, Linux, MacOS, Android)
- CRAN R (установить Windows, Linux)
- Набор тестовых данных
Пример 3.
- OpenModeller (установщики для Windows, Mac OS и RPM-based дистрибутивов Linux можно взять здесь)
- Набор тестовых данных
Пример 4.
- QGIS (как установить в Windows, Linux, MacOS, Android)
- MaxEnt (скачать)
- Набор тестовых данных
Геоданные: задачи, источники, методы, ПО для работы с ними
Основные источники данных
Непараметрические классификаторы для анализа данных дистанционного зондирования
Теория
Деревья классификации (classification and regression trees, CART, random forests)
Метод опорных векторов
Нейронные сети
Практика
Пример 1. Детектирования вырубок по многовременной съемке в DTClassifier/QGIS
Пример 2. Выделение сгореших территорий по данным AVHRR в R с помощью GDAL, tree
Метод максимальной энтропии для пространственного нишевого анализа
Теория
Bioclim
GARP
MaxEnt
Практика
Пример 3. Прогнозирование с учетом будущего климата
Пример 4. Моделирование местообитаний с MaxEnt