AIST, 2012
по адресу http://gis-lab.info/qa/../docs/aist/index.html
Материалы для самостоятельной работы и ознакомления
Географические информационные системы (ГИС) - это информационные системы, которые работают с особым видом данных - геоданными (называемых также пространственными, географическими, геопространственными данными). Основными особенностями геоданных являются:
- привязка к системам координат, позволяющим устанавливать местоположение любых элементов в глобальном географическом пространстве;
- большие объемы;
- тесная связь геометрической и атрибутивной информации.
Геоданные и их анализ позволяют решать множество практических задач, включая задачи природно-ресурсного картографирования. Однако обычно природа объекта анализа достаточно сложна. Дешифрируемые объекты как правило отличаются большой вариабельностью и мультимодальностью, и для их выделения лучше использовать непараметрические методы, т.е. методы, не накладывающие ограничений на статистическое распределение треннировочных данных. До недавних пор непараметрические классификаторы и другие методы машинного обучения были недоступны из-за банального недостатка вычислительной мощности и плохой методологической интеграции ГИС с другими областями (таких как медицинская диагностика и компьютерное зрение). Прогресс последних лет позволил наконец применить эти методы к большим массивам геоданных включая данные дистанционного зондирования. Такие методы, как деревья классификации и регрессии, метод опорных векторов и нейронные сети получили достаточно широкое распространение в науке, но до сих пор не очень активно используются на практике.
В мини-курсе мы кратко рассмотрим с какими геоданными и задачами приходится сталкиваться ГИС-аналитику, разберем несколько практических примеров применения деревьев классификации для выделения интересующих объектов или явлений, а также метод максимальной энтропии применительно к ситуации, когда у исследователя нет данных об отсутствии объекта, а есть только данные о присутствии.
План:
- Геоданные: задачи, источники, методы, ПО для работы с ними
- Непараметрические классификаторы для анализа данных дистанционного зондирования
- Метод максимальной энтропии для пространственного нишевого анализа
Материалы мини-курса можно найти здесь: http://gis-lab.info/docs/aist
Программное обеспечение необходимое для примеров
Пример 1.
- QGIS (как установить в Windows, Linux, MacOS, Android)
- DTClassifier (как установить)
Пример 2.
- QGIS (как установить в Windows, Linux, MacOS, Android)
- CRAN R (установить Windows, Linux)
Пример 3.
- OpenModeller (установщики для Windows, Mac OS и RPM-based дистрибутивов Linux можно взять здесь)
Пример 4.
- QGIS (как установить в Windows, Linux, MacOS, Android)
- MaxEnt (скачать)
Геоданные: задачи, источники, методы, ПО для работы с ними
Презентация с конференции (посмотреть, скачать, 20 Мб).
Ссылки на упомянутые данные:
Ссылки на ПО:
Деревья классификации для анализа данных дистанционного зондирования
Пример 1. Детектирование вырубок по многовременной съемке в DTClassifier/QGIS
Знакомство с данными Landsat TM/ETM+. Основные дешифровочные признаки. Загрузка данных, задание тренировочных образцов соответствующих вырубкам леса, обучение и классификация данных в DTClassifier/QGIS используя деревья классификации (реализация из OpenCV).
Пример 2. Выделение сгореших территорий по данным AVHRR в R с помощью GDAL, tree
Знакомство с данными AVHRR. Подготовка данных. Дешифровочные признаки. Загрузка данных в R с помощью rgdal, обучение и классификация с помощью tree. Выгрузка результата. Валидация.
Тестовые данные, подробное описание и код
Метод максимальной энтропии для пространственного нишевого анализа
Пример 3. Прогнозирование распределений явлений с учетом будущего климата
Знакомство с понятием ниши, openModeller и климатическими данными. Моделирование экологической ниши и предсказание пространственного распределения объекта с учетом изменений среды.
Пример использования openModeller Desktop для новых условий
Пример 4. Моделирование местообитаний с MaxEnt