Оценка точности тематических карт
Методические подходы для оценки точности тематических карт
Введение
Данная статья является кратким и довольно вольным переводом работы «Making better use of accuracy data in land change studies: Estimating accuracy and area and quantifying uncertainty using stratified estimation» [1]. Основной целью авторов данной работы было описание стратегии использования информации о точности тематической карты для оценки площади выделенных классов с указанием доверительных интервалов. Авторы имеют еще одна работу по данной тематике [2], позволяющую глубже погрузиться в механизм расчетов точности тематических карт. Авторы указывают [1], что в статьях посвященных исследованию изменений растительного покрова довольно часто упускается важная информация о точности созданных тематических карт или ошибках в определении площадей выделенных классов. Отмечается, что для более полного использования информации, представленных на данных картах в статьях необходимо обязательно указывать:
- Показатели точности: "общая точность классификации" (Overall accuracy), "точность пользователя" (User's accuracy) и "точность производителя" (Producer's accuracy). Более подробно со смысловым содержанием данных ошибок можно познакомиться в данной статье [3].
- Площади выделенных классов с поправкой на ошибки классификации.
- Указание ошибки среднего (SE) или доверительного интервала (CI) оцениваемых площадей.
Несколько простых числовых примеров позволят проследить последовательность расчетов данных показателей для простой случайной, систематической и стратифицированной случайной выборки. Выборка - это набор точек на оцениваемой тематической карты в атрибутах которых записаны значения класса взятые с самой карты, а также полученные из иных источников (полевых исследований, снимков более высокого пространственного разрешения и т.д.).
Практическая часть
Приведем пример расчета ошибок классификации тематической карты в общем виде. Предположим необходимо оценить точность классификации космического снимка с q категориями/классами и оценить площадь каждой уникальной категории с указанием ошибки. Для этого либо случайным, либо систематическим образом закладывается выборка из n-го количества точек и строится типовая матрица ошибок (matrix error, табл.1). В рядах данной таблицы записываются категории карты (i = 1, 2, … q), а в колонках – справочные (экспертные) категории (j = 1,2, …, q). Правила, по которым заполняется данная таблица можно посмотреть здесь [3]. Отметим, что справочные категории считаются эталонными, т.е. получены из источников заведомо более точных, чем оцениваемая тематическая карта.
Таблица 1. Типовая матрица ошибок (matrix error)
Категория/класс | 1 | 2 | ... | q | Всего |
---|---|---|---|---|---|
1 | n11 | n1q | n1 | ||
2 | ... | ... | ... | ... | ... |
... | ... | ... | ... | ... | ... |
q | nq1 | ... | ... | nqq | nq |
Всего | n1 | ... | ... | nq | n |