Оценка точности тематических карт: различия между версиями
Xen87 (обсуждение | вклад) Нет описания правки |
Xen87 (обсуждение | вклад) Нет описания правки |
||
Строка 37: | Строка 37: | ||
Однако как считают авторы приводимой здесь методики [1,2], более информативной является так называемая преобразованная матрица ошибок, учитывающая относительные значения площади каждой категории (табл. 2). Значения для каждой ячейки данной матрицы (табл. 2) вычисляются по формуле: | Однако как считают авторы приводимой здесь методики [1,2], более информативной является так называемая преобразованная матрица ошибок, учитывающая относительные значения площади каждой категории (табл. 2). Значения для каждой ячейки данной матрицы (табл. 2) вычисляются по формуле: | ||
<center > | <center><math>{p_{ij}} = {W_i} \times \frac {n_{ij}} {n_i}</math>, (1)</center> | ||
где n<sub>ij</sub> – значение в соответствующей ячейки матрицы с координатами i, j (табл. 1); | где n<sub>ij</sub> – значение в соответствующей ячейки матрицы с координатами i, j (табл. 1); | ||
Строка 44: | Строка 44: | ||
W<sub>i</sub> – отношение суммарной площади i-ой категории, к общей площади карты, т.е.: | W<sub>i</sub> – отношение суммарной площади i-ой категории, к общей площади карты, т.е.: | ||
<center> | <center><math>{W_i}=\frac {A_i}{A_{tot}}</math></center> | ||
Результаты расчетов записываются в преобразованную матрицу ошибок (табл. 2). | Результаты расчетов записываются в преобразованную матрицу ошибок (табл. 2). | ||
Строка 67: | Строка 67: | ||
Примечание: категории карты указаны в строках, а справочные (экспертные) категории в колонках таблицы.</center> | Примечание: категории карты указаны в строках, а справочные (экспертные) категории в колонках таблицы.</center> | ||
Ошибки классификации оказывают влияние на оценку площади соответствующей категории. Оценить общую площадь категории можно путем непосредственных измерений с тематической карты. Другой способ оценки площади опирается на справочные (экспертные) категории карты (столбцы в табл. 2). В этом случае площадь соответствующей категории находится путем переумножения общей площади карты на суммарные значения категорий колонок: | Ошибки классификации оказывают влияние на оценку площади соответствующей категории. Оценить общую площадь категории можно путем непосредственных измерений с тематической карты. Другой способ оценки площади опирается на справочные (экспертные) категории карты (столбцы в табл. 2). В этом случае площадь соответствующей категории находится путем переумножения общей площади карты на суммарные значения категорий колонок: | ||
<center> | |||
<center><math>{A_j} = {A_{tot}} \times {p_j}</math>, (2)</center> | |||
Выражение (2) может быть записано в развернутом виде: | Выражение (2) может быть записано в развернутом виде: | ||
Строка 80: | Строка 81: | ||
<math>S({p_j})= | <math>S({p_j})= | ||
\sqrt{ | \sqrt{ | ||
\sum^{q}_{i=1} {W_i^2} \frac{\frac{{n_{ij}}}{n_i}(1-\frac{{n_{ij}}}{n_i})}{ | \sum^{q}_{i=1} {W_i^2} \frac{\frac{{n_{ij}}}{n_i}(1-\frac{{n_{ij}}}{n_i})}{n_i-1} | ||
} | } | ||
</math>, (3) | </math>, (3) | ||
Строка 96: | Строка 97: | ||
Точность пользователя (6), точность производителя (7) и общая точность карты (8) также оценивается с учетом площадей каждой категории, т.е. данные для расчетов берутся из табл. 2. | Точность пользователя (6), точность производителя (7) и общая точность карты (8) также оценивается с учетом площадей каждой категории, т.е. данные для расчетов берутся из табл. 2. | ||
<center><math>{U_i} = \frac{p_{ii}}{p_i}</math>, (6)</center> | |||
<center><math>{P_j} = \frac{p_{jj}}{p_j}</math>, (7)</center> | |||
<center><math>{O} = \sum^{q}_{j=1} {p_{jj}}</math>, (8)</center> |
Версия от 20:09, 12 января 2016
Методические подходы для оценки точности тематических карт
Введение
Данная статья является кратким и довольно вольным переводом работы «Making better use of accuracy data in land change studies: Estimating accuracy and area and quantifying uncertainty using stratified estimation» [1]. Основной целью авторов данной работы было описание стратегии использования информации о точности тематической карты для оценки площади выделенных классов с указанием доверительных интервалов. Авторы имеют еще одна работу по данной тематике [2], позволяющую глубже погрузиться в механизм расчетов точности тематических карт. Авторы указывают [1], что в статьях посвященных исследованию изменений растительного покрова довольно часто упускается важная информация о точности созданных тематических карт или ошибках в определении площадей выделенных классов. Отмечается, что для более полного использования информации, представленных на данных картах в статьях необходимо обязательно указывать:
- Показатели точности: "общая точность классификации" (Overall accuracy), "точность пользователя" (User's accuracy) и "точность производителя" (Producer's accuracy). Более подробно со смысловым содержанием данных ошибок можно познакомиться в данной статье [3].
- Площади выделенных классов с поправкой на ошибки классификации.
- Указание ошибки среднего (SE) или доверительного интервала (CI) оцениваемых площадей.
Несколько простых числовых примеров позволят проследить последовательность расчетов данных показателей для простой случайной, систематической и стратифицированной случайной выборки. Выборка - это набор точек на оцениваемой тематической карты в атрибутах которых записаны значения класса взятые с самой карты, а также полученные из иных источников (полевых исследований, снимков более высокого пространственного разрешения и т.д.).
Практическая часть
Приведем пример расчета ошибок классификации тематической карты в общем виде. Предположим необходимо оценить точность классификации космического снимка с q категориями/классами и оценить площадь каждой уникальной категории с указанием ошибки. Для этого либо случайным, либо систематическим образом закладывается выборка из n-го количества точек и строится типовая матрица ошибок (matrix error, табл.1). В рядах данной таблицы записываются категории карты (i = 1, 2, … q), а в колонках – справочные (экспертные) категории (j = 1,2, …, q). Правила, по которым заполняется данная таблица можно посмотреть здесь [3]. Отметим, что справочные категории считаются эталонными, т.е. получены из источников заведомо более точных, чем оцениваемая тематическая карта.
Категория/класс | 1 | 2 | ... | q | Всего |
---|---|---|---|---|---|
1 | n11 | n1q | n1 | ||
2 | ... | ... | ... | ... | ... |
... | ... | ... | ... | ... | ... |
q | nq1 | ... | ... | nqq | nq |
Всего | n1 | ... | ... | nq | n |
Примечание: категории карты указаны в строках, а справочные (экспертные) категории в колонках таблицы.
Однако как считают авторы приводимой здесь методики [1,2], более информативной является так называемая преобразованная матрица ошибок, учитывающая относительные значения площади каждой категории (табл. 2). Значения для каждой ячейки данной матрицы (табл. 2) вычисляются по формуле:
где nij – значение в соответствующей ячейки матрицы с координатами i, j (табл. 1);
ni – суммарное значение i-ой категории карты (табл. 1);
Wi – отношение суммарной площади i-ой категории, к общей площади карты, т.е.:
Результаты расчетов записываются в преобразованную матрицу ошибок (табл. 2).
Категория/класс | 1 | 2 | ... | q | Всего |
---|---|---|---|---|---|
1 | p11 | p1q | p1 | ||
2 | ... | ... | ... | ... | ... |
... | ... | ... | ... | ... | ... |
q | pq1 | ... | ... | pqq | pq |
Всего | p1 | ... | ... | pq | 1 |
Ошибки классификации оказывают влияние на оценку площади соответствующей категории. Оценить общую площадь категории можно путем непосредственных измерений с тематической карты. Другой способ оценки площади опирается на справочные (экспертные) категории карты (столбцы в табл. 2). В этом случае площадь соответствующей категории находится путем переумножения общей площади карты на суммарные значения категорий колонок:
Выражение (2) может быть записано в развернутом виде:
Т.е. происходит переоценка площадей категорий, опирающиеся на справочные значения категорий.
Среднее квадратичное отклонение площади соответствующей категории определяется по формулам (3)-(4):
, (3)
Значение площади с доверительным интервалом равным 95% записывается в виде:
Принимается, что ошибка имеет z-распределения, при 95% доверительном интервале, z=1.96, округлили до z=2.
Формулы (1) – (5) применены как к случайной, так и систематической или стратифицированной выборке.
Точность пользователя (6), точность производителя (7) и общая точность карты (8) также оценивается с учетом площадей каждой категории, т.е. данные для расчетов берутся из табл. 2.