Оценка точности тематических карт: различия между версиями

Версия от 22:17, 12 января 2016

Эта страница является черновиком статьи.

Методические подходы для оценки точности тематических карт

Введение

Данная статья является кратким и довольно вольным переводом работы «Making better use of accuracy data in land change studies: Estimating accuracy and area and quantifying uncertainty using stratiﬁed estimation» [1]. Основной целью авторов данной работы было описание стратегии использования информации о точности тематической карты для оценки площади выделенных классов с указанием доверительных интервалов. Авторы имеют еще одна работу по данной тематике [2], позволяющую глубже погрузиться в механизм расчетов точности тематических карт. Авторы указывают [1], что в статьях посвященных исследованию изменений растительного покрова довольно часто упускается важная информация о точности созданных тематических карт или ошибках в определении площадей выделенных классов. Отмечается, что для более полного использования информации, представленных на данных картах в статьях необходимо обязательно указывать:

Показатели точности: "общая точность классификации" (Overall accuracy), "точность пользователя" (User's accuracy) и "точность производителя" (Producer's accuracy). Более подробно со смысловым содержанием данных ошибок можно познакомиться в данной статье [3].
Площади выделенных классов с поправкой на ошибки классификации.
Указание ошибки среднего (SE) или доверительного интервала (CI) оцениваемых площадей.

Несколько простых числовых примеров позволят проследить последовательность расчетов данных показателей для простой случайной, систематической и стратифицированной случайной выборки. Выборка - это набор точек на оцениваемой тематической карты в атрибутах которых записаны значения класса взятые с самой карты, а также полученные из иных источников (полевых исследований, снимков более высокого пространственного разрешения и т.д.).

Практическая часть

Приведем пример расчета ошибок классификации тематической карты в общем виде. Предположим необходимо оценить точность классификации космического снимка с q категориями/классами и оценить площадь каждой уникальной категории с указанием ошибки. Для этого либо случайным, либо систематическим образом закладывается выборка из n-го количества точек и строится типовая матрица ошибок (matrix error, табл.1). В рядах данной таблицы записываются категории карты (i = 1, 2, … q), а в колонках – справочные (экспертные) категории (j = 1,2, …, q). Правила, по которым заполняется данная таблица можно посмотреть здесь [3]. Отметим, что справочные категории считаются эталонными, т.е. получены из источников заведомо более точных, чем оцениваемая тематическая карта.

Таблица 1. Типовая матрица ошибок (matrix error)

Категория/класс	1	2	...	q	Всего
1	n₁₁			n_1q	n₁
2	...	...	...	...	...
...	...	...	...	...	...
q	n_q1	...	...	n_qq	n_q
Всего	n₁	...	...	n_q	n

Примечание: категории карты указаны в строках, а справочные (экспертные) категории в колонках таблицы.

Однако как считают авторы приводимой здесь методики [1,2], более информативной является так называемая преобразованная матрица ошибок, учитывающая относительные значения площади каждой категории (табл. 2). Значения для каждой ячейки данной матрицы (табл. 2) вычисляются по формуле:

{p_{ij}}={W_{i}}\times {\frac {n_{ij}}{n_{i}}}

, (1)

где n_ij – значение в соответствующей ячейки матрицы с координатами i, j (табл. 1);

n_i – суммарное значение i-ой категории карты (табл. 1);

W_i – отношение суммарной площади i-ой категории, к общей площади карты, т.е.:

{W_{i}}={\frac {A_{i}}{A_{tot}}}

Результаты расчетов записываются в преобразованную матрицу ошибок (табл. 2).

Таблица 2. Преобразованная матрица ошибок, учитывающая соотношения площадей категорий

Категория/класс	1	2	...	q	Всего
1	p₁₁			p_1q	p₁
2	...	...	...	...	...
...	...	...	...	...	...
q	p_q1	...	...	p_qq	p_q
Всего	p₁	...	...	p_q	1

Примечание: категории карты указаны в строках, а справочные (экспертные) категории в колонках таблицы.

Ошибки классификации оказывают влияние на оценку площади соответствующей категории. Оценить общую площадь категории можно путем непосредственных измерений с тематической карты. Другой способ оценки площади опирается на справочные (экспертные) категории карты (столбцы в табл. 2). В этом случае площадь соответствующей категории находится путем переумножения общей площади карты на суммарные значения категорий колонок:

{A_{j}}={A_{tot}}\times {p_{j}}

, (2)

Выражение (2) может быть записано в развернутом виде:

{A_{j}}={A_{tot}}\sum _{i}^{q}{W_{i}}{\frac {n_{ij}}{n_{i}}}

, (2')

Т.е. происходит переоценка площадей категорий, опирающиеся на справочные значения категорий.

Среднее квадратичное отклонение площади соответствующей категории определяется по формулам (3)-(4):

$S({p_{j}})={\sqrt {\sum _{i=1}^{q}{W_{i}^{2}}{\frac {{\frac {n_{ij}}{n_{i}}}(1-{\frac {n_{ij}}{n_{i}}})}{n_{i}-1}}}}$ , (3)

S({A_{j}})={A_{tot}}\times S({p_{j}})

, (4)

Значение площади с доверительным интервалом равным 95% записывается в виде:

{A_{j}}\pm 2\times S({A_{j}})

, (5)

Принимается, что ошибка имеет z-распределения, при 95% доверительном интервале, z=1.96, округлили до z=2.

Формулы (1) – (5) применены как к случайной, так и систематической или стратифицированной выборке.

Точность пользователя (6), точность производителя (7) и общая точность карты (8) также оценивается с учетом площадей каждой категории, т.е. данные для расчетов берутся из табл. 2.

{U_{i}}={\frac {p_{ii}}{p_{i}}}

, (6)

{P_{j}}={\frac {p_{jj}}{p_{j}}}

, (7)

{O}=\sum _{j=1}^{q}{p_{jj}}

, (8)

Приведем пример с числовыми данными. Допустим, имеется тематическая карта с тремя категориями/классами. Для оценки точности в каждой категории случайный образом заложено по 10 точек. Для каждой точки определена категория карты (map categories) и справочная (эталонная) категория (reference categories), на основании этих данных составлена типовая матрица ошибок (табл. 3).

Таблица 3. Типовая матрица ошибок (matrix error)

Категория/класс	1	2	3	Всего	Площадь
1	9	1	0	10	300
2	1	7	2	10	200
3	2	4	4	10	100
Всего	12	12	6	30	600

Примечание: категории карты указаны в строках, а справочные (экспертные) категории в колонках таблицы.

Рассчитаем матрицу ошибок с учетом значений площади для каждой категории по формуле (1), но сначала рассчитаем процентное соотношение площадей для 1-ой категории по формуле (2):

{W_{i}}={\frac {300}{600}}={\frac {1}{2}}

Аналогичным образом рассчитаем значения для остальных категорий: 2-3. Занесем результаты расчетов в соответствующие ячейки 5-ой колонки таблицы 4.

{p_{11}}={\frac {1}{2}}\times {\frac {9}{10}}={\frac {9}{20}}

Аналогичным образом рассчитаем значения для остальных ячеек таблицы 3. Занесем результаты расчетов в соответствующие ячейки 3-5 колонок таблицы 4.

Таблица 4. Преобразованная матрица ошибок, учитывающая соотношения площадей категорий

Категория/класс	1	2	3	Всего	Точность пользователя	Точность производителя	Общая точность
1	9/20	1/20	0	1/2	90%	87%	75%
2	1/30	7/30	2/30	1/3	70%	67%	-
3	1/30	2/30	2/30	1/6	40%	50%	-
Всего	31/60	21/60	8/60	1	-	-	-

Примечание: категории карты указаны в строках, а справочные (экспертные) категории в колонках таблицы.

Рассчитаем площади с учетом категорий продукта (2):

{A_{1}}={600}\times {\frac {31}{60}}=310;

{A_{2}}={600}\times {\frac {21}{60}}=210;

{A_{3}}={600}\times {\frac {8}{60}}=80.

Таким образом производится перерасчет площадей с учетом ошибок справочных категорий, то есть ошибка в одно значение может составить площадь для:

1-ой категории

600\times 1/2\times 1/10=30;

2-ой категории

600\times 1/3\times 1/10=20;

3-ей категории

600\times 1/6\times 1/10=10.

Тогда значение площади для каждой справочной категории с учетом ошибок классификации можно получить так:

{A_{1}}={300}-(1+0)\times 30+1\times 20+2\times 10=310;

{A_{2}}={200}-(1+2)\times 20+1\times 30+4\times 10=210;

{A_{3}}={100}-(2+4)\times 10+0\times 30+2\times 20=80.

Как видно, получаем идентичные результаты, но запись в более развернутом виде, возможно, делает расчет более прозрачным.

Среднее квадратичное отклонение вычисляем по формуле (3) и (4):

$S({p_{1}})={\sqrt {{({\frac {1}{2}})^{2}}\times {\frac {{\frac {9}{10}}(1-{\frac {9}{10}})}{10-1}}+{({\frac {1}{3}})^{2}}\times {\frac {{\frac {1}{10}}(1-{\frac {1}{10}})}{10-1}}+{({\frac {1}{6}})^{2}}\times {\frac {{\frac {2}{10}}(1-{\frac {2}{10}})}{10-1}}}}=0.064;$

$S({A_{1}})=600\times 0.064=38.43.$

Аналогичны образом производится расчет для остальных категорий (2-3).

Окончательных результат записывается в виде (5):

{A_{1}}\pm 2\times S({A_{1}})=310\pm 76;

{A_{2}}\pm 2\times S({A_{2}})=210\pm 90;

{A_{3}}\pm 2\times S({A_{3}})=80\pm 61.

Точность пользователя вычисляется по формуле (6):

для 1-ой категории:

{\frac {9}{20}}:{\frac {1}{2}}={\frac {18}{20}}=0.9;

для 2-ой категории:

{\frac {7}{30}}:{\frac {1}{3}}={\frac {21}{30}}=0.7;

для 3-ей категории:

{\frac {2}{30}}:{\frac {1}{6}}={\frac {12}{30}}=0.4;

Точность производителя вычисляется по формуле (7): для 1-ой категории:

{\frac {9}{20}}:{\frac {31}{60}}={\frac {27}{31}}=0.9;

для 2-ой категории:

{\frac {7}{30}}:{\frac {21}{60}}={\frac {14}{21}}=0.67;

для 3-ей категории:

{\frac {2}{30}}:{\frac {8}{60}}={\frac {1}{2}}=0.5;

Общая точность вычисляется по формуле (8):

{\frac {9}{20}}+{\frac {7}{30}}+{\frac {2}{30}}={\frac {3}{4}}=0.75;

Для сравнения можно рассчитать данные показатели точности традиционным образом исходя из значений матрицы ошибок [3]: точность пользователя:

для 1-ой категории:

{\frac {9}{10}}=0.9;

для 2-ой категории:

{\frac {7}{10}}=0.7;

для 3-ей категории:

{\frac {4}{10}}=0.4;

Как видно, результаты точности пользователя вычисленные двумя методами оказались идентичными, но так происходит далеко не всегда!

Точность производителя:

для 1-ой категории:

{\frac {9}{12}}=0.75;

для 2-ой категории:

{\frac {7}{12}}=0.58;

для 3-ей категории:

{\frac {4}{6}}=0.67;

При сравнении видно, что точность продукта вычисленное вторым способом для 1 и 2 категории занижена, а для 3-ей категории завышено по сравнению с результатами вычисленными по первому способу.

Оценка точности тематических карт: различия между версиями

Версия от 22:17, 12 января 2016

Введение

Практическая часть

Навигация

Поиск