Метод весомости признака (weight of evidence)

Материал из GIS-Lab
Перейти к навигации Перейти к поиску

Введение

Изначально метод весомости признака (weight of evidence) был разработан для работы с непространственными данными в задачах медицинской диагностики. Признаком в подобных приложениях считался набор симптомов, а тестируемой гипотезой - предположение о том, что "пациент болен болезнью X". В этом случае для каждого симптома по определенному алгоритму вычислялась пара весов, один из которых соответствовал наличию симптома, а другой - его отсутствию. Абсолютная величина веса отражала степень достоверности связи между симптомом и наличием/отсутствием болезни (связь выявлялась на основе обследования большой группы пациентов). Соответственно, полученные веса могли быть использованы для определения вероятности того, что вновь поступивший пациент болен данной болезнью, основываясь на наличии/отсутствии у него определенных симптомов.

В последствии метод весомости признака был адаптирован для анализа пространственных данных, этот метод может быть применен для проверки гипотез о совместном появлении определенных событий. Например, в геологии, используя этот метод и основываясь на наличии или отсутствии определенных пород на исследуемой территории, можно оценить справедливость гипотезы "В данном месте ожидается наличие залежи типа X". Метод также широко применяется в экологических задачах, при анализе изменений территорий и т.п. Особенностью данного метода является простота в реализации - анализ может быть выполнен стандартными инструментами ГИС (пространственная выборка, пересечение и объединение объектов и т.п.).

В данной статье рассматривается простейший случай метода весомости признака - бинарный, когда анализируемые признаки подразделяются на два класса (например, наличие/отсутствие).

Описание метода

Представим, что имеются некоторые события или явления, которые предположительно связаны с какими-то другими пространственными явлениями. Например, какой-либо вид растений может быть встречен на определенных участках в зависимости от характера этих участков (влажность, экспозиция склона и т.д.). Пусть нас интересует выявление закономерности - какие именно характеристики влияют на вероятность появления данного события, насколько сильна взаимосвязь, положительна она или отрицательна. Решить данную задачу можно при помощи построения уравнения регрессии и дальнейшего анализа его коэффициентов, и метод весомости признака предлагает подобный подход, но коэффициенты, полученные при помощи данного метода легче интерпретируются.

По своей сути метод весомости признака представляет статистический метод, основанный на теореме Байеса.