GDAL+MapInfo: разрезаем изображение прямоугольной сеткой
Постановка задачи
Есть большое изображение, и есть сетка, которой бы хотелось это изображение разрезать. Сетка должна совпадать с изображением по проекции (или системе координат). Может и не совпадать, но это уже требует лишних настроек в параметрах.
Небольшое отступление
Самый известный вариант сетки — это сетка планшетов СК-42 (и аналогичных). Она стандартна, удобно создана для разных масштабов, и имеется у всех, кому нужна. С ней есть только один небольшой минус — она не прямоугольна. А смысл в том, что бы резать изображение, не нарушая его пиксельной структуры — без пересчетов и искажений. gdalwarp в позволяет обрезать изображение векторной сеткой, записанной в файл. Это не наш случай, т.к. он производит пересчет пикселей под векторный контур. И к тому же, это тривиально, поскольку gdalwarp позволяет использовать SQL-запросы к векторному слою. gdal_translate, по-моему, нет.
Итак, наша задача
- Создать прямоугольную сетку
- Эту сетку приложить к растру (пусть он имеет путь f:\test\test.tif)
Небольшое отступление №2
Задача №1 мною решена в MapInfo. Верю, что существуют и другие достойные пути, но хорошо я умею только так:
Начнем совсем с другого – создадим внешний контур изображения. Тут есть два пути.
- Простой – просто рамка изображения, она получается командой gdaltindex (builds a shapefile as a raster tileindex).
Например, для всех растров в папках, начинающихся с «MRGN_» (здесь и далее синтаксис командной строки Windows XP):
for /d %b in (MRGN_*) do @for %a in (%b\*.tif) do if exist "%~fa" gdaltindex -skip_different_projection MRGN_SP5_2011_index.shp "%~fa"
для одной папки с растрами синтаксис имеет вид:
gdaltindex -skip_different_projection index.shp "*.tif"
- Сложный, который учитывает, что растр может занимать только часть изображения, а часть растра нас не интересует, т.к. имеет «черное» поле (NODATA=0). В этом случае, я делаю еще «пару танцев с бубном»:
1. Cоздадим новый растр из предположения, что есть NODATA=0 и все остальное > 0. Используем утилиту gdal_calc, чтобы вычленить ненулевые значения (в примере снова обработка целой папки с растрами TIF):
for /r %a in (*.tif) do gdal_calc -A "%~fa" --outfile="%~dpna_c.tif" --calc="(A>0)*127+(A==0)*0" --NoDataValue=0 --type=Byte –overwrite
2. Сжимаем полученные файлы с помощью опции COMPRESS=CCITTFAX4 с очевидным уменьшением разрядности до 1 бита через gdal_translate:
for /d %b in (MRGN_*) do @for %a in (%b\%~b_c.tif) do gdal_translate -of "GTiff" -a_nodata 127 -co "NBITS=1" -co "TFW=YES" -co "COMPRESS=CCITTFAX4" "%~fa" "%~dpna_msk.tif"
Это делаем для того, чтобы однозначно избавиться от всех значений больше 0, и радикально уменьшить размер растра, если мы задумаем его хранить как маску.
Создаем контура значимых (непустых) частей снимков через утилиту векторизации gdal_polygonize:
for /d %b in (MRGN_*) do @for %a in (%b\*_c_msk.tif) do if exist "%~fa" gdal_polygonize "%~fa" -b 1 -f "ESRI Shapefile" %b\%~na_poly.shp
Теперь надо открыть полученный вектор в какой-то ГИС, т.к. MapInfo результат gdal утилит не может открыть, т.к. в них есть тестовые поля в 255 символов, а у MapInfo ограничение длины строки в 254, контур приходится перевести программно через ogr2ogr:
ogr2ogr -f "MapInfo File" MRGN_SP5_2011_poly_mi.tab MRGN_SP5_2011_poly.shp
Темы объединения векторов я касаться не буду, она имеет место быть в пакете OGR.
Откроем контур (-а) растра (-ов) в MapInfo. С вероятностью 25%, в случае когда мы векторизовали значимый контур изображения через gdal_polygonize, в векторе будут присутствовать мелкие дырки от пикселей, которые имели значение NODATA внутри значимой части изображения.
- Для борьбы с ними в Mapinfo я разгруппирую все составные объекты, превращая «дырки» в отдельные объекты.
- После этого удаляю все объекты, имеющие площадь меньше некоторой критичной ( на пример 1 кв.км). Должны остаться только контура изображений.
Теперь откроем контуры планшетов в ГИС. Проделаем с ними следующие превращения (большинство избыточны):
- Увеличим размер каждого планшета на некоторую величину (не обязательно, но если потом придется выводить растр с перекрытием, это даст запас пикселей по краям). Я увеличиваю на 5% от размера планшета, пересчитанных в метры.
- Переводим полученный вектор в проекцию (или систему координат (СК) ) растра.
- Новый растр открываем и находим для каждого контура MBR (minimum bounding rectangle). В MapInfo – это стандартная функция, которую можно применить к объектам слоя, затирая их (это команда на MapBasic’е, которая выполняется в окне MapBasic внутри программы MapInfo):
update cutSHP_m50_000_UTM37 set obj=MBR(buffer(obj,20,2000,"m"))
что буквально означает следующее: "Для всех объектов слоя cutSHP_m50_000_UTM37 создать MBR для буфера вокруг каждого объекта с приращением 2000 метров и числом вершин при моделировании дуги равным 20".
- Надо расширить атрибутику векторных данных, т.к. в дальнейшем нам потребуются числовые значения координат вершин планшетов ( я пишу планшетов, т.к. это короче чем каждый раз писать «геометрические объекты сетки»). Этот пункт обязателен для исполнения (ниже станет ясно почему):
Alter Table "cutSHP_m50_000_UTM37" ( add ulX float, ulY float, lrX float, lrY float)
- Сейчас надо физически удалить планшеты, которые не пересекают значимый контур изображения. В Mapinfo отбор таких объектов делается с помощь пространственного запроса. В этом же пункте можно удалить и избыточные объекты сетки т.к. мы их создали с перекрытием.
- Теперь существенный момент: надо обрезать планшеты внешней границей растра (той, что получена в результате gdal_polygonize). Это обязательно надо сделать, т.к. планшеты, которые будут выступать за физические границы растра, не будут обработаны gdal_translate. В MapInfo это делается стандартной командой «Erase outside».
- Последний пункт – вычисление координат углов каждого планшета и сохранение этих координат в ранее созданные поля ulX float, ulY float, lrX float, lrY float. В Mapinfo для этого существуют стандартные функции и команда Update:
update cutSHP_m50_000_UTM37 set ulx=ObjectGeography( object, 1 ),uly=ObjectGeography( object, 4 ),lrx=ObjectGeography( object, 3 ),lry=ObjectGeography( object, 2 )
- Внимание! Параметр -projwin у gdal_translate имеет вид
-projwin ulx uly lrx lry
Что отличается от обычной записи, которая начинается с ЛЕВОГО НИЖНЕГО угла. Здесь как в растре – начало в ЛЕВОМ ВЕРХНЕМ, а вторая пара координат соответствует ПРАВОМУ НИЖНЕМУ углу.
- Сохраняем векторные данные в формат MIF/MID. так, что бы они имели следующий вид:
Id, ulx, uly, lrx, lry
где Id – уникальный номер (не обязательно, но я так делаю, что бы задать упорядоченные имена для создаваемых файлов-фрагментов), X -координата верхнего левого угла, Y - координата верхнего левого угла, X координата нижнего правого угла, Y координата нижнего правого угла.
Это может быть не только формат MIF/MID, в этом случае будем использовать только MID – текстовый файл атрибутивных данных, но и любой другой текстовый формат. Все что нам нужно – это координаты углов планшетов, что извлекать подмножество из исходного растра.
Все «танцы с бубном завершены». Получилось длинно и сильно в сторону, но я умею получить атрибутивные данные углы на планшетов только так.
Повторю, что собственно нам обязательно надо получить:
- 4 координаты углов сетки;
- эти координаты должны лежать только в пределах обрезаемого (скорее разбираемого) растра;
- иметь ту же СК, что и обрезаемый растр.
Обрезка растра
Само использование GDAL, а именно, gdal_translate, гораздо короче:
- Создаем набор команд для вычисления контуров в виде BAT-файла.
- Команда выполняется в каталоге, где лежит файл Q1.MID (так я назвал экспорт координат углов), файлы выполнения сохраняются в каталог root\1\, в нем же должна быть воссоздана структура исходных каталогов:
for /f "tokens=1-5 delims=," %a in (Q1.MID) do @echo @if not exist "root\1\test_%~a.tif" gdal_translate -of GTIFF -projwin %b %c %d %e -a_nodata 0 -co "TFW=YES" -co "compress=LZW" "f:\test\test.tif" "root\1\test_%~a.tif">>root\1\do_%~a.bat
- Можно сразу же запускать команды на выполнение в цикле for командной строки DOS, но создание набора BAT-файлов позволяет воспользоваться параллельным вычислением фрагментов или вернуться к прерванному вычислению, если понадобиться.
Для тех, кому необходимо, поясню, что записано выше, потому как использовать утилиты командной строки без FOR – на мой взгляд , не разумно и не эффективно:
for /f "tokens=1-5 delims=," %a in (Q1.MID) do
Построчно считать файл Q1.MID и выполнить над каждой строчкой операцию, записанную после do:
- Использовать в качестве разделителя параметров строки символ «,»
- Используя разделитель, получить 5 параметров – переменные от а до e
- %а – уникальный номер, %b %c %d %e - координаты углов планшета из файла Q1.MID
Если не существует файл с именем "root\1\test_%~a.tif" , то:
- Выполнить команду gdal_translate
- над исходным файлом "f:\test\test.tif"
- с результирующим файлом "root\1\test_%~a.tif"
- -a_nodata 0 - условием "нет данных" (NODATA) для пикселей со значение 0 во всех каналах
- -of GTIFF - выходным форматом GeoTIFF
- -co "TFW=YES" -co "compress=LZW" с дополнительными параметрами «Создавать world file» и «Сжимать растр алгоритмом LZW»
- -projwin %b %c %d %e – вырезать фрагмент, заданный указанными координатами, в системе координат растра (gdal_translate переведет их в координаты растра перед тем как вырезать фрагмент, о чем информирует нас при выполнении программы). Если границы выйдут за пределы растра – программа завершиться сбоем и сообщением об ошибке.
И, наконец, запускаем на выполнение все созданные BAT-файлы:
for %a in (do_*.bat) do "%~fa"