База географических названий GNS: различия между версиями

Материал из GIS-Lab
Перейти к навигации Перейти к поиску
(Новая страница: «{{Статья|Опубликована|gns}} {{Аннотация|Сводные данные и примеры для скачивания}} __NOTOC__ [http:/…»)
 
 
(не показано 5 промежуточных версий 2 участников)
Строка 20: Строка 20:
Получить подготовленные данные можно выбрав одну из ссылок в таблице. Если вы работаете в ГИС скорее всего вам нужны shape-файлы в кодировке UTF-8. Нажав на дату, можно посмотреть историю обновлений.
Получить подготовленные данные можно выбрав одну из ссылок в таблице. Если вы работаете в ГИС скорее всего вам нужны shape-файлы в кодировке UTF-8. Нажав на дату, можно посмотреть историю обновлений.


{| cellspacing="0" border="1"
{{#widget:Iframe
! Страна
|url=http://gis-lab.info/data/gns/scripts/gns_counts.php
! Объектов
|width=700
! Обновлено
|height=280
! Shape-файл, UTF8
|border=0
! Shape-файл, CP1251
}}
! CSV-файл, UTF8
! CSV-файл, CP1251
|-
| РФ
| 745568
|
[http://gis-lab.info/data/gns/logs/rs-update.log 21-07-2012 ]
|
[http://gis-lab.info/data/gns/gns-shp-utf-rs.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-shp-win-rs.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-utf-rs.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-win-rs.7z Скачать]
|-
| Беларусь
| 73228
|
[http://gis-lab.info/data/gns/logs/bo-update.log 21-07-2012 ]
|
[http://gis-lab.info/data/gns/gns-shp-utf-bo.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-shp-win-bo.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-utf-bo.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-win-bo.7z Скачать]
|-
| Украина
| 65972
|
[http://gis-lab.info/data/gns/logs/up-update.log 21-07-2012 ]
|
[http://gis-lab.info/data/gns/gns-shp-utf-up.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-shp-win-up.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-utf-up.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-win-up.7z Скачать]
|-
| Казахстан
| 34245
|
[http://gis-lab.info/data/gns/logs/kz-update.log 21-07-2012 ]
|
[http://gis-lab.info/data/gns/gns-shp-utf-kz.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-shp-win-kz.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-utf-kz.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-win-kz.7z Скачать]
|-
| Таджикистан
| 8835
|
[http://gis-lab.info/data/gns/logs/ti-update.log 21-07-2012 ]
|
[http://gis-lab.info/data/gns/gns-shp-utf-ti.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-shp-win-ti.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-utf-ti.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-win-ti.7z Скачать]
|-
| Армения
| 4747
|
[http://gis-lab.info/data/gns/logs/am-update.log 21-07-2012 ]
|
[http://gis-lab.info/data/gns/gns-shp-utf-am.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-shp-win-am.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-utf-am.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-win-am.7z Скачать]
|-
| Грузия
| 15228
|
[http://gis-lab.info/data/gns/logs/gg-update.log 21-07-2012 ]
|
[http://gis-lab.info/data/gns/gns-shp-utf-gg.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-shp-win-gg.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-utf-gg.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-win-gg.7z Скачать]
|-
| Киргизстан
| 15986
|
[http://gis-lab.info/data/gns/logs/kg-update.log 21-07-2012 ]
|
[http://gis-lab.info/data/gns/gns-shp-utf-kg.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-shp-win-kg.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-utf-kg.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-win-kg.7z Скачать]
|-
| Туркменистан
| 6389
|
[http://gis-lab.info/data/gns/logs/tx-update.log 21-07-2012 ]
|
[http://gis-lab.info/data/gns/gns-shp-utf-tx.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-shp-win-tx.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-utf-tx.7z Скачать]
|
[http://gis-lab.info/data/gns/gns-win-tx.7z Скачать]
|}


Наличие обновлений проверяется ежедневно, непосредственно обновление происходит по мере обновления БД (примерно один раз в неделю).
Наличие обновлений проверяется ежедневно, непосредственно обновление происходит по мере обновления БД (примерно один раз в неделю).
Строка 155: Строка 35:
[http://earth-info.nga.mil/gns/html/help.htm Подробнее] на языке оригинала.
[http://earth-info.nga.mil/gns/html/help.htm Подробнее] на языке оригинала.


{| cellspacing="0" border="1"
{| class="wikitable"
| '''Поле'''
| '''Поле'''
| '''Описание поля'''
| '''Описание поля'''

Текущая версия от 20:38, 22 августа 2012

Эта страница опубликована в основном списке статей сайта
по адресу http://gis-lab.info/qa/gns.html


Сводные данные и примеры для скачивания


GEOnet Names Server (GNS) - свободно распространяемая база данных имён географических объектов. Используется Федеральным правительством США, но "варианты названий тех или иных объектов, а также связанные с ними данные могут не соответствовать точке зрения правительства". Ограничения по использованию данных отсутствуют.

Каждая запись базы представляет собой текстовую строку, в которой описаны помимо всего прочего: широта/долгота географического объекта, его название в кодировке Unicode UTF-8 и классификационный признак типа объекта (реки, горы, населенные пункты и др.)

География покрытия включает в себя весь мир, за исключением США и Антарктики. GNS содержит порядка 4 миллионов объектов и приблизительно 5.5 миллионов имен. Ежемесячно обновляется в среднем по 20 000 записей данной базы. Последнее обновление произведено 20 апреля 2009 года. Используемая система координат - WGS84, координаты приблизительны и предназначены только для целей поиска.

Получение данных

Полную версию базы GNS на весь мир можно скачать со страницы: http://earth-info.nga.mil/gns/html/namefiles.htm, воспользовавшись гиперссылкой, "Click here to Download a single...". Имя загружаемого архива соответствует дате последнего обновления базы. Архив занимает порядка 300 Мб, несжатые данные - около 900 Мб.

Там же можно получить данные по каждому государству в отдельности в текстовом формате с разделителями (разделитель - символ табуляции). Для этого необходимо выбрать требуемую страну (поле "Country Name") и перейти по гиперссылке "Reading Order". Ссылка для скачивания данных на территорию РФ: http://earth-info.nga.mil/gns/html/cntyfile/rs.zip.

Обработанные данные

Получить подготовленные данные можно выбрав одну из ссылок в таблице. Если вы работаете в ГИС скорее всего вам нужны shape-файлы в кодировке UTF-8. Нажав на дату, можно посмотреть историю обновлений.

{{#widget:Iframe |url=http://gis-lab.info/data/gns/scripts/gns_counts.php |width=700 |height=280 |border=0 }}

Наличие обновлений проверяется ежедневно, непосредственно обновление происходит по мере обновления БД (примерно один раз в неделю).

На официальном сайте GNS расположены также инструменты текстового поиска объектов и графического поиска (в случае использования браузера Opera появляется сообщение "Invalid browser detected", с другими браузерами проблем не замечено) с использованием картографической подложки.

Поля базы данных

Подробнее на языке оригинала.

Поле Описание поля Тип поля
RC

Код шрифта, определяющий таблицу символов, используемую в полях SHORT_FORM, Generic и Full_Name (см. Character Set Conversion Table):
1
= Америка/Западная Европа;
2 = Восточная Европа;
3 = Африка/Средний Восток;
4 = Россия/Центральная Азия;
5 = Азия/Тихоокеания;
6 = Вьетнам.

Числовой
UFI Уникальный идентификатор объекта. Одному объекту может соответствовать несколько записей. В этом случае поля UFI таких записей будут совпадать. Числовой
UNI Уникальный идентификатор названия объекта. Числовой
LAT Широта объекта в десятичных градусах (± dd.dd...). Для обозначения южной широты используется знак "-". Числовой
LONG Долгота объекта в десятичных градусах (± dd.dd...). Для обозначения западной долготы используется знак "-". Числовой
DMS_LAT Широта объекта в формате ГМС (ггммсс). Для обозначения южной широты используется знак "-". Числовой
DMS_LONG Долгота объекта в формате ГМС (ггммсс). Для обозначения западной долготы используется знак "-". Числовой
MGRS Военная система координат. Текстовый
JOG Номенклатура листа Joint Operation Graphics, 1:250000 Текстовый
FC Класс объекта. Девять основных типов:
A = Административный район
P = Населенный пункт
V = Растительность
L = Местоположение или область
U = Подводный объект
R = Улицы, шоссе, дороги, железные дороги
T = Объекты рельефа
H = Гидрографические объекты
S = Точечные объекты
Текстовый
DSG Код обозначения объекта. Двух или пятисимвольный код используемый для обозначения типа объекта GNS. В перечень кодов входит более 600 типов объектов. Текстовый
PC Классификатор населенных пунктов. Числовая шкала, обозначающая относительную важность населенного пункта (от 1 - высокая до 5 - низкая). Значение NULL соответствует неустановленной важности. Числовой
CC1 Основной код страны. Двухсимвольный код уникальным образом идентифицирующий геополитическую единицу (страну, подчиненную территорию и т.п.). Текстовый
ADM1 Код административного деления первого уровня. Двухсимвольный буквенно числовой код стандарта FIPS 10-4 описывающий первый уровень деления геополитической единицы, например штат (state) в США. Текстовый
ADM2 Код административного деления второго уровня. Название единицы второго уровня деления геополитической единицы, например округ (county) в США. Текстовый
POP Численность населения. Числовой
ELEV Высота в метрах. Числовой
CC2 Дополнительный код страны. Двухсимвольный буквенный код стандарта FIPS 10-4 уникально описывающий код страны объекта Geoname если он отличен от основного кода страны этого объекта (международные объекты). Текстовый
NT Тип имени:
C = Обычное название
N = Название объекта в стандарте BGN
NS = Название объекта в стандарте BGN в нероманском написании
P = Временное название
PS = Временное название в нероманском написании
H = Историческое название
HS = Историческое название в нероманском написании
D = Непроверенное название
DS = Непроверенное название в нероманском написании
V = Альтернативное название
VS = Альтернативное название в нероманском написании
Текстовый
LC Код языка в стандарте ISO 639-3 Текстовый
SHORT_FORM Сокращенная форма полного названия. Текстовый
GENERIC Описательная часть полного названия (гора, река, море). Текстовый
SORT_NAME

Форма полного названия позволяющая осуществлять корректную сортировку в режиме географического справочника (gazetteer). Все символы заменены на латиницу в верхнем регистре, числа заменены на буквы в нижнем регистре (0-9 = a-j), пробелы удалены, запятые заменены на пробелы. Замена производится согласно Character Set Conversion Table [Char_Sets_20060703.pdf].

Текстовый
FULL_NAME Полное название объекта. Представлено в порядке чтения, то есть имеет место запись вида "Гора Эверест", вместо "Эверест, Гора", как хранится в базе данных. Текстовый
FULL_NAME_ То же, что и FULL_NAME, но все символы заменены на латиницу, регистр и пробелы сохранены. Замена производится согласно Character Set Conversion Table Текстовый
MODIFY DATE Дата добавления или изменения объекта (ГГГГ-ММ-ДД). Дата

Недостатки

  • База GNS построена по избыточному принципы, что является плюсом, так как информация не удаляется, но это значительно усложняет работу. Как только то или иное название помещено в базу, оно никогда не удаляется, за исключением очевидных повторений. Поэтому в базе присутствует большое количество вариантов имен объектов, которых на настоящий момент не существует.
  • Географические координаты объектов зачастую очень неточны, расхождения могут достигать 2-3 км.
  • Присутствует некоторое количество некорректных или просто неверных записей: некоторые места, описанные в базе GNS как принадлежащие одной стране, фактически располагаются совершенно в другой.


Ссылки по теме