MODELO DE DATOS


Se describe a continuacíón el modelo de datos que se ha definido para la recopilación efectiva de los datos de direcciones, topónimos y puntos de interés (POI) que servirán de referencia para la implementación de un servicio nacional de geocodificación de direcciones.


1. Objetivos


El modelo de datos a definir tiene como objetivo principal estructurar la información que es preciso recopilar para constituir los datos de referencia de un servicio de geocodificación de direcciones de carácter nacional.

Las características técnicas que debe cumplir el servicio son las siguientes:

En cuanto a la funcionalidad el servicio debe permitir:


2. Introducción


En España la competencia administrativa para definir el nombre oficial del viario y la numeración de las direcciones corresponde a los ayuntamientos.

Por este motivo, para constituir una base de datos de direcciones, es necesaro definir un procedimiento de recopilación de información muy básico en el que pueda participar cualquier administración local independientemente de su tamaño y capacidad técnica o económica.

Para ello se ha establecido que el formato de fichero de datos a utilizar para la recolección de direcciones sea conforme con el estándar CSV (Comma-Separated Values) [RFC 4180], dada su naturaleza de texto plano, la sencillez de su estructura interna y la posibidad de generarlo con cualquier tipo de software.

A diferencia de otros modelos de datos de direcciones, la estructura y tipología de sus atributos se ha orientado para atender las funcionalidades genéricas de un servicio de geocodificación.

Por este motivo se ha incluido un atributo que codifique el estado del dato, con objeto de diferenciar las direcciones entre: oficiales; normalizadas; históricas y otras, así como otro atributo que permita asignar un nombre propio a una dirección o localización, con objeto de facilitar su descubrimiento cuando no se dispone de un dato preciso de dirección, siendo aplicable también a la búsqueda de toponimia y puntos de interés.

Es necesario recalcar que este modelo de datos no está dirigido a la formación de una base de datos de direcciones al uso, sino a la indexación de información con el objetivo de dar soporte a un servicio de geocodificación.


3. Modelo de datos


3.1 Identificador


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
ID Identificador persistente y local proporcionado por el proveedor para referenciar una dirección (ubicación puntual) de un lugar que puede tener diferentes lenguas, diferentes épocas, diferentes denominaciones… Opcional 0,1 Cadena de caracteres Texto libre

Características para asignar el identificador:

Ejemplo: ID

Ejemplo de tratamiento del ID de una dirección por el CNIG:
ID 2016 2021
123456 Avenida Diagonal, 16 Avenida Diagonal, 21
123456 Avinguda Diagonal, 16 Avinguda Diagonal, 21
Ejemplo de tratamiento del ID de una dirección por la Diputación Provincial de Barcelona:
ID 2016 2021
bcn4cfr567 Avenida Diagonal, 16 Avenida Diagonal, 21
bcn4cfr567 Avinguda Diagonal, 16 Avinguda Diagonal, 21

Nota:

Este atributo, concatenado con el relativo a la fuente de datos, se puede utilizar eficazmente para diseñar los procesos de actualización de la información, para el seguimiento de su evolución histórica, así como para el estudio de las distintas fórmulas lingüísticas de una dirección, topónimo o POI.


3.2 Tipo de vía


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
TIPVIA Expresión de la tipología de vía de referencia o de su abreviatura Opcional 0,1 Cadena de caracteres Texto libre

No es necesario que las organizaciones tengan almacenado en sus bases de datos el TIPVIA. El campo puede estar vacío.

Se propone, como dominio, utilizar la tipología proporcionada por el INE, la D.G. del Catastro y los departamentos catastrales del País Vasco y Navarra, así como los utilizados en los proyectos de recopilación de datos de direcciones gestionados por otras administraciones públicas.

Se recomienda utilizar la expresión textual completa para el tipo de vía, siendo posible aplicar las abreviaturas más comunes.

En los casos en que el tipo de vía se considere parte intrínseca del nombre, se recomienda no rellenar el atributo TIPVIA con el fin de no duplicar esta información.

Tampoco es necesario expresar el tipo de vía en aquellas direcciones identificadas mediante un nombre propio o un código, ni en los casos correspondientes a topónimos o puntos de interés.

Ejemplo: TIPVIA + nombre de vía

Se parsea para identificar solo el nombre de la vía (sin preposiciones ni artículos)
TIPVIA NOMVIA
(null) Calle de la Virgen María Logroño
Calle de la Virgen María Madrid
(null) Barrutiko kalea Iruñea

Notas:

En el caso del País Vasco, donde el tipo de vía se coloca generalmente detrás del nombre (Ej: Satrustegi hiribidea, Mirakontxa pasealekua, Zubieta kalea), se recomienda concatenar la información del nombre y tipo de vía conforme a su orden y uso natural dentro del atributo Nombre de la vía [NOMVIA], manteniendo vacío el atributo Tipo de vía [TIPVIA].

Es necesario atender los casos en los se incluye un tipo de vía que no coincide con el que ofrece el Ayuntamiento. Ejemplos de ello son la Calle Avda. Mediterráneo o Calle Travesía Camino del Molino.


3.3 Nombre de la vía


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
NOMVIA Nombre o denominación de la calle o vía a la que se adscribe una dirección Condicional 0,1 Cadena de caracteres Texto libre

Se recomienda utilizar expresiones completas evitando el uso de abreviaturas, si bien pueden tener cabida las abreviaturas más comunes.

Cuando el tipo de vía se trate o se considere como parte del nombre, no se debe rellenar el atributo TIPVIA.

No es necesario expresar el nombre de vía en aquellas direcciones identificadas mediante un código o número de registro, o un nombre de localización.

Si alguna organización recoge el tipo de vía en un campo aparte, el atributo TIPVIA se rellenará. Si la organización no hace esa diferenciación, el tipo de vía vendrá incluido en el atributo NOMVIA junto con el nombre de la vía y en este caso el atributo TIPVIA estará vacío.

Notas:

En los casos de direcciones con nombre de vía, en los que no consta un número pero sí el nombre de la casa o de la finca, es necesario especificar en el registro el nombre de la vía indicando el nombre de la casa en el atributo Nombre de la localización [NOMLOC].

En el caso del País Vasco, donde el tipo de vía se coloca generalmente detrás del nombre (Ej: Satrustegi hiribidea, Mirakontxa pasealekua, Zubieta kalea), se recomienda concatenar la información del nombre y tipo de vía conforme a su orden y uso natural dentro del atributo Nombre de la vía [NOMVIA], manteniendo vacío el atributo Tipo de vía [TIPVIA].


3.4 Número de la finca, portal o punto kilométrico


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
NUMERO Localizador o identificación del portal; número; punto km asociado a una dirección Condicional 0,1 Cadena de caracteres Texto libre

Se entiende como número (popularmente así denominado) el localizador que acompaña al nombre de la vía con objeto de identificar una dirección específica dentro de esta.

Aunque generalmente se expresa mediante caracteres numéricos, se admite el uso de textos compuestos numérico-alfabéticos y fórmulas como bis, tris, complementario, supletorio, km, edificio, etc.

Las expresiones que complementan o discriminan una numeración como: bis, tris, supletorio, etc. se deben expresar dentro del atributo NUMERO a continuación del dato de numeración, con un espacio de separación entre ambos.

Se recomienda separar los distintos elementos de este atributo, si los hubiera, mediante espacios en blanco, evitando el uso como separadores de comas, puntos y coma, barras o guiones.

Ejemplo: uso del atributo NUMERO

  • Paseo de las flores 3 bis (NUMERO = 3 bis)
  • Calle de la vaguada Edificio A (NUMERO = Edificio A)
  • Autovía de Extremadura km 5 (NUMERO = km 5)

Nota:

En el caso de que un portal haga referencia a dos o más números por dar servicio desde la misma entrada a distintos inmuebles, se recomienda generar un registro distinto para cada una de las opciones numerales. Ejemplo: portal rotulado como «Calle del cerezo 12-14» por compartir dos inmuebles el mismo acceso, generaría dos registros:
  • Calle del cerezo 12
  • Calle del cerezo 14


3.5 Nombre de la localización


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
NOMLOC Designación alternativa ligada a la dirección o lugar (nombre de edificio, topónimo, POI) Condicional 0,1 Cadena de caracteres Texto libre

Nombre propio por el que se conoce un emplazamiento.

Su uso es opcional cuando el registro de datos corresponde a una dirección (TIPDATO = Dirección), siendo obligatorio en los registros cuyo tipo de dato (TIPDATO) sea Topónimo o POI.

Nota:

La inclusión de esta información de carácter complementario en los registros de direcciones definidos conforme a la fórmula clásica 'calle-número', permite buscar una dirección tanto por sus datos formales como por su nombre. Ej.: Torre Picasso; Facultad de Filosofía; Palacio de los deportes, Estación de autobuses.


3.6 Código postal


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
CODPOSTAL Código postal asociado a una dirección Condicional 0,1 Cadena de caracteres Códigos postales de la Sociedad Estatal Correos y Telégrafos

Su uso es obligatorio cuando el registro de datos corresponde a una dirección (TIPDATO=Dirección), no siendo necesario en los registros cuyo tipo de dato (TIPDATO) sea Topónimo o POI.

No incluir separador de millares.


3.7 UNIDADES ADMINISTRATIVAS


Los siguientes atributos estructuran por orden de rango las unidades administrativas a las que se asocia una dirección, topónimo o POI.


3.7.1 Comunidad/Ciudad Autónoma


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
CA Nombre de la comunidad o ciudad autónoma Obligatorio 1 Cadena de caracteres Lista controlada Comunidades autónomas; Lista controlada Ciudades autonomas

Los textos de los nombres de la comunidad o ciudad autónoma deben expresarse preferiblemente en lenguaje natural (no indizado), evitando el uso de abreviaturas.


3.7.2 Provincia


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
PROVINCIA Nombre de la provincia Obligatorio 1 Cadena de caracteres Lista controlada Provincias

Los textos de los nombres de provincia deben expresarse preferiblemente en lenguaje natural (no indizado), evitando el uso de abreviaturas.


3.7.3 Isla/Comarca


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
ISLACOMARC Nombre de la isla, comarca o agrupación de direcciones supramunicipal Opcional 0,1 Cadena de caracteres Texto libre

Nombre de la isla, comarca o agrupación de direcciones supramunicipal.

El texto del nombre debe expresarse preferiblemente en lenguaje natural (no indizado), evitando el uso de abreviaturas.


3.7.4. Municipio


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
MUNICIPIO Nombre del municipio Obligatorio 1 Cadena de caracteres Lista controlada Municipios

Los textos de los nombres de municipio deben expresarse preferiblemente en lenguaje natural (no indizado), evitando el uso de abreviaturas.


3.7.5 Primer nivel


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
NIVEL1 Agrupación de direcciones de primer nivel, de orden inferior al municipio: entidad colectiva, parroquia, diputación, entidad singular, núcleo urbano, población, distrito, sección, barrio, aldea, urbanización, polígono industrial, diseminado, etc. Opcional 0,1 cadena de caracteres Texto libre

Existen muchas posibilidades de estructurar y jerarquizar una dirección por debajo del nivel del municipio, siendo la casuística muy variada.

En este modelo se ha establecido la posibilidad de definir hasta dos niveles de jerarquización (NIVEL1 y NIVEL2) de orden inferior al municipio, pudiendo ser estos niveles los que dicta la práctica y la costumbre de cada caso o territorio, no fijándose de antemano una estructura específica.

Los textos de los nombres de agrupamiento de direcciones de primer nivel deben expresarse preferiblemente en lenguaje natural (no indizado), evitando el uso de abreviaturas y de fórmulas de indexación, por ejemplo: «El Escorial», siendo las formas no recomendadas «Escorial, El», «Escorial (El)».

Ejemplos: NIVEL1

Ejemplos de uso del atributo NIVEL1
NIVEL1
(distrito)
(aldea)
(entidad singular)
(parroquia)
(polígono industrial)

Notas:

Dado que pueden existir poblaciones pertenecientes a un mismo municipio que tengan nombres de calles coincidentes, su uso es obligado en los casos de direcciones que se encuentren en el ámbito urbano.

Para direcciones en el ámbito rústico su uso es opcional.


3.7.6 Segundo nivel

Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
NIVEL2 Agrupación de direcciones de segundo nivel, de orden inferior al municipio: entidad colectiva, parroquia, diputación, entidad singular, núcleo urbano, población, distrito, sección, barrio, aldea, urbanización, polígono industrial, diseminado, etc. Opcional 0,1 Cadena de caracteres Texto libre

Información de una agrupación de direcciones de orden inferior al primer nivel, cuando dicha pertenencia participa en la estructura formal de una dirección.

Los textos de los nombres de agrupamiento de direcciones de segundo nivel deben expresarse preferiblemente en lenguaje natural (no indizado), evitando el uso de abreviaturas y de fórmulas de indexación.

Ejemplos: NIVEL1 y NIVEL2

Ejemplos de uso de los atributos NIVEL1 y NIVEL2
NIVEL1 NIVEL2
(distrito) (barrio)
(aldea) (diseminado)
(entidad singular) (población)
(parroquia) (núcleo urbano)
(polígono industrial) (null)


3.8 Código INE de tramo


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
INETRA Código INE de tramo (16 dígitos) Opcional 0,1 Cadena de caracteres Código INE de tramo

Formación del código de tramo de 16 dígitos: 2 dígitos de la provincia, 3 del municipio, 2 de la entidad colectiva, 2 de la entidad singular, 2 de núcleo o diseminado, 5 del tramo, correlativos. No confundir con el código de vial corto de 10 posiciones.

Nota:

Recomendación para construir los 5 dígitos del tramo cuando aún no lo ha establecido el INE: definir 5 dígitos de alarma que indique que el código está en espera de que lo defina el INE. Ejemplo para vías en una misma población: X0001, X0002, X0003…


3.9 Lengua


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
LENGUA Lengua utilizada en la expresión de una dirección, topónimo o punto de interés Opcional 0,1 Cadena de caracteres Lista controlada lenguas ISO 639-3

Este atributo permite acotar el ámbito de la búsqueda de una dirección a un subconjunto de registros en función de la lengua en la que se encuentran expresados.

La codificación de tres (3) caracteres que se propone, es conforme con la norma ISO 639-3.


Código ISO 639-3 Lengua
ast Asturleonés | Asturiano | Llingua Asturiana | Bable| Leonés
arg Aragonés | Altoaragonés | Fabla aragonesa
glg Gallego | Galego
eus Vasco | Euskera | Vascuence | Lengua vasca
cat Catalán | Català | Valenciano | Valencià |Catalán-Valenciano-Balear | Català-Valencià-Balear
spa Español | Castellano
oci Aranés


3.10 Tipo de dato


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
TIPDATO Tipología del registro de datos conforme a la naturaleza de la información Obligatorio 1 Cadena de caracteres Lista controlada Tipos de dato

Recoge la tipología del registro de datos con objeto de su aplicación en el algoritmo de búsqueda:

Este atributo permite acotar el ámbito de la búsqueda de una dirección, topónimo o POI a un subconjunto de registros en función de su tipología.

3.11 Estado


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
ESTADO Estatus de una dirección o nombre geográfico Obligatorio 1 Cadena de caracteres Lista controlada Estados del dato

Información que permite discernir qué crédito debe darse a la información con respecto a su oficialidad, grado de normalización y/o su vigencia.

Fuente: Reglamento (UE) Nº 1089/2010.

Este atributo permite acotar el ámbito de la búsqueda de una dirección, topónimo o POI a un subconjunto de registros en función de su estado.


3.12 Proveedor


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
PROVEEDOR Proveedor de datos de la información del registro, señalando mediante una codificación el organismo o institución que suministra la información Obligatorio 1 Cadena de caracteres Lista controlada Proveedores de datos

Como la procedencia de los datos puede ser muy variada, se propone utilizar una lista controlada de códigos de proveedor para hacer referencia al productor/suministrador.

Este atributo permite acotar el ámbito de la búsqueda de una dirección, topónimo o POI a un subconjunto de registros en función del organismo productor/suministrador.

Nota:

Poder integrar de forma flexible datos de distintas procedencias y formatos en un servicio común de geocodificación de direcciones, ofrece la posibilidad de adaptar la metodología de la recopilación de información a las necesidades y posibilidades de cada productor. De esta manera los datos de direcciones recopilados por una comunidad autónoma, administración local u organismo público, se podrían actualizar remitiéndolos a un repositorio común (P.ej. Cartociudad) para su indexación, o bien ser recopilados de forma automática y periódica a partir de un servicio de publicación on line o de un fichero en red.


3.13 GEOMETRÍA


Expresión de las coordenadas que definen la ubicación geográfica de un registro de datos, representado mediante un objeto puntual.

Nota:

La norma UNE-EN ISO 6709:2010 “Representación normalizada de localizaciones geográficas puntuales mediante coordenadas. (ISO 6709:2008, incluyendo Cor 1:2009)" recomienda el uso de grados decimales para el intercambio de datos informáticos de latitud y longitud en formato digital, si bien permite el uso de notaciones sexagesimales para visualizar la latitud y la longitud (grados, minutos y minutos decimales o grados, minutos, segundos y segundos decimales).


3.13.1 Latitud


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
LATITUD Valor de la latitud de la geometría puntual Obligatorio 1 Numérico decimal -90.00<=latitud<=+90.00


3.13.2 Longitud


Nombre Definición Obligación Ocurrencia Tipo de dato Dominio
LONGITUD Valor de la longitud de la geometría puntual Obligatorio 1 Numérico decimal -180.00<=longitud<=+180.00


4. Formato del fichero


El formato de fichero de intercambio de datos debe ser conforme con el estándar CSV (Comma-Separated Values) [RFC 4180], utilizando como separador de los atributos el carácter punto y coma (;).

Cada registro (dirección, topónimo, punto de interés) se define mediante una línea adicional en el fichero.

Los datos de latitud y longitud deben indicarse con al menos cinco (5) cifras decimales de precisión geográfica.

Codificación de caracteres: UTF-8 sin BOM.