Foto por sergis blog (Flickr)En abril de este mismo año David Cabo (Civio.es) comparaba en un excelente artículo la fiebre de apertura de portales de datos abiertos u opendata con la de inauguración de aeropuertos infrautilizados: portales casi vacíos, con datos testimoniales o datasets rozando el ridículo, son algunos de las situaciones con las que se encuentra un usuario que visita estas páginas. Destacaba la falta de métricas rigurosas y parámetros para medir la calidad de las iniciativas de open data que se están realizando en España en los últimos años, confundiendo lo importante con lo que se puede medir, al tener solo en cuenta la primera métrica simple que encuentran: número de portales, número de datasets…, en vez de utilizar criterios objetivos como el volumen de información o la frecuencia de actualización.

Alberto Abella, consultor de Rooter esta trabajando en el desarrollo de una metodología para la evaluación de fuentes de datos abiertos. Como parte de su investigación en la Universidad Rey Juan Carlos de Madrid ha publicado a través de la página Meloda (MEtric for reLeasing Open Data), un muestreo de los dataset presentes en portales de datos abiertos españoles, y ha analizado 3 aspectos:

  • Política de redistribución
  • Formato de la información
  • Accesibilidad de la información

Cada aspecto se ha dividido en 5 niveles de madurez (1 bajo, 5 alto) con criterios objetivos. Así a cada conjunto de datos analizado se la asignado un nivel de madurez en cada uno de los 3 parámetros estudiados. Los niveles son

  • Aspectos legales (Legal)
  • Nivel 1 Los datos tienen copyright. Estos derechos reservados limitan su uso
  • Nivel 2 Solo se permite el uso privado de los datos.
  • Nivel 3 Se permite la reutilización de los datos pero no el uso comercial de la reutilización de la información, es decir, para un blog, o una organización sin ánimo de lucro por ejemplo.
  • Nivel 4 Se permite la la reutilización de los datos, incluida la reutilización comercial (es decir, para cualquier empresa con el fin de crear una nueva visualización de los datos)
  • Nivel 5 Solo se exige la atribución de los datos, licencias tipo CC BY.
  • Formatos estándar (Technical Standards)
  • Nivel 1 Datos en formatos propietarios o formatos abiertos no adecuados (como usar formato de imagen para texto). Algunos ejemplos: xls, pdf imagen, doc, shp, etc.
  • Nivel 2 Datos liberados con estándares abiertos, pero como archivos individuales: csv, txt, ODB, odt, ods, etc.
  • Nivel 3 Estándar abierto con la documentación explicativa. Como los anteriores pero añadiendo información sobre el contenido de los archivos, es decir, csv, ODB, odt, ods, etc con información adicional sobre la estructura de los campos dentro del archivo, tamaño, tipo de datos, rango de registros del archivo...
  • Nivel 4 Estándar abierto, acceso / metadatos individuales. Se proporcionan metadatos adjuntos a cada dato, aunque sin información adicional sobre el contenido de la fuente de datos. Por ejemplo: RDF, RSS, json, xml (con meta-tags) sin instrucciones adicionales.
  • Nivel 5 Estándar abierto, con metadatos asociados y material explicativo. Se incluye información adjunta con los metadatos, e información adicional sobre el contenido de la fuente de datos disponible. Es decir RDF con documentación adicional.
  • Acceso a la información (Accessibility to the information)
  • Nivel 1 No hay acceso a los datos por Internet o es necesaria una solicitud escrita. El acceso a la información requiere un proceso de aprobación no automático.
  • Nivel 2 Existe acceso a la información a través de la Web, pero requiere la interacción del usuario para seleccionar la fuente de datos.
  • Nivel 3 Existe acceso a la información a través de la Web, pero permite que para cada uno de los conjuntos de datos se pueda acceder de forma individual, o a través de una URL única, o por parámetros específicos en la llamada de consulta.
  • Nivel 4 Existe acceso a la información a través de la Web y se permite acceder a cada uno de los datos, dentro del conjunto de datos, de forma individual, bien a través de una URL acortada, por parámetros específicos en la consulta, incluyendo la fecha o la versión.
  • Nivel 5 Se accede por API o por medio de lenguaje de consulta. Por ejemplo SPARQL.

De los dataset analizados en Meloda, se han seleccionado los correspondientes a información geográfica (9 octubre 2013): 

Dataset Entidad Legal Access Standard Global
Listado de calles que conforman la red viaria del Municipio de Santander Ayuntamiento Santander 5 5 4 8.66
Distritos de Zaragoza Ayuntamiento de Zaragoza 5 5 4 8.66
Mapa base de altimetría (geoservicio WMS) Open Data Barcelona 5 5 4 8.66
Servicio OGC. Web Map Service (WMS) Ayuntamiento de Gijón 5 5 4 8.66
Policía Local Open Data Málaga 5 5 4 8.66
Promociones VPP Open Data Málaga 5 5 4 8.66
Callejero y Tramero Open Data Pamplona 5 3 4 6.12
Centres d Educació Secundària Lleida Open Data 5 3 4 6.12
Estat de les platges Ayuntamiento de Badalona 4 3 4 5.81
Información de los huertos escolares coordinados por el Cabildo de Tenerife Cabildo de Tenerife 4 3 4 5.81
Playas gallegas con bandera azul en 2013 Xunta de Galicia 5 3 3 5.00
Relación de las calles de la ciudad Ayuntamiento de Tarrasa 5 3 2 3.54
Mapa de la ciutat, divisió per districtes Open Data Sabadell 4 3 2 3.35
Consulta masiva al Catastro Catastro España 4 2 2 2.37
Cuadrículas cartográficas MTN25 y MTN50 Instituto Geográfico Nacional de España 5 3 1 2.24
Coordenas de la la red orden inferior Instituto Geográfico Nacional de España 5 3 1 2.24
Unidades administrativas CyL 1:5000 (textos) Junta de Castilla y León 3 2 4 2.17
Cartociudad Instituto Geográfico Nacional de España 3 2 1 0.79
Altitud Instituo Estadistica Madrid 3 2 1 0.79
Cartografia digital: districtes Sant Boi Open Data 1 3 1 0.00
Geoportal urbanístic Open Data Badalona 1 3 1 0.00

De la muestra seleccionada solo aprueban la mitad y dos de los conjuntos de datos incluidos obtienen un cero de puntuación global, la cartografía digital de los distritos de San Boi (83.000 hab.) y el Geoportal urbanístico de Badalona (221.000 hab). No es muy alentador.

Más información sobre Meloda y la métrica para la evaluación de fuentes de datos abiertos en su Web: http://www.meloda.org/