jueves, 20 de mayo de 2010

Criterios de una fuente de datos para RISP (I)

¿Qué criterios mínimos debería pedirse a un dataset (conjunto de datos) para ser considerado una fuente pública reutilizable de datos.? (abreviando una fuente ciudadana RISP). Como reflexión particular para debate planteo las siguientes
condiciones:

Condiciones de fuentes de datos desde la perspectiva ciudadana

1) Que sea universalmente accesible (por ejemplo a través de una URL)
2) Que sea digital para que permita su portabilidad a los dispositivos que necesite el ciudadano para su utilización
3) Que este disponible de forma diligente, es decir que el tiempo desde la petición a la entrega sea acorde a la era digital en que nos encontramos
4) Que se entregue en un formato abierto
5) Que el coste, en caso de haberlo, sea mínimo y asumible por el ciudadano.
 
Universalmente disponible
Imaginemos la violación de alguna de estas condiciones. La violación de la primera condición supondría que no estuviera universalmente disponible y por tanto supondría una cierta discriminación para alguna parte de la población.  Una característica poco deseable desde una fuente pública. 

Formato digital
Imaginemos la violación de la segunda condición y que por ejemplo nos entregan una copia en papel de la información. A poco copiosa que sea la información su utilización será compleja, y la reutilización por tanto será muy limitada para el ciudadano.

Proporcionar la información en tiempo digital
La tercera condición es una de las más exigentes, ya que deberían estar disponibles vías de petición digital manteniendo todas las condiciones de legalidad. 
La solución técnica de estos requerimientos ya existe y además en un país con 17 millones de DNI digitales (y subiendo) tenemos un paso andado por delante de muchos de los países de nuestro entorno.
Por comparación google atiende 7.200 millones de accesos cada día es decir unas 83.000 al segundo.

En formato abierto
Entregar la información en formatos no abiertos  supone aumentar el coste de acceso [1] y muy probablemente un coste de publicación [2] en los casos que haya que hacer migraciones como consecuencia del formato propietario.
Además los formatos propietarios no favorecen la interoperabilidad entre distintas fuentes ya que, en el mejor de los casos, tendremos que pagar por un precio en efectivo o implícito para su utilización. 

A un coste asumible
Es evidente que la información gratuita, según el tipo de información,  podría generar una demanda infinita o al menos muy superior a la que puede ser abordada inicialmente desde el ámbito público. Y consecuentemente generar unos costes muy elevados, si bien la transparencia en la ejecución de la función pública tiene un coste que debe ser asumido por el ciudadano. El balance no es evidente como ya tratamos recientemente  y la solución habrá que encontrarla durante el proceso de liberación y por aproximaciones sucesivas.
Algún estudio apunta a que los modelos económicos de la liberación de datos en crudo deben ser aquellos que únicamente contemplan el coste de distribución.
Generalizar esta afirmación es aventurado, pero al menos es una referencia.

mañana mas condiciones para el uso profesional....

1 comentario:

alberto dijo...

Parece que estos criterios son bastante coincidentes con la clasificación de 5 estrellas que propone tim bernes-lee.
http://www.elon.edu/e-web/predictions/futureweb2010/open_government.xhtml

pero prometo no haberlo leído, de hecho se parece sustancialmente pero también hay diferencias..,