Mostrando entradas con la etiqueta dataset. Mostrar todas las entradas
Mostrando entradas con la etiqueta dataset. Mostrar todas las entradas

viernes, 21 de mayo de 2010

Criterios de una fuente de datos para RISP (II)

¿Qué criterios mínimos debería pedirse a un dataset (conjunto de datos) para ser considerado una fuente pública reutilizable de datos.? (abreviando una fuente profesional RISP). Como reflexión particular para debate planteo las siguientes
condiciones:

Lo primero tiene que tener todas las condiciones de una fuente de datos ciudadana RISP.

Pero además para una explotación comercial debería incluir:

6) Que sea industrializable, es decir que haya una forma automatizada de acceder a los datos
7) Que tenga unas condiciones legales que permitan la explotación
8) Pago automatizable (en el caso de que lo haya), que no sea necesaria la intervención manual para el pago

9) Interoperable, que el formato de entrega esté adherido a algún estándar que permita el cruce sencillo de los datos


Industrializable
La necesidad de que sea posible una recuperación de datos sin intervención manual es evidente para una explotación profesional. Salvo utilizaciones muy específicas del ámbito profesional, un uso profesional no puede depender de una recuperación manual de datos para generar un cierto volumen de información. Por tanto una fuente donde la recuperación de datos dependa de consultar un formulario online introduciendo los valores en unos campos, es en general no admisible. En estos casos URL permanentes y normalizadas, una API o un web service son ejemplos de vías de distribución que permiten la industralización.

Condiciones legales
Una utilización profesional no puede estar basada en la inseguridad jurídica, por tanto el acceso a los datos debe estar respaldado de unas condiciones legales que fijen explícitamente los posibles usos de los datos. Si es posible deberían fijar también que posibilidades existen de mezcla con datos de otras fuentes y de la comercialización del resultado. Por tanto unas condiciones legales que no delimiten estos aspectos, o que simplemente impidan su reutilización profesional limitan que una fuente sea considerada como profesional.



Unas condiciones legales como las de reutilización de los datos del banco mundial facilitan más la reutilización (en inglés) o estas genéricas de data.gov, el repositorio de datos federal de la administración de los Estados Unidos.

Pago automatizable
Aunque hay indicios de que los precios bajos son los que de forma global podrían fomentar el mayor beneficio para la sociedad, es indiscutible que el acceso a la información pública podría tener cierto coste, especialmente en el uso profesional. En este caso la existencia de 'tarifas planas' de acceso u otros mecanismos que no requieran de intervención manual para realizar las transacciones económicas es un requerimiento.

Interoperable
Que la información se proporcione en formato abierto no garantiza que sea utilizable en un ámbito profesional. Pensemos en cualquier fichero de microdatos como éste ejemplo de una encuesta del INE "1451601000071016511020000 210   1     11  0093  3       666    3                                                                  66 07    641119    30203    1      09  0017403" donde de no tener su significado su utilidad es nula. Se hace por tanto necesaria una estandarización de la semántica para no minimizar los costes de integración de distintas fuentes de datos . Complementariamente lenguajes como el SPARQL, de generalizarse, permitirán esas consultas entre distintas fuentes de datos.  Conjuntamente  permitirían una explotación muchísimo más profunda e interesante de la que actualmente disfrutamos, además de la generación de multitud de nuevos modelos de negocio, que seguramente hoy ni acabamos de imaginar.

En resumen, que la generación de modelos de negocio alrededor de la reutilización de la información del sector público es una enorme oportunidad para nuestras administraciones públicas y para nuestra sociedad en general. Para que ello sea posible es necesario desbrozar el terreno en el ámbito legal y abonarlo un poco en el ámbito técnico para que crezcan estos negocios, una posibilidad bien deseable en estas épocas de crisis.