sábado, 22 de mayo de 2010

¿Que informaciones son útiles para reutilización?

Tan importante como determinar el volumen de negocio alrededor de la reutilización de informaciones del sector público es determinar su reparto por tipo de información. En  esta etapa que nos encontramos, todavía inicial, de la publicación masiva de datos públicos tener ejemplos que muestren el valor y que comiencen a proporcionar beneficios reafirmarían las iniciativas de publicación. 

Reparto del valor por tipos de información
En la imagen vemos el reparto de valor  económico por tipos de información, proveniente del informe PIRA del año 2000. Claro que por hacernos una idea precisa del contexto, tengamos en cuenta que cuando se elaboró ese informe google tenía 2 años de vida, faltaban 5 para que google maps estuviera disponible, en España sólo el 13,4 % de la población española tenía acceso a internet (y una minoría con banda ancha) y el euro no estaba en manos de los ciudadanos. En España se destacaba la reutilización de la información en la web sispain.org que parece congelada desde aquella época.

A la hora de valorar este sector hay que tener en cuenta no solo el valor de las informaciones de forma individual, sino en su potencial de utilización conjunta y aún más su mezcla con datos 'privados'. Entrecomillamos privados como todos aquellos datos que no recogen y publican las Administraciones públicas, no por que no sean tan públicos como aquellos.

Compleja clasificación
La complejidad de esta asignación por temas podemos valorarla con un ejemplo todavía no real pero que podría serlo.
¿En que tipo de información asignaríamos el negocio surgido de un posible mapa inmobiliario (geográfico) que incluya datos de donde están las instalaciones generadoras de residuos (empresarial), cual es la distribución de delitos del barrio (sociales) y cuales son las medidas de calidad del aire (otros)? Sería difícilmente clasificable tanto por la mezcla de datos privados, como por las distintas temáticas, y por tener fuentes de distintas administraciones, todo esto independientemente del valor que pudiera tener para los posible compradores.
Determinar que informaciones serán de mayor interés o de cuanto valor económico es un asunto peliagudo como acabamos de ver. Lo que si parece intuitivo es que las informaciones del ámbito ciudadano más demandadas serán las que tengan más que ver con las preocupaciones ciudadanas actuales, p.e. paro, política, inmigración.

¿Como abordarlo? pregunte a sus clientes
¿Como podrían las administraciones determinar que juegos de datos son más interesantes? Con la difusión del acceso a la red, parece que el método natural sería implementar canales que recojan que informaciones son las más demandadas por cada categoría de usuarios bien sean ciudadanos o usuarios profesionales. 
Por otra parte esta no es una idea ni nueva ni original como vemos en el sitio relacionado de data.gov, o en el de data.gov.uk

Determinando la demanda y cruzando con los recursos disponibles probablemente optimizaría la inversión pública en la publicación de datos del sector público, lo cual aceleraría su adopción y el impacto en la sociedad.

viernes, 21 de mayo de 2010

Criterios de una fuente de datos para RISP (II)

¿Qué criterios mínimos debería pedirse a un dataset (conjunto de datos) para ser considerado una fuente pública reutilizable de datos.? (abreviando una fuente profesional RISP). Como reflexión particular para debate planteo las siguientes
condiciones:

Lo primero tiene que tener todas las condiciones de una fuente de datos ciudadana RISP.

Pero además para una explotación comercial debería incluir:

6) Que sea industrializable, es decir que haya una forma automatizada de acceder a los datos
7) Que tenga unas condiciones legales que permitan la explotación
8) Pago automatizable (en el caso de que lo haya), que no sea necesaria la intervención manual para el pago

9) Interoperable, que el formato de entrega esté adherido a algún estándar que permita el cruce sencillo de los datos


Industrializable
La necesidad de que sea posible una recuperación de datos sin intervención manual es evidente para una explotación profesional. Salvo utilizaciones muy específicas del ámbito profesional, un uso profesional no puede depender de una recuperación manual de datos para generar un cierto volumen de información. Por tanto una fuente donde la recuperación de datos dependa de consultar un formulario online introduciendo los valores en unos campos, es en general no admisible. En estos casos URL permanentes y normalizadas, una API o un web service son ejemplos de vías de distribución que permiten la industralización.

Condiciones legales
Una utilización profesional no puede estar basada en la inseguridad jurídica, por tanto el acceso a los datos debe estar respaldado de unas condiciones legales que fijen explícitamente los posibles usos de los datos. Si es posible deberían fijar también que posibilidades existen de mezcla con datos de otras fuentes y de la comercialización del resultado. Por tanto unas condiciones legales que no delimiten estos aspectos, o que simplemente impidan su reutilización profesional limitan que una fuente sea considerada como profesional.



Unas condiciones legales como las de reutilización de los datos del banco mundial facilitan más la reutilización (en inglés) o estas genéricas de data.gov, el repositorio de datos federal de la administración de los Estados Unidos.

Pago automatizable
Aunque hay indicios de que los precios bajos son los que de forma global podrían fomentar el mayor beneficio para la sociedad, es indiscutible que el acceso a la información pública podría tener cierto coste, especialmente en el uso profesional. En este caso la existencia de 'tarifas planas' de acceso u otros mecanismos que no requieran de intervención manual para realizar las transacciones económicas es un requerimiento.

Interoperable
Que la información se proporcione en formato abierto no garantiza que sea utilizable en un ámbito profesional. Pensemos en cualquier fichero de microdatos como éste ejemplo de una encuesta del INE "1451601000071016511020000 210   1     11  0093  3       666    3                                                                  66 07    641119    30203    1      09  0017403" donde de no tener su significado su utilidad es nula. Se hace por tanto necesaria una estandarización de la semántica para no minimizar los costes de integración de distintas fuentes de datos . Complementariamente lenguajes como el SPARQL, de generalizarse, permitirán esas consultas entre distintas fuentes de datos.  Conjuntamente  permitirían una explotación muchísimo más profunda e interesante de la que actualmente disfrutamos, además de la generación de multitud de nuevos modelos de negocio, que seguramente hoy ni acabamos de imaginar.

En resumen, que la generación de modelos de negocio alrededor de la reutilización de la información del sector público es una enorme oportunidad para nuestras administraciones públicas y para nuestra sociedad en general. Para que ello sea posible es necesario desbrozar el terreno en el ámbito legal y abonarlo un poco en el ámbito técnico para que crezcan estos negocios, una posibilidad bien deseable en estas épocas de crisis.

jueves, 20 de mayo de 2010

Criterios de una fuente de datos para RISP (I)

¿Qué criterios mínimos debería pedirse a un dataset (conjunto de datos) para ser considerado una fuente pública reutilizable de datos.? (abreviando una fuente ciudadana RISP). Como reflexión particular para debate planteo las siguientes
condiciones:

Condiciones de fuentes de datos desde la perspectiva ciudadana

1) Que sea universalmente accesible (por ejemplo a través de una URL)
2) Que sea digital para que permita su portabilidad a los dispositivos que necesite el ciudadano para su utilización
3) Que este disponible de forma diligente, es decir que el tiempo desde la petición a la entrega sea acorde a la era digital en que nos encontramos
4) Que se entregue en un formato abierto
5) Que el coste, en caso de haberlo, sea mínimo y asumible por el ciudadano.
 
Universalmente disponible
Imaginemos la violación de alguna de estas condiciones. La violación de la primera condición supondría que no estuviera universalmente disponible y por tanto supondría una cierta discriminación para alguna parte de la población.  Una característica poco deseable desde una fuente pública. 

Formato digital
Imaginemos la violación de la segunda condición y que por ejemplo nos entregan una copia en papel de la información. A poco copiosa que sea la información su utilización será compleja, y la reutilización por tanto será muy limitada para el ciudadano.

Proporcionar la información en tiempo digital
La tercera condición es una de las más exigentes, ya que deberían estar disponibles vías de petición digital manteniendo todas las condiciones de legalidad. 
La solución técnica de estos requerimientos ya existe y además en un país con 17 millones de DNI digitales (y subiendo) tenemos un paso andado por delante de muchos de los países de nuestro entorno.
Por comparación google atiende 7.200 millones de accesos cada día es decir unas 83.000 al segundo.

En formato abierto
Entregar la información en formatos no abiertos  supone aumentar el coste de acceso [1] y muy probablemente un coste de publicación [2] en los casos que haya que hacer migraciones como consecuencia del formato propietario.
Además los formatos propietarios no favorecen la interoperabilidad entre distintas fuentes ya que, en el mejor de los casos, tendremos que pagar por un precio en efectivo o implícito para su utilización. 

A un coste asumible
Es evidente que la información gratuita, según el tipo de información,  podría generar una demanda infinita o al menos muy superior a la que puede ser abordada inicialmente desde el ámbito público. Y consecuentemente generar unos costes muy elevados, si bien la transparencia en la ejecución de la función pública tiene un coste que debe ser asumido por el ciudadano. El balance no es evidente como ya tratamos recientemente  y la solución habrá que encontrarla durante el proceso de liberación y por aproximaciones sucesivas.
Algún estudio apunta a que los modelos económicos de la liberación de datos en crudo deben ser aquellos que únicamente contemplan el coste de distribución.
Generalizar esta afirmación es aventurado, pero al menos es una referencia.

mañana mas condiciones para el uso profesional....

miércoles, 19 de mayo de 2010

Modelos de financiación para publicación de datos publicos

Ya hablamos en 2.000 millones de euros en RISP. ¿Es tan fácil? (II) de los costes de publicación por parte de las entidades que comparten información y de los costes de acceso por parte de las entidades o ciudadanos que los utilizan. Hablemos ahora de los ingresos que soportan esos costes, y entonces la pregunta que nos planteamos es determinar qué modelo de financiación de las entidades que publican información maximiza el uso de la información manteniendo a la vez una estructura financiera autosostenible.


Políticas de precios
En un extremo tenemos aquellas entidades que establecen sus precios  maximizando su beneficio basándose en que en muchos casos son monopolistas del tipo de información que generan. En el otro tenemos aquellas entidades que publican la información de forma gratuita. En puntos intermedios, tenemos políticas de precios que  asignan precios para cubrir los costes de generación y  distribución y aquellas que únicamente cargan los costes de distribución (un coste simbólico).

Como usuarios y contribuyentes ¿Dónde está el óptimo? es claro que una política de maximizar beneficios de la entidad, reduce la carga directa como contribuyente, pero también es cierto que limita (por el precio) la aparición de modelos de negocio y por tanto los impuestos, el empleo, etc  que paguen  estas empresas, amén de estar en contra del espíritu de la directiva vigente y que se ha traspuesto, entre otras en la ley 37/2007

Un precio igual al coste de distribución podría ser óptimo
Esta disyuntiva ya ha sido analizada para entidades específicas del ordenamiento británico [trading funds] (Models of Public Sector Information Provision via Trading Funds de 2006), donde sin llegar a conclusiones definitivas o generalistas si parece que establecen recomendaciones de que el modelo de costes que maximiza el bienestar de la sociedad es el de asignar únicamente los costes de distribución para los datasets en crudo. Teniendo en cuenta que los costes de distribución en el ámbito digital son muy bajos este coste se aproxima bastante a cero.

Competencia en igualdad
Dado que muchas de las entidades que publican información se financian de los servicios alrededor del tratamiento de la información en crudo, aparece la problemática de garantizar que dichas entidades proporcionen la información en crudo en iguales condiciones (tiempo, detalle, estándar utilización) a las que ella misma utiliza para generar sus productos de valor añadido.

Una problemática no menor
Fomentar la reutilización del sector público dejando de lado los modelos de financiación de las entidades que publican la información podría condicionar su desarrollo. Por ello en la evaluación  de los modelos de negocio ha de visualizarse no sólo  los retornos directos vía precios o tasas públicas sino también aquellos  indirectos vía impuestos de las organizaciones profesionales que los utilizan o la optimización causada sobre el tejido empresarial o ciudadano.

Y la pregunta para los comentarios
¿Ejemplos destacables de políticas de precios en las entidades públicas españolas?

martes, 18 de mayo de 2010

¿Ladrillos o vigas para el open data? La posible evolución de los estándares del open data

Construyendo el edificio del open data
¿Ladrillos o vigas para el open data? Cuando se construye un edificio los ladrillos son flexibles en su utilización, fáciles de utilizar y con ellos se pueden resolver muchos de los problemas de construcción más comunes. Una viga es una estructura más hecha a medida con una concienzuda planificación y que no da mucho juego a la hora de una utilización distinta a la que fue originalmente concebida. Por contra soporta toda la presión de muchas de las estructuras del edificio.
Este símil arquitectónico me sirve de excusa para abordar uno de los problemas no claramente resueltos en el open data, especialmente en la liberación de datos de sector público, que es el de los estándares de liberación de datos.


Parece que hay consenso en que se utilicen estándares abiertos, si es que hay consenso sobre lo que es un estándar abierto. Pero ¿Es eso suficiente?, para un uso intensivo sencillamente parece que no. ¿Por que no? Por que cuando queremos  cruzar datos de varias (idealmente de muchas) fuentes empieza a ser necesario estar de acuerdo tanto en el estándar como en el significado de los datos que se están proporcionando.
Que el estándar sea abierto nos garantiza la independencia de un fabricante, y con un poco esfuerzo la pervivencia de los datos pero no una sencilla interoperación entre fuentes heterogéneas.

Volvamos a la pregunta original.  ¿Ladrillos o vigas para el open data?
Ladrillos, es decir estándares abiertos y simples con poca información de significado, reducidos en sus especificaciones y fáciles de implementar o Vigas, estándares más complejos, que proporcionan un amplio significado de los datos que se ponen a disposición y que son sólidos en su utilización compleja.

Los ladrillos cuentan a su favor de una rápida y económica adopción inicial pero podrían limitar en un futuro uso intensivo las interacciones complejas. También  al no cubrir algunos aspectos degenerar en diferentes estándares de facto. 
Las vigas por contra cubren aspectos de su utilización  de forma más sólida pero  suponen máyor complejidad a la hora de las primeras implementaciones y por tanto una adopción más lenta. Lo que puede condicionar su implantación

Ejemplos
Como ejemplo de estándar pequeño y ágil ('ladrillo') tenemos los microformatos,  que ya cuentan con un pequeño grupo de herramientas para su incorporación.
Como ejemplo de estándar grande y complejo tenemos las taxonomías XBRL, en las que España es referente mundial y que sirven para el reporte de información financiera y económica como usos iniciales.

Futuro
El futuro es inescrutable y sólo los muy temerarios pueden asegurar sin género de dudas por donde va a ir el mercado ;-D. Incluso podría resultar que los estándares propietarios resultaran significativos en el RISP. En cuanto a si dominarán los ladrillos o las vigas será dataset a dataset donde se tome esa decisión.
Dada la heterogeneidad de entidades y la falta de una organización  coordinadora con poder ejecutivo sobre el resto de fuentes de información del sector público, parecería que será más fácil llegar a acuerdos sobre estándares simples, ladrillos, que sobre vigas
Si el ámbito público se lanzara a normalizar sobre estándares vigas, es más probable que los estándares propietarios tomen una parte significativa del mercado ya que esos si tienen una entidad coordinadora e impulsora que es su propietario y que si cuenta con la dimensión suficiente puede hasta casi imponerlo.

Lo veremos.... pronto.

domingo, 16 de mayo de 2010

Factores para el auge de la reutilización de la información del sector público

¿Por que está de moda hoy la reutilización de información del sector público (RISP)? ¿Por que no hace 2 años o dentro de 2 años más? 
Algunos factores ayudan, como por ejemplo
Factores sociales
1.-Hoy en día casi un 60% de la población española tiene acceso a a Internet, es decir si se publican datos desde las administraciones, hay una potencial audiencia de dimensión considerable. Es decir que ya no es publicar para 'na'.

Factores técnicos
2.-La capacidad de las redes ha aumentado. Es decir que ahora para los usuarios es viable la descarga, la visualización o la consulta de los juegos de datos que la administración ponga a su alcance.

Factores económicos
3.-La publicación de datos, de forma que se incentive su reutilización, aunque es un proceso oneroso, no supone un esfuerzo diferencial con respecto a los servicios de e-administración que ya se realiza de forma habitual en casi todas las administraciones.

4.-Así mismo la presión sobre la eficiencia en el uso de los caudales públicos hace que la publicación de datos referidos a su gestión se vean recompensadas con una favorable acogida por los ciudadanos.

Factores administrativos y legales
5.- Ya existe una legislación sólida que ampare y regule la publicación de datos, para su reutilización como es la ley 37/2007, el Real Decreto 1671/2009, y los  recientes Esquemas Nacionales tanto de Interoperabilidad  4/2010, y de Seguridad 3/2010 entre otras normativas.

6.- Además hoy ya esta muy extendido el requerimiento de enviar la información en digital a la administración (especialmente para las empresas), por tanto solicitar que la información de la gestión pública este disponible en la red, parece una contrapartida natural en este contexto.

Factores externos
7.- No puede ser despreciado el impulso dado desde el Reino Unido en Europa y especialmente desde Estados Unidos a la publicación de datos del sector público.

Por estos y seguro que por varios otros factores la liberación de información del sector público y promover su reutilización es un proceso (una moda como la inmortal Audrey Hepburn de la imagen) que en los próximos meses no puede ir sino a más y que podría reportar beneficios muy importantes a nuestra sociedad.

viernes, 14 de mayo de 2010

¿Importa normalizar el open data?

Decíamos en el post de hace un par de días "2.000 millones de euros en RISP. ¿Es tan fácil? (I)" que eran necesarios una URL permanente, API o servicio web para una utilización profesional de los datos públicos. 

También  veíamos ayer que la falta de estándares definidos podría llevarnos a importantes elevaciones de los costes de acceso para los usuarios profesionales . Y recordemos que el volumen mayor de esos prometidos 2.000 M€ que auguran informes como el antiguo MEPSIR (2006)eson creado basados en los datos públicos. 

En la ilustracion siguiente vemos un ejemplo de esa normalización de open data  aplicado a las URL

Es sin duda una normalización muy razonable y detallada y buena para una utilización profesional. ¿Pero será la misma que utilizarán en Extremadura para datos similares?¿Y en la administración central? ¿O la de data.gov o de data.gov.uk? 

En un futuro la disponibilidad de ese tipo de informaciones será muy importante a la hora de decidir el establecimiento de empresas. Disponer de todo tipo de datos puede acelerar inversiones y reducir las incertidumbres asociadas a  lanzamiento de todo tipo de emprendimiento.

Los datos están ya publicados en muchos casos, y la normalización aunque bien posible todavía no esta globalmente implementada en nuestro país. Podríamos pagar las consecuencias.... nunca mejor dicho.

jueves, 13 de mayo de 2010

Los estándares técnicos en el RISP (I)

Algunas preguntas sobre estándares
¿Que pasaría si la liberación de datos públicos se hiciera conforme a 3, por poner un ejemplo sólo 3, estándares distintos? Una situación que se repite con cierta frecuencia en otros ámbitos tecnológicos equivalentes.
¿Cuantos interfaces de conexión habrá que crear para conectar distintas fuentes de datos en distintos estándares? O bien ¿Qué coste supondría tener que publicar la información en 3 estándares distintos?
¿Que ocurriría si añadimos que para que el RISP genere grandes volúmenes de actividad es necesaria la interconexión de fuentes de datos?

Más preguntas sobre el mercado resultante
¿Qué harán los productores privados de datos?¿A qué estándar se adherirán?¿Y quien les habrá condicionado su decisión?
¿Podría suceder que uno de esos estándares fuera propiedad de un fabricante?y si eso ocurriera, a medida que crecieran el número y dimensión de fuentes públicas ¿Que tipo de mercado tendríamos en ese contexto?
¿Sería deseable o estaría limitado?
Mañana más

miércoles, 12 de mayo de 2010

2.000 millones de euros en RISP. ¿Es tan fácil? (II)

Modelos económicos
¿Cobrar o no cobrar por la información pública? Es evidente que la puesta a disposición de los ciudadanos de la información del sector público supone un coste añadido para el sector público, que llamaremos coste de publicación

Este coste de publicación es un coste no despreciable, puesto que aunque no incluye los costes de la generación de esta información, ya que es propia de la tarea administrativa, debe incluir costes de adecuación legal, sistemas de información, atención a los usuarios, mantenimiento de niveles de servicio, actualización de tecnología, etc.

Denominemos coste de acceso al coste que tiene que afrontar el usuario de la información pública y que incluye el precio o tasa pública  (si lo hubiere),  el de las herramientas, infraestructuras y otros recursos (como autorizaciones, tiempos, etc) necesarias para el acceso efectivo a la información publicada.  
Si este coste de acceso es reducido o nulo en la práctica, es posible que aparezca una demanda muy alta de la información, y como consecuencia el coste de publicación de la información se elevará.
Cual siete y media no es bueno si no llegas pero tampoco si te pasas.

Pero si la utilización es alta como consecuencia de un bajo coste de acceso y en una parte significativa de esa utilización  es profesional, este uso generará negocios que podrán proporcionar financiación vía impuestos. ¿Cuantos impuestos pagarían un sector que moviera 2.000 millones de euros? ¿Financiarían los costes de publicación?

Valor añadido para los datos públicos
También es verdad que si pensamos en modelos de negocio que únicamente mezclen informaciones provenientes del ámbito público no será sencillo que aparezcan negocios diferenciados ya que todos los actores contarían con la misma materia prima y solo el procesamiento específico de la información y servicios de valor añadido podrían suponer factores diferenciadores. Sin embargo aquí es donde debemos  considerar una nueva dimensión en la utilización de la información pública.
Mezcla con datos privados
Como permiten muchas licencias privadas de contenidos 1, 2, una interesante posibilidad es la mezcla de datos con otras fuentes de datos privadas.
Por poner un ejemplo podríamos imaginar un servicio donde sobre un mapa del catastro (un dato público de ámbito nacional) información de las industrias emisoras de residuos (un dato público de ámbito autonómico) y los niveles de polen de  una base de datos privada y que envíe avisos al teléfono móvil de una persona que padezca problemas respiratorios.

Muchos otros modelos de servicio más sensatos que el ejemplo anterior podrían ser desarrollados por emprendedores que tomen como una parte  fundamental de su negocio la reutilización de los datos del sector público.
Parece interesante que si se quiere alcanzar rápidamente los niveles de negocio alrededor de la reutilización de datos públicos las licencias administrativas, permitieran modelos como éste que se plantea en el ejemplo. Todo ello sin menoscabar implicaciones sobre la responsabilidad, autoría, remuneración, etc que establece la legislación vigente.

lunes, 10 de mayo de 2010

2.000 millones de euros en RISP. ¿Es tan fácil? (I)

¿2000 millones de euros en el sector de negocio de reutilización de datos públicos en España? ¿Es tan fácil? Ver MEPSIR (2006) y su próxima revisión.

Una cifra comparable a dos veces el presupuesto de radiotelevisión española, notoriamente superior al presupuesto de la comunidad autónoma de La Rioja,  superior a la suma de los sectores del cine, el videojuego y la música en España en 2008, o superior a todo el presupuesto de los equipos de fútbol de primera división por poner ejemplos de distintos ámbitos.

Sería poco realista pensar que semejante dimensión se puede alcanzar sin tomar algunas decisiones estructurales. Como planteaba en el post anterior "La administración no puede oponerse a compartir datos" hay ciertas medidas necesarias (pero seguro que no suficientes) para poder aspirar a estos volúmenes de mercado.

Datos en crudo por favor
Es del todo imposible crear un sector de tal volumen sin una fuente de materia prima (en este caso los datos públicos) que sea industrializable. Para posibilitar la multitud de usos necesarios para  llegar a la cifra mágica, de 2.000 millones el requerimiento de que los datos se proporcionen con todo el detalle posible -en crudo- es absolutamente imprescindible.
Esta necesidad ha de hacerse compatible con el respeto de la legislación vigente  de protección de datos personales y de seguridad nacional (entre otros) como se establece en el artículo 3 de la ley 37/2007.

Enlaces estables, API o servicios web
Para que sea industrializable el sector además de conseguir una materia prima adecuada, hay también que saber donde conseguirla. Por ello, y dado que la tecnología lo permite, se hace necesario que los datos públicos se encuentren disponibles como URL estables, como API's o como servicios web. De esta manera los posibles utilizadores tanto ciudadanos como empresariales pueden incorporar dichos datos de forma sistemática. Y por tanto podrían crear usos estables sobre los que asentar sus iniciativas.

Un catálogo no vendría mal
Además un catálogo global de fuentes públicas, una posible versión avanzada del catálogo aporta también comienza a hacerse necesario, ya que de las en torno a 400 fuentes actuales deberíamos saltar a posiblemente 100 veces esa cifra.

Formatos (estándares) abiertos
Aunque la legislación nacional recoge abundantemente, primero como recomendación (2005) y luego como legislación (2007) (Artículo 4.i de la ley 11/2007) la obligatoriedad de utilizar estándares abiertos por las administraciones públicas su uso viene además obligado por el sentido común.

¿Debería una administración dejar sus datos y la industria generada a su alrededor, a la voluntad de un fabricante propietario de un estándar?.¿Pondríamos hoy nuestros datos en wordstar?

Mañana más

La administración no puede oponerse a compartir datos

Las recientes legislaciones como son la ley 37/2007 de 16 de noviembre de 2007 y el Real Decreto 1671/2009, de 6 de noviembre de 2009 que la desarrolla parcialmente, fomentan la reutilización de la información del sector público.

Complementariamente y con un enfoque más técnico los  Esquemas Nacionales tanto de Interoperabilidad recogido en el Real Decreto 4/2010,  y de Seguridad recogido en el Real Decreto 3/2010, de 8 de enero  establecen un marco para su puesta en marcha.

Y tanto marco pero pero la pintura todavía no dibuja un panorama favorable para la utilización efectiva pues se topan con una asentada 'tradición' de obstaculizar al ciudadano (al menos en una utilización mínimamente profesional) el acceso a la información.
Esta obstaculización en no pocos casos tiene impulso de aquellos que sacan partido del oscurantismo, creo que no hace falta dar más explicaciones.

No es una exageración si vemos cláusulas legales de sitios tan útiles como la DGT, o simplemente vemos el marco jurídico de utilización de datos del catastro del ministerio de economía y hacienda, por poner solo unos ejemplos y al que agradezco a su servicio de atención la rapidez en la respuesta (incluida al final de este post) a mi consulta pero que no es precisamente satisfactoria.

Y es que los esfuerzos de liberación de datos públicos, y el valor económico que pueden proporcionar a la sociedad pueden verse lastrados por la falta de mecanismos ágiles de licitación y utilización de la información. 

En un mundo digital tener con esquemas de firma electrónica, con 17 Millones de DNI electrónicos en poder de los ciudadanos, y cerca de un 60% de ciudadanos así mismo conectados a la red decirle a una empresa o a un ciudadano que tiene que rellenar un papel y esperar una respuesta escrita se me antoja de otro siglo o al menos de otra década.

Ejemplos como el contrato para descarga de documentos de red.es nos muestran que es posible la certeza jurídica con la agilidad digital.

Si a esto sumásemos unas fuentes de datos públicos, con acceso a los datos en crudo (y no sólo tablas de html paginadas), enlaces estables a los mismos (además de los formularios que requieren interacción manual), y en formatos abiertos (para que las sucesivas de versiones de las herramientas no nos dejen sin datos) entonces estaremos más cerca de obtener los augurados beneficios que promete el informe MEPSIR y que si bien corresponden a estimaciones del 2006 para España se cifraban superiores a los 2.000 millones de euros (tomando España como el 8% de la UE).

De: SIN_RESPUESTA@catastro.meh.es
Para:ALBERTOABELLA@LIBROBLANCO.COM
 Asunto: Respuesta a la consulta Num: 56874
 Fecha: Fri, 23 Apr 2010 15:15:08 +0200

 --------------------------------------MENSAJE ORIGINAL--------------------------------------

REUTILIZACIÓN COMERCIAL DE LOS CONTENIDOS DE LA WEB


PODRÍAN INDICARME EL ENLACE O DONDE ENCONTRAR LAS CONDICIONES LEGALES PARA LA REUTILIZACIÓN DE LA INFORAMCIÓN DE ESTA WEB (INCLUIDO UN POSIBLE USO COMERCIAL) HTTP://WWW.CATASTRO.MEH.ES EN CONCRETO ME INTERESAN LAS CONSULTAS  DE ESTADÍSTICAS SOBRE BIENES DE NATURALEZA URBANA

MUCHAS GRACIAS

 --------------------------------- RESPUESTA A LA CONSULTA ----------------------------------

 Estimado Alberto.

No existe enlace ni condiciones para la reutilización comercial de los datos de la Web de Catastro porque no está permitido.

 Atentamente, Linea Directa del Catastro. 902373635.

No responda a este correo. Para cualquier duda utilice el enlace 'Contactar' de la página web de la Dirección General del Catastro (www.catastro.meh.es)