domingo, 28 de noviembre de 2010

Método LTCA de valoración del open data

Cuando hoy estamos mas cerca de un nuevo reglamento que desarrolle la ley 37/2007 y profundizando en las reflexiones que se volcaron en el FICOD sobre los catálogos de informaciones de las administraciones públicas, se echo en falta la valoración de las distintas fuentes o una catalogación que pusiera en contexto unas frente a otras. 
En el anterior post, y bajo unas hipótesis muy concretas se determinaba que  la utilidad crecía con el cuadrado del número de fuentes, siempre que esas fuentes fueran 'perfectas'. 
Que sean 'perfectas' es como decir fueran L·T·C·A =1, me explico:
LTCA
Que sean L de Legalmente reutilizables y como ejemplo podríamos considerar que un CC by sería un 1 para este parámetro y un copyright estaría cerca del 0.
T de Técnicamente accesible, es decir que si la fuente se ofrece en un formato crudo, basado en un estándar abierto (Ver definición en anexo k de la ley 11/2007) y bien documentado estaríamos en un 1 y si se ofrece la fuente en un pdf en formato imagen estaríamos cerca del 0.
C de Completa en su ámbito, es decir que si el ámbito es el de un mapa geográfico imaginemos  un mapa de un país donde faltan ciudades o provincias, su utilidad sería muy cuestionada
A de Actualizada respecto a su tasa de variación natural. De igual modo, con un ejemplo la situación del tráfico de hace 8 horas puede tener una utilidad muy limitada para un conductor.
Por tanto para las mejoras al reglamento que desarrolle la ley 37/2007 deberían pedirse medidas que garantices que además de tener muchas fuentes  fueran LTCA 1, es decir legalmente muy reutilizables, técnicamente accesibles, completas (para lo cual sería deseable la coordinación de administraciones )y  bien actualizadas, y conforme a esta prioridad aplicar la financiación adecuada, por que aunque la sociedad se va a beneficiar, quien tiene que dar el primer paso son las administraciones actuales.

Estrategias de inversión en el open data publico y privado

El catalogo de fuentes de datos del proyecto aporta muestra actualmente 719 'fuentes publicas de datos'.(28-11-10)
Durante los debates que tuvieron lugar en el pasado FICOD en la sesión sobre catalogos de información publica y los subsiguientes comentarios en twitter lo que quedó claro es que se demandaban más información, más fuentes y en datos crudos que permitieran un tratamiento comercial posterior, eso siempre con respecto a la legalidad vigente.
 Si el valor/utilidad de estas fuentes viniera por la capacidad de combinarse  la fórumla que reflejaría este valor (tomando como N el número de fuentes) se estaría reflejado en la siguiente fórmula, 
pero que si suponemos que la vaca es redonda crece con N2.
Simplificando, esta fórmula supone que un crecimiento del 40% en el número de fuentes casi duplica la utilidad global, y duplicar el número de fuentes supone cuadruplicar su utilidad, etc.
Por otra parte para que esa combinación sea posible han de existir estándares comunes (por supuesto abiertos) que permitan esa combinación.
El número de pasarelas a desarrollar para que la combinación sea posible crece con el factorial de su número, por ello introducir una nueva serie de fuentes de datos basados en un estándar distinto puede no suponer un avance en la utilidad global del sistema.
(N número de fuentes y K número de estándares)
Es evidente que no todas las combinaciones proporcionan una utilidad (y que muchas de ellos proporcionarán casi la misma, y deben ser los usuarios y el sector privado los que muestren el camino de aquellas que realmente proporcionan valor.
De cara a las inversiones unas condiciones legales que permitan la reutilización son absolutamente necesarias, difícilmente puede catalogarse algo como  fuente como fuente, sino es posible combinarlo con otras informaciones y sería deseable que el próximo decreto que desarrolla la ley 37/2007 así lo establezca.
Para concluir el resumen de la sesión sería "libera mucho, libera crudo y en estándares conocidos" para que una vez superadas las barreras legales, no sean las tecnológicas las que lastren el despliegue de los potenciales beneficios del open data tanto de índole económica como de índole social y política.

martes, 2 de noviembre de 2010

Que si tiene futuro el opendata y cuanto

Pregunta 1
¿Es una moda el open data, es decir la libración de caudales de datos tanto del ámbito público como privado?.

Respuesta 1
No. Está de moda por que hoy es posible tanto desde el punto de vista de usuario y de fuentes por que hay una masa suficiente de fuentes de información que son de interés.

Pregunta 2
¿Por que está tan de moda el RISP o la reutilización de datos públicos?

Respuesta 2
Por que la digitalización de las aapp permite que grandes fuentes de datos puedan ser hechas publicas. Que los usuarios puedan acceder hoy a millones de fuentes privadas contrasta con su contrapartida pública.

Pregunta 3
¿cual es la perspectiva de crecimiento de los modelos de negocio alrededor del open data?

Respuesta
Mi estimación es que la función de crecimiento tiene una formula como la siguiente.



donde:
K es un parámetro que mide la conversión entre la disponibilidad de las fuentes y el potencial de negocio € / Gb
T es el tamaño de las fuentes medidas en Gb
To es el parámetro de normalización de la cantidad de datos (Gb)
N es el número de fuentes dispares de información
No es un número umbral de fuentes dispares (informaciones distintas) y que representa las dificultades técnicas a la conexión de fuentes
alfa es un parámetro entre 0 y 2 que sintetiza las restricciones económicas y legales a la utilización de las fuentes (adimensional)

F es el valor económico medida en euros generados por las fuentes.

Dado que tanto T (el tamaño de las fuentes de datos), como N (los tipos de información disponible) crecen con el tiempo a medida que se liberan más fuentes de información, parecería imparable el creciente valor económico de este sector. Pero ha de tenerse en cuenta también que tanto No es creciente en el tiempo a medida que se crean nuevos formato de liberación de información, y que alfa depende del esfuerzo del legislador y de los particulares por hacer legal la reutilización económica de la información y de la disposición económica de los consumidores a pagar por la información. Finalmente To también crece con el tiempo a medida que los consumidores somos más exigentes con las fuentes de información (lo que ayer era estupendo como un mapa estático en pdf ahora estamos pidiendo mapas interactivos que consecuentemente requieren de mayores necesidades de almacenamiento).

La evolución factorial de N es la lógica de un sistema realimentado donde cada nuevo tipo de fuente puede ser interconectado con todo el resto de tipos de fuentes generando nuevas posibilidades.

Próximo post: valores de los parámetros en el sector nacional.

sábado, 9 de octubre de 2010

jueves, 2 de septiembre de 2010

Gobierno abierto o gobierno cerrado

La pregunta. Se podría...
¿Podría existir un gobierno abierto y participativo basado en software privativo (propietario en otros ámbitos).?
Pues por poder podría existir. Ahora bien. Imaginemos, que no es mucho imaginar, que así lo hacemos, que una entidad pública utiliza un software privativo de gobierno abierto [bien sea de publicación de sus datos o bien de subida de las opiniones ciudadanas hacia la administración].

Y ya se sabe que muchos responsables políticos son aversos al riesgo, luego que cosa más natural que compartir el sistema que se ha utilizado en otro punto.
Y máxime ahora en la época de ahorro en que nos encontramos.

Problemas graves para extenderlo
Y aquí viene el problema, vamos a aprovechar esa experiencia e instalar esa copia en otra entidad pública y que es lo menos que tendremos:
1) Habrá que volver a pagar por una licencia por los usuarios o por el uso global de la herramienta.
2) No habrá posibilidades de adaptación más allá de los que habilite el fabricante de la herramienta.
3) No se podrá compartir esa herramienta sin el permiso (y pago) del fabricante.
4) La herramienta respetará los estándares abiertos para su uso por los ciudadanos, o no, según decida el fabricante en su opinión de lo que debe haber en el mercado.

No es hoy objeto de reflexión toda la jurisdicción europea, nacional o autonómica que promueve el uso de licencias abiertas para el software utilizado en el ámbito público, sino que es una reflexión desde el sentido común.

¿Podemos dejar que una compañía controle la participación ciudadana?
¿Es conveniente dejar en manos de una compañía privada la gestión de la participación en la cosa pública?
No es que no cueste dinero ni tenga consecuencia económicas, pero la participación ciudadana es algo más que un negocio, y por tanto como  podría explicar un responsable público cosas como: 
1) Que no puede incorporarse una nueva característica de participación ciudadana a una solución, por que no está en el roadmap del fabricante. 
2) Que no hay dinero en la CCAA para pagar las licencias del software al que el mismo ciudadano puede acceder para la participación nacional o local.
3) Que una de sus lenguas maternas no está disponible por que el fabricante mundial ya proporcionará versión en otro momento.
4) Que no pueden agregarse los resultados de una entidad con los de otra por que la información está almacenada en formatos que sólo el fabricante conoce.
5) Que hay un fallo de seguridad del software que compromete el anonimato de los participantes y el fabricante no considera prioritario solucionarlo. 
....
Seguro que en los comentarios aparecen más casos kafkianos como estos...

Cierto es que alguna situación comparable conocemos a diario, pero por una vez podíamos atender al sentido común y evitar que estas situaciones de gasto e incoherencia se produzcan en el ámbito público.

No es discriminación empresarial
La apuesta por una licencia abierta para el software del gobierno abierto no es discriminatoria para ninguna empresa. Si son propietarias del código fuente siempre pueden liberarlo bajo estas licencias. 
Otra cosa es que, basado en esa restricción de la licencia, quieran ganar más dinero, entonces la decisión pública no es una discriminación sino una elección de acuerdo al buen gobierno que se espera de la cosa pública.

Conclusión
¿Podría existir un gobierno abierto y participativo basado en software privativo?, Poder existir puede. 
Ahora bien, en ese caso el gobierno debería ser llamado mas bien gobierno cerrado o cerrable, ya que una entidad externa a la participación y al  propio ámbito público tendrá en sus manos la estrategia de participación ciudadana.

lunes, 26 de julio de 2010

Video de Tim Berners-Lee sobre open data en la red

No es nuevo pero como dicen los anglos "it's a must".
es una charla de Tim Berners-Lee sobre open data en internet.
Mejor oirlo que comentarlo.

viernes, 23 de julio de 2010

Fuengirola. Ante la falta de transparencia matemos al mensajero (I)

La reciente publicación del índice de transparencia de los ayuntamientos españoles ha ocasionado, afortunadamente para Transparencia internacional, y para la sociedad en general cierta polémica.
Y es que el ayuntamiento de Fuengirola ha exigido una rectificación o en caso contrario demandarían a la organización. 
Ayuntamiento: Por favor haganlo y el tema de transparencia y reutilización de información del sector público ganaría en audiencia. 

Matando al mensajero
Lo publicado (esperando que sea fiel a la realidad) describe una situación "Hay que matar al mensajero" de libro.
Paso 1. Cuestionar al autor
Se afirma (seǵun la voz de málaga) "Es una empresa privada que sólo persigue el interés económico", 
Situación real:
"Transparency International (TI) es una organización internacional, no gubernamental, no partidista, y sin fines de lucro, dedicada a combatir la corrupción a nivel nacional e internacional" (enlace)

Paso 2. Cuestionar los fines
Se afirma (seǵun la voz de málaga)
Situación real:
En su web no tiene publicidad, y no es una empresa por el número de accesos a su web es, por ejemplo, significativamente menor que el de la web de Fuengirola (Alexa dixit) que ganen dinero por eso.


Paso 3. Cuestionar la metodología

Según la voz de málaga. "El análisis difundido por la empresa sólo analiza las informaciones de las páginas web municipales, y no la transparencia de los ayuntamientos como institución." "Sólo podrá pronunciarse sobre la funcionalidad operativa o informativa de dichas páginas web"
Situación real:
Hay que darle la razón en cuanto al alcance del análisis (Análisis centrado en la web) también es cierto que eso que los políticos llaman sociedad de la información, es precisamente eso, que la sociedad (por ejemplo los ciudadanos de Fuengirola) puedan acceder a la información.
Y baste decir que uno de los principios de transparencia es  "Las entidades públicas, a iniciativa propia, deben poner a disposición del público información básica y esencial sin que sea necesario realizar una solicitud "

Paso 4. Mostrar sus errores pasados
Se afirma "Ninguna garantía de veracidad u objetividad, como se puede comprobar a través de la Wikipedia, que cuestiona la valoración de sus informes porque se basan en encuestas que miden valoraciones subjetivas"
Situación real:
Los informes cuestionados en wikipedia, se refieren a otro índice que genera la misma entidad, el índice de percepción de corrupción, donde evidentemente una parte tiene que ser conseguida mediante encuestas por la insólita tendencia de los corruptos a no confesarlo en las encuestas. Su metodología completa está disponible.

Paso 5. Somos normales o un poco mejores incluso
"Las páginas web no son obligatorias, puesto que existen cientos de ayuntamientos que ni siquiera tienen, y no por ello dejan de ser transparentes"
Situación real
¿Cuantos ayuntamientos de 70.000 habitantes NO TIENEN web en España?"
Ayuntamiento: si no se tiene web, hoy en día, SI DEJA de ser transparentes.

seguiremos....

jueves, 15 de julio de 2010

Los funcionarios los aliados inesperados del open data

Muchas veces se alude a los funcionarios como uno de los obstáculos para la difusión del opendata, de la transparencia o de la reutilización de la información del sector público.
El otro día contrasté esta opinión con uno de ellos, cuyo nombre omitiré oportunamente por motivos que se entenderán perfectamente en la continuación de este post y cual fue mi sorpresa cuando el lo veía como una 'necesidad' y como una 'defensa' mas que como una amenaza.
No era como pensaba
Ante mi cara de asombro espontáneamente me planteaba algunas de las ventajas que el open data (o al menos la publicación intensiva de lo que hacían  las administraciones publicas) podía suponer para ellos.
Explicaba que él sólo hacía lo que le ordenaban, sea coherente, sea inútil, sea tirar el dinero público o sea la primera ocurrencia política que el jefe de su jefe (que ese si es plenamente político) le ha pasado por la cabeza.
Que los resultados o incluso parte del proceso sea público, pensaba, permitiría que muchas insensateces no se 'cometieran' o al menos requirieran tantas explicaciones que los impulsores desistieran de ellas.
O si realmente eran públicos los resultados de la inversión se podría constatar la estupidez de la iniciativa (el famoso 'ya te lo habíamos dicho').
En concreto identificaba como excesivos la inversión  en  publicidad, en  autobombo y en ocultar que parte de la inversión viene de una entidad no afín políticamente.
I+D e innovación de piedra y ladrillo
O muchas inversiones en investigación y desarrollo e innovación, en realidad estaban motivados más por dar salida a algún inmueble de alguna institución afín, o simplemente gastar dinero europeo, que la intención de realmente crear una institución de investigación o vivero de innovación. Y además al cabo de los años (al darse cuenta de que no funciona sin un plan y una dirección del sector) se fusiona con otras entidades para ver si barajando y dando las mismas cartas  o algunas menos, cambia la partida, o bien se cierra, y aquí se acabó el cuento.
 Rentabilidad inesperada
Me contaba, que sólo con la publicación de los datos en tiempo 'real' y sin  'cocina' previa se podían producir, no ahorros, globales sino incrementos espectaculares de la inversión y del impacto.
Hablaba casi de un órden de magnitud, no se si creerlo pero tal vez esté en lo cierto.
Que la transparencia y la reutilización de los datos podía ser interesante,  me lo confirmaba, pero la mejora de la eficiencia global para la sociedad es un beneficio mucho mayor para la sociedad y para él en particular.

Algo malo tenía que tener
Sus temores eran que la publicación de la información no fuera automática y por tanto fuera una tarea más para los funcionarios. Otro temor era  que les pidieran además una 'precocina' de los datos antes de su ejecución (y publicación. por tanto)  Vaya que podía ser más trabajo, en cualquier caso el lo veía más positivo que negativo.
Mi capacidad de sorpresa es grande pero de vez en cuando hay gente que  prueba esos límites como en esta iniciativa.

viernes, 9 de julio de 2010

Flyontime.us. Un sitio del futuro ¿o del presente?

Flyontime.us es una web que utiliza datos públicos de los aeropuertos de Estados Unidos para informar de la puntualidad de los mismos.
Hasta ahí no es sino un ejemplo interesante de reutilización de datos públicos. Más interesante es que su código esté abierto bajo una MIT license es decir que sería posible evolucionar ese código y crear nuevas utilidades o utilizarlo para otras naciones.

Pero además de ser un código abierto, también es posible el desarrollo sobre los datos de este sitio a través de una serie de posibilidades de conexión
Al no ser propietario de sus contenidos (son datos públicos) no tiene una licencia para la reutilización, sus fuentes, que incluyen el omnipresente data.gov, pero también informaciones de las Condiciones de los aeropuertos de la administración Federa, así como Historical Weather Reports de la agencia metereologica y los Airport Security Line Wait Times.

Es un ejemplo de como la mezcla de datos públicos crea valor para los ciudadanos, sin coste adicional y creando a su vez un modelo de negocio.

martes, 29 de junio de 2010

Referentes en el open government

Estamos en una época preciosa y desafiante en materia de open government. La difusión amplia de la conexión a internet entre la ciudadanía posibilita una participación en las tareas de administración que anteriormente o bien era imposible, o bien era injusta.
Y por esa bisoñez en que nos encontramos, el desarrollo de referentes es una tarea urgente y necesaria.
¿A que llamamos referentes?
Pues referentes necesarios son por ejemplo:

1) Un referente legislativo que defina la obligación tiene un estado o administración de publicar sus datos, es decir que leyes dan soporte o establecen obligaciones de publicar los datos de la actividad de la administración pública.

2) Referentes en cuanto a reutilización, es decir bajo que mecanismos legales (licencias) se va a permitir la reutilización de la información, y su mezcla con datos privados.

3) Referentes de participación de los administrados, de los funcionarios, de los infomediarios en la tarea del gobierno abierto.

4) Referentes tecnológicos de los mecanismos y herramientas técnicas para la publicación de los datos, de forma que permitan la interoperabilidad y las explotaciones secundarias y terciarias de la información.

5) Qué inversión y qué implicación es necesaria desde el ámbito público para la implantación profunda de esta filosofía de gobierno.

Es claro que existen ya algunas opciones en estos 5 apartados, pero todavía no existe un consenso del sector en cuanto a cuales de ellos dentro de cada categoría son los más útiles o beneficiosos. 
Para 1), aunque existe una directiva europea para el fomento de la reutilización de información del sector público, no será hasta dentro de más de 12 meses cuando exista una revisión que establezca estas obligaciones.
Para 2) todavía se están dirimiendo si las licencias de publicación de datos públicos pueden ser licencias sujetas a la normativa americana tipo Creative Commons o deben ser licencias administrativas.
Para 3) todavía hay iniciativas muy incipientes pero ninguna que pueda ser considerada como referente.
Para 4) ya nos gustaría tener un estándar de interoperabilidad aceptado, hasta hoy los único estándares son tipo csv, que es un estándar no semántico, es decir que solo atiende al formato y no al contenido, aunque aquí si parece haber consenso en cuanto a que tenga que ser un estándar abierto cualquiera que sea el definitivo.
Para 5) Todavía no hay métricas efectivas y comúnmente aceptadas que evalúen ni el volumen de inversión necesaria ni los retornos obtenidos por la sociedad.

Existe un balance entre la libertad de cada iniciativa de explorar un camino y la necesidad de coordinar esfuerzos para que la utilidad desarrollada por unas iniciativas lo sea compatible por otras.

De un buen trabajo en cada uno de estos aspectos dependerá la rapidez con la que se desarrollarán y extenderán estas iniciativas. Esperemos que en esta época de tensiones económicas, tengamos el suficiente sentido común para darnos cuentas de que en coordinación y con cooperación generaremos más valor para la sociedad y por tanto más empleo, transparencia, y otros beneficios alcanzables a través de al implantación del open government.

miércoles, 23 de junio de 2010

Opendata y transparencia en la actividad de la administración pública

El problema de medir sólo en euros
¿Quién no ha oído el bajo nivel que tiene la inversión en I+D en España?.  En el gráfico podemos ver la inversión comparada con nuestro producto interior bruto. 
Es curioso que los déficit estructurales de nuestra  economía se midan prácticamente solo con euros. 
Sin menospreciar la importancia del dinero, especialmente en la época que nos toca vivir , creo que la mejora de nuestras capacidades como economía deben venir más del incremento de la efectividad. 
Y alrededor de ese incremento está la reflexión de este artículo.
Incentivos a la efectividad en el gasto
¿Que fomenta que las inversiones se midan principalmente en euros? Pues que se gaste dinero de forma ineficiente. Que cuando se financie con dinero público cualquier tipo de actividad, (no solo innovación o I+D) lo importante sea que el dinero se gaste, y no tanto que se consigan algún tipo de resultados.
Si alguien consigue financiación y en el curso del proyecto descubre alguna tecnología disruptiva que le permite ahorros trascendentales (p.e. utilizar software libre) esos ahorros rara vez podrán repercutir sobre el innovador, sino que tendrá que devolver la práctica totalidad del ahorro generado (¡Vaya incentivo!)
No estaría mal en esta época de crisis en la financiación pública que se promuevan mecanismos que permitan ese tipo de ahorros.

Propuesta
Para ello estaría bien que si alguien hace una inversión y cumple unos parámetros establecidos, esta entidad pudiera beneficiarse también en parte (por ejemplo el 50%).

Y los resultados
Y una vez ejecutados los proyectos con financiación pública, ¿Hay alguien que evalúe la efectividad de los euros invertidos?. No sólo que se han respetado los conceptos contables de los gastos bajo los que se ha establecido la financiación pública, sino también si el proyecto cumplirá las necesidades para las que fue inicialmente admitido. Si el impacto en la sociedad ha sido el esperado para la inversión realizada.

Un uso inteligente del RISP evitaría casos inauditos
La falta de una apertura real de los datos y de unos indicadores de gestión posibilitan casos inauditos como el que publicaba hace poco el diario El mundo.
Un alcalde de una ciudad española se compra un coche que cuesta el doble que el del presidente de los EEUU, (casi 600.000€, en realidad el coste es por 4 años) y no salga en primera página de varios diarios y sólo nos enteremos cuando lo cambia.
¿Que parámetro operativo de gobierno soporta semejante inversión? La transparencia de estos parámetros operativos vía #opendata  fomentaría que excesos como éste nunca lleguen a producirse. 

Por ello el núcleo no será sólo conocer vía opendata el gasto público, sino también pasar a posteriori el análisis de efectividad para mejorar el uso de los fondos públicos.

Gracias Juantomas por tu enfoque sobre la disrupción.

martes, 22 de junio de 2010

Acierto o sentido común del Banco de España

El gobernador del Banco de España sorprendía (por el sentido común de la medida) con la noticia de que se van a publicar las pruebas de stress de los bancos del sistema financiero español
Y es que parece que nos estamos dando cuenta de un hecho "Es mejor ser pobre y que se sepa cuanto, a que no se sepa cuan pobre eres".

Es decir, si se sabe cuan pobre eres como país, los inversores saben donde se meten, qué riesgos están tomando y cuales no. 
Si, por el contrario, los únicos datos que tienes sobre la situación son sospechas y declaraciones de políticos o de medios no respaldadas por datos, (y últimamente los mercados financieros se mueven basados en los rumores y sospechas a falta de datos fiables) la proverbial aversión del dinero al riesgo hace que ni se te acerque dinero alguno. 

En el vídeo embebido podemos ver la propaganda de una entidad bancaria que apuesta por la transparencia como argumento comercial, algo está calando en este sector y puede que la crisis sea un buen acicate.
Esta iniciativa seguro que será seguida por otras. ¿Por qué? Por que una vez que una entidad abre una iniciativa de transparencia (como Caja Navarra en el vídeo), es difícil mantenerse al margen.

miércoles, 16 de junio de 2010

Herramientas para la transparencia: la cuenta abierta

¿Podría una entidad hacer accesibles sus apuntes bancarios a todos los ciudadanos o al menos a un grupo de ellos?
En mi conocimiento lo puede hacer pero 'a mano' es decir con sus propios medios, pero no es un servicio que ofrezcan las entidades bancarias.
Aquellas entidades que deben hacer de la transparencia un principio fundamental de funcionamiento (partidos políticos, sindicatos, ONG, comunidades de vecinos, fundaciones, etc) no disponen de un producto que ofrezca estas características.
La posibilidad técnica existe, y sólo creo que puedan existir pequeños inconvenientes legales ligados al tratamiento de datos personales.
Pero sin duda pueden ser superados con un tratamiento legal adecuado de los apuntes.
Las consecuencias pueden ser muy interesantes ya que el seguimiento en tiempo real puede acabar con muchas especulaciones, permitir conocer de forma real los periodos de pago de las entidades públicas, conocer el estado real de las finanzas, y muchos otros temas de interés.
¿Están los bancos y cajas perdiendo una oportunidad de negocio?, por que nadie ha dicho que este servicio sea gratis.

lunes, 14 de junio de 2010

La falta de transparencia en el ojo de la crisis

El 93% de los productos financieros calificados como AAA (la máxima calificación) por las agencias de calificación de riesgos (Fitch, Moody's and Standards & Poor's) en 2006 han sido degradados a bonos basura.
Lehman Brothers tenía la máxima calificación crediticia hasta el último día antes de su quiebra.
La metodología de como las agencias de calificación cualifican el riesgo, los datos que utilizan y los mecanismos de decisión son completamente opacos.

Las consecuencias de la errónea calificación las estamos viviendo actualmente con pérdidas millonarias que pagan no solo los inversores que se fiaron de estas agencias sino también el resto de la sociedad. 

Pero lo más preocupante no es la existencia de estas empresas, que no hacen sino vender sus productos, sino que esta falta de transparencia continúa aún presente y solo ha habido tímidas iniciativas para remediar esta situación.

La apertura de datos públicos podría tener significativo impacto sobre la incertidumbre que rodea a la calificación de riesgo de los países. Los hechos recientes en Reino Unido, Hungría y Grecia,(¿bono basura?) muestran que queda un considerable camino por recorrer.

Aunque el Banco de España publica un buen número de indicadores económicos, su uso comercial está bastante restringido como puede verse en su nota legal.
Y por lo visto no son suficientes para acallar los rumores

La cuestión al final vuelve a ser la misma ¿Quien se beneficia de la falta de transparencia?

jueves, 10 de junio de 2010

Resumen PSI Meeting Madrid 2010

El día 9 se ha celebrado en Madrid el PSI Madrid Meeting 2010. Un encuentro muy interesante donde ha habido ciertas reflexiones que o bien fueron compartidas por varios de los ponentes o bien creo que son destacadas por su relevancia y que recojo aquí.


Implantación: qué es necesario
- Liderazgo político. Y convencimiento de la organización. Sorprendentemente se afirmó que parece que los políticos son razonablemente receptivos a estos conceptos por encima de otros colectivos. 
- Mecanismos adecuados de licenciamiento que proporcionen seguridad jurídica a los reutilizadores profesionales.
- Apartarlo de la política partidista, es decir la reutilización debe ser asumida por todos los partidos políticos como un elemento propio de la función pública.
- Simplicidad y accesibilidad para la reutilización. Y recoger la forma de uso y las sugerencias de los reutilizadores.
- Incentivos para las AAPP para que vayan más allá del puro cumplimiento de la ley.
- Feedback. Que haya puntos de contacto para los reutilizadores.
 - Los datos deben proporcionarse al menos en formatos 'crudos' y más adelante mediante API's, webservices o equivalentes.

- No necesario, pero si parece de ayuda la existencia de Una agencia para la reutilización de información del ámbito público y sirva de interlocutor en casos de denegación de peticiones además de fomentar la interoperabilidad de los juegos de datos o servicios puestos a disposición de la sociedad.


Implantación: barreras
- Tasas altas de reutilización, incluso desde los infomediarios se aboga por la tasa gratuita que el País Vaso o adoptó.
- Miedos en los responsables de las AAPP a compartir datos sensibles, a posibles reutilizaciones tergiversadas y a costes no asumibles

Desafíos
- La medida del valor económico es compleja.Y en los pasillos se comentaba la actualización tanto metodológica como de datos el informe MEPSIR, una de las últimas referencias disponible en este ámbito.
- La nueva directiva europea sobre reutilización, que debería recoger conceptos más avanzados que la directiva actual que data de 2002.

Ámbito internacional
Hay consenso que el país de la UE que más adelantadas tienen estas políticas es el reino unido, si bien el reciente cambio de gobierno y los recortes presupuestarios podrían comprometer este liderazgo, España se encuentra entre los países seguidores.

Ambito nacional
Hay casos en las administraciones españolas no proporcionan los datos en condiciones adecuadas para los reutilizadores o directamente no dan respuesta a las peticiones para reutilización.

Frases destacadas
- "La generación de valor público no es un monopolio de la administración". Alberto Ortiz de Zárate

lunes, 7 de junio de 2010

Transparencia versus renta per cápita

Si el open data aumentara la transparencia
Además de los efectos de creación de negocios alrededor de la liberación de datos  públicos existen otros efectos cuya cuantificación requiere de análisis bastante complejos. Además no todo se mide en euros en esta vida.
No obstante, ¿Tiene efectos económicos la transparencia? Es de sentido común que sí, pero su cuantificación definitiva es compleja.
En la gráfica vemos la comparación  de la renta per cápita de distintos países (datos del banco mundial) respecto a la percepción de la corrupción de transparencia internacional
La pendiente de esta curva es de 9.000$ por grado de percepción. Es decir que si la economía española mejorara  1   punto en esta escala de 1 a 10, nos correspondería tener una renta  9.000$  superior. Lo cual supondría una mejora de más de un 25% de nuestra renta actual. 
No puede afirmarse que un aumento de transparencia derivado de la apertura de datos públicos trajera como consecuencia directa esa mejora de nuestra economía pero si deberíamos sopesar que aumentar la  transparencia tiene consecuencias estructurales.

Es decir, aunque el aumento de transparencia como consecuencia de políticas de open data (de Reutilización de Información del Sector Público) no traiga esa mejora de nuestra economía, Sí puede suceder que la falta de transparencia por no tener implantadas estas políticas impida que mejoremos nuestra renta hasta esos niveles.
Merece una reflexión los datos están ahí....

viernes, 4 de junio de 2010

Nos reiremos en 5 años

Publicar los datos en 2015
Nos reiremos dentro de 5 años cuando recordemos que en aquella época, es decir hoy en el año 2010, las administraciones públicas no publicaban sistemáticamente los datos de su funcionamiento.

Información de subcontrataciones
Nos reiremos también de la dificultad actual para saber de forma rápida qué compañías contrataban con las distintas administraciones y por qué importes y cuales eran los resultados. Nos reiremos entonces de las facilidades que esto suponía para los corruptos.

Nuevos servicios
Puestos a reirnos, nos reiremos de como era posible de que hubiera restricciones y dificultades para mezclar los datos públicos con los de nuestra propia empresa y así crear nuevos servicios más interesantes para los ciudadanos y consumidores. Y de la cantidad de empleo e impuestos que no existían por esta falta de publicación.

Control del sector público
Nos reiremos de aquellos miedos de la alta dirección pública a que se conociera con cierta exactitud cada una de sus decisiones y se midiera su impacto desde fuera de la propia administración, incluidos los propios ciudadanos.

Menos manipulación
Nos reiremos finalmente de como era posible que se dieran datos  de la acción pública erróneos, obsoletos o tergiversados.

Desde el principio
Y también nos reiremos de como era posible que cuando se diseñaba un nuevo servicio público no se tuviera en cuenta que había que publicar los datos para los ciudadanos.

Ahorrando tiempo y dinero
Y de lo que más nos reiremos será de la cantidad de dinero  y de tiempo que se desperdiciaba entonces por la falta adecuación de los servicios a las necesidades reales.

¿Nos reiremos verdad?

miércoles, 2 de junio de 2010

El 90% de las aplicaciones son ilegales

El 90% de las aplicaciones del concurso abredatos son ilegales. Probablemente más si deciden montar un negocio basado en ellas. Algún motivo habrá se me ocurren algunos...

Motivos inventados para las cláusulas restrictivas de la reutilización de información del sector público
¿Por qué? Por que aunque hay legislación(ver este post) que ampara la reutilización de información del sector público, utilizando un poco de sentido de humor pueden pasar cosas como estas (mera imaginación calenturienta):

"¡Quietos paraos! ¡A ver que van a hacer con esa información!" 
1) En este caso la entidad pública aprovecha que la legislación actual deja la posibilidad de ser muy restrictivo en el posicionamiento y lo restringe. (No siendo que empiecen a hacer preguntas incómodas)

"Gobierno abierto abierto sí, pero ¡¡A ver si se van a hacer daño!!
2) Esto lo dicen aquellas entidades que aunque se le llene la boca con temas de gobierno abierto cuando llegan al detalle de la licencia se paran no siendo que alguien se acabe haciendo daño. (o creando negocio otro efecto indeseable :-DD)

"¡Que pereza me da ¿no?"
3) Las cláusulas las han redactado abogados pensando en no tener mucho trabajo, y por tanto cuanto menos se use la información menos trabajo. Y en el caso de que algún insistente lo haga, que se les pueda denunciar rápido. (Lamentablemente, ahora que les han bajado el sueldo, se ha confirmado su enfoque pero ellos no lo hicieron sabiéndolo).

"¿Fuentes de datos? nosotros tenemos web no tenemos fuentes."
4) Esto podría ser la afirmación de algunas entidades ancladas en paradigmas antiguos de utilización de la red, p.e. los que consideran que los ordenadores son para jugar con los chavales pero no para comunicarse el sector público con los ciudadanos. (donde este un buen mitin....)

etc seguro que encontráis posicionamientos más graciosos y reales que estos.. pero lo que sucede en realidad que el 90% de las aplicaciones del magnífico concurso abredatos organizado por pro bono publico serían ilegales si pretendieran crear un negocio sobre ellas.

Un ejemplo
¿Cuanto tardaría (y a que coste) un ayuntamiento en crear una aplicación para móvil que nos dijera cuantos minutos va a tardar en llegar una autobús, cuantas bicicletas hay disponibles en un puesto municipal de alquiler o donde está el wifi municipal más cercano?

Probablemente meses.

¿Cuanto les ha costado a este grupo de programadores? Pues un intenso fin de semana como hemos visto y aquí puedes ver los resultados. Probablemente no sería exactamente lo mismo que una aplicación lanzada desde el ámbito público, pero ¿Se justifica que no existan estas aplicaciones basado sólo en el hecho de ciertas diferencias que para el usuarios final puedan ser menores?

¿No nos provoca ninguna reflexión este ejemplo?

El tuerto en el país de los ciegos
Siendo el ayuntamiento de Zaragoza uno de los más avanzados de España en este ámbito tiene en su aviso legal cosas como esta "La reproducción total o parcial, uso, explotación, distribución, comercialización o transformación no autorizada de los contenidos de esta sede electrónica requiere la previa autorización por parte del Excmo. Ayuntamiento de Zaragoza. Cualquier uso no autorizado previamente por el mismo será considerado un incumplimiento grave de los derechos de propiedad intelectual." 

Lo he pedido, a ver que pasa...
ACTUALIZADO. 2-6-10
Fantástica respuesta del ayuntamiento que ha sido en menos de un día. ole, ole eso es una administración y no el concepto que se tiene por ahí.

 Estimado Sr.:

En primer lugar, queremos agradecerle su colaboración por utilizar este servicio como instrumento para hacernos llegar sus planteamientos y sus inquietudes.

Y en segundo lugar, informarle que en la web municipal se está trabajando en la reutilización de los datos, existiendo ya el portal "conjunto de datos" desde dónde podrá acceder de forma libre a los datos y documentos que necesite para su reutilización:
http://www.zaragoza.es/ciudad/servicios/conjuntodatos.htm

Atentamente,
Web Municipal. Ayuntamiento de Zaragoza.

Una de cal y una de arena
La de cal 1) Muy buena intención de conjuntodatos  ya pdoría muchas entidades aprender de ellos.
La de arena 2) Las condiciones legales SON LAS MISMAS. por tanto les falta   que MODIFIQUEN  las condiciones legales.

NOTA: Gracias a Lucas de dondezaragoza por inspirar este post.

sábado, 22 de mayo de 2010

¿Que informaciones son útiles para reutilización?

Tan importante como determinar el volumen de negocio alrededor de la reutilización de informaciones del sector público es determinar su reparto por tipo de información. En  esta etapa que nos encontramos, todavía inicial, de la publicación masiva de datos públicos tener ejemplos que muestren el valor y que comiencen a proporcionar beneficios reafirmarían las iniciativas de publicación. 

Reparto del valor por tipos de información
En la imagen vemos el reparto de valor  económico por tipos de información, proveniente del informe PIRA del año 2000. Claro que por hacernos una idea precisa del contexto, tengamos en cuenta que cuando se elaboró ese informe google tenía 2 años de vida, faltaban 5 para que google maps estuviera disponible, en España sólo el 13,4 % de la población española tenía acceso a internet (y una minoría con banda ancha) y el euro no estaba en manos de los ciudadanos. En España se destacaba la reutilización de la información en la web sispain.org que parece congelada desde aquella época.

A la hora de valorar este sector hay que tener en cuenta no solo el valor de las informaciones de forma individual, sino en su potencial de utilización conjunta y aún más su mezcla con datos 'privados'. Entrecomillamos privados como todos aquellos datos que no recogen y publican las Administraciones públicas, no por que no sean tan públicos como aquellos.

Compleja clasificación
La complejidad de esta asignación por temas podemos valorarla con un ejemplo todavía no real pero que podría serlo.
¿En que tipo de información asignaríamos el negocio surgido de un posible mapa inmobiliario (geográfico) que incluya datos de donde están las instalaciones generadoras de residuos (empresarial), cual es la distribución de delitos del barrio (sociales) y cuales son las medidas de calidad del aire (otros)? Sería difícilmente clasificable tanto por la mezcla de datos privados, como por las distintas temáticas, y por tener fuentes de distintas administraciones, todo esto independientemente del valor que pudiera tener para los posible compradores.
Determinar que informaciones serán de mayor interés o de cuanto valor económico es un asunto peliagudo como acabamos de ver. Lo que si parece intuitivo es que las informaciones del ámbito ciudadano más demandadas serán las que tengan más que ver con las preocupaciones ciudadanas actuales, p.e. paro, política, inmigración.

¿Como abordarlo? pregunte a sus clientes
¿Como podrían las administraciones determinar que juegos de datos son más interesantes? Con la difusión del acceso a la red, parece que el método natural sería implementar canales que recojan que informaciones son las más demandadas por cada categoría de usuarios bien sean ciudadanos o usuarios profesionales. 
Por otra parte esta no es una idea ni nueva ni original como vemos en el sitio relacionado de data.gov, o en el de data.gov.uk

Determinando la demanda y cruzando con los recursos disponibles probablemente optimizaría la inversión pública en la publicación de datos del sector público, lo cual aceleraría su adopción y el impacto en la sociedad.

viernes, 21 de mayo de 2010

Criterios de una fuente de datos para RISP (II)

¿Qué criterios mínimos debería pedirse a un dataset (conjunto de datos) para ser considerado una fuente pública reutilizable de datos.? (abreviando una fuente profesional RISP). Como reflexión particular para debate planteo las siguientes
condiciones:

Lo primero tiene que tener todas las condiciones de una fuente de datos ciudadana RISP.

Pero además para una explotación comercial debería incluir:

6) Que sea industrializable, es decir que haya una forma automatizada de acceder a los datos
7) Que tenga unas condiciones legales que permitan la explotación
8) Pago automatizable (en el caso de que lo haya), que no sea necesaria la intervención manual para el pago

9) Interoperable, que el formato de entrega esté adherido a algún estándar que permita el cruce sencillo de los datos


Industrializable
La necesidad de que sea posible una recuperación de datos sin intervención manual es evidente para una explotación profesional. Salvo utilizaciones muy específicas del ámbito profesional, un uso profesional no puede depender de una recuperación manual de datos para generar un cierto volumen de información. Por tanto una fuente donde la recuperación de datos dependa de consultar un formulario online introduciendo los valores en unos campos, es en general no admisible. En estos casos URL permanentes y normalizadas, una API o un web service son ejemplos de vías de distribución que permiten la industralización.

Condiciones legales
Una utilización profesional no puede estar basada en la inseguridad jurídica, por tanto el acceso a los datos debe estar respaldado de unas condiciones legales que fijen explícitamente los posibles usos de los datos. Si es posible deberían fijar también que posibilidades existen de mezcla con datos de otras fuentes y de la comercialización del resultado. Por tanto unas condiciones legales que no delimiten estos aspectos, o que simplemente impidan su reutilización profesional limitan que una fuente sea considerada como profesional.



Unas condiciones legales como las de reutilización de los datos del banco mundial facilitan más la reutilización (en inglés) o estas genéricas de data.gov, el repositorio de datos federal de la administración de los Estados Unidos.

Pago automatizable
Aunque hay indicios de que los precios bajos son los que de forma global podrían fomentar el mayor beneficio para la sociedad, es indiscutible que el acceso a la información pública podría tener cierto coste, especialmente en el uso profesional. En este caso la existencia de 'tarifas planas' de acceso u otros mecanismos que no requieran de intervención manual para realizar las transacciones económicas es un requerimiento.

Interoperable
Que la información se proporcione en formato abierto no garantiza que sea utilizable en un ámbito profesional. Pensemos en cualquier fichero de microdatos como éste ejemplo de una encuesta del INE "1451601000071016511020000 210   1     11  0093  3       666    3                                                                  66 07    641119    30203    1      09  0017403" donde de no tener su significado su utilidad es nula. Se hace por tanto necesaria una estandarización de la semántica para no minimizar los costes de integración de distintas fuentes de datos . Complementariamente lenguajes como el SPARQL, de generalizarse, permitirán esas consultas entre distintas fuentes de datos.  Conjuntamente  permitirían una explotación muchísimo más profunda e interesante de la que actualmente disfrutamos, además de la generación de multitud de nuevos modelos de negocio, que seguramente hoy ni acabamos de imaginar.

En resumen, que la generación de modelos de negocio alrededor de la reutilización de la información del sector público es una enorme oportunidad para nuestras administraciones públicas y para nuestra sociedad en general. Para que ello sea posible es necesario desbrozar el terreno en el ámbito legal y abonarlo un poco en el ámbito técnico para que crezcan estos negocios, una posibilidad bien deseable en estas épocas de crisis.

jueves, 20 de mayo de 2010

Criterios de una fuente de datos para RISP (I)

¿Qué criterios mínimos debería pedirse a un dataset (conjunto de datos) para ser considerado una fuente pública reutilizable de datos.? (abreviando una fuente ciudadana RISP). Como reflexión particular para debate planteo las siguientes
condiciones:

Condiciones de fuentes de datos desde la perspectiva ciudadana

1) Que sea universalmente accesible (por ejemplo a través de una URL)
2) Que sea digital para que permita su portabilidad a los dispositivos que necesite el ciudadano para su utilización
3) Que este disponible de forma diligente, es decir que el tiempo desde la petición a la entrega sea acorde a la era digital en que nos encontramos
4) Que se entregue en un formato abierto
5) Que el coste, en caso de haberlo, sea mínimo y asumible por el ciudadano.
 
Universalmente disponible
Imaginemos la violación de alguna de estas condiciones. La violación de la primera condición supondría que no estuviera universalmente disponible y por tanto supondría una cierta discriminación para alguna parte de la población.  Una característica poco deseable desde una fuente pública. 

Formato digital
Imaginemos la violación de la segunda condición y que por ejemplo nos entregan una copia en papel de la información. A poco copiosa que sea la información su utilización será compleja, y la reutilización por tanto será muy limitada para el ciudadano.

Proporcionar la información en tiempo digital
La tercera condición es una de las más exigentes, ya que deberían estar disponibles vías de petición digital manteniendo todas las condiciones de legalidad. 
La solución técnica de estos requerimientos ya existe y además en un país con 17 millones de DNI digitales (y subiendo) tenemos un paso andado por delante de muchos de los países de nuestro entorno.
Por comparación google atiende 7.200 millones de accesos cada día es decir unas 83.000 al segundo.

En formato abierto
Entregar la información en formatos no abiertos  supone aumentar el coste de acceso [1] y muy probablemente un coste de publicación [2] en los casos que haya que hacer migraciones como consecuencia del formato propietario.
Además los formatos propietarios no favorecen la interoperabilidad entre distintas fuentes ya que, en el mejor de los casos, tendremos que pagar por un precio en efectivo o implícito para su utilización. 

A un coste asumible
Es evidente que la información gratuita, según el tipo de información,  podría generar una demanda infinita o al menos muy superior a la que puede ser abordada inicialmente desde el ámbito público. Y consecuentemente generar unos costes muy elevados, si bien la transparencia en la ejecución de la función pública tiene un coste que debe ser asumido por el ciudadano. El balance no es evidente como ya tratamos recientemente  y la solución habrá que encontrarla durante el proceso de liberación y por aproximaciones sucesivas.
Algún estudio apunta a que los modelos económicos de la liberación de datos en crudo deben ser aquellos que únicamente contemplan el coste de distribución.
Generalizar esta afirmación es aventurado, pero al menos es una referencia.

mañana mas condiciones para el uso profesional....

miércoles, 19 de mayo de 2010

Modelos de financiación para publicación de datos publicos

Ya hablamos en 2.000 millones de euros en RISP. ¿Es tan fácil? (II) de los costes de publicación por parte de las entidades que comparten información y de los costes de acceso por parte de las entidades o ciudadanos que los utilizan. Hablemos ahora de los ingresos que soportan esos costes, y entonces la pregunta que nos planteamos es determinar qué modelo de financiación de las entidades que publican información maximiza el uso de la información manteniendo a la vez una estructura financiera autosostenible.


Políticas de precios
En un extremo tenemos aquellas entidades que establecen sus precios  maximizando su beneficio basándose en que en muchos casos son monopolistas del tipo de información que generan. En el otro tenemos aquellas entidades que publican la información de forma gratuita. En puntos intermedios, tenemos políticas de precios que  asignan precios para cubrir los costes de generación y  distribución y aquellas que únicamente cargan los costes de distribución (un coste simbólico).

Como usuarios y contribuyentes ¿Dónde está el óptimo? es claro que una política de maximizar beneficios de la entidad, reduce la carga directa como contribuyente, pero también es cierto que limita (por el precio) la aparición de modelos de negocio y por tanto los impuestos, el empleo, etc  que paguen  estas empresas, amén de estar en contra del espíritu de la directiva vigente y que se ha traspuesto, entre otras en la ley 37/2007

Un precio igual al coste de distribución podría ser óptimo
Esta disyuntiva ya ha sido analizada para entidades específicas del ordenamiento británico [trading funds] (Models of Public Sector Information Provision via Trading Funds de 2006), donde sin llegar a conclusiones definitivas o generalistas si parece que establecen recomendaciones de que el modelo de costes que maximiza el bienestar de la sociedad es el de asignar únicamente los costes de distribución para los datasets en crudo. Teniendo en cuenta que los costes de distribución en el ámbito digital son muy bajos este coste se aproxima bastante a cero.

Competencia en igualdad
Dado que muchas de las entidades que publican información se financian de los servicios alrededor del tratamiento de la información en crudo, aparece la problemática de garantizar que dichas entidades proporcionen la información en crudo en iguales condiciones (tiempo, detalle, estándar utilización) a las que ella misma utiliza para generar sus productos de valor añadido.

Una problemática no menor
Fomentar la reutilización del sector público dejando de lado los modelos de financiación de las entidades que publican la información podría condicionar su desarrollo. Por ello en la evaluación  de los modelos de negocio ha de visualizarse no sólo  los retornos directos vía precios o tasas públicas sino también aquellos  indirectos vía impuestos de las organizaciones profesionales que los utilizan o la optimización causada sobre el tejido empresarial o ciudadano.

Y la pregunta para los comentarios
¿Ejemplos destacables de políticas de precios en las entidades públicas españolas?

martes, 18 de mayo de 2010

¿Ladrillos o vigas para el open data? La posible evolución de los estándares del open data

Construyendo el edificio del open data
¿Ladrillos o vigas para el open data? Cuando se construye un edificio los ladrillos son flexibles en su utilización, fáciles de utilizar y con ellos se pueden resolver muchos de los problemas de construcción más comunes. Una viga es una estructura más hecha a medida con una concienzuda planificación y que no da mucho juego a la hora de una utilización distinta a la que fue originalmente concebida. Por contra soporta toda la presión de muchas de las estructuras del edificio.
Este símil arquitectónico me sirve de excusa para abordar uno de los problemas no claramente resueltos en el open data, especialmente en la liberación de datos de sector público, que es el de los estándares de liberación de datos.


Parece que hay consenso en que se utilicen estándares abiertos, si es que hay consenso sobre lo que es un estándar abierto. Pero ¿Es eso suficiente?, para un uso intensivo sencillamente parece que no. ¿Por que no? Por que cuando queremos  cruzar datos de varias (idealmente de muchas) fuentes empieza a ser necesario estar de acuerdo tanto en el estándar como en el significado de los datos que se están proporcionando.
Que el estándar sea abierto nos garantiza la independencia de un fabricante, y con un poco esfuerzo la pervivencia de los datos pero no una sencilla interoperación entre fuentes heterogéneas.

Volvamos a la pregunta original.  ¿Ladrillos o vigas para el open data?
Ladrillos, es decir estándares abiertos y simples con poca información de significado, reducidos en sus especificaciones y fáciles de implementar o Vigas, estándares más complejos, que proporcionan un amplio significado de los datos que se ponen a disposición y que son sólidos en su utilización compleja.

Los ladrillos cuentan a su favor de una rápida y económica adopción inicial pero podrían limitar en un futuro uso intensivo las interacciones complejas. También  al no cubrir algunos aspectos degenerar en diferentes estándares de facto. 
Las vigas por contra cubren aspectos de su utilización  de forma más sólida pero  suponen máyor complejidad a la hora de las primeras implementaciones y por tanto una adopción más lenta. Lo que puede condicionar su implantación

Ejemplos
Como ejemplo de estándar pequeño y ágil ('ladrillo') tenemos los microformatos,  que ya cuentan con un pequeño grupo de herramientas para su incorporación.
Como ejemplo de estándar grande y complejo tenemos las taxonomías XBRL, en las que España es referente mundial y que sirven para el reporte de información financiera y económica como usos iniciales.

Futuro
El futuro es inescrutable y sólo los muy temerarios pueden asegurar sin género de dudas por donde va a ir el mercado ;-D. Incluso podría resultar que los estándares propietarios resultaran significativos en el RISP. En cuanto a si dominarán los ladrillos o las vigas será dataset a dataset donde se tome esa decisión.
Dada la heterogeneidad de entidades y la falta de una organización  coordinadora con poder ejecutivo sobre el resto de fuentes de información del sector público, parecería que será más fácil llegar a acuerdos sobre estándares simples, ladrillos, que sobre vigas
Si el ámbito público se lanzara a normalizar sobre estándares vigas, es más probable que los estándares propietarios tomen una parte significativa del mercado ya que esos si tienen una entidad coordinadora e impulsora que es su propietario y que si cuenta con la dimensión suficiente puede hasta casi imponerlo.

Lo veremos.... pronto.

domingo, 16 de mayo de 2010

Factores para el auge de la reutilización de la información del sector público

¿Por que está de moda hoy la reutilización de información del sector público (RISP)? ¿Por que no hace 2 años o dentro de 2 años más? 
Algunos factores ayudan, como por ejemplo
Factores sociales
1.-Hoy en día casi un 60% de la población española tiene acceso a a Internet, es decir si se publican datos desde las administraciones, hay una potencial audiencia de dimensión considerable. Es decir que ya no es publicar para 'na'.

Factores técnicos
2.-La capacidad de las redes ha aumentado. Es decir que ahora para los usuarios es viable la descarga, la visualización o la consulta de los juegos de datos que la administración ponga a su alcance.

Factores económicos
3.-La publicación de datos, de forma que se incentive su reutilización, aunque es un proceso oneroso, no supone un esfuerzo diferencial con respecto a los servicios de e-administración que ya se realiza de forma habitual en casi todas las administraciones.

4.-Así mismo la presión sobre la eficiencia en el uso de los caudales públicos hace que la publicación de datos referidos a su gestión se vean recompensadas con una favorable acogida por los ciudadanos.

Factores administrativos y legales
5.- Ya existe una legislación sólida que ampare y regule la publicación de datos, para su reutilización como es la ley 37/2007, el Real Decreto 1671/2009, y los  recientes Esquemas Nacionales tanto de Interoperabilidad  4/2010, y de Seguridad 3/2010 entre otras normativas.

6.- Además hoy ya esta muy extendido el requerimiento de enviar la información en digital a la administración (especialmente para las empresas), por tanto solicitar que la información de la gestión pública este disponible en la red, parece una contrapartida natural en este contexto.

Factores externos
7.- No puede ser despreciado el impulso dado desde el Reino Unido en Europa y especialmente desde Estados Unidos a la publicación de datos del sector público.

Por estos y seguro que por varios otros factores la liberación de información del sector público y promover su reutilización es un proceso (una moda como la inmortal Audrey Hepburn de la imagen) que en los próximos meses no puede ir sino a más y que podría reportar beneficios muy importantes a nuestra sociedad.

viernes, 14 de mayo de 2010

¿Importa normalizar el open data?

Decíamos en el post de hace un par de días "2.000 millones de euros en RISP. ¿Es tan fácil? (I)" que eran necesarios una URL permanente, API o servicio web para una utilización profesional de los datos públicos. 

También  veíamos ayer que la falta de estándares definidos podría llevarnos a importantes elevaciones de los costes de acceso para los usuarios profesionales . Y recordemos que el volumen mayor de esos prometidos 2.000 M€ que auguran informes como el antiguo MEPSIR (2006)eson creado basados en los datos públicos. 

En la ilustracion siguiente vemos un ejemplo de esa normalización de open data  aplicado a las URL

Es sin duda una normalización muy razonable y detallada y buena para una utilización profesional. ¿Pero será la misma que utilizarán en Extremadura para datos similares?¿Y en la administración central? ¿O la de data.gov o de data.gov.uk? 

En un futuro la disponibilidad de ese tipo de informaciones será muy importante a la hora de decidir el establecimiento de empresas. Disponer de todo tipo de datos puede acelerar inversiones y reducir las incertidumbres asociadas a  lanzamiento de todo tipo de emprendimiento.

Los datos están ya publicados en muchos casos, y la normalización aunque bien posible todavía no esta globalmente implementada en nuestro país. Podríamos pagar las consecuencias.... nunca mejor dicho.

jueves, 13 de mayo de 2010

Los estándares técnicos en el RISP (I)

Algunas preguntas sobre estándares
¿Que pasaría si la liberación de datos públicos se hiciera conforme a 3, por poner un ejemplo sólo 3, estándares distintos? Una situación que se repite con cierta frecuencia en otros ámbitos tecnológicos equivalentes.
¿Cuantos interfaces de conexión habrá que crear para conectar distintas fuentes de datos en distintos estándares? O bien ¿Qué coste supondría tener que publicar la información en 3 estándares distintos?
¿Que ocurriría si añadimos que para que el RISP genere grandes volúmenes de actividad es necesaria la interconexión de fuentes de datos?

Más preguntas sobre el mercado resultante
¿Qué harán los productores privados de datos?¿A qué estándar se adherirán?¿Y quien les habrá condicionado su decisión?
¿Podría suceder que uno de esos estándares fuera propiedad de un fabricante?y si eso ocurriera, a medida que crecieran el número y dimensión de fuentes públicas ¿Que tipo de mercado tendríamos en ese contexto?
¿Sería deseable o estaría limitado?
Mañana más

miércoles, 12 de mayo de 2010

2.000 millones de euros en RISP. ¿Es tan fácil? (II)

Modelos económicos
¿Cobrar o no cobrar por la información pública? Es evidente que la puesta a disposición de los ciudadanos de la información del sector público supone un coste añadido para el sector público, que llamaremos coste de publicación

Este coste de publicación es un coste no despreciable, puesto que aunque no incluye los costes de la generación de esta información, ya que es propia de la tarea administrativa, debe incluir costes de adecuación legal, sistemas de información, atención a los usuarios, mantenimiento de niveles de servicio, actualización de tecnología, etc.

Denominemos coste de acceso al coste que tiene que afrontar el usuario de la información pública y que incluye el precio o tasa pública  (si lo hubiere),  el de las herramientas, infraestructuras y otros recursos (como autorizaciones, tiempos, etc) necesarias para el acceso efectivo a la información publicada.  
Si este coste de acceso es reducido o nulo en la práctica, es posible que aparezca una demanda muy alta de la información, y como consecuencia el coste de publicación de la información se elevará.
Cual siete y media no es bueno si no llegas pero tampoco si te pasas.

Pero si la utilización es alta como consecuencia de un bajo coste de acceso y en una parte significativa de esa utilización  es profesional, este uso generará negocios que podrán proporcionar financiación vía impuestos. ¿Cuantos impuestos pagarían un sector que moviera 2.000 millones de euros? ¿Financiarían los costes de publicación?

Valor añadido para los datos públicos
También es verdad que si pensamos en modelos de negocio que únicamente mezclen informaciones provenientes del ámbito público no será sencillo que aparezcan negocios diferenciados ya que todos los actores contarían con la misma materia prima y solo el procesamiento específico de la información y servicios de valor añadido podrían suponer factores diferenciadores. Sin embargo aquí es donde debemos  considerar una nueva dimensión en la utilización de la información pública.
Mezcla con datos privados
Como permiten muchas licencias privadas de contenidos 1, 2, una interesante posibilidad es la mezcla de datos con otras fuentes de datos privadas.
Por poner un ejemplo podríamos imaginar un servicio donde sobre un mapa del catastro (un dato público de ámbito nacional) información de las industrias emisoras de residuos (un dato público de ámbito autonómico) y los niveles de polen de  una base de datos privada y que envíe avisos al teléfono móvil de una persona que padezca problemas respiratorios.

Muchos otros modelos de servicio más sensatos que el ejemplo anterior podrían ser desarrollados por emprendedores que tomen como una parte  fundamental de su negocio la reutilización de los datos del sector público.
Parece interesante que si se quiere alcanzar rápidamente los niveles de negocio alrededor de la reutilización de datos públicos las licencias administrativas, permitieran modelos como éste que se plantea en el ejemplo. Todo ello sin menoscabar implicaciones sobre la responsabilidad, autoría, remuneración, etc que establece la legislación vigente.