miércoles, 31 de octubre de 2012

Búsqueda de bibliografía de calidad sobre open data y open government (I)

BUSQUEDA DEL ARTÍCULO EN LA TEMÁTICA ELEGIDA


Este post forma parte de un grupo, todavía no se cuantos, en la búsqueda de bibliografía de calidad en materias de acuerdos de cooperación y open data y open government.
1.- Hay que tener acceso a bases de datos científicas
Arrancamos utilizando bases de datos de artículos cientificas. (P.e. ISI web of knowledge). Para ello tendrás que tener un acceso de una Universidad pública, en este caso gracias a la colaboración con FECYT.Si no perteneces a la comunidad universitaria lo tendrás más difil (o más caro)

2.- Las primeras búsqueda infructuosas
Realizamos una búsqueda sobre los términos simultáneos "open data" y "cooperation" y obtenemos unos magros 10 resultados. 
De ellos la verdad es que aunque hay alguno prometedor por el título ninguno tiene más de 6 citas, lo que indica un impacto bastante limitado.
 Tras ellos realizo otras 4 búsquedas infructuosas con terminos afines,




esta es una de ejemplo...


3.- Parece que encuentro algo
Tras otra serie de búsquedas, utilizo los términos "cooperative agreements" y "open data" encontramos un artículo que parece prometedor. 
Título: "R&D Cooperation between Firms and Universities Some empirical evidence from Belgian manufacturing" que parece alineado con la temática de la búsqueda.
con  68 citas para un artículo del año 2005 (relativamente reciente) parece una artículo relevante.


Consigo la referencia completa. "Source: INTERNATIONAL JOURNAL OF INDUSTRIAL ORGANIZATION  Volume: 23   Issue: 5-6   Pages: 355-379   DOI: 10.1016/j.ijindorg.2005.01.008   Published: JUN 2005"
Adjunto aquí el mapa de referencias, donde se puede ver las referencias hacia atrás y hacia adelante.

4.- A por el texto. 
Para conseguirlo, con perdón, la forma más rápida en este caso es ir a google scholar. Directamente lanzamos la búsqueda con todo el título y aparece a la primera con acceso full text (ojo aunque está en google, el enlace que añado es de la web interna de isi web of knowledge ya que el que localiza google es un previo, ojo hay que estar registrado).
Si tiene conexión (usuario y pass) con la base de datos de Science direct te lo puedes descargar como pdf a texto completo.

INDICIOS DE CALIDAD
5.- ¿Relevante la revista?

Analicemos si la revista tiene indicios de calidad. Gracias a haber accedido a la web de la revista obtenemos de primera mano sus índices de calidad.
A 5 años 1.264 y actual 0.841. (pero eso es hoy, claro,no cuando se publicó el artículo)

6.- ¿Encontramos su JCR?
Intento encontrar la revista buscando por el texto completo. Busco un trozo bastante representativo ("organization") y dice que no existe. No parece muy fiable.
Ahora buscamos por el ISSN. ISSN: 0167-7187, a ver si aparece. Dice que si. Es que esta almacenado el titulo abreviado aunque en la pantalla de búsqueda no lo avise. Esto es del año 2011, a ver si, en el 2005, año de publicación del artículo también también es igual de relevante.


Debajo puede verse un montón de información (requiere esta autenticado en el sistema) buena parte de ella interesante.

Seguimos en el siguiente post....

lunes, 13 de agosto de 2012

versión 0.1 del Decalogo para detectar Vividores de lo 'open'

Versión 0.1 Decálogo para detectar a los vividores del Open

1. Utlizan mucho la palabra Open

2. En frases largas, tecnológicas y colectivas 
3. Mezclando las licencias de software y de contenidos abiertos
4. Pertenecen a organizaciones no transparentes
5. De las que no explican como se sostienen
6. Ya que su financiación anterior siempre viene de la administración publica
7. Por eso buscan más adeptos que colaboradores 
8. Y en sus presentaciones no hay prácticamente atribuciones de otros
9. Y justo les pillas antes de liberar el código

Este es una primera versión 0.1, en modo bastante sarcástico. Y si te has dado cuenta, sí, son solo 9 puntos, pero es que no conozco una palabra para una lista de nueve elementos, y además estoy abierto a completarla con más puntos. 

La ampliación, cachonda espero, de los conceptos.

1. Utiliza mucho la palabra open
Open, Procomún, fuentes abiertas, libre, etc junto con palabras sinónimas y de carácter tecnológico que permitan ofuscarlos para que parezca más dificil e interesante. Son mas 'open' que Stallman o Lessig.

2. En frases largas, tecnológicas y colectivas
Fundamental para dar idea de que es algo muy interesante, grupal, multicultural, creativo y complicado de enterarse. De hecho te hacen un favor explicándote el resumen antes de que seas un adepto (pago en € o en trabajo). Pero es lo más de lo más. Si además incluye emprendimiento, huye directamente :-D

3. Mezclando las licencias de software y de contenidos abiertos
Todo es lo mismo por que lo que quieren es sacar(te) tajada. Que el software se ejecute y preste servicios son detalles irrelevantes. Les vale una CC para software, hasta para el ejecutable y todo. Si no lo pillas, no estás leyendo el blog adecuado. :-D

4. Pertenecen a organizaciones no transparentes
En realidad de su organización (que tendría un nombre complicado o será una agrupación de muchas iniciativas) y de sus actividades se sabe más por el BOE que por lo que te cuenten. No hay meritocracia ni decisiones colectivas. O pertenecen/colaboran con partidos políticos, pero omiten ese detalle.

5. De las que no explican como se sostienen
Viven del aire y lo que tiene que ser open es lo de los otros (y además gratis)  

6. Ya que su financiación anterior siempre viene de la administración publica 
Curiosamente solo han podido engañar a administraciones para que les faciliten hacerse la foto con lo 'open' que son para el político de turno y hacer 'nada' que en realidad sea útil.

7. Por eso buscan más adeptos que colaboradores
Lideran proyectos, nunca les pillas en la fase de diseño, y buscan 'adeptos' y son poco amigos de las aportaciones no dirigidas por ellos.


8. Y en sus presentaciones no hay prácticamente atribuciones de otros
Nacieron aprendidos y no necesitan utilizar materiales de otros (ni atribuir la autoría) aunque sean copyleft.

9. Y justo les pillas antes de liberar el código
A puntito, ahorita mismo, la próxima semana ya lo tienes, es q lo estamos 'limpiando' para publicarlo, etc. Nunca hay enlace

Si algún interlocutor cumple más de 5 de estas, escapa. De 3 a 5 lo miras con recelo (p.e. a mí) y le examinas. Por debajo, hasta podría ser una persona normal.



martes, 12 de junio de 2012

Opendata: Cuestion de enchufes y cargadores


Enchufes y cargadores
¿Cuantos cargadores de dispositivos tiene en su casa?¿Cuantos ha tenido en su vida? Desde la maquina de afeitar, a los distintos móviles, tablets, portátiles, etc.
 La situación del opendata es muy próxima a etapas previas a la normalización. Necesitamos un montón de dispositivos para un tema muy simple: Cargar una batería. 
A diferencia, ninguno nos planteamos que el enchufe no valga en cualquiera de los que tenemos en la oficina, hogar, hotel, o donde sea. Es donde tiene que llegar el opendata.

Situación actual
El análisis más simple puede venir de analizar las fuetnes que anuncian que hay un nuevo dataset en cada una de las fuentes públicas. Se han analizado las 6 que tienen un rss más sencillo de capturar.  ¿Será enchufe o será cargador?

Primera incidencia Atom o RSS.
Por ejemplo de las disponibles (andalucía, galicia, cataluña, zaragoza, navarra y datos abiertos de la AGE ya empiezan las diferencias, una de ellas no usa rss 2.0 sino atom.

Segunda incidencia: Las fechas
¿Qué formato de estos 4 nos gusta más?  : 1) Andalucía "2012-05-16T16:33:08.000Z", 2) Aporta "Thu, 07 Jun 2012 11:16:03 +0000" 3) Cataluña "dv., 1 juny 2012 00:00:00 CEST" y 4)  Galicia "Tue, 29 May 2012 12:08:00 +0200", Navarra "Mon, 21 May 2012 10:59:03 +0200.

Tercera incidencia. Los juegos de caracteres
De las seis fuentes hay 4 que son utf-8, una ISO-8859-1 y otra que no lo especifica.

Otras incidencias
Hay fuentes que introducen numerosos espacios entre items, otras que introducen campos particulares, y variación de idiomas.

Con sólo los 3 primeros casos de incidencias implica que para que todo funcione con todos se necesitan considerar 2 * 4 * 2 = 16 posibilidades de conexión. 16 cargadores  por decirlo así. Por tanto  se podría reducir el coste de la actualización de forma drástica con solo llegar a un acuerdo.

Y esto sólo con las primeras seis fuentes y para un tema muy normalizado como es el estándar RSS de su actualización.

Podemos imaginar lo que puede suceder con los centenares de datasets que ya tienen estas y otras fuentes  y la complejidad que la falta de normalización está imponiendo a los reutilizadores.

Acciones a tomar

Si en la actualidad cada electrodoméstico o dispositivo electrónico tuviera su propio enchufe (como tienen ahora en los cargadores) nuestro hogar sería (o es con los cargadores) un amasijo de adaptadores, de corriente. 

Que exista la posibilidad de conectar distintas fuentes de datos es un requisito para la creación de economías de escala y de utilidad y el desarrollo sencillo de negocios y aplicaciones.
Por tanto es una necesidad nacional para fomentar el sector una mesa donde reutilizadores y publicadores puedan normalizar los numerosos datasets ya disponibles, de lo contrario unos tendrán mayores costes, y otros no conseguirán de forma efectiva que se use la información que con tanto esfuerzo, especialmente en estos tiempos, está publicando.

Debemos centrar los esfuerzos en la publicación de muchos datasets, y que los formatos sea un tema 'menor'. Por ello el requerimiento de que sean abiertos y normalizados ayudarán a desarrollar la economía alrededor del opendata.

lunes, 21 de mayo de 2012

Transparencia, héroes y topos

Por que apoyar la transparencia
La conquista de la transparencia y de la apertura de datos (publicos y privados) es una cualidad de un estado moderno, dinámico y por tanto con futuro, donde sus ciudadanos tienen capacidad de aportar ideas, exigen una buena gestión y son capaces de defender sus propias posiciones.
El principal impacto de la transprencia viene dado por la eliminación de la competencia desleal de la economía sumergida y del fraude fiscal, si bien es cierto que colateralmente también ayuda a la dinamización de los ámbitos públicos, el control de sus dispendios discrecionales, reducir la corrupción, y eliminar otros sinsentidos de los que en España hemos vivido bien de cerca.

Estamos solos pero somos mayoría
"La ley suprema es el bien del pueblo."Marco Tulio Cicerón

Por estos y otros motivos la mayoría de la población es favorable a una mayor transparencia. Entre los ciudadanos, merecen destacar dos tipologías especialmente importantes de cara a la promoción de la transparencias. Seguro que entre los cuales se hallarán muchos de los lectores de este post: los héroes y topos
Héroes son aquellas personas que son visibles en las organizaciones del ámbito público y privado apoyando la transparencia de forma real y que por tanto se encontrarán actualmente 'marginados' por este apoyo. Entre estos se encuentra muchos políticos y cargos públicos.
Los 'topos' son aquellas personas que no pueden asumir el coste de esta visibilidad pero que pasan información. Los héroes necesitan apoyo y difusión y los topos necesitan un wikileaks de la transparencia. Estos topos también se encuentran en los partidos políticos, en los propios gobiernos, y en otras grandes organizaciones.

Los partidos políticos mejor no hablar
"El secreto de la vida es la honestidad y el juego limpio. Si puedes simular eso, lo has conseguido." Groucho Marx
Los partidos políticos no consiguen más poder por implantar la transparencia, por tanto, y como bien refleja su curriculum, no lo apoyarán de forma decidida.
Al igual que ya conocimos con el software libre, los partidos apoyarán las políticas de transparencia mientras vean réditos electorales.
Es decir lo apoyarán en la oposición para alcanzar el poder y en el gobierno para moderarlo y que no tenga realmente impacto. Como en todo hay excepciones, que no hacen sino confirmar la regla.
Es interesante hacer notar la falacia que se esconde tras la estrategia política de 'Adaptado a las necesidades locales', para justificar hacer algo completamente incompatible con otras iniciativas nacionales e internacionales y por tanto de futuro incierto y resultados aún más.


Las administraciones públicas nada de nada
"Los empleos públicos pertenecen al Estado; no son patrimonio de particulares. Ninguno que no tenga probidad, aptitudes y merecimientos es digno de ellos."Simón Bolívar
Las propias administraciones públicas y sus trabajadores ya tienen bastante con ellas de tener a unos mandatarios políticos que en muchos casos no superarían las oposiciones a puestos cuatro niveles inferiores, por tanto es complicado que desde éste ámbito se consiga algo más que tibios apoyos. 
Es claro que cualquier 'héroe' del ámbito publico que promueva la transparencia vería enormes dificultades para conseguir resultados cuando otros 'compañeros' les pongan palos en las ruedas, se enfrenten a una legislación que no les ampara y no cuenten con el apoyo decidido de sus jefes políticos.

Las empresas también deberían estar en la transparencia
"El mundo no está en peligro por las malas personas sino por aquellas que permiten la maldad". Albert Einstein

La necesidad de transparencia no sólo es una necesidad pública, también es del ámbito privado, como estamos pagando bien a las claras actualmente. Con una mayor transparencia del sector privado la prima de riesgo país caería unos cuantos puntos, tendríamos claro cuanto hay que pagar por el déficit de tarifa eléctrica, o cual es la deuda privada real de nuestro sistema financiero.
Incluso tendríamos claro si una sanidad privada o pública es más cara y el mismo desafío podría aplicarse para un sistema ferroviario ahora que pensamos privatizarlo.
El periodismo tiene un papel
Es curioso que el sector que más tiene que ganar con la transparencia como puede ser el periodismo (que además lo necesita de forma desesperada) no es el que más bandera está haciendo de ello.
Y eso que especializaciones como el periodismo de datos está surgiendo con fuerza y redefiniendo el concepto de la profesión y quizás, tan solo quizás, sea una puerta a la esperanza en un sector que todavía no ha sabido redefinirse en medio de la marea digital.

Que nos jugamos
Con la ley de transparencia nos jugamos una oportunidad de modernizar el estado y de conseguir una economía más dinámica. La actual propuesta de ley es una mala propuesta en cuanto a conseguir algún objetivo.

En su actual redacción
  1. El silencio continuará siendo la respuesta por defecto del ámbito público
  2. Contiene casi más excepciones que ámbitos donde aplicarla
  3. No fomenta la publicación proactiva de información y su reutilización
  4. No propone procedimiento alguno de medida de la transparencia o mecanismos para mejorarla.
  5. No fomentará la transparencia en el ámbito privado
  6. No parece que su organismo regulador sea suficientemente muy independiente
y por tanto su puesta en marcha 'taponará' la oportunidad de hacer una ley moderna por un buen tiempo.

Nos jugamos demasiado dinero y demasiado tiempo con una ley así, pero hay tiempo y oportunidad pese a los últimos augurios. Necesitaremos de muchos héroes y muchos topos para conseguirlo.

viernes, 27 de abril de 2012

Experimento: Las fuentes opendata españolas agregadas en rss y twitter

En el texto de abajo teneis el resultado de un script que agrega todas las fuentes opendata de España que tienen un rss, es decir que anuncia cuando hay un dataset actualizado.
Solo agrega las fuentes que tienen un rss disponible, a saber, opendata Euskadi, Galicia, Zaragoza, España(AGE), Cataluña y Andalucía

Por favor si hubiera otra fuente con rss de sus nuevos dataset deja un comentario en el blog.
Esta agregado usando  yahoo pipes, y aquí tenéis el enlace al pipe que he utilizado.

En paralelo se puede seguir desde esta cuenta de twitter @_opendata. (irán precedidos por el texto 'NUEVO DATASET:'

El RSS agregado aquí lo tienes: RSS_opendata_españa para que tu también experimentes.
A divertirse!!

domingo, 22 de abril de 2012

Impacto económico de la transparencia. Ordenes de magnitud.


Una estimación fiable del retorno de la inversión para una política de apertura y reutilización de datos requiere de un estudio que excede las posibilidades de un post. Sin embargo intentemos estimar los órdenes de magnitud posibles en base a los distintos efectos primarios de este tipo de políticas y de ellos extraer un par de conclusiones.
De adonde estan los beneficios e impactos de las políticas de transparencia por la publicación de datos públicos.

Los siguientes datos son por tanto no fiables en cuanto a su valor pero posiblemente (y salvo algún error de concepto que espero ver en los comentarios) si podrían serlo en cuanto a sus órdenes de magnitud.

Efecto 1: Impuestos del sector infomediario
Si el sector infomediario llegara a su potencial en España (Si españa supone un 8% de la UE según informe MEPSIR se estimaría en 2.000 M€, frente a los actuales 550-600 M€ los ingresos por impuestos supondrían (si pagaran como grandes empresas 17%) tan sólo unos 40 M€.

Efecto 2: Coste de los servicios sociales negocio no creado
Estos 1.400 Millones de negocio que no se están generando por una falta de publicación de informaciones y por la necesaria maduración del sector infomediario suponen a la media de empleo por facturación del sector TIC unos 8.900 puestos de trabajo.El coste del desempleo (suponiendo que sólo  fueran beneficiarios el 50% de estos empleados) en un año de esas personas están suponiendo ahora unos 34,5 M€ (Aunque este pago sólo sería durante un año.

Efecto 3: El coste de las peticiones de información
El coste de las peticiones de información son de 11.5 M€ en Canadá que es un país comparable a España en cuanto a PIB. Claro que en España todavía no existe ese derecho, aunque es posible que lo tengamos pronto. Por tanto el importe que nos tocará sería comparable en ese sentido.

Efecto 4: Mejora de la productividad del sector público
Una mejora de la productividad del sector público del 2% por el acceso más fluido a información supondrían  unos 2.034 M€ sólo en la AGE. (No quiere decir que la transparencia tenga un efecto de esa magnitud)

Efecto 5: La corrupción  
Según Johann Graff Lambsdorff un incremento en la corrupción de un punto en una escala de 10 (altamente honesto) a 0 (altamente corrupto) baja la productividad en un 4 por ciento del Producto Interno Bruto –PIB- Un descenso de 0,5 puntos supondría para España según esos mismos cálculos un incremento de 21.251 nuevos millones de € de negocios. Y el pago de impuestos correspondientes podría suponer al 10% que pagan las grandes empresas, serían 2.125 M€.
Efecto 6: Reducción de protestas sociales
Si se redujeran  las protestas sociales como consecuencia de un mayor conocimiento, un 4% de ahorro en el presupuesto del ministerio del interior supondría 88 M€. (No quiere decir que la transparencia tenga un efecto de esa magnitud)
Efecto 7. Reducción del fraude fiscal tributario
Por recaudación de lo generado y no declarado. Si la publicación de datos públicos incluyera los datos antiṕaticos y se ayudara a una reducción del fraude fiscal (cifrado en 90.000 M€ por los técnicos del ministerio de hacienda) del 4%. El volumen nuevos ingresos supondría 3.600 M€. (No quiere decir que la transparencia tenga un efecto de esa magnitud)

Efecto 8. Reducción de la economía sumergida
Por otra parte si la apertura de datos públicos y la transparencia incluyera los datos antipáticos, se redujera la bolsa de economía sumergida que actualmente se cifra en un 23% de la economía (245.000 M€), suponiendo una reducción del 10% 24.500M€ de nueva actividad detectada. Y, suponiendo un beneficio del 10%, serían 2.450 M€. (No quiere decir que la transparencia tenga un efecto de esa magnitud, pero una apertura gratuita de los datos del registro mercantil seguro que depararía muchas sorpresas)

Efecto 9. Efectos de red
El retorno de la inversión en el mundo físico es un cálculo de los rendimientos decrecientes. En el mundo digital es uno de los rendimientos crecientes. Cada nuevo dataset de datos abiertos añade valor a los anteriores datos abiertos. Y los costos para recoger y mantener datos abiertos decrecen por las economías de escala en las infraestructuras.
Si ese efecto pudiera cifrarse en un 2%, adicional (40 M€ +34,5 M€ +  11,5 +2034 M€ + 2.125M€ + 88M€ + 3.600 M€ + 2.450 M€) supone otros 207,6 M€.

Tengo que insistir en que este análisis no tiene un rigor en cuanto al valor de las cifras pero si puede ser indicativo de dos cosas:

1) El principal efecto NO es la creación de valor a través de la creación de nuevas empresas o nuevos servicios, sino que es la modernización de la eficiencia de los servicios públicos.

2) La reducción de la economía informal con la publicación de datos es el mayor potencial económico de impacto de la apertura de datos.