viernes, 25 de noviembre de 2011

charla sobre opendata en sevilla y 100 twitts sobre opendata


Aquí podéis ver la charla que bajo el título 
Aspectos Legales en la Apertura de Datos from Opendatasev on Vimeo.
Estos son los casi 100 twitts en los que se basa la charla
INICIO
-Arranque de la sesión experimental en #opendatasev sobre aspectos legales del #opendata
-soy @aabella de la empresa @rooteranalysis
-colaboracion con @probp y con el grupo de #periodismodatos de @medialab-
El #opendata en españa para niños http://is.gd/Kox7Fp #opendata #opendatasev
hoy aprenderemos mucho de @dcabo @jdelacueva y del resto ponentes
Agradecer a @cabralens @vicky_anderica de @accessinfo y a @albertocairo sus ideas
interacción en la sesión de #opendatasev con el hashtag #opendata #opendatasev

CONTEXTO GENERAL del #opendata #opendatasev
#opendata #opendatasev ¿Por que es importante?
Razón 1 #opendata: ¿Se puede tener un #ogov gobierno abierto hasta no tener sus datos abiertos? #opendata #opendatasev
Componentes de gobierno abierto #ogov. Publicación opinión y participación #opendata #opendatasev
#ogov Publicacion: No solo publicar sino alimentar el ecosistema. No nos pase como aqui http://forjamari.linex.org/ #opendata #opendatasev
Razón 2 #opendata: corrupción:problema teoría de juegos. si defraudar paga mucho más que cumplir http://is.gd/TWwBkn #opendata #opendatasev
En Noruega el pago de impuestos es público. http://is.gd/BnhMzK ¿Reduciríamos #corrupción? #opendata #opendatasev
Noruega 8,6/10 no #corrupcion, españa 6,1/10 http://is.gd/nzsrCV #opendata #opendatasev
Razón 3 #opendata: para ayudar ¿como podemos ayudar a frenar el gasto en componentes no esenciales si no es publico? #opendata #opendatasev
A la hora de ver el gasto publico no es lo mismo esto http://is.gd/QyTJH2 q esto http://isa.gd/wur8YO (era i/alegal) #opendata #opendatasev
La minera goldcorp se salvo gracias a abrir sus datos http://is.gd/VCQhMy y hasta le dieron un premio #innovación #opendata #opendatasev
Razón 4 #opendata: económica es decir empleo #opendata #opendatasev
¿Que es mas importante el #opendata publico o el privado? #opendata #opendatasev
#opendata simpatico son los datos de transporte, tiempo geolocalizados, etc #opendata #opendatasev
Los datos 'antipaticos' todavía o no se liberan o se mal liberan. Económicos, gasto, inversión, etc #opendata #opendatasev
España tiene un nuevo portal de datos abiertos #opendata #ogov http://is.gd/3SC7as con 11 aplicaciones #opendata #opendatasev
Repositorio de aplicaciones para el #ogov de la AGE (11 aplicaciones) http://is.gd/mM9Res #opendata #opendatasev
De donde viene la info para el desarrollo de apps. Publica y mayoritariamente procesos AAPP (salvo transporte y meteo) #opendata #opendatasev

SOSTENIBILIDAD DEL #OPENDATA en #opendata #opendatasev
Crear un ecosistema cuesta más que tener un portal http://www.participaenandalucia.net/ #opendata #opendatasev
El mercado de las app para #ogov está hoy en las apps simples que usen datos 'simpáticos' (no comprometedeores) #opendata #opendatasev
Puede sobrevivir hoy un especialista en exclusiva en desarrollo de aplicaciones para #ogov. Dificil #opendata #opendatasev
Una empresa q explote como servicio una app basada en #opendata ya puede sobrevivir #opendata #opendatasev

CONTEXTO LEGAL #opendata
Directiva europea 2003 http://is.gd/YvnRuK #opendata #opendatasev
Ley 37/2007 http://is.gd/ykaDyx introdujo el #RISP en España #opendata #opendatasev
España acaba de tener un nuevo decreto de reutilización información publica #opendata http://is.gd/l6B5aL #opendata #opendatasev
#RISP 1495/2011 los recursos de información pública reutilizable estarán un punto común http://is.gd/NWtAZs #opendata #opendatasev
El PP dice que impulsaran una ley de #transparencia http://is.gd/ekt5Ye #opendata #opendatasev
En 18 meses todas las entidades de AGE deben publicar 4 conjuntos documentos 'de alto impacto' http://is.gd/qx8peN #opendata #opendatasev
Nos quedamos solos sin una ley de acceso a la información pública http://is.gd/oENGUV #opendata #opendatasev

CONTEXTO ECONÓMICO
¿Hay mercado del opendata? en España ya son 550-600 M€ http://is.gd/X2DWY0 #opendata #opendatasev
MEPSIR (2006) ya asignaba un potencial de 2000M€ a España http://is.gd/ucnzuG #opendata #opendatasev
El ultimo informe no UE eleva a 2560 M€ y estima q crece a un 7% anual #opendata #opendatasev
La #transparencia del #opendata ayuda a derretir el iceberg de la economía 'oscura' #opendata #opendatasev
#fraudefiscal 61000 M€ en España http://is.gd/oMv8Qj. Comparable deuda de todas las CCAA http://is.gd/K01sqL, #opendata #opendatasev
Economía sumergida 24% PIB http://is.gd/G8qJiK 245000 M€ #opendata #opendatasev
#ogov: ¿Tiene sentido gastar más de 50 M€ para elegir?. 50M€ son 2 a 4 km de AVE http://is.gd/KjLASy #opendata #opendatasev
#ogov: ¿Tiene sentido gastar más de 50 M€ para elegir?. El aeropuerto castellón http://is.gd/0StKZs 150 M€ #opendata #opendatasev
3 errores a evitar por el #opendata de España #opendata #opendatasev
3 errores que cometió el #softlibre en España hace 10 años: política, dispersión y frikismo. #opendata #opendatasev
Aprovechará el #softlibre españa la oportunidad del #ogov y del #opendata o volveremos errores pasados. http://is.gd/dwpJyD #opendata #opendatasev
Error 1 político: Huir de la asignación política. #softlibre = utility los datos deben ser como agua, electricidad #opendata #opendatasev
Error 1: El #softlibre por activa o por pasiva se dejó politizar. http://youtu.be/wzu7KvGBlZ0. #opendata #opendatasev
Error 2 organización: #opendata debe ser una piña empresas y comunidad. #opendata #opendatasev
Error 2: En el #softlibre hubo dispersión y desunión. (más de 130 grupos de usuarios 15 distros) poca colaboración. #opendata #opendatasev
Error 3 marketing: Cambiar el lenguaje. #opendata= ahorro y sentido común en los datos. Por medios técnicos. #opendata #opendatasev
Error 3: El #softlibre consiguió por activa o por pasiva dar la imagen de ser tema de frikis técnicos. http://is.gd/Smjjmx #opendata #opendatasev

MELODA
Las 5 * de linkeddata http://is.gd/FdKFDg ¿sirven para evaluar fuentes de cara a su reutilización práctica? #opendata #opendatasev
Metodología para evaluación cuantitativa de la apertura de fuentes de datos #opendata. Http://meloda.org #opendata #opendatasev
Definimos lo que es #opendata. Metodología MELODA M4J. http://is.gd/DqJ7cU #opendata #opendatasev
Condicion 1 para #opendata #M4J. Tienen que ser datos #opendata #opendatasev
Condicion 2 para #opendata #M4J. Tienen que ser liberado en un estándar abierto #opendata #opendatasev
En españa si que está definido lo q es un estandar abierto http://is.gd/WwJEri apdo k ley 37/2007 #opendata #opendatasev
Condicion 3 para #opendata #M4J. Tienen que ser licenciable para su reutilización hasta comercial #opendata #opendatasev
Condicion 4 para #opendata #M4J. Tienen que tener acceso automatizable (p.e. ser descargable, url unica) #opendata #opendatasev

INFORME APORTA
El proyecto @aporta tiene 703 fuentes ¿de datos? #opendata. http://is.gd/gDCjMo #opendata #opendatasev
De las fuentes de @aporta el 60% no eran accesibles de forma automatizada #opendata #opendatasev
De las fuentes de @aporta el 61% no eran fuentes de datos de acuerdo a #opendata #M4J #opendata #opendatasev
De las fuentes de @aporta el 85% no se podía reutilizar legalmente #opendata #opendatasev
De las fuentes de @aporta el 88% estan en formatos abiertos (de verdad) #opendata #opendatasev
Análisis completo de las fuentes opendata de @aporta en http://amedioentender.blogspot.com/2011/11/el-proyecto-aporta-se-queda-al-3.html #opendata #opendatasev
App liberadas sin un ecosistema no son nada http://is.gd/k8hLbF #opendata #opendatasev
Resultados para las fuentes @aporta bajo #opendata M4J. Sólo el 3% eran opendata M4J #opendata #opendatasev
Una fuente no #opendata #M4J es la lista de precios de venta de sus publicaciones http://is.gd/cy3VUe #opendata #opendatasev
Una fuente no #opendata #M4J son por ejemplo unos estatutos. http://is.gd/4Le5Sh #opendata #opendatasev
Una fuente no #opendata #M4J son unos videos de la policia http://is.gd/t3RepO #opendata #opendatasev

LICENCIAS OPENDATA
Características generales de las licencias #opendata #opendatasev
Las licencias de #opendata suelen pedir atribución #opendata #opendatasev
Las licencias de #opendata suelen pedir fecha de actualización #opendata #opendatasev
Las licencias de #opendata suelen que no se establezca relación con el publicador por usar sus datos #opendata #opendatasev
Las licencias de #opendata suelen que no se modifiquen (desnaturalice) la información
Excepciones de las licencias #opendata #opendatasev
Las licencias de #opendata no suelen cubrir la publicación de datos personales #opendata #opendatasev
Las licencias de #opendata no suelen cubrir la información aún no publicada oficialmente #opendata #opendatasev
Las licencias de #opendata no suelen cubrir logos, diseños, etc #opendata #opendatasev
Las licencias de #opendata no suelen datos militares #opendata #opendatasev
Las licencias de #opendata no suelen cubrir datos de terceros añadidos #opendata #opendatasev
Las licencias de #opendata no suelen cubrir otros elementos sujetos a propiedad intelectual mapas, marcas, etc #opendata #opendatasev
Open database license es una licencia copyleft http://is.gd/BkYw6d que se refiere a toda la ddbb #opendata #opendatasev
Open database license impulsada con la @okfn #opendata #opendatasev
Creative commons son de las licencias más conocidas y extendidas http://is.gd/noKZCf #opendata #opendatasev
#coloriuris es de las mas completas y adaptadas al ordenamiento español http://is.gd/YPg7wW #opendata #opendatasev
Open government licence (UK) http://is.gd/xThGYQ #opendata #opendatasev

NECESIDADES
Necesidad 1: Estandarizar el #opendata y #ogov para q pueda crecer el sector de app de #softlibre #opendata #opendatasev
Necesidad 2: Ley acceso información que garantice mucho #opendata y #ogov para q pueda crecer el sector de app de #softlibre #opendata #opendatasev
Necesidad 3: Repositorio único (o federado) y privado de aplicaciones de #softlibre para #opendata y #ogov. #opendata #opendatasev
informaciones interesantes para el #opendata #opendatasev
Los datos financieros y tributarios de las personas físicas y jurídicas #opendata #opendatasev
Los actos registrales (de la propiedad, de actividad industrial, concesión de licencias, etc) #opendata #opendatasev
Los informes que hacen los lobies para influir políticamente además de quien los hace y recibe #opendata #opendatasev
Las ofertas, adjudicaciones y contrataciones estipuladas en la ley 30/2007 de contratación pública #opendata #opendatasev

CONSECUENCIAS OPENDATA
¿Existen frameworks para el desarrollo de #opendata para un gobierno, un ministerio, una entidad? #opendata #opendatasev
¿Existen mashup para el desarrollo de #opendata para un gobierno, un ministerio, una entidad? #opendata #opendatasev
la lista de la compra http://is.gd/50700Z app para #ogov gratis, libre http://is.gd/SkY62e compras 'simpatica' #opendata #opendatasev
Los ojos de la ciudad app para #ogov http://is.gd/WRj0Qq geográfica, de #abredatos libre http://is.gd/fgOu80 #ogov #opendata #opendatasev

FUTURO
El sector que más crece en volumen será el #opendata of things. Sensorización y publicación datos simples #opendata #opendatasev
La idea es q todos los procesos publicos publiquen su información, desde la licitación de las herramientas #opendata #opendatasev
Nos jugamos el crecimiento del sector del #softlibre de los próximos 5 años. #opendata #opendatasev
Otro sector en crecimiento es el #opendata para gestionar las smartcities y los smart governments #opendata #opendatasev
#ogov Publicacion : todos los datos han de ser abiertos a reutilización libre excepto por seguridad y protección datos #opendata #opendatasev
Además del impulso económico a lo mejor hasta acabamos con la morosidad de las AAPP http://is.gd/olnaKh #opendata #opendatasev


miércoles, 23 de noviembre de 2011

Opendata Navarra al 100% M4J

Analizando Open Data Navarra
Seguimos el análisis de las fuentes de datos publicas para conocer si realmente es oro todo lo que reluce en cuanto a si la información que liberan es realmente opendata. 
El criterio establecido es la metodología Meloda M4J, un umbral que establece los mínimos para determinar si una fuente de datos es realmente abierta de cara a la reutilización.

Condiciones de Meloda M4J
A modo de recordatorio las condiciones para cumplir Meloda M4J son básicas y sencillas de determinar:
1) Deben ser datos estructurados
2) Deben ser liberados en formatos abiertos o que haya herramientas libres y sin coste que permitan su tratamiento
3) Deben ser accesibles de forma automatizada
4) Deben tener una licencia que permita su reutilización comercial 

Método de muestreo
Navarra tiene 73 fuentes de datos (a 12-11-11), se van a muestrear 15 de ellas. Para seleccionarlas utilizamos 15 celdas de una hoja de cálculo y mediante una selección aleatoria obtenemos 15 números distintos entre el 1 y el 73.
Las seleccionadas fueron las fuentes 1,10, 12, 21, 24, 25, 40, 42, 43, 44, 49, 52, 53, 65, 71.

Los resultados de las fuentes elegidas pueden verse en esta tabla de la que merece la pena destacar lo siguiente. 

Lo bueno frente a aporta
Merece la pena destacar que en el 100% de los casos estamos hablando de fuentes de datos opendata M4J, frente al anterior análisis sobre las fuentes de aporta que reflejaban que solo un 39% eran realmente fuentes de datos. 
En cuanto a la accesibilidad de nuevo hablamos del 100% frente al 40% que se mostraban en los datos de aporta. 
Y finalmente la licencia es reutilizable en el 100% de los casos cuando en el proyecto aporta sólo podíamos hablar del 15%.

Lo mejorable 
En cuanto al formato es el único punto donde cabe una clara mejora puesto que el formato SHP no es un formato abierto y un  60% de las que han  sido muestreadas, aunque han sido cualificadas M4J, están basadas en este estándar propietario, con el consiguiente peligro de que en una actualización del estandar por el fabricante, pudieran perder esta cualificación.

Con lo que ese mínimo cambio llevaría a Opendata Navarra a pasar del 100% de apertura a tan solo el 40%.

Datos simpáticos vs antipáticos
De acuerdo a la clasificación de @dcabo como datos simpáticos aquellos que no comprometen la acción política y antipáticos aquellos que ocasionan una supervisión de la acción política, de las 15 fuentes muestreadas solo 1  (7%) , las retribuciones de 2011, puede considerarse antipática.

Proximos pasos 
1) 73 fuentes parece un número bajo para una comunidad como Navarra, especialmente en el ámbito de datos 'antipáticos'.
2) Por otra parte el mecanismo de liberación es M4J y por tanto ya solo queda atender a la comunidad de reutilizadores.
3) Navarra debería buscar la normalización de estándares con otras administraciones para que la reutilización de su información tuviera mayor impacto.

jueves, 3 de noviembre de 2011

Gonzalez Pons se moja con el opendata

Estas son las declaraciones de Esteban Gonzalez Pons en una entrevista digital en el diario el mundo.
11. Sr. González Pons, existe un todo un movimiento en la Red y fuera de ella a favor del acceso normalizado y sencillo a los datos públicos al estilo de Data.gov en EEUU u Data.gov.uk en Reino Unido. ¿Se plantea el PP hacer algo similar en el Gobierno? Muchas gracias.

Sí, entre las leyes que llevaremos al Parlamento en los 100 primeros días estará la Ley de Transparencia. Primero, porque es democráticamente indispensable. Y segundo, porque ayudará a la economía al hacer previsible y fiable a la administración
 
Es decir  que si ganara el partido popular tendríamos una ley de transparencia en torno a abril de 2012
 
Es coherente con lo que dicen en su programa electoral
"70. Aprobaremos con carácter inmediato y de acuerdo con los principios que inspiran el Convenio Europeo sobre Acceso a los Documentos Públicos, una ley de transparencia, acceso a la información pública y buen gobierno. La ley abordará desde una perspectiva integral la transparencia como un derecho de los ciudadanos y como un principio básico de actuación de todas las administraciones públicas, garantizando de manera ponderada el
derecho a la protección de datos de carácter personal y salvaguardando siempre el interés general
"
Será bonito revisar en esa fecha.
La imagen de access-info refleja la situación de los países de la UE  en materia de leyes de acceso a la información.

miércoles, 2 de noviembre de 2011

El Proyecto aporta se queda al 3%

Mínimos para la reutilización profesional
(viene del anterior post )
Como se define en opendata M4J, los requisitos mínimos para la reutilización profesional de la información contenida en una fuente de opendata son:
1) Que sean realmente datos (no documentos q aunque posiblemente valiosos son 'otra cosa')
2) Tengan una licencia que permita su reutilización más allá de la consulta privada (uso profesional).
3) Se liberen en formatos abiertos *
4) Sean accesibles sin necesidad de intervención manual (URL directa, aunque sea con parámetros)
Estas condiciones, no demasiado exigentes por otra parte, son necesarias para fomentar una  utilización profesional de los datos y por tanto la creación de valor económico (empleo) alrededor de unas fuentes cuyo gasto de generación ya ha sido realizado.
Quedan muy lejos de los requerimientos del linked data.

El dato del 3% es desolador para la reutilización comercial

Como se describía en un post anterior,  tras un muestreo de 72 de las 703 fuentes del proyecto aporta, y que ahora parece que forman la base del nuevo portal de la administración general del estado, tan sólo hubo 2 (La agenda de red.es y las noticias del ministerio de justicia) que cumplieran las condiciones de opendata M4J. Lo cual excedió con mucho nuestras peores previsiones. Además las fuentes incluidas son los rss que ni siquiera son los que se inventarían en la lista de fuentes de aporta.
Las fuentes analizadas y los datos parciales sobre las mismas están disponibles.

El detalle de los datos también revela sorpresas
La sorpresa global ha sido mayúscula, por que las condiciones anteriores no parecían inicialmente tan restrictivas si lo que queremos es que haya una reutilización efectiva como se describe en el propio proyecto.
El detalle de los resultados reflejaron también algunos otros datos interesantes

Fuentes reales de datos un 39%
Que realmente fueran datos y no documentos (como notas de prensa) o catálogos de las publicaciones a la venta eran cumplidos sólo por el 39%. (P.e. fuentes descartadas han sido la búsqueda dentro de los estatutos  de la Real Academia Nacional de Farmacia o el enlace  a los datos de 2 libros).
Seguro que hay muchos otros conjuntos de datos liberables en todas las entidades que se publican.

Formatos bien al 88%. Mejorar al alcance de la mano
Los formatos no plantearon tanto problema*, se llegaba al 88% de las fuentes. Si bien en general no facilitaban su reutilización por ser formatos poco incorporables como pantallas html o documentos texto pdf.
Curiosamente en la mayoría estos, html o pdf, vienen de bases de datos cuya liberación haría muchísimo más sencilla su reutilización.

Acceso directo a la información sólo al 40%
La accesibilidad a los datos también fue un problema ya que solo en un 40% de los casos se podía acceder de forma sistemática y automatizable a la fuente de datos.**
Es decir en el 60% de las fuentes requerían de una intervención manual, en la mayoría de los casos a través de un formulario con mayor o menor complicación, y en algunos casos se limitaba el número de resultados proporcionados.
No sería complicado incluir un enlace para la descarga completa.

El licenciamiento merece especial atención. Solo el 15% permite reutilización
Lo que mayor sorpresa ha causado ha sido el licenciamiento de los contenidos, ya que en un 85% de los casos prohibían la reutilización profesional de los contenidos.
Merece destacar que no son pocas las fuentes que cuentan con copyrights anticuados (hasta del año 2006) o con el copyright asignado a una empresa privada o con casos más extremos que incluyen licencias prohibiendo expresamente la reutilización, el scrapping y la utilización para menores como en Correos.

Conclusión
Aunque este basado en un muestreo aleatorio (para que sea estadísticamente significativo) los resultados excedieron, por lo inferiores nuestras peores pervisiones. 
Pero esta situación actual puede ser un buen punto de partida, ya que con sólo cambiar o actualizar las políticas de publicación, cambio realmente estético y de mínimo coste, multiplicaríamos por 5 (15%) la información disponible para su reutilización.
Si además en lugar de crear pdf intratables de cara a su reutilización se volcaran las bases de datos desde las que se generan, probablemente se podría duplicar este 15% hasta un 30%. 
Lo cual supone que con inversiones mínimas podríamos abrir realmente las puertas a un #opendata.
Como dicen en Cuba "Por el dinero no te preocupes que dinero no hay". En este caso no es cuestión de dinero, solo con voluntad podemos multiplicar por 8 la situación actual.

* en este caso se ha inbcluido en los formatos abiertos .xls aunque no .xlsx.
** incluso en el caso de que la evaluación determinara que no era una fuente de datos opendata.