| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

Libertad para los datos

Page history last edited by Juanan Pereira 14 years, 11 months ago

 

¿A qué datos nos referimos?

En general, hablamos sobre los datos que las instituciones oficiales crean y recopilan con nuestro dinero. Por ejemplo (aunque pueden ser muchos más) :

  • Meteorología: datos historicos y previsiones.
  • Información geográfica: carreteras, vías ferroviarias, calles, canalizaciones de agua, líneas eléctricas, límites municipales, provinciales etc.
  • Toponimia: callejeros y nombres de lugar oficiales, toponimia histórica.
  • Datos sociológicos: censo y todos los datos relacionados, la cantidad de gente que vive en una calle, paro, nivel de estudios...
  • Resultados electorales por distritos, mesas, municipios, partidos...
  • Información económica: recaudación de impuestos, beneficios de empresas, bases de datos de empresas y negocios...
  • Transporte público: recorridos de tren y autobus, horarios, paradas, precios, estadísticas de uso...
  • Tráfico: obras, atascos, previsiones...
  • Turismo: restaurantes, hoteles, casas rurales, puntos de interés, museos, otros servicios...
  • Diccionarios, glosarios y recopilaciones filológicas similares.
  • Base de datos terminológicos (Euskalterm)
  • Memorias de traducción (IVAP, etc...)
  • Información de bibliotecas: autores, libros, discos, ISBN...
  • Exámenes de la Administración Pública (EGA, Osakidetza...)
  • Datos sobre focos contaminantes, tipo de contaminación y niveles de emisión (http://www.eper-euskadi.net).
  • Datos sobre calidad del aire en la CAV (http://www.ingurumena.ejgv.euskadi.net).
  • Datos sobre la calidad de las aguas en la CAV, tanto aguas superficiales, como subterraneas y marinas (http://www.uragentzia.euskadi.net/).
  • Datos estadísticos sobre accidentes laborales y enfermedades profesionales. Objeto: datos de utilidad en análisis y comparación para los departamentos de prevención de las empresas.  
  • Datos sobre el coste en licencias software en el que incurre la administración anualmente

¿A qué datos no nos referimos?

No haría falta aclararlo, pero por si acaso:

  • Datos personales y datos privados de empresas.
  • Datos que previamente se hayan comprado con derechos de autor restringidos.
  • Datos relacionados con la seguridad (con la verdadera seguridad, sin que la seguridad sirva de excusa para no publicar algunos datos)

¿Por qué?

  • Porque si son datos pagados con dinero público, todos tendríamos que tener modo de obtenerlos y utilizarlos de forma igualitaria. Como ocurre con carreteras, hospitales, bibliotecas o parques, todos tenemos el mismo derecho de utilizarlos, ya que las instituciones los pagan con nuestro dinero.
  • Porque como ciudadanos, queremos tener los mismos datos que las administraciones cuando analizamos su trabajo. Actualmente es muy difícil pedir cuentas a la administración en sus mismas condiciones.
  • Porque gracias a los datos las empresas aumentan su competitividad. Si las empresas de aquí disponen de buenos datos y las de otro país no, la ventaja será para nuestras empresas.
  • Si yo tengo una manzana y te la doy, tu tendrás una manzana y yo no. Si te doy una base de datos, los dos tendremos la base de datos.
  • Porque distintas administraciones hacen el mismo trabajo de recopilación de datos hoy en día. Si la información fuera completamente pública, no se recopilarían dos veces los mismos datos. Por ejemplo: ¿Cuántos callejeros existen hoy en día en nuestras instituciones, y cada uno con datos divergentes?
  • Por la propia transparencia de la Administración, la publicidad de los datos otorga el poder a los ciudadanos para su control.

¿Cómo pedimos estos datos?

En el siglo XXI no vale que nos digan que han impreso los datos y que se pueden comprar. No vale decir que el censo se hace cada X años y que los datos se publican con esa periodicidad. No vale decir que para tal dato tenemos que ir a no sé qué web a leerlo.

 

En la era de Internet y las aplicaciones web:

  • Hay que ofrecer sistemas de acceso automatizados a los datos (Lo que en informática se llaman APIs)...
  • ... Pero eso no excluye que se deban ofrecer descargas cada X tiempo; hay aplicaciones que necesitan tener una copia de todos los datos.
  • En formatos libres. No vale que haya que comprar este u otro software para leerlos.
  • Los datos deben estar actualizados. Gracias a la informática actual, un ayuntamiento sabe su población en todo momento. ¿Por qué no podemos saberlo los ciudadanos?
  • Autorizado su uso bajo licencias libres, para poder utilizar esa información como mejor nos convenga.

Licencias Non-commercial y beneficios económicos:

  • Las licencias que no autoricen uso comercial, no son licencias libres.
  • En las licencias de uso se deben autorizar usos comerciales. Cuando vamos por carretera o en tren, nadie nos pregunta si ganamos dinero o no con ello.
  • Algunas empresas ganarán dinero con estos datos. Creemos que es un uso correcto y que debe ser impulsado. De la misma forma, muchas empresas ganan mucho dinero gracias a la red de carreteras, llevando de aquí allá mercancias. A eso le llaman progreso económico.
  • Además, hoy en día muchas empresas que "hacen trampas" y ganan dinero con los datos públicos. Por ejemplo, los planos que la administración entrega a una empresa para un proyecto público, se utilizan poco tiempo después para proyectos privados, sin pedir permiso por ello.
  • Si se exige cuota o peaje por el uso de los sistemas, siempre debe ser con mesura, para que no supongan desigualdades entre los que pagan y los que no.

 

Metodología: Javier de la Cueva propone la siguiente metodología para la identificación de los datos a reutilizar:

 

Para la identificación de todos los datos, propondría una metodología. Consiste en ser lo más exhaustivo posible para que no se escape ningún dato en manos de la administración y realizar para ello:

 

1. De la norma jurídica que estructure los departamentos de la administración (gobierno, conserjerías, direcciones generales, ...) se realiza un censo de todos los órganos de la administración de que se trate.

 

2. Ese censo contemplará el nombre del organismo y su categoría jerárquica señalada en dicha norma jurídica.

 

3. En cada una de las estructuras se puede definir el nivel de granularidad deseada para el sistema, lo que permite un análisis creciente o decreciente, según los recursos que se detinen al trabajo de este proyecto.

 

4. Se analiza qué información es la que genera cada órgano de la administración.

 

5. Se analizará si dicha información se halla sometida a la ley de propiedad intelectual, ley de protección de datos, ley de reutilización de información del sector público y, en su caso, a qué licencias.

 

6. Se analizará también el formato de los datos.

 

7. Identificada una fuente de información, ésta se incluirá en el censo indicando el órgano fuente (de esta manera se compatibilizan los trabajos tanto de arriba-abajo como de abajo-arriba).

 

8. En una base de datos que ejemplifique lo que Jorge sabiamente argumenta, se introducirá una tabla que contenga el organismo y otra tabla vinculada con los datos de la información.

 

9. Esa base de datos, además, debe contener un campo que indique si una fuente de datos pública cumple los requisitos de este artículo.

Por supuesto que el modelo puede ser mucho más complejo, pero creo que esta debería ser su estructura inicial.

 

 

Comments (18)

Ketari said

at 8:01 pm on Jun 26, 2009

Y los datos creados por empresas privadas que utilizan dinero público para crear algún contenido, ¿Se debería exigir en esos casos que los datos fueran libres?

Gari Araolaza said

at 11:01 am on Jun 29, 2009

Supongo que dependerá de qué estemos hablando. Si se trata de un cartel de fiestas de un artista no será lo mismo que si se trata de un censo o encuesta, no?

Necesitamos ayuda para hacer todo esto digerible y presentable a los que tengan posibilidad de hacer algo con esto.

Alorza said

at 11:11 am on Jul 5, 2009

Gari, no puedo estar más de acuerdo. Yo soy uno de esos que tiene posibilidad de hacer algo con esto, en el Gobierno Vasco. Colaboremos. :-)

Alorza said

at 11:24 am on Jul 5, 2009

Sólo una pequeña ¿discrepancia? (igual estamos diciendo lo mismo): creo que hay que empezar por suministrar los datos "crudos", sin esperar a poder ofrecer conjuntos de datos con lógica "API", simplemente para poder ofrecer datos relevantes de manera rápida. Como segunda fase, habría que mejorar el acceso a esos datos.

Me gusta cómo lo han hecho en el catálogo de data.gov (http://www.data.gov/catalog) que diferencia entre "raw data", "tools" y "geodata".

Gari Araolaza said

at 8:46 am on Jul 6, 2009

Estamos de acuerdo @Alorza , algo es infinitamente más que nada. Se trata de evitar que se escurra el bulto diciendo "ya lo hemos cumplido publicando este papel todos los años" Eskerrik asko atxekumenduagatik.

futuretelematics said

at 10:49 pm on Jul 16, 2009

La apertura de datos tiene que formar parte de una estrategia global, una directiva general contando con suficiente soporte (sponsorización)... de otra forma todo quedará en prototipos o como mucho en dos o tres iniciativas limitadas de "apertura de datos"... todo hasta que rompa la ola open-data... y para entonces ya será tarde.
En lugares donde se toman en serio la apertura de datos, crean agencias que impulsan, coordinan y soportan técnicamente la apertura de datos: la complejidad de la administración, la burocracia, los nichos de poder y la forma de gestionar proyectos hacen la tarea extremádamente dificil.
En definitiva, como con muchas otras cosas relacionadas con la web y de ámbito horizontal, sin un impulso "de alto nivel", es dificil.

Sin embargo, y como contrapunto positivo, es algo ilusionante, y más ilusionante es que exitan iniciativas "no administrativas" con ganas de usar los datos!

lorenaubierna said

at 8:21 pm on Jul 27, 2009

Una pregunta que no pega porque ya aclaráis lo que son datos abiertos. La información sanitaria no es viable?? Os comento porque creo que como ciudadana tengo derecho a acceder a mis datos y que puedan ser compartidos si tengo una urgencia o me voy de vacaciones. Más simple, mi padre que está muy mal, tiene sus datos repartidos en papel, sobre todo en diferentes lugares. cada vez que voy al médico, teongo que llevar todos los informes, `pruebas , o sea horrible. Ya sé que me vais a contar el famoso poryecto de historia clinica que es´ta en mantillas, y tengo datos. Lo que quiero es acceder a un tipo googlehealth, BAJO MI RESPONSABILIDAD, y no tener que meter el rollo 20 veces y 20 sitios distintos...si encima quiero ir a un médico en Barcelona, es inviable ir con todo ésto en mi carpeta. De hecho he tenido que crear una pequeña historia clinica de mi padre para poder consultar a diferentes especialistas....Si se está constryendo un HC, quiero participar como cuidadano en su construcción porque son mis datos..! Alorza, esto está fuera de este proyecto???
Por último, esta mañana he estado en una reunión con médicos en barcelona, y me han contado de una iniciativa para protegernos de la gripeA y no colapsar los ambulatorios, Es una especie de red socila por distritos, en donde se aconseja, ya que nadie sabe de las repercursiones de esta gripe, y lo único fiable es quedarte en casa para no contagiar a nadie,,,como os decía, una red social donde metes a amigos y vecinos para que te lleven las cosas a casa y así evitar contagiar. Me puedo enterar mejor, pero me parece una inicitaiva muy buena...pero estos datos cómo los catalogamos....

Por último, todo el tema sociosanitario, ver demograficamente donde hay más necesidad por edad patologías, para temas residenciales, en mantillas en el pais vasco por cierto, y temas de ayuda domiciliaria, cuidadoras...yo me he vuelto loca con ésto.

donde cuelgo las ideas???

Gracias por leerme

Alorza said

at 9:27 am on Jul 28, 2009

Me interesa mucho emprendedores que digan: "Si liberamos este conjunto de datos, me comprometo a hacer algo con ellos" (y mejor si se dice algo sobre ese "algo" :-)

Iván Sánchez Ortega said

at 10:57 am on Jul 28, 2009

@Alorza: Si liberáis ese conjunto de datos, me comprometo a subirlos a OpenStreetMap. Y a dar una versión de los mapas sólo en castellano y otra versión sólo en euskera. :-)

@lorenaubierna: puede ser interesante crear una página del workspace para ideas (con los datos necesarios para llevarlas a cabo)

silvia_ncuentra said

at 11:57 am on Jul 28, 2009

Estoy con Lorena en lo referente al tema de la Sanidad. Resultados de pruebas -desde un simple análisis de sangre-, diagnósticos concretos, etc.
Que se cree la infraestructura necesaria para ello está bien y ha de ser el primer paso. Pero, siguiendo con el ejemplo médico: ¿en las consultas de especialistas veis si se escribe algo en el ordenador? En medicina general sí, ya van cogiendo costumbre. Pero en especialistas siguen con su boli, sus hojas desordenadas, sus expedientes-carpetas de cartón, etc. A día de hoy dudo mucho de que mi historial médico esté a un click de hacerse público...
Los temas de Hacienda también sería interesante tener acceso directo a ello: cada persona a su historial, por supuesto. Y en qué punto está tu declaración, por ejemplo, si está revisada, si está pendiente de inspección, aprobada, etc.
Y, por último, darle una vuelta a la página del Eustat. El tratamiento de la información que se ofrece a través de su web es de lo peor... :-(
Y una pregunta para @alorza: todo esto de la apertura de datos que ahora dicen López, Mendía, etc.... será a corto, medio, largo plazo? para esta legislatura? para el próximo año? ... cuándo podré utilizar mi tarjeta ONA para algo relevante?

Alorza said

at 7:18 pm on Jul 28, 2009

@silvia ¡Silvia! Creo que te has liado un pelín. Vamos por partes:

- Lo de Sanidad no tiene que ver con la reutilización de datos del sector público.Y además, seguramente Sanidad es el peor lugar para empezar a hacer públicos los datos, por su especial sensibilidad, protección, etc.
- Lo de Hacienda... otro tanto. Lo que reclamas no es que se hagan públicos los datos, sino que monten una Administración electrónica en condiciones.
- Lo de la ONA, lo mismo que en el apartado anterior.
- Lo del EUSTAT, ¡es una excelente sugerencia! Esta vez has dado en el blanco. :-)

lorenaubierna said

at 4:41 pm on Jul 30, 2009

Alberto, lo siento, como bien dices el tema de la sanidad es el
mas complejo y políticamente incorrecto, así nos va...creo y te confirmo que los datos médicos que tiene la
administración son del
paciente aunque el centro tenga el derecho de custodia.con esto, lo que pretendo decir ea
que quiero tener mis datos que maneja la
admón., junto con los que tenga la privada, accesibles para
poderme ir a donde me salga, pedir segundas opiniones o lo que sea.la plataforma sea la que sea,
no se limita a que yo meta m datos en el googlehealth, sino que los meta osakidetza, y la clínica universitaria si viene al caso , pq son "mis datos" no "sus datos" y la platataforma es colaborativa entre admón., paciente, y otros agentes...me
gustaría tb definir esto de la apertura de datos
y que entendemos por públicos y privados.
Para mi mis datos médicos son publicos, los míos.

Xavier Badosa said

at 6:00 pm on Jul 30, 2009

@Alorza: "Lo del EUSTAT, ¡es una excelente sugerencia! Esta vez has dado en el blanco. :-)"

100% de acuerdo: la estadística oficial es un ámbito fácil por el que empezar. Fácil institucionalmente al menos, porque es llevada a cabo por "organismos orientados a datos". Lo he defendido repetidamente, en alguna ocasión ante gente del Eustat entre otra:

"La difusión estadística en el contexto de la web 2.0"
http://www.slideshare.net/badosa/la-difusin-estadstica-en-el-contexto-de-la-web-20-presentation

"Statistical dissemination 2.0"
http://www.slideshare.net/badosa/statistical-dissemination-20

Rafael Olalde said

at 6:17 pm on Jul 31, 2009

Interesante foro. En especial el debate que se ha planteado sobre los datos clínicos de los pacientes. Como sanitario yo distinguiría los datos globales y disociados de los pacientes en lo que no veo ninguna pega para que sean liberados y puestos a disposición de todo el mundo. Cualquier estudio que haga referencia a la salud (científica, resultados en salud, farmacoeconomía, priorizacion en inversion, nuevas tecnológías...) sacarían chispas de esos datos.

Por otro está el tema que plantea Lorena. Razón tiene mas que una santa en este caso. Sus datos son suyos y puede y debe disponer de llos si lo quiere y su uso está sometido a su libre albedrío. La solución es otra cosa. Existen el mercado soluciones a lo que plantea:
Desde las que ya apunta on-line como Google Healt o españolas como Keyose ( http://keyose.com/record/login?locale=es-ES#q1) hasta un pen drive ( http://www.medinfochip.com/europe/spanish/producto.html) pensado y diseñado para ello en la que los distintos médicos con los que interactua añadan lo básico de su actuación (nuevos diagnósticos, tratamientos etc).

El problema lo tendrá Lorena cuando se enfrente a esta inteactuación en la que muchos profesionales sanitarios se sienten como un pulpo en un garaje y ven miedos y recelos fruto de su inseguridad. Pero esto es otro tema

p.rios@... said

at 10:24 pm on Aug 2, 2009

Por proponer otra serie de datos: agenda de la comunicación, datos de todos los cargos públicos de la CAV, incluyendo ayuntamientos, con sus respectivos mails, etc.

angel maldonado said

at 7:18 pm on Aug 7, 2009

Enhorabuena por esta iniciativa. Desde legalsolo.com hemos trabajado mucho por la apertura hacia la reutilización de datos públicos de tipo legal. Más aquí http://blog.legalsolo.com/tag/apertura-de-datos/

Una vez superado el difícil reto de comprender que los datos llegan a la gente mediante la reutilización y no mediante la publicación, hemos identificado los subsiguientes obstáculos:

1. Prever cuales son los ámbitos de info pública más demandados. Esta tarea evidentemente precisa se definan todos los posibles dominios y a este respecto la sección 8 del informe MEPSIR (Measuring European Public Sector Information Resources; Junio 2006) de la Comisión Europea; "Overview of Results for Domains", página 25, hace un buen resumen de dominios y subdominios (datos empresariales, geográficos, climatológicos, legales, sociales y de transporte). Datos como resoluciones sobre competencia, energía, telecomunicaciones aun no formando parte aparente vienen articulados bajo los autos y resoluciones judiciales dentro del ámbito legal.

2. Una vez determinados los ámbitos más demandados, el siguiente obstáculo consiste en hacerlos públicos en formatos auto-procesables como XML sin por ello incurrir en costos de transformación que a su vez justifiquen tasas y por ende frenen su reutilización y distribución "viral" hacia la sociedad. Buena guía a este fin es la publicada recientemente por www.aporta.es o los Open Data Principles de US http://resource.org/8_principles.html

:)




Juanan Pereira said

at 7:22 pm on Sep 20, 2009

Esta iniciativa... ¿se ha parado? ¿Se ha idola gente a otro sitio a discutirla? ¿Podríamos seguir desarrollándola? ¿Cuáles serían los siguientes pasos?

angel maldonado said

at 12:36 pm on Sep 21, 2009

Juanan, bien por tu comentario, sin duda me hago esa misma pregunta, especialmente al ver que se habían implicado directamente desde la Administración y atisbar posibilidades de avance. ¿Alguno de los iniciadores puede arrojar algo de luz?

You don't have permission to comment on this page.