Skip to contentSkip to navigation
User

Big Data y Datos Abiertos: ¿Qué son y por qué son importantes?

Big Data y Datos Abiertos: ¿Qué son y por qué son importantes?

Tradujimos este artículo de Joel Gurin, publicado en The Guardian


Big Data y el nuevo fenómeno de los datos abiertos están relacionados pero no son lo mismo. Los Datos Abiertos brindan una perspectiva que puede hacer a la Big Data más útil, más democrática y menos amenazante.

Mientras Big Data es definido por su tamaño, los datos abiertos son definidos por su uso. Big Data es el término utilizado para describir conjuntos de datos muy grandes, complejos y cambiantes. Pero todos estos juicios son subjetivos y dependen de la tecnología: en un par de años cuando el análisis de datos y la tecnología de computación mejoren la Big Data de hoy puede no parecer tan grande.

Los Datos Abiertos son datos públicos accesibles que las personas, compañías y organizaciones pueden utilizar para lanzar nuevas empresas, analizar patrones y tendencias, tomar decisiones basadas en datos y resolver problemas complejos. Todas las definiciones de los datos abiertos incluyen 2 características: la data tiene que estar publicada y disponible para que cualquiera pueda utilizarla y debe tener licencias de manera que permita reusarla. Los Datos Abiertos también debe ser relativamente fácil de usar, teniendo en cuenta que hay gradaciones de "apertura". Y hay un acuerdo general que los datos abiertos deberían estar disponibles gratuitamente o a un costo mínimo.

La relación entre Big Data y Datos Abiertos

Este diagrama de Venn muestra la relación entre Big Data y datos abiertos, y como estos conceptos se relaciones con Gobierno Abierto. Hay algunos puntos importantes para destacar:
Big Data que no está abierto no es democratica: La sección 1 del diagrama incluye todos los tipos de Big Data que se mantiene oculta al público - como los datos de clientes de las empresas o los datos de seguridad nacional recolectada por la NSA. Este tipo de Big Data brinda una ventaja a las personas que controlan pero nos desempoderan al resto de nosotros. Es este el tipo de big data que se ha convertido en controversial.

La apertura de datos no implica necesariamente que sea Big Data: Pequeñas cantidades de datos, como se muestra en la sección cuatro, pueden tener un gran impacto cuando se haga pública. Los datos de los gobierno locales, por ejemplo, pueden ayudar a los ciudadanos a participar en la elaboración de presupuestos locales, elegir la asistencia sanitaria, analizar la calidad de los servicios locales, o construir aplicaciones que ayuden a seguir el transporte público.

Big Data abierto no tiene porque venir del gobierno: Esto se muestra en la sección tres. Cada vez más científicos están compartiendo sus investigaciones en astronomía, la genómica y otras áreas en un nuevo y colaborativo modelo de investigación. Otros investigadores están utilizando grandes volúmenes de datos recogidos de los medios de comunicación social - la mayoría de las cuales está abierto al público - para analizar las tendencias de opinión y de mercado públicos.

Pero, cuando el gobierno convierte Big Data en datos abiertos, es especialmente potente: Las agencias gubernamentales tienen la capacidad y los fondos para recopilar grandes cantidades de datos (como los ejemplos de Estados Unidos en la sección seis), y la apertura de los conjuntos de datos puede tener una muchos beneficios en la economía. Dirijo un estudio de Open Data 500 en el GovLab de la Universidad de Nueva York. Hemos encontrado 500 ejemplos de empresas con sede en Estados Unidos que están construyendo sus negocios con los datos de gobierno abierto, y gran parte de que los datos son Big Data también. Estamos planeando trabajar con el Instituto Open Data para replicar el estudio en el Reino Unido, y espero encontrar el mismo patrón.

La aplicación de los principios de datos abiertos para Big Data puede ayudar a resolver algunas de las cuestiones difíciles que Big Data ha planteado. La mayor amenaza para el bienestar público es el riesgo de que los datos privados y personales puedan ser recogidos y utilizados como Big Data en formas en que los sujetos de los datos - es decir, todos nosotros - no quieran o aprobarían. Paradójicamente, la apertura de estos datos sensibles, de una manera específica y controlada, en realidad puede hacer que sea más seguro.

El problema ahora es no sólo que las agencias del gobierno y algunas empresas están recogiendo los datos personales de todos nosotros; también es que nosotros, como individuos no sabemos lo que está siendo recogido y no tenemos acceso a la información acerca de nosotros mismos. Si supiéramos más, podríamos controlar más. La iniciativa "midata" del gobierno del Reino Unido, que ha animado a las empresas a compartir los registros de clientes con los clientes a sí mismos, es parte de la solución. Programas estadounidenses similares, como "Blue Button" para los historiales médicos y "Green Button" para los datos del uso de la energía, también están teniendo un efecto positivo.

Tanto Big Data como los datos abiertos pueden transformar los negocios, el gobierno y la sociedad - y una combinación de los dos es especialmente potente. Big Data nos da un poder sin precedentes para entender, analizar, y en última instancia cambiar el mundo en que vivimos datos. Abrir los datos asegura que el poder será compartido - y que el mundo que nosotros cambiamos será, con suerte, uno más justo y democrático.

Joel Gurin es Presidente y fundador del Center for Open Data Enterprise. Es autor de Open Data Now.