El lado oculto del Big Data. La codicia insaciable por los datos.

Una nueva palabreja que viene apareciendo en todos los medios es el «Big Data«, es uno de los términos de moda. Junto con el «Cloud Computing» y el «Internet de las Cosas» son los términos de moda en el mundo de la informática. Lo que me pregunto es si realmente sabemos lo que se esconde detrás del Big Data y su utilidad. He visto a personajes de lo más variopinto hablar alegremente del Big Data, incluso políticos, se ve que usar la palabra de moda crea expectación y gran impresión en sus audiencias.

Resulta que cuando los grandes del mundo de la informática y de Internet tienen un problema que no saben resolver o no quieren invertir en resolver, ponen a trabajar a los demás sobre este, de forma gratuita y masiva. Este es el caso del Big Data.

Los grandes del mundo de Internet hace tiempo que se encontraron con un gran problema. El problema era como tratar y extraer información de la ingente cantidad de datos que almacenan de sus usuarios. Hay que tener en cuenta que con frecuencia hablamos de datos desestructurados, por ejemplo: la información almacenada por las redes sociales consiste en textos, imágenes, la información guardada por los sistemas gratuitos de almacenamiento en la Nube consiste en archivos de los usuarios.

Para resolver este gran problema, tal y como ocurre con otras cosas, los grandes del mundo de Internet comenzaron a expandir y promocionar la idea del Big Data. De esta forma y con algo de tiempo, un ejército de informáticos comenzarían a asumir el problema como propio y a desarrollar soluciones. Las necesidades de los grandes, bien publicitadas y promocionadas, crean expectativas de empleo y de éxito profesional. Hay muchos programadores a los que les encantaría entrar por la puerta grande en empresas como IBM, Google u Oracle.

Una cosa es tener los datos, que los tienen, y otra es extraer la información de esos datos. Imaginemos que pudiésemos tener todos los datos de Dropbox almacenados en un ordenador. Tendríamos, en un hipotético disco duro, miles de millones de archivos que los usuarios han subido al sistema. Lo primero que deberíamos hacer es crear un proceso que nos extrajera el texto de esos archivos e incluso información referente a las imágenes almacenadas. Una vez que lo tenemos en formato de texto, podríamos empezar a hacer Big Data.

Para hacer Big Data es evidente que se necesitan los datos y además ciertas herramientas o programas que nos permitan extraer la información de esos datos. Las herramientas existen y además existe una amplia comunidad de desarrolladores que, apoyados en mayor o menor medida por los grandes de la informática, siguen mejorando y desarrollando esas herramientas.

Volviendo al ejemplo anterior. Una vez que tenemos los datos, solo nos falta plantearnos preguntas sobre esos datos. Imaginemos ahora una multinacional de Ingeniería Civil muy interesada en abrir oficinas en un país. Sería muy interesante disponer de información sobre la competencia que existe en ese país, alguien nos podría facilitar conocimiento de las obras que se realizan, precios, costes y contratos a nivel institucional. Afortunadamente para ellos, muchas empresas del sector de ese país han subido archivos al sistema, ese sistema amparado por las leyes de California, tenemos facturas, proyectos, nóminas, contratos, etc.

El Big Data podría comenzar por buscar todos los archivos que contienen palabras relevantes como «Factura», «Proyecto», «Nómina», «Contrato», «Cliente». Una vez reducido el universo de archivos que nos interesan, ya se podría hacer Big Data sobre los que nos quedan. Por ejemplo, podríamos buscar potenciales clientes para la empresa, relacionando los resultados obtenidos con las palabras anteriores. La multinacional ya podrá tener una base de datos de posibles clientes y lo que les han cobrado otros, información muy valiosa para hacer sus ofertas y comenzar fuerte en ese país. Cuentan con una ventaja que otros ignoran.

El Big Data no tiene ningún futuro en Europa, al menos no tanto como lo tiene en USA. La leyes europeas de protección de datos prohíben la venta, manipulación o comercialización de los datos almacenados por los clientes, es más, las leyes europeas obligan a su protección y confidencialidad.

El Bigdata en Europa solo tiene futuro dentro de empresas o instituciones que usan datos legítimos. Las empresas en Europa pueden usar el Big Data con sus propios datos, sin ponerlos nunca en manos de terceros. Pueden hacer sus propios estudios con los datos e información de sus clientes, esa es la utilidad del Big Data en Europa. La ciencia, los gobiernos e incluso el deporte pueden usar el Big Data con fines estadísticos. Estos son usos del Big Data cuando no se trata de manipular los datos de los usuarios, hay muchos pero nada tienen que ver con los que otros tienen en mente.

La codicia por los datos de la gente y de las empresas no tiene límites. Esto continuará durante algún tiempo y hace que muchas empresas que ofrecen servicios gratuitos alcancen cifras de valoración de miles de millones de dólares. Para que los datos que tienen se conviertan en información útil necesitan el Big Data, esto es lo que aporta valor a los traficantes de datos.

Por último, una recomendación: si eres un programador y deseas dedicarte al Big Data deberás marcharte a los Estados Unidos, hay buenos empleos y muy bien remunerados para esto. La parte moral y ética ya corre por tu cuenta, siempre hubo mercenarios en este mundo.

3 comentarios

Julio

21/07/2016 / 17:38 Responder

Impecable artículo…siempre me pareció vidirioso todo el tema que enrolla Cloud Computing y demas lios…hay algo de tras, la gratuidad trae de fondo algún vicio…
- Francisco Javier Ruiz
  
  24/07/2016 / 12:09 Responder
  
  ¡Gracias!
Julio

20/02/2023 / 17:39 Responder

Creo que en Europa el uso de los datos de esta manera pasa por anonimizar los datos para poder ser usados en ámbitos como la medicina u otras ramas.

3 comentarios

Deja un comentarioCancelar respuesta