Cátedra BOB

¿Qué es Big Data?

Big Data

Big Data se ha convertido en una palabra de moda en el mundo actual. Las tecnologías Big Data permiten capturar, almacenar, gestionar y analizar datos masivos (por su volumen), complejos (por su variedad) y que se crean o cambian rápido (por su velocidad de transferencia y variabilidad en su estructura). Esto no era posible con las tecnologías computacionales clásicas.

Este término es cada vez más importante en el mundo empresarial. Las empresas utilizan los datos para numerosas actividades como conocer mejor el comportamiento de sus clientes, identificar nuevas oportunidades y optimizar sus operaciones. 

Por ejemplo, Atlantis Technology, la empresa tecnológica del Grupo Binter utiliza Big Data para analizar el éxito de sus campañas de marketing. En primer lugar, separan en dos grupos los clientes potenciales y la campaña de marketing se dirige a un solo grupo. Durante la campaña rastrean clicks en la página web, en los anuncios de Google… hasta llegar a una venta en los casos en que se produzca. Aprovechando estos datos analizan el comportamiento de los clientes afectados por la campaña de marketing y lo comparan con el otro grupo para saber si la campaña tuvo realmente éxito o si hubieran tenido el mismo éxito sin hacerla.

El Big Data desempeña un papel importante en el sector sanitario. En los últimos años, los servicios sanitarios han ido evolucionando en el uso del big data para mejorar la atención al paciente y reducir costes, pues gracias a los grandes conjuntos de datos se puede identificar previamente a los pacientes de alto riesgo. Para ejemplificar esto, podemos tomar el caso del Hospital Universitario de Nuestra Señora de la Candelaria, el cuál utiliza grandes cantidades de imágenes de los ojos de los pacientes para identificar si el grado de retinopatía diabética:

Los macrodatos también se utilizan en el sector público. Los gobiernos están utilizando Big Data para mejorar los servicios y crear mejores políticas. Por ejemplo, el Gobierno de Canarias publica los datos de las llegadas de los pasajeros a los diferentes aeropuertos y puertos de la isla, algo clave para empresas como TITSA, la cual realiza un estudio de estos datos y puede determinar las horas en las que habrá un pico de llegadas para aumentar la frecuencia de las guaguas en ese lugar. Esto les ayuda a concentrar los recursos en las áreas adecuadas y crear estrategias de seguridad pública más eficaces.

Según la definición de Gartner, de aproximadamente 2001 (y que continúa siendo la definición de referencia): Big data son datos que contienen una mayor variedad y que se presentan en volúmenes crecientes y a una velocidad superior. Esto se conoce como «las tres V»:

  • Volumen: La cantidad de datos importa. Con Big Data, tendrá que procesar grandes volúmenes de datos no estructurados de baja densidad. Puede tratarse de datos de valor desconocido o equipo con sensores. En algunos casos esto puede suponer decenas de terabytes de datos o incluso cientos de petabytes.
  • Velocidad: La velocidad es el ritmo al que se reciben los datos y (posiblemente) al que se aplica alguna acción. La mayor velocidad de los datos normalmente se transmite directamente a la memoria, en vez de escribirse en un disco. Algunos productos inteligentes habilitados para Internet funcionan en tiempo real o prácticamente en tiempo real y requieren una evaluación y actuación en tiempo real.
  • Variedad: La variedad hace referencia a los diversos tipos de datos disponibles. Los tipos de datos convencionales eran estructurados y podían organizarse claramente en una base de datos relacional. Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, audio o vídeo, requieren un preprocesamiento adicional para poder obtener significado y habilitar los metadatos.

IBM describe Big Data incorporando dos V adicionales:

  • Variabilidad
    • La forma en que se capturan los datos puede variar de un momento a otro, o de un lugar a otro, de manera que puede crearse cierta dependencia del contexto en que se de la recopilación de información. Esta variabilidad significa que los datos solo se pueden interpretar de manera significativa cuando se toma en consideración el contexto. Las tecnologías que componen una arquitectura Big Data deben ser flexibles para poder adaptarse a nuevos cambios en la forma de obtención de los datos como en su almacenamiento y procesado.
  • Valor
    • El objetivo final del Big Data es extraer valor de toda la información almacenada, a través de distintos procesos, de manera eficiente y con el coste más bajo posible. Es importante cerciorarse de que los conocimientos que se generan se basen en datos precisos. De esta manera, un sistema Big Data debe extraer dicho valor en forma de nueva información de la manera más óptima posible, adaptándose a todos los formatos existentes y futuros.

Desde la Cátedra fomentaremos la difusión, formación e investigación en Big Data ayudando a las entidades públicas y privadas de Canarias a aprender y aplicar estas tecnologías para que consigan ser más eficientes.