¿Qué es el Big Data?
Al concepto de Big Data se le pueden atribuir dos definiciones: una de ellas, como la cantidad de datos tan voluminosos que sobrepasan la capacidad del software tradicional, el cual no puede llegar a gestionar esta cantidad de datos; o para referirse al conjunto de infraestructuras, tecnologías y servicios que permiten el almacenamiento, procesamiento y uso de la información obtenida a través de las diferentes tecnologías.
Tipos de datos
Es importante tener en cuenta que los datos se pueden clasificar dependiendo de su estructura:
1. Datos estructurados
Son los que tienen un formato ya predefinido, en el que los campos ocupan un sitio fijo y, por lo tanto, conocemos de forma anticipada su organización, tipo, etc.
Se almacenan en tablas y la información se representa por datos elementales.
2. Datos no estructurados
Son aquellos que no tienen una estructura específica, por lo que manipularlos es algo más complejo y no se pueden almacenar en una tabla como sí sucede con los estructurados.
Son datos no estructurados los archivos multimedia, archivos PDF o Word, contenido de emails, comentarios en las redes sociales, interacciones con otros usuarios, etc.
3. Datos semiestructurados o híbridos
Son aquellos datos que sí tienen alguna estructura autodefinida pero, no tienen una estructura fija. Ofrecen información poco regular ya que a veces, debido a su complejidad en el proceso de carga, se pueden perder datos. El tipo de archivo es XML o JSON.
Las "V" del Big Data
Cuando hablamos de Big Data, asociamos a este término directamente con las denominadas "V de Big Data".
Volumen
Como podemos deducir a partir del término, el volumen alude a la cantidad de datos, al gran volumen de los mismos. Por lo tanto, la cantidad de datos que se recibe siempre es importante.
Al poder ser datos de valor desconocido, como feeds de datos de Twitter, flujos de clicks de una página web o aplicación para móviles, o equipo con sensores.
Velocidad
La velocidad es la gran V que representa lo rápido que se reciben y tratan los datos. De manera que la velocidad será mayor si los datos se transfieren directamente a la memoria y no se escriben en un disco, y, consecuentemente, se trabajará muchísimo más deprisa y los datos se proporcionarán prácticamente en tiempo real.
Variedad
La V de variedad hace referencia a los tipos de datos que están disponibles. Los tipos de datos convencionales eran estructurados y podían organizarse en una base de datos relacional. Sin embargo, con el auge del Big Data, los datos se presentan en nuevos tipos de datos no estructurados.
Cuando trabajas con tantos datos, se debe tener en cuenta que muchos de ellos son no estructurados y semiestructurados (texto, audio, vídeo, etc.). Por este motivo, este tipo de datos requerirán un preprocesamiento adicional para poder obtener significado y habilitar los metadatos.
Veracidad
La veracidad se refiere a cómo de exactos son los datos del conjunto de datos. Aunque recopiles muchos datos de redes sociales y sitios web, no te puedes asegurar al 100% de que estos sean correctos.
Los datos inciertos pueden dar lugar a análisis imprecisos y llevarte a tomar decisiones equivocadas. Por este motivo, se recomienda que siempre se comprueben los datos para obtener resultados válidos y relevantes.
Valor
No todos los datos utilizados tienen valor y estos pueden causarte problemas, al tomar decisiones comerciales con datos sin valor. Por eso mismo, es de extrema relevancia conocer el valor de los datos que tienes a tu disposición, estableciendo una forma de limpiar los datos y confirmar que son relevantes para así conseguir el objetivo deseado.
Variabilidad
La variabilidad se refiere a la de cantidad de diferentes fines en los que se puede utilizar los datos recogidos. Cuando se tienen muchos datos, se puede utilizar con diferentes objetivos y formatearlos de distintas maneras. Como consecuencia, estos diferentes datos se utilizan en varias veces, al no poder analizarlos y clarificarlos de la manera más optima. Eso es lo que significa la variabilidad: la opción de utilizar los datos con distintos fines.


No hay comentarios:
Publicar un comentario