Compartilhar

¿Cuántas V debería tener el Big Data?

Desde los comienzos, IBM y Gartner plantearon el Big Data como un modelo que abarca tres dimensiones (volumen, velocidad y variedad) denominadas “Modelo de las tres V”.

Con las tres V es posible definir el Big Data como el conjunto de herramientas que trabajan conjuntamente y permiten captar, almacenar y gestionar un gran volumen de información variada a una alta velocidad, permitiendo obtener datos para la toma de decisiones.

Volume, velocity, variety

Volumen de datos

Como su propio nombre indica, la tecnología Big Data ha de ser capaz de gestionar un gran volumen de datos que se generan diariamente por las empresas y organizaciones de todo el mundo, por ejemplo una cadena de supermercados puede almacenar más de 1 millón de transacciones comerciales cada hora identificando los productos que compran sus clientes, más de 100.000 Gb de información almacena la red social Facebook diariamente así como 72 millones de descargas se realizan en la Appstore.

Variedad de los datos

El Big Data ha de tener la capacidad de combinar una gran variedad de información digital en los diferentes formatos en las que se puedan presentar ya sean en formato video, audio o texto. Diferentes fuentes de información como las nuevas tecnologías wearables que monitorizaran nuestra actividad física, el internet de las cosas que conectará los dispositivos y máquinas entre sí, millones de mensajes escritos en redes sociales como Facebook o Twitter, millones de videos subidos a Youtube por día... son ejemplos entre otros de fuentes generadoras de diferentes tipos de información.

Velocidad

La tecnología Big data ha de ser capaz de almacenar y trabajar en tiempo real con las fuentes generadoras de información como sensores, cámaras de videos, redes sociales, blogs, páginas webs... fuentes que generan millones y millones de datos al segundo, por otro lado la capacidad de análisis de dichos datos han de ser rápidos reduciendo los largos tiempos de procesamiento que presentaban las herramientas tradicionales de análisis.

Como el Big Data en si mismo está dando mucho de qué hablar, IBM ha evolucionado las "tres V" y ya empieza a considerar una más, la Veracidad.

Veracidad

El Big Data ha de ser capaz de tratar y analizar inteligentemente el gran volumen de datos con la finalidad de obtener una información verídica y útil que nos permita mejorar nuestra toma de decisiones.

Esta cuarta V fue recibida con amplio beneplácito por parte de la comunidad, ya que exige que los datos no solamente sean muchos, sean analizados y aprovechados a gran velocidad y que sean de diversas fuentes, sino que además estos datos sean veraces y con ello confiables.

Big Data

La veracidad, sin embargo, está más enfocada hacia la Inteligencia de Negocio y se utiliza en el análisis de datos para el apoyo a la toma de decisiones, pasando a ser parte de la generación de Valor. ¿Será el Valor la quinta V?

Para mucha gente, (principalmente los ingenieros y desarrolladores de Big Data), las nuevas V como veracidad y otras candidatas a serlo como (valor, validez, viabilidad...) son más propias para caracterizar los datos, alejándose de las características del Big Data cuyas funciones son permitir el procesamiento masivo de muchos datos para generar información que antes resultaba inalcanzable con los sistemas tradicionales. La V de Veracidad ha generado mucha crítica también en forma de humor:

Big Data

Fuentes:

Kavya Muthanna - Innovation to make a difference - Última visita: 30/07/2014

AVNET - Última visita: 30/07/2014

The Big Data & Analytics Hub - Última visita: 30/07/2014

Quees.info - Última visita: 30/07/2014