Big data es un término que se utiliza para describir el gran volumen de datos que las empresas reciben en su vida diaria. Como tal, los datos se pueden analizar para generar insigths que impulsen las decisiones comerciales y las estrategias de las organizaciones.
En cuanto al volumen total de datos, no necesariamente importa cuánto sea, sino qué hacen las empresas con él.
En resumen, big data es un conjunto de datos complejos, extensos y variados que llega en volúmenes y velocidades cada vez mayores. Pero pueden y deben usarse para resolver problemas corporativos que no podríamos hacerlo solos. También conocido como las 3V´s:
Volumen: la cantidad de datos importa. Con big data, tendrás que procesar grandes volúmenes de datos no estructurados de baja densidad. Pueden ser datos de valor desconocido, como feeds de datos de Twitter, transmisiones de clics en una página web, aplicación móvil o equipos con sensores. Para algunas empresas, esto puede utilizar decenas de terabytes de datos. Para otros, podrían ser cientos de petabytes.
Velocidad: la velocidad es la velocidad más rápida en la que se reciben y tal vez se gestionan los datos. Normalmente, la velocidad de datos más alta se transmite directamente a la memoria en lugar de ser grabada en el disco. Algunos productos inteligentes habilitados para Internet funcionan en tiempo real o casi en tiempo real y requieren evaluación y acción en tiempo real.
Variedad: Se refiere a los diversos tipos de datos disponibles. Los tipos de datos tradicionales se han estructurado y encajan perfectamente en una base de datos relacional. Con el auge del big data, los datos vienen en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como texto, audio y video, requieren un procesamiento previo adicional para obtener significado y dar soporte a metadatos.
Historia
Big data no se considera un concepto antiguo, sin embargo, su origen de big data almacenado se remonta a unas pocas décadas atrás (1960 y 1970), donde comenzó el mundo de los datos.
Alrededor de 2005, el número de usuarios de Facebook, YouTube y otros servicios en línea fue creciendo y con eso los datos que generaban. Con esto en el mismo año, se creó Hadoop, una estructura para almacenar y analizar grandes datos. Durante este período, NoSQL comenzó a ganar popularidad.
A pesar de su evolución, Big Data se encuentra todavía en el inicio de su utilidad, con la nube ofreciendo escalabilidad elástica y ampliando aún más sus posibilidades. Las bases de datos de gráficos son cada vez más importantes por su capacidad para mostrar grandes cantidades de datos de una manera que hace que el análisis sea aún más rápido y completo.
Big Data engloba demasiada información, de manera que a partir de ella podemos obtener respuestas más completas, lo que se traduce en más confianza en los datos para las empresas.
Escrito por: Mayara Pimentel | Adaptación: Karina Ríos