Big data é um termo usado para descrever o grande volume de dados que as empresas recebem em seu dia a dia. Sendo assim, os dados podem ser analisados para gerar insights levando decisões e estratégias de negócios para as organizações.
Referente ao volume total de dados, não importa necessariamente a sua quantidade, mas sim o que as empresas fazem com eles.
Resumindo, Big Data é um conjunto de dados complexos e extensos, com maior variedade que chegam em volumes crescentes e velocidade cada vez maior. Porém podem e devem ser usados para resolver problemas da corporação que você não iria conseguir sozinho. Sendo conhecido também pelos 3V’s:
Volume: A quantidade de dados importa. Com o big data, você terá que processar grandes volumes de dados não estruturados de baixa densidade. Podem ser dados de valor desconhecido, como feeds de dados do Twitter, fluxos de cliques em uma página web ou em um aplicativo para dispositivos móveis, ou ainda um equipamento habilitado para sensores. Para algumas empresas, isso pode utilizar dezenas de terabytes de dados. Para outras, podem ser centenas de petabytes.
Velocidade: Velocidade é a taxa mais rápida na qual os dados são recebidos e talvez administrados. Normalmente, a velocidade mais alta dos dados é transmitida diretamente para a memória, em vez de ser gravada no disco. Alguns produtos inteligentes habilitados para internet operam em tempo real ou quase em tempo real e exigem avaliação e ação em tempo real.
Variedade: Variedade refere-se aos vários tipos de dados disponíveis. Tipos de dados tradicionais foram estruturados e se adequam perfeitamente a um banco de dados relacional. Com o aumento de big data, os dados vêm em novos tipos de dados não estruturados. Tipos de dados não estruturados e semiestruturados, como texto, áudio e vídeo, exigem um pré-processamento adicional para obter significado e dar suporte a metadados.
História do Big data
O big data não é um conceito considerado antigo, porem a origens de grandes dados armazenados datam à alguma décadas atrás (1960 e 1970), onde o mundo dos dados se iniciava.
Por volta de 2005, os usuários do Facebook, YouTube e outros serviços online foram crescendo e com isso os dados gerados por eles. Com isso no mesmo ano foi criado o Hadoop, uma estrutura para armazenar e analisar grandes dados. Durante esse período o NoSQL começou a ganhar popularidade.
Apesar da sua evolução o Big Data ainda está no começo da sua utilidade. Com a nuvem oferecendo uma escalabilidade elástica e expandindo ainda mais suas possibilidades. Os bancos de dados grafos estão se tornando cada vez mais importantes, pela sua capacidade de exibir grandes quantidade de dados de uma forma que a análise se torne ainda mais rápida e abrangente.
Como o Big Data possui muitas informações podemos a partir delas obter respostas mais completas, significando para empresas mais confiança nos dados.
Escrito por Mayara Pimentel – com revisão final de Raphael Silva.