TECH: Big Data x Small Data

A bola da vez no mundo tecnológico, corporativo e até mesmo acadêmico em TI é a palavra DADOS. O cuidado que penso que precisamos tomar como entusiastas, empresários, empreendedores, estudantes, amantes de tecnologia, enfim, todos, é que isso não vire uma “modinha” do qual se vendem muitos eventos, matérias, etc., e ao final não se obtém nenhum resultado.

smallxbigO Big Data já conquistou a graça de muitas corporações, principalmente depois da criação do Google e o melhor entendimento desta “união de dados”. Afinal, compilar informações se faz necessário para conseguir uma vantagem competitiva. Porém, hoje um dos grandes desafios é o que se faz com estes dados de maneira eficiente, sem que a produção de “lixo de dados” não seja maior ou mais cara financeiramente em relação aquilo que “se tira de proveito destes dados”.

Então, baseado em algumas dificuldades (em breve escreverei algo sobre isso), tem surgido um novo sistema de gerenciamento de dados, o Small Data. Estranhamente quando leio isso me volto ao passado (claro, passado só volta, rs) e me lembro do curso de ACCESS lá em 95 e me pergunto: Aquilo não era um Small Data?! Se for, então estamos pegando definições passadas e aplicando neste presente para o futuro.

Quais seriam as diferenças que definem o “melhor a ser utilizado”. Na minha visão AMBOS devem ser adotados, e não podemos de “cara” optar por um BIG DATA se ao menos não temos os nossos SMALL organizados ou já analisados. A “briga” constante que precisamos travar é: QUANTIDADE vs. QUALIDADE.

BIG DATA: Coletar, armazenar, processar um grande volume de dados não-estruturados que, posteriormente, deverão ser analisados através de ferramentas computacionais.

SMALL DATA: Pequena quantidade de dados coletados a fim de entender os detalhes das informações.

Os focos de cada tipo são diferentes, enquanto o primeiro foca na quantidade de informações coletadas e não separa a relevância delas, o segundo visa a qualidade dos dados, que podem ser melhor utilizados em estratégias rápidas.

Uma das diferenças é a forma de coletar os dados, sendo o BIG coletados em Cloud (Nuvem), diversos bancos de dados, monitoramento de cookies, entre outros. Já o SMALL procura focar em redes sociais, CRM, sistemas legados de empresas, pesquisas e entrevistas.

Uma diferença que impacta diretamente na boa utilização de um SMALL ou BIG DATA é o custo de armazenamento e processamento destes dados. Quando se fala de BIG estamos na casa PETABYTE (1 P = 1000000 GIGABYTE), já os SMALL os tamanhos são consideravelmente menores.

Atualmente minhas indagações quanto ao uso de dados passa por esta definição. Em muitos casos tenho analisado a aplicação inicial de um BIG DATA coletando informações gerais e dando insumos e direções para tratativas melhores em pequenos SMALL DATA.

A pergunta é: Será que esta é a melhor direção?

Em breve, escreverei mais sobre este assunto.

Enjoy!

 

Publicidade

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

Crie um site ou blog no WordPress.com

Acima ↑

%d blogueiros gostam disto: