Categorias
Big data

Big Data: a nova commodity – Parte 1

Antes de tudo é preciso saber a diferença entre dado e informação. Enquanto os dados são meros números, caracteres ou fatos não processados, a informação é resultado da analise e processamento desses dados criando sentido para os mesmos.

Ou seja, a informação surge a partir da análise e processamento dos dados. Essa informação, por sua vez, gera conhecimento que serve de base para a tomada de decisão das empresas, indústria e governo.

Definição de Big Data

Big Data pode ser representado como uma enorme quantidade de dados dos mais variados tipos. Em outras palavras, refere-se à capacidade de armazenamento e de processamento de um número imensurável de informações distintas entre si.

big data

Existem vários tipos de dados. Nossos dados pessoais, por exemplo, como nome, idade e estado civil, podem ser considerados dados, pois isoladamente não constituem uma informação.

Além disso, o Big Data está relacionado a área do conhecimento que estuda como tratar, analisar e obter informações a partir desse grande conjunto de dados. Ou seja, gerar valor e informações úteis a partir de dados brutos.

O conceito de Big Data se divide em 5 V’s:
  • Volume, devido ao gigantesca quantidade de dados;
  • Velocidade, ligada à velocidade de produção dos dados;
  • Variedade, relacionada aos diferentes tipos de dados;
  • Veracidade, atrelada aos dados verídicos e atualizados e;
  • Valor, sendo este gerado após o processamento e análise.

5 Vs do big data

Resumindo, Big Data nada mais é do que uma gigantesca quantidade de dados que ao serem processados e analisados produzem informações valiosas que servem de base para a tomada de decisão.

Ademais, o Big Data pode trabalhar com dados estruturados, não estruturados e semiestruturados. Dados estruturados são aqueles organizados por um padrão fixo como o banco de dados.

Por outro lado, os dados não-estruturados não possuem estrutura de organização rígida, sendo totalmente desestruturados como as fotos, áudios e vídeos.

Já os dados semiestruturados estão no meio termo. Estes possuem algumas características consistentes e definidas, mas não apresentam uma estrutura rígida como os dados estruturados. O arquivo XML é um exemplo.

Um grande potencial

Ao longo do tempo, a quantidade de dados gerados vem crescendo exponencialmente. Esse fenômeno se deve, principalmente, ao surgimento da rede mundial de computadores e à internet das coisas (IoT).

Essas invenções permitem a criação e compartilhamento de dados e informações de forma bastante facilitada. Para se ter uma ideia, atualmente geramos mais de 40 trilhões de Gigabytes de dados diariamente.

Toda vez que você navega na internet, posta fotos ou vídeos em redes sociais há a produção de dados. Adicionalmente, as empresas, indústrias e governo produzem dados durante a execução de suas atividades. Ou seja, é dado que não acaba mais!

Agora imagine quantas informações valiosas podem ser extraídas dessa imensidão de dados. São infinitas possibilidades!

A partir da análise desses dados pode-se obter tendências de mercado, padrões de comportamentos, realizar o diagnóstico atual de uma empresa ou até mesmo fazer previsões por meio da análise preditiva.

Tudo isso ajuda as empresas, indústrias e governo a tomarem decisões mais inteligentes, aumentar a produtividade e efetividade das suas ações. Além disso, contribui para a redução dos custos e das chances de tomar uma decisão errada.


Percebeu o grande potencial do big data e da análise desses dados?

Na parte 2 veremos como podemos aplicá-los na engenharia.

Postagens Relacionadas