Big Data é como um imenso oceano de dados que fica mais cheio a cada dia. Geramos diariamente 2,5 quintilhões de dados, o equivalente a dois Museu do Louvre. E como você já deve ter ouvido por aí, dados são o novo petróleo, um recurso natural valioso para as organizações. Por isso, tem muita gente interessada em explorar esse mar de informação.
Só que para vasculhar essas águas é preciso investir em tecnologia, como algoritmos de inteligência artificial (IA). Esses recursos possibilitam, por exemplo, uma análise precisa de gostos e hábitos dos consumidores. As informações coletadas podem ser usadas para criação de produtos, serviços e experiências mais refinados e personalizados para cada cliente.
“Coincidentemente”, as empresas mais bem posicionadas no ranking das 500 marcas mais valiosas do mundo da consultoria Brand Finance, investem em Big Data. Estão no top 5 da lista: Amazon, Google, Apple, Microsoft e Samsung.
IA e Big Data
Além disso, a análise de dados por inteligência artificial pode ajudar seres humanos a tomar decisões melhores e mais rápidas. Nos hospitais de Nova York, por exemplo, todas as cirurgias feitas pelos médicos são registradas em um imenso banco de dados.
Fazendo uma análise dessa base, a IA pode dizer: y% dos médicos que fizeram esse protocolo z, tiveram a seguinte taxa de sucesso e assim sucessivamente com os demais protocolos.
Com essas informações, o médico tem subsídios para decidir qual protocolo realizar, sabendo ainda quais problemas podem ocorrer e que tipos de medicamentos utilizar. Isso garante mais agilidade e assertividade na escolha do procedimento.
Um pouco de história
Ao contrário do que muita gente pensa, o Big Data não é algo tão novo assim: o termo foi criado em 1997, mas o conceito de usar os dados para encontrar soluções foi utilizado já em 1663 pelo demógrafo inglês John Graunt, durante o surto de peste bubônica — momento muito semelhante ao que estamos vivendo… Ele usou estatísticas de mortalidade para alertar sobre o aparecimento e propagação da peste bubônica em Londres.
É bom saber
O conceito de Big Data engloba 5 Vs:
são todas as interações que ocorrem no mundo digital. Para você ter uma ideia, nesse volume estão inclusas as transações financeiras, as bancárias no e-commerce, todos os trâmites em uma empresa, todos os novos cadastros de alunos de uma universidade, pesquisas científicas, buscas, arquivos e planilhas geradas… isto é, tudo o que passa pelo mundo virtual.
muito rápida, porque temos infinitas ferramentas! Uma boa medida é o número de vezes que olhamos para o nosso celular — em média, 150 vezes por dia. E em todas elas são produzidas informações, independentemente da situação.
se esses dados forem organizados, eles permitem obter valor — isto é, o que é extraído e possa ser entendido como “informação importante”, a que gera conhecimento para que as empresas, por exemplo, transformem em algo diferenciado para seus clientes.
qual a diferença entre um extrato bancário e algo publicado em qualquer mídia social? O primeiro tem uma alta veracidade, pois as informações ali contidas podem ser facilmente comprovadas e autenticadas. Já a segunda… Como há um volume enorme, aliado à alta velocidade, nem sempre dá para comprovar a “reputação” dessa informação ou a autenticidade de um dado com a mesma rapidez com que ela se espalhou. E é aí que mora o perigo das fake news…
dentro da diversidade enorme de dados, podemos classificá-los em dois grupos: os estruturados e os não estruturados.
Estruturados: aqueles que já possuem um formato. Exemplo: a declaração do Imposto de Renda. O aplicativo determina quais os campos que devem ser preenchidos, com definições claras e suas especificidades, bem organizado (bens 1, bens 2). Outro exemplo: folha de pagamento (descreve aulas dadas, valor de cada hora, descontos, benefícios etc.).
Desestruturados: tudo aquilo que escrevemos principalmente nas mídias sociais, assim como as nossas interações (likes, emojis), postagens de fotos, figurinhas, gifs etc. Atualmente, 80% dos dados são desestruturados.
Consultamos José Aníbal Ferreira, coordenador da Pós-Graduação em Big Data e Inteligência de Marketing da ESPM, realizada em parceria com a IBM.