Quer vender dados? Pense de novo.
Novo petróleo, é uma das expressões que se usa quando tentamos convencer alguém do valor do Big Data.
Qual a maneira certa de entender
a comparação?
Quando Clive Humby usou a
metáfora “novo petróleo” em 2006 para se referir ao Big Data, sem querer
reforçou a crença de que os dados têm valor apenas pelo seu
volume. Digo reforçou, porque isso aconteceria de qualquer modo, mesmo sem a
ajuda de Humby. Na ânsia de conhecer a nossa riqueza, colocamos rapidamente etiquetas
de valores em nossos ativos tangíveis, que podem ser vistos e contados, e
muitas vezes esquecemos os intangíveis. Ver e avaliar ativos intangíveis ainda
são competências raras.
Dados digitais podem ser contados
e, embora não sejam tão concretos assim, é normal que qualquer um que administre
um grande banco de dados, quando ouve falar que Big Data tem um valor
inestimável, inicialmente se imagine sentado em cima de uma reserva de petróleo:
perfurou, jorrou, vendeu, ficou rico.
É certo que o petróleo também não
tem valor intrínseco, mas faz parte de cadeias produtivas que geram ativos tangíveis
numa relação direta entre volumes. Portanto é fácil valorar o petróleo pelo
valor dos produtos gerados.
Só que dados fazem parte da cadeia
que gera um ativo intangível, o conhecimento, e não existe relação direta entre
os volumes dessa cadeia. Uma grande quantidade de dados não gera
necessariamente uma grande quantidade de conhecimento, simplesmente porque
conhecimento não é valorado por quantidade.
Um ativo tangível aumenta seu
valor quando é acumulado e poupado e para garantir que não vamos perdê-lo, o trancamos
e protegemos. Um ativo intangível aumenta seu valor quando é distribuído e usado
e para garantir que não vamos perdê-lo, o expomos e deixamos compartilhar.
Você até pode colocar cifrões em
dados digitais, mas saiba que esses cifrões aumentam conforme eles passam por
uma cadeia de agregação de valor que está de modo resumido na figura ao lado.
Se você precificar os seus dados
digitais brutos com o intuito de ficar rico, não vai encontrar interessados. Se
você organizá-los e indexá-los, vai encontrar muitos interessados, mas ninguém
que queira pagar para você enriquecer. Então você aplica modelos estatísticos e
algoritmos para identificar padrões e correlações entre seus dados e começa a
encontrar bons compradores, mas quem vai ficar rico são eles, se depois que
comprarem suas informações conseguirem passar para a última fase da figura.
Como dá pra saber tudo isso? Pense
por um momento na internet. Lembra que para encontrar alguma coisa na rede
precisávamos do endereço completo? Lembra que as pessoas ditavam os endereços
enfatizando coisas do tipo: “www” ou “educação sem cedilha e sem til” ou “Hotel Copacabana Palace tudo em
minúsculo sem espaço". Que valor teria um monte de dados acumulados se só comandos muito
específicos pudessem encontrá-los? Então apareceu o Google que fez um trabalho
incrível indexando os dados e otimizando as buscas. Agora você pode escrever um
endereço sem www, sem saber a grafia perfeita e usando maiúsculos ou minúsculos.
O Google acha. Todo mundo adorou! Quanto você paga por isso? Nada. Quem paga
por isso? Ninguém. E se você disser que o anunciante paga, eu lhe digo que
não. O anunciante paga para vender para você. Se isso
não acontecer ele deixa de pagar.
Atualmente o Google administra e controla
(não possui!) uma quantidade incontável de dados que apresenta uma taxa de
crescimento assustadora. Eles não podem
vender os dados que administram porque não são proprietários deles. Mas eles
não se importam. Se os dados tivessem valor intrínseco, já estaríamos vendo a
empresa engajada numa batalha judicial pela posse deles. Mas o que vemos? O
Google protegendo a “privacidade” de seus usuários. No entanto, pelo acordo que
faz com seus clientes, a empresa pode usar os dados para criar novos produtos e
serviços (leia-se criar algoritmos e fazer correlações entre os dados). Tudo
leva a crer que os conhecimentos gerados pela análise desses dados geram renda
à empresa.
Antes que pensem que estou
recriminando o Google, quero afirmar que não vejo nada de errado nisso. Até onde
sei, a empresa trabalha dentro da lei e de um código ético estabelecido e aceito
por toda a sociedade. Além disso, acredito que todo trabalho de inteligência
deve ser remunerado. Sabe-se, por exemplo, que em 2008 o Google utilizou dados
de busca de seus usuários para construir um modelo preditivo que ajudou o
governo americano a desenvolver um plano de ação para controlar a disseminação
da gripe suína antes que ela se transformasse em pandemia. Imagino que o governo
americano tenha sabido valorizar e remunerar esse trabalho.
Se você duvida que modelos
preditivos feitos dessa maneira sejam confiáveis, veja o gráfico abaixo sobre
casos de dengue no Brasil. A linha azul é a previsão do Google feita a partir
de determinados termos consultados (por exemplo: febre, dengue, dor no corpo
etc). A linha amarela representa os dados oficiais do Ministério da Saúde. Excelente
modelo preditivo. Quanto vale? E tornar o modelo acionável, quanto valeria?
Portanto, precisamos resistir à
tentação de colocar cifrões grandes demais nos dados. O que Humby quis dizer
com a metáfora novo petróleo foi que,
se no século XX a economia mundial não pôde prescindir do petróleo para
crescer, no século XXI não poderemos ignorar o Big Data. Só isso. Nem de longe
o modelo de negocio de um se assemelha ao do outro.
Nenhum comentário:
Postar um comentário