sexta-feira, 19 de abril de 2013

Quer vender dados? Pense de novo


Quer vender dados? Pense de novo.


Novo petróleo, é uma das expressões que se usa quando tentamos convencer alguém do valor do Big Data.

Qual a maneira certa de entender a comparação?

Quando Clive Humby usou a metáfora “novo petróleo” em 2006 para se referir ao Big Data, sem querer reforçou a crença de que os dados têm valor apenas pelo seu volume. Digo reforçou, porque isso aconteceria de qualquer modo, mesmo sem a ajuda de Humby. Na ânsia de conhecer a nossa riqueza, colocamos rapidamente etiquetas de valores em nossos ativos tangíveis, que podem ser vistos e contados, e muitas vezes esquecemos os intangíveis. Ver e avaliar ativos intangíveis ainda são competências raras.

Dados digitais podem ser contados e, embora não sejam tão concretos assim, é normal que qualquer um que administre um grande banco de dados, quando ouve falar que Big Data tem um valor inestimável, inicialmente se imagine sentado em cima de uma reserva de petróleo: perfurou, jorrou, vendeu, ficou rico.

É certo que o petróleo também não tem valor intrínseco, mas faz parte de cadeias produtivas que geram ativos tangíveis numa relação direta entre volumes. Portanto é fácil valorar o petróleo pelo valor dos produtos gerados.

Só que dados fazem parte da cadeia que gera um ativo intangível, o conhecimento, e não existe relação direta entre os volumes dessa cadeia. Uma grande quantidade de dados não gera necessariamente uma grande quantidade de conhecimento, simplesmente porque conhecimento não é valorado por quantidade.

Um ativo tangível aumenta seu valor quando é acumulado e poupado e para garantir que não vamos perdê-lo, o trancamos e protegemos. Um ativo intangível aumenta seu valor quando é distribuído e usado e para garantir que não vamos perdê-lo, o expomos e deixamos compartilhar.

Você até pode colocar cifrões em dados digitais, mas saiba que esses cifrões aumentam conforme eles passam por uma cadeia de agregação de valor que está de modo resumido na figura ao lado.    
         
Se você precificar os seus dados digitais brutos com o intuito de ficar rico, não vai encontrar interessados. Se você organizá-los e indexá-los, vai encontrar muitos interessados, mas ninguém que queira pagar para você enriquecer. Então você aplica modelos estatísticos e algoritmos para identificar padrões e correlações entre seus dados e começa a encontrar bons compradores, mas quem vai ficar rico são eles, se depois que comprarem suas informações conseguirem passar para a última fase da figura.

Como dá pra saber tudo isso? Pense por um momento na internet. Lembra que para encontrar alguma coisa na rede precisávamos do endereço completo? Lembra que as pessoas ditavam os endereços enfatizando coisas do tipo: “www” ou “educação sem cedilha e sem til” ou “Hotel Copacabana Palace tudo em minúsculo sem espaço". Que valor teria um monte de dados acumulados se só comandos muito específicos pudessem encontrá-los? Então apareceu o Google que fez um trabalho incrível indexando os dados e otimizando as buscas. Agora você pode escrever um endereço sem www, sem saber a grafia perfeita e usando maiúsculos ou minúsculos. O Google acha. Todo mundo adorou! Quanto você paga por isso? Nada. Quem paga por isso? Ninguém. E se você disser que o anunciante paga, eu lhe digo que não. O anunciante paga para vender para você. Se isso não acontecer ele deixa de pagar.

Atualmente o Google administra e controla (não possui!) uma quantidade incontável de dados que apresenta uma taxa de crescimento assustadora. Eles não podem vender os dados que administram porque não são proprietários deles. Mas eles não se importam. Se os dados tivessem valor intrínseco, já estaríamos vendo a empresa engajada numa batalha judicial pela posse deles. Mas o que vemos? O Google protegendo a “privacidade” de seus usuários. No entanto, pelo acordo que faz com seus clientes, a empresa pode usar os dados para criar novos produtos e serviços (leia-se criar algoritmos e fazer correlações entre os dados). Tudo leva a crer que os conhecimentos gerados pela análise desses dados geram renda à empresa.

Antes que pensem que estou recriminando o Google, quero afirmar que não vejo nada de errado nisso. Até onde sei, a empresa trabalha dentro da lei e de um código ético estabelecido e aceito por toda a sociedade. Além disso, acredito que todo trabalho de inteligência deve ser remunerado. Sabe-se, por exemplo, que em 2008 o Google utilizou dados de busca de seus usuários para construir um modelo preditivo que ajudou o governo americano a desenvolver um plano de ação para controlar a disseminação da gripe suína antes que ela se transformasse em pandemia. Imagino que o governo americano tenha sabido valorizar e remunerar esse trabalho.

Se você duvida que modelos preditivos feitos dessa maneira sejam confiáveis, veja o gráfico abaixo sobre casos de dengue no Brasil. A linha azul é a previsão do Google feita a partir de determinados termos consultados (por exemplo: febre, dengue, dor no corpo etc). A linha amarela representa os dados oficiais do Ministério da Saúde. Excelente modelo preditivo. Quanto vale? E tornar o modelo acionável, quanto valeria?


Portanto, precisamos resistir à tentação de colocar cifrões grandes demais nos dados. O que Humby quis dizer com a metáfora novo petróleo foi que, se no século XX a economia mundial não pôde prescindir do petróleo para crescer, no século XXI não poderemos ignorar o Big Data. Só isso. Nem de longe o modelo de negocio de um se assemelha ao do outro.

Nenhum comentário:

Postar um comentário