Open data não é bandeira.
No final da década de 80, uso intensivo dos computadores gerou uma
preocupação muito natural entre os filósofos: que impacto isso teria no
conhecimento?
O filósofo francês Jean-François Lyotard, por exemplo, afirmou que o
conhecimento seria armazenado em bancos de dados, permitindo seu deslocamento,
concentração e comercialização, o que ele chamou de mercantilização do
conhecimento.
Lyotard percebeu muito bem que informações digitalizadas viajam facilmente
e fez um prognóstico: a mobilidade dos dados digitais resultaria num
movimento de concentração do conhecimento.

De 80 para cá, dados e informações digitais têm
aumentado em progressão geométrica e a internet ampliou
consideravelmente as possibilidade de deslocamento das informações.
Se todas as condições existentes na época de Lyotard continuam existindo
e até se potencializaram, por que a sua previsão (concentração e mercantilização
do conhecimento) não se concretiza?
O
primeiro motivo é simples e independe de contexto. Conhecimento é o ato de
atribuir ideia ou noção às informações. Ou seja, é um ato humano e
contextualizado. Experiência única, baseada em outras experiências únicas que
não podem ser armazenadas. Por mais detalhada que seja a descrição de um
determinado conhecimento, ela será sempre, no máximo, um conjunto de
informações.
Como
tenho que admitir que pode ter havido um erro de interpretação ou de tradução
das palavras de Lyotard, passemos para o motivo mais importante.
O
deslocamento das informações digitais, não obedeceu ao movimento concentrador previsto. Ao
contrário, a internet propiciou, além de facilidade e rapidez, uma desconcentração
da informação que, guardadas as proporções, só tem precedente com a invenção da
prensa no século XV.
Juntando
tudo isso, temos um contexto extremamente inóspito para concentração de
conhecimento:
informações
digitais viajam facilmente + internet espalha informação
(e não concentra) + conhecimento é gerado atribuindo ideias a dados e
informações (e não os possuindo)
Por que toda facilidade que a internet propicia
na mobilidade das informações favorece a desconcentração da informação e não a
concentração? Existem mecanismos restritivos altamente confiáveis para negar
acesso às informações na rede, o que favorece a
concentração. Por que eles não são sempre utilizados?
Porque, se o conhecimento é gerado a partir de dados, então quanto maior a quantidade, diversidade e veracidade dos
dados existentes, maiores as chances de inovação. Como é impossível que um
único agente de pesquisa gere sozinho uma base de dados com essa qualidade, a
noção da necessidade dos dados not invented here torna-se
óbvia.
Isso não
é novidade da era digital muito menos da era Big Data. A comunidade
científica sempre trabalhou no modelo de compartilhamento de dados
porque gerar conhecimento a partir de dados é o core das suas
instituições. Todo o foco é na busca de soluções, então todo o processo se
ajustou para esse fim.
Além
disso, todo cientista sabe que a capacidade de atribuir ideias aos dados é
humana e contextualizada (por isso não tem medo de perder poder compartilhando)
e que todo conhecimento é gerado em cima de uma base de conhecimento
anterior (então, não importa de onde vem, quanto maior a base existente,
melhor).
Se você pensava que o movimento Open Data é recente vai se surpreender ao saber que o conceito já fazia parte das normas Mertonianas da ciência moderna definidas em 1942 e foi utilizado formalmente pela primeira vez na década de 50, num projeto internacional sobre geofísica.
Por
extensão do raciocínio, não é difícil entender que foi na esfera cientifica que
surgiram os primeiros insights sobre Big Data. Com uma visão open a visão do Big Data é mais intuitiva e possível.
Nesse modelo a inovação se descentraliza, transcendendo limites geográficos e de expertise. Já é possível visualizar uma queda das barreiras que asseguravam a primazia de certos países em algum campo específico do conhecimento e também a perda de exclusividade de algumas profissões em suas respectivas áreas de atuação.

Na extrapolação das competências profissionais, uma visita ao site da organização XPrize mostrará pessoas atuando bem longe das suas competências profissionais, ajudando a resolver problemas crônicos de saúde, alimentação, poluição, educação, energia entre outros.

Todos os exemplos citados são de
organizações sem fins lucrativos (pesquisa, ONGs e governos).
Como as empresas com fins lucrativos estão se posicionando?
Em sua
maioria, grandes empresas têm aderido parcialmente à ideia do Big Data,
utilizando apenas a grande quantidade de dados transacionais que possuem. Aos
poucos estão descobrindo que perdem muito em qualidade preditiva se não
adicionam dados externos.

Claro que o capital ambiental de uma empresa competitiva é bem diferente
do de instituições sem fins lucrativos, no entanto, partindo do princípio de
que conhecimento e inovação ocorrem por atribuição de ideias e não por
algoritmos, talvez um business open data não seja tão
desastroso assim.
Mas se você quer fazer as contas, veja isso: dados transacionais restritos
provocam assimetria de informação que explica boa parte de um dos custos mais
curiosos e intrigantes da Teoria das Agencias: o custo de transação.
Como esse texto já está bem grande, deixemos as contas pra semana que
vem.
É muito raro (na verdade não me lembro de ter lido isto alguma vez) alguém conseguir mostrar com tanta clareza porque o conhecimento precisa de ar fresco e liberdade para se desenvolver. Um ambiente fechado tira o oxigênio que ele precisa para crescer... E a internet só fez potencializar a criação deste ambiente mais aberto! Muito bom e já estou curioso para ler a continuidade...
ResponderExcluirPenso que temos ainda muito ruído com esse conceito de "open data", pois daí só constroi música a mente privilegiada.
ResponderExcluirA mente que conseguiu romper as barreiras de linguagem, que conhece as fundo os algorítmos relevantes nesses cenários e que possue a capacidade de reconstrução do significado da informação assente nos dados.
Só mentes privilegiadas construirão novos significados partindo das dissimuladas pistas soterradas nos dados que a maioria chama de informação.
Como diria um amigo meu, ..open data para quem, cara pálida?