Dados Abertos e visualização de informação: mais ou menos Estado?

César Hidalgo, um professor do MIT, escreveu um post interessante na Scientific American sobre os problemas com os portais públicos de Open Data.

O argumento-chave é o de que pode existir uma “vasta quantidade de informação útil nos sites governamentais [portais de dados abertos] mas, muitas vezes, é impossível extrair algum sentido dessa informação“.

O ponto é reforçado com uma analogia em que compara os portais de open data (dados abertos) com um supermercado onde todos os produtos estão dentro de caixas que, por fora, são absolutamente indistinguíveis, tornado o processo de recolha e análise de informação muito difícil.

A partir daqui o texto segue para a promoção do DataUSA, um projecto em que o MIT colaborou com a Deloitte e a Datawheel, e que consiste num portal que utiliza open data para criar visualizações de informação e explorar conjuntos de dados de forma incrivelmente apelativa. “Se os sites de open data fossem o IKEA”, argumenta Hidalgo, “nós construímos o segundo piso” (que suponho ser aquela parte de showroom onde as pessoas se podem sentar nos sofás mas só devem andar num sentido).

O DataUSA é um projeto muito interessante, com resultados visualmente espectaculares (talvez um pouco menos consistentes no campo da experiência de utilização), e um excelente exemplo daquilo que se pode fazer com informação do sector público. Mas apresentá-lo como um argumento contra a utilidade dos portais de dados, ou as suas funcionalidades de repositório, é acertar um pouco ao lado.


É verdade que a grande maioria dos portais de dados abertos (e o dados.gov não é excepção) têm problemas de organização de informação ou de usabilidade. Há muito trabalho a ser feito nas áreas da categorização da meta-informação, normalização taxonómica e harmonização de catálogos (um trabalho que não deve ser dissociado de uma intervenção transversal e estratégica na arquitectura TIC da Administração Pública). Também no front-end, nas componentes da interface e da usabilidade, à medida que cresce o número de datasets, começa a ser claro que os sistemas clássicos de navegação e pesquisa também têm limitações. A solução não é acabar com elas, mas sim tornar essas formas de exploração da informação mais inteligentes (há mais paradigmas de pesquisa de informação do que aquele que o Google lançou em 2003). A resolução do problema passará por publicar melhor, não por visualizar melhor.

Além disto, também é importante que se não se perca de vista o princípio de disponibilizar os dados em bruto. Os dados abertos do Estado não são o piso 0 do armazém do IKEA. São a matéria-prima sob a qual podem ser construídos os IKEA (ou as Moviflores, ou as oficinas artesanais…) do mundo digital. A questão não deve ser substituir as prateleiras e caixas do supermercado por showrooms, mas sim criar melhores caixas, e organizar os catálogos e as prateleiras de forma mais inteligente. Pela razão óbvia de ser impossível para o Estado conseguir criar showrooms para todos os dados. Uma coisa é publicar dados, ou disponibilizá-los ao público, outra é construir mecanismos de visualização de dados (com ou sem APIs para aceder aos dados directamente). O Estado pode fazer as duas coisas (sobretudo em áreas relacionadas com estatísticas oficiais, transparência e outros dados de utilidade pública), mas na base deverá sempre estar a parte da disponibilização de dados em bruto.

O exemplo da Pordata

Na realidade portuguesa, e sendo um assunto que surge bastantes vezes em apresentações que faço sobre o dados.gov, a Pordata é um exemplo interessante quando pensamos nestas questões. A Pordata, Base de Dados de Portugal Contemporâneo, é um portal privado que disponibiliza informação estatística de forma apelativa e útil, de uma série de fontes oficiais diferentes. Muitas vezes perguntam-nos se o dados.gov “quer ser” uma espécie de Pordata. A resposta imediata é obviamente que não, dados abertos não são sinónimos de estatística, e, mais uma vez, a principal vocação de um portal de dados abertos não é apresentar informação ao público geral.

O verdadeiro objectivo do dados.gov é possibilitar o acesso ao tipo de informação que alimenta a Pordata, e que vem, na grande maioria, de fontes oficiais do Estado (cujo acesso é facilitado por uma rede de contactos que não está ao alcance de qualquer um). Um portal público de dados abertos deve assegurar que todos aqueles dados estatísticos e informação em bruto, que a Pordata processa para criar os seus gráficos e tabelas, estão disponíveis sem quaisquer restrições ou limitações de uso através de mecanismos automáticos. O objectivo do dados.gov é permitir que qualquer pessoa, grupo ou entidade, crie a(s) sua(s) Pordatas da forma que entender melhor. É aqui que está a verdadeira abertura, é aqui que todos ganhamos.

Leave a Reply

Your email address will not be published. Required fields are marked *