Formado no Instituto Superior de Engenharia do Porto (ISEP) e membro do GECAD (Grupo de Investigação em Engenharia do Conhecimento e Apoio à Decisão) do mesmo instituto desde 1995, Nuno Silva foi premiado com o Best Paper Award da edição deste ano do Eurographics/IEEE VGTC Symposium on Visualization, um importante evento internacional de visualização de conteúdos, que se realizou na Holanda.

O sistema premiado permite a visualização de conteúdos em termos gráficos, em oposição a uma lista de dados expostos sem significado.

Podia descrever-nos o âmbito do artigo?

O artigo tem como objectivo a redução do trabalho de um utilizador da internet na visualização de informação, nomeadamente da informação que está em tabelas. Os valores, que poderão ser numéricos ou alfa-numéricos, não dizem absolutamente nada ao computador, que é incapaz de perceber o significado daqueles dados, apenas os aceita.

Os computadores estão aqui para substituir o papel. Ora, são muito mais caros, por isso se o computador não serve para processar informação por nós, não serve para nada. E é sobre isso que estamos a trabalhar, para permitir que o utilizador compreenda a tabela que está a ver, para que possa retirar dela aquilo que procura.

Pode exemplificar?

Um exemplo seria depararmo-nos com uma tabela de classificações do campeonato de futebol e o utilizador querer obter a relação entre as equipas no que toca a cartões amarelos.

O que nós fizemos para este trabalho foi um método para apresentar tabelas em termos gráficos, enfatizando determinadas dimensões de cada tabela. De maneira a ser possível interrelacionar estes dados, tivemos que capturar o significado daquela página, daquela tabela. O que acontece é que alguém vai criar a descrição da informação da página. E quando criamos esta descrição da informação, estamos a criar meta-informação, que é a semântica da informação. É isso que é a web semântica.

Aceita o rótulo “Web 3.0” para estes avanços?

Completamente, isto é Web 3.0, retirar conhecimento de factos sintácticos. A tabela é sintáctica: são algarismos, palavras. Quando se extrai informação com semântica para o interior da aplicação, aquilo passa a dizer alguma coisa ao computador, de tal forma que a informação começa a fazer sentido.

Entre as várias teorias sobre o caminho que a web semântica irá seguir, uma apoia-se na Web 2.0 e na base de dados criadas pelas redes sociais, e outra na criação de uma espécie de inteligência artificial, em que os computadores extraem automaticamente conhecimento de um dado sintáctico. Qual destas “avenidas” lhe parece a mais viável?

As duas parecem-me perfeitamente conciliáveis e complementares. Acho mesmo fundamental que as duas se interliguem. Os utilizadores participam cada vez mais na web: escrevem, fazem tagging [etiquetagem], opinam até mais não. E apesar de isto trazer um problema de filtragem, o conhecimento está lá, é a inteligência global. Se conseguirmos explorar isto, começamos a demarcar tendências, padrões nas ilhas, nas tribos. Depois de feito o mapeamento, é uma questão de interrelacionar o termo A com o termo B, que até são parecidos, e se calhar se referem à mesma coisa. Começaríamos assim a poder fazer pontes semânticas entre as comunidades. Mas surge-nos de novo o problema das regras: é necessário ter a certeza que o termo X significa de facto aquilo que nós dizemos que significa.

Mantendo-se esse problema, parece-lhe possível manter a construção da Web 3.0 nas mãos do utilizador comum, ou seria necessário passar o controlo desta para entidades avalizadas?

Não. Qualquer pessoa pode, e deve continuar a poder, dizer o que lhe apetece. Temos é que criar mecanismos em que as pessoas digam o que quer que seja mas que fique representado de uma forma formal.

Há conceitos a ser desenvolvidos, nomeadamente microformatos [“conjuntos de pequenas especificações que têm como objectivo elevar o valor semântico das páginas“] ou o “friend of a friend” (que é algo utilizado nas redes sociais mas que pode ser formalizado de maneira a que o computador o compreenda). Calculando o grau de proximidade entre duas pessoas é possível extrapolar a veracidade ou não do que uma diz sobre a outra. Mas não acho possível as pessoas poderem ser retiradas desta construção, até porque as empresas dependem do dinheiro da publicidade online. A Internet somos nós.

O programa que criaram para a elaboração do artigo científico, o SemViz, vai ser algo para aprofundar ou serviu apenas para ilustrar os conceitos que queriam apresentar?

Ainda há muito trabalho a fazer. No entanto, já serviu o seu propósito. Owen Gilson, meu orientando e co-autor do artigo, já voltou para a Universidade de Swansea, no Reino Unido. Ele ocupava-se da parte de visualização e, por isso, teríamos que encontrar alguém com essas competências. Por isso, fazia mais sentido o programa ter sido mais desenvolvido quando ainda havia aquelas sinergias. Mas este trabalho insere-se num percurso do qual poucas vezes me desviei e que vou continuar a percorrer.