O REACTION (Retrieval, Extraction and Aggregation Computing Technology for Integrating and Organizing News) é um laboratório de investigação criado pela convergência da Universidade do Texas, em Austin (EUA), pela Universidade Nova de Lisboa (UNL) e pelo Laboratório de Ciências da Informática e Inteligência Artificial da Universidade do Porto (LIACC).

O objetivo, desde o princípio, foi o de explorar as possibilidades no processamento de big data – isto é, bases de dados de grande dimensão e de consulta difícil. Naturalmente, a aplicação destes conceitos no plano do jornalismo foi natural. É assim que chegamos a um termo revitalizado – “database journalism”, agora “computational journalism” – a análise automática de conteúdos.

Quatro anos volvidos, o REACTION promoveu um encontro de Jornalismo Computacional, de maneira a apresentar o trabalho realizado e promover o debate entre estes dois campos de estudo: a informática e o jornalismo. Desde logo foi aparente a maneira como estas disciplinas se complementam. Enquanto os modelos matemáticos produzidos pelos cientistas informáticos visam minar a informação escondida em massas de dados densas, cabe aos peritos da comunicação procurar a narrativa subjacente à informação recolhida – encontrar a história.

Tendo sido um dia que se centrou na problemática de escrever programas capazes de interpretar a carga valorativa e emocional em frases construídas por humanos, é fácil ocorrermo-nos daquela citação do “Metropolis”, de Fritz Lang: “O mediador entre a cabeça e as mãos deve ser o coração”.

Os projetos

Alguns dos projetos encontram-se já numa forma bastante final e estiveram, durante o início da semana, disponíveis para consulta numa sala de demos. Ficam aqui alguns deles, disponíveis também online.

POPSTAR – Acrónimo para Public Opinion and Sentiment Tracking, Analysis and Research, o POPSTAR é uma plataforma que nos providencia gráficos em tempo real das menções, com ou sem carga valorativa, feitas nas redes sociais acerca de políticos. Com este enquadramento, a plataforma procura dar uma ideia das tendências de popularidade.

Socialbus – Disponível para descarga gratuita, o Socialbus pretende ser uma ferramenta de procura refinada para redes sociais, usando um processamento heurístico para, por exemplo, conseguir distinguir posts brasileiros de posts portugueses, ou decifrar calão/terminologia abreviada.

Sentilex-PT – Embora não seja um produto para utilizadores finais, o Sentilex foi, no entanto, o projeto com o âmbito mais alargado – visava construir um léxico de termos de sentimento na língua portuguesa, de maneira a permitir a análise do conteúdo valorativo que os outros projetos fariam aos conteúdos analisados. A eficiência deste léxico pode ser testada no Opinionizer.

Uma lista completa dos projetos pode ser consultada aqui.

As conferências

A primeira conferência do dia, ainda antes da apresentação por parte da direção do REACTION, ficou a cargo do jornalista da RTP Daniel Catalão. Reconhecido como o especialista em tecnologia e gadgets aplicados ao jornalismo daquela estação, Catalão começou por traçar um contínuo da história recente da tecnologia utilizada na transmissão de TV, culminando na utilização de estúdios “virtuais”, compostos por chroma key. Mas daí partiu para a problemática da audiência como fonte de notícias: a ubiquidade das câmaras dos telemóveis permitiu uma maior agilidade na recolha de imagens, mas criou problemas ao nível da fiabilidade dos conteúdos.

De seguida coube ao diretor Mário Silva fazer uma breve súmula do trabalho realizado pelo REACTION, nos seus quatro anos de existência. Destacando desde logo a natureza dinâmica do amplo grupo de trabalho, Mário Silva rendeu homenagem a todos os investigadores que já não fazem parte do REACTION.

Após uma breve explanação das avenidas de pesquisa do projeto, detalhou os principais problemas encontrados, destacando o difícil acesso a arquivos de notícias – que entretanto eles próprios já procuraram solucionar, com a criação do Big Corpus PT, um arquivo de sete meses de notícias online portuguesas. Mas o maior dilema foi ético e levantado já na sessão de perguntas e respostas. Será questionável criar ferramentas que permitam a agentes menos bem intencionados aglomerar as opiniões expressas em público?

Mário Silva distanciou-se, sublinhando que eles são os “good guys“, já que todo o código que produzem é disponibilizado gratuitamente e está ao alcance de qualquer um. Afirmou ainda que esta é uma tecnologia de ponta, neste momento, com mais potencial do que uso.

As apresentações seguintes prenderam-se com a mecânica das plataformas elaboradas até ao momento, cabendo a Arian Pascoali a apresentação do Socialbus e a Sílvio Moreira a explicação da construção do Sentilex (ver caixa). Sílvio Moreira continuou a linha da contenção de entusiasmo no que toca à analise de sentimento. Chegou mesmo a caracterizar esta área como “magia negra”, já que apenas se pensam ângulos sobre como chegar a uma automatização completa de análise de sentimento.

O aluno de doutoramento chegou mesmo a propôr uma nova técnica híbrida como uma solução melhor para o problema: machine learning através de dados anotados, isto é, programas que apenas analisam padrões consoante uma grelha de padrões de linguagem previamente configurados por humanos.

Da parte da tarde realizaram-se três videoconferências, duas delas com investigadores a desenvolver trabalho nos Estados Unidos. Matt Lease, que problematizou os processos necessários para a pesquisa de memes – expressões, passagens de texto repetidas – como uma ferramenta para a descoberta de fontes originais de dados na web; e Nicholas Diakopoulos, que na sua “From Tools to Algorithmic Accountability” analisou a questão do reverse engineering de algoritmos – ou seja, a tentativa de descortinar o modo de funcionamento de algoritmos através do seu uso.

Por fim, a terceira videoconferência e uma das últimas do dia coube ao investigador português e analista político Pedro Magalhães, que em “Social Media e Public Opinion” abriu um debate sobre que valores se poderão retirar de uma análise de mensagens nas redes sociais. Questões como o perfil dos utilizadores e as suas motivações para exprimirem ou reprimirem uma opinião foram pesadas como prós ou contras para encarar as redes sociais como uma fonte suficientemente funcional para a análise de opinião pública no domínio da política.