Conheça o Forensia, um software pronto para desmascarar arquivos de áudio falsos do WhatsApp

Verificando Os Fatos

Por Inferiorz Presents / Shutterstock

o dia mais longo para os adversários de Trump

Os verificadores de fatos geralmente reviram os olhos quando precisam verificar um arquivo de áudio extraído do WhatsApp. Eles sabem que é uma tarefa demorada e que faltam ferramentas para ajudá-los a chegar a um veredicto sobre a voz que ouvem. Esse cenário, no entanto, acaba de mudar. O Forensia está instalado e funcionando em Buenos Aires e pronto para trabalhar nas línguas saxônica e românica - mas não de graça.

Lançado pelo Laboratório de Pesquisa Sensorial (LIS), parte do Conselho Nacional de Pesquisa Científica e Técnica (Conicet) da Argentina, o Forensia é - como o nome sugere - um software forense usado para verificação de fatos pela primeira vez na semana passada.



No início do mês, a organização argentina de checagem de fatos Verificado viu um arquivo de áudio se tornar viral no WhatsApp e decidiu gastar 10.000 pesos (porque Chequeado é uma ONG nacional) em uma reportagem do LIS.

Laura Zommer, diretora da plataforma, ficou surpresa com os resultados obtidos por sua equipe e decidiu compartilhar essa experiência com a International Fact-Checking Network.

“Sempre recebemos muitos arquivos de áudio para verificação dos fatos e, embora sempre queiramos verificá-los, nunca pudemos fazer isso”, disse ela. “Forensia não é uma solução barata, mas definitivamente deve ser usada para verificar tópicos importantes e quando personagens importantes estão envolvidos.”

O caso que o Chequeado tinha em mãos na semana passada foi muito forte. No arquivo de áudio que eles queriam verificar, um político específico estava supostamente acusando toda a comunidade não branca de ter votado no kirchnerismo porque “negros * querem churrasco, vinho barato, cerveja, muita cerveja, maconha e cocaína”. Chequeado precisava confirmar se a voz ouvida era mesmo do deputado Guillermo Montenegro - como estava divulgando no WhatsApp e em outras redes sociais.

Jorge Gurlekian, o cientista pesquisador que dirige o LIS, recebeu o arquivo WhatsApp e pediu aos verificadores de fatos que fornecessem outros arquivos de áudio reais da voz de Montenegro. Ele conectou todos eles ao Forensia e, em alguns minutos, concluiu que havia poucas chances de aquela voz ser de Montenegro. Em uma escala que varia de -5 a +5, o clipe de áudio foi classificado como -1.

a que horas descobrimos quem é o presidente

“Em primeiro lugar, comparamos o arquivo questionado com aqueles que transmitem a verdadeira voz do candidato. Em seguida, comparamos o arquivo questionado a um enorme banco de dados de vozes e sons de pessoas que nasceram e vivem na região de origem do candidato ”, explicou Gurlekian. “Nossa resposta final nunca é binária. É uma probabilidade e sugerimos fortemente que os verificadores de fatos usem o Forensia como outra evidência de seu trabalho - assim como um juiz usa um teste de DNA. ”

Gurlekian estuda o reconhecimento de voz há décadas e há muito tempo ajuda as forças de segurança e o sistema judiciário de seu país. Ele agora está animado para ver que seu conhecimento - e sua ferramenta - podem servir na batalha contra a desinformação online.

“A minha equipa, composta por Miguel Martinez Soler, Pedro Univaso e eu, está 100% preparada para trabalhar com verificadores e experiências neste domínio”, afirmou. “Só precisamos ter em mente que alguns requisitos técnicos são necessários. Áudios questionados, por exemplo, devem ter pelo menos 15 segundos de duração para serem verificados e devem ser foneticamente complexos. Um arquivo onde você só ouve uma pessoa dizendo 'sim, sim, sim', por exemplo, não seria adequado para o Forensia. ”

O formato de arquivo perfeito para rodar no software é .wav, mas Gurlekian sabe que isso não é realista no universo das notícias falsas e está pronto para lidar com gravações do WhatsApp. Em cada arquivo são verificados cerca de 90 indicadores diferentes e a maioria deles nada tem a ver com o conteúdo do que está sendo dito, por isso a ferramenta pode lidar com muitos idiomas.

O Forensia pode ser licenciado e instalado em computadores, mas Gurlekian sugere que a comunidade internacional de checagem de fatos dê um passo de bebê por enquanto e permita que Gurlekian execute os testes.

Para compreender totalmente o relatório oferecido pelo software, é necessário algum treinamento. Também seria importante inserir bancos de dados locais de vozes no Forensia para ter um relatório mais preciso da máquina - e apenas Gurlekian e sua equipe podem fazer isso.

“Os países mais desenvolvidos do mundo já possuem bancos de dados públicos sobre o som das vozes dos cidadãos. Alguns deles estão até divididos em regiões e alguns desses bancos de dados são públicos. Mas outros não ”, disse Gurlekian.

O Forensia também pode apontar edições feitas em um arquivo e ajudar a identificar quando uma alteração foi feita em uma frase.

Então, quais são suas limitações?

homem morre de ataque cardíaco no trabalho

“A limitação pode ser o envelhecimento. A voz de meninos e meninas muda com o tempo. Se questionarmos um áudio gravado quando eles são jovens, precisaremos de exemplos de vozes reais daquela época para comparar e isso pode ser difícil. ”

* O termo usado em espanhol foi “los negros”. Isso geralmente se refere a comunidades não brancas, pobres e imigrantes.

Cristina Tardáguila é diretora associada da International Fact-Checking Network. Ela pode ser contatada em ctardaguila@poynter.org.