O que os pesquisadores podem encontrar entre os 32 milhões de URLs que o Facebook acaba de lançar para a Social Science One?

Verificando Os Fatos

Por Sergey Nivens / Shutterstock

Ciências Sociais Um , a comissão sem fins lucrativos lançada em 2018 para estabelecer parcerias concretas entre acadêmicos e instituições ricas em dados como o Facebook, agora tem 32 milhões de links individuais extraídos da rede de mídia social de Mark Zuckerberg para realizar pesquisas.

Após um atraso inesperado de quase um ano, algo que criou um chateado com os fundadores do projeto, a coalizão de pesquisadores finalmente recebeu do Facebook o que é considerado “um dos maiores conjuntos de links já criado para pesquisa acadêmica. ”



a ideia do sonho americano está mais intimamente relacionada a qual dos seguintes?

Pelo menos foi o que Solomon Messing, ex-diretor do Laboratório de Dados do Pew Researcher Center e agora gerente de ciência de dados da Social Science One, disse ao IFCN.

Agora, equipes de pesquisadores selecionados em todo o mundo poderão usar o conjunto de dados para identificar tendências, padrões e tópicos populares no mundo do conteúdo do Facebook.

De acordo com a plataforma, o conjunto de dados inclui o número de vezes que os URLs foram compartilhados publicamente, a data em que foram compartilhados pela primeira vez, a data em que foram verificados pela primeira vez, o país em que foram mais compartilhados e um resumo do conteúdo real contido no URL.

Também inclui dados sobre a interação do usuário, incluindo o número de vezes que um URL foi sinalizado por um usuário como contendo notícias falsas e o número de vezes que um URL foi compartilhado sem ser realmente clicado.

O Facebook disse que selecionou esses pontos de dados porque são amplamente considerados indicadores de desinformação. A partir de agora, os pesquisadores podem usá-los para entender o tipo de tópicos que dominam na plataforma ou para criar modelos de aprendizado de máquina baseados nesses padrões.

Para acessar o conjunto de cerca de 32 milhões de URLs, os acadêmicos devem ter seus projetos aprovados pela comissão Social Science One. As propostas aceitas podem receber financiamento, dados e outros benefícios. E todos os artigos resultantes podem ser publicados de acordo com os desejos do pesquisador, sem quaisquer restrições adicionais do Facebook ou da comissão.

“Continuamos disponibilizando dados adicionais de forma a proteger a privacidade das pessoas”, disse Messing. “Este conjunto de dados permitirá que os pesquisadores respondam a questões importantes sobre a desinformação e o papel das mídias sociais na sociedade.”

As expectativas são altas.

Atraso na entrega de dados

Em abril de 2018, quando o Facebook anunciado estava fazendo parceria com acadêmicos para fornecer-lhes dados valiosos para a pesquisa de desinformação, previa-se que esses conjuntos de dados tire algum tempo preparar. Mas não tanto.

Em agosto, Buzzfeed News relatado os financiadores do Social Science One, incluindo o Fundo para a Democracia, a Fundação William e Flora Hewlett, a Fundação John S. e James L. Knight, a Fundação Charles Koch e a Rede Omidyar estavam ameaçando desistir do projeto devido ao atraso.

De acordo com o relatório, eles deram ao Facebook um prazo de 30 de setembro para compartilhar os conjuntos de dados que havia prometido ou o projeto seria encerrado.

Em janeiro, no entanto, a Social Science One notificou em um blog que o Facebook precisaria de mais tempo para lançar um conjunto de dados de URL citando questões de privacidade.

homem sofre ataque cardíaco em grupo selfie

“O Facebook não só deve cumprir o novo Regulamento Geral de Proteção de Dados da União Europeia, bem como leis de privacidade semelhantes em jurisdições ao redor do mundo, mas também deve cumprir o decreto de consentimento do Facebook com a Comissão Federal de Comércio dos EUA”, a postagem do blog leitura. “Devido à natureza sem precedentes do nosso projeto, o Facebook está se movendo lentamente e com cautela para garantir que nosso projeto esteja em conformidade com todas as diretrizes legais relevantes.”

O conjunto de dados foi lançado em meados de setembro, pouco antes do prazo que o Buzzfeed informou.

que ganhou o prêmio Pulitzer de ficção em 1988

Como as questões de privacidade foram gerenciadas?

De acordo com o Facebook, a privacidade diferencial foi adicionada aos URLs que entraram no conjunto de dados. Isso significa que a contribuição de qualquer indivíduo para os dados foi mascarada.

O Facebook disse que caracterizou a privacidade diferencial como um “ruído estatístico” adicional que fornece às pessoas uma camada extra de proteção e as mantém protegidas contra ataques cibernéticos.

Que pesquisa é viabilizada por este conjunto de dados?

Uma versão anterior do conjunto de dados de URL, que foi disponibilizado para pesquisadores aprovados por meio da plataforma de monitoramento social CrowdTangle, já foi usada em um estudar sobre o comportamento coordenado de compartilhamento de links inautêntico na preparação para as eleições europeias de 2019 na Itália.

Agora, os pesquisadores poderão usar o conjunto de dados completo para entender melhor quais tipos de conteúdo e tópicos são predominantes no Facebook. Eles serão capazes de identificar padrões no que é compartilhado ao longo do tempo e podem construir modelos de aprendizado de máquina que identificam informações incorretas.

O Facebook disse que os pesquisadores há muito estão cientes da necessidade de um conjunto de dados grande e diversificado para treinar esse modelo de aprendizado de máquina. Este conjunto de dados de URL está entre os maiores existentes, com 7 gigabytes contendo aproximadamente 32 milhões de URLs e cerca de 544 milhões de valores de células.

Os acadêmicos podem ser capazes de identificar como o conteúdo de tendências está relacionado a eventos políticos e lançamentos de produtos no Facebook. Outros possíveis tópicos de estudo incluem como a polarização, os políticos e os ciclos de notícias desempenham um papel na disseminação de desinformação na plataforma.