Vigilância em redes, Mark Zuckerberg e viés de confirmação

Muitas pessoas acreditam que Mark Zuckerberg vigia todos os usuários (mais ou menos 900 milhões de pessoas e contando) todo o tempo, 24/7, o que eles escrevem, comentam, falam ou mesmo pensam. E que filtra esse volume de dados (dezenas de peta-petabytes de dados diários) para encontrar palavras chave (nesse sentido, toda palavra dita ou escrita ou pensada é uma chave para algo tão genérico) de forma a responder imediatamente, ou em alguns dias, com anúncios de clientes da ferramenta Facebook.

Eu penso que é preciso considerar 3 pontos chave nessa questão. Primeiro, é possível? Segundo, temos evidências de que isso ocorre? Terceiro, essas evidências são sólidas, confiáveis, científicas ou se baseiam na forma em que nossa mente funciona?

Não parece haver impedimento técnico para vigilância nas redes. Tirando a “leitura de pensamento”, outros elementos podem sim ser detectado e filtrados. Em termos.

A NSA americana tem um sistema de vigilância em telefonia nesse sentido, que permite que detecte palavras-chave como “bomba”, “atentado”, “ei pessoal, vamos fazer um churras este fim de semana para planejar o ataque ao presidente, eu levo a cerva”.

A um custo basicamente astronômico esse sistema de vigilância consegue fazer algo parecido com a alegação, vigiar muita gente ao mesmo tempo. Telefonia, mais que dados, porque dados podem ser simplesmente criptografados, rapidamente e seguramente. Qualquer mensagem enviada com PgP (chave pública, chave privada) está protegida de qualquer análise e trafega seguramente pelas redes. Telefonemas é um pouco mais complicado, e o filtro pode simplesmente detectar se algo está nesse formato e dar o alerta.

Boa parte das vezes será apenas comunicação empresarial segura.

Assim, o custo de criar o super sistema de vigilância, para 900 milhões de usuários, 24/7, e basicamente infalível parece superior ao lucro que se teria vendendo posts de viagens e sapatos.

Mas, sim, é possível, embora eu penso que seria mais algo direcionado a alguma pessoas, alvos específicos. Nesse sentido a conspiração mais razoável seria, o Mark vende a vigilância para a CIA/FBI de algumas pessoas de interesse 🙂

A segunda parte é, temos evidência dessa vigilância e de posts direcionados por ela?

O que temos, basicamente, é, eu falei, escrevi, comentei (ou pensei) algo, e em seguida, momentos depois, alguns dias depois, umas semanas depois, passei a perceber posts relacionados.

Vamos supor que alguém se disponha a fazer um teste, uma pesquisa “científica” (entre aspas, porque pesquisa científica se baseia em protocolos bem específicos) e passe alguns dias a dizer, por exemplo, Azerbaijão.
Com o tempo, parece que recebemos posts relacionados, por exemplo, sobre viagens. Não uma viagem para o Afeganistão, mas viagens. E relacionamos isso com ter dito Azerbaijão ao lado do computador ligado e no Face.

A primeira coisa a se considerar é a possibilidade de uma coincidência. E como se avalia isso? Pela lei de números grandes e a análise do universo de eventos.

Se fosse uma pessoa usando o Face, e um post pouco tempo depois, seria uma coincidência? Talvez não, talvez indicasse algo. Mas com 900 milhões de pessoas usando o Face diariamente, algumas centenas de bilhões de interações entre pessoas e posts, mesmo uma chance em um milhão seria algo não apenas provável de ocorrer, mas uma certeza. Como na Megasena, que tem uma chance em 50 MILHÕES de ocorrer, mas devido ao universo de eventos e a lei dos números grandes, acontece sempre, também falar ou pensar algo e em seguida ver um post relacionado deve ocorrer muitas vezes por dia por coincidência.

Mais uma vez, mesmo considerando que é possível a vigilância e o post “intencional”, o fato de que o aparente relacionamento ocorre não é suficiente, pois é uma certeza estatística que ocorra muitas vezes. Quantas?

Sem ser um estatístico é difícil dizer, mas podemos “exagerar no rigor” e tentar uma estimativa. Supondo que 0,01% desses 900 milhões diga algo, escreva ou fale (ou pense) que receba um post aparentemente relacionado (o aparentemente é porque não se define o que é relacionado para cada palavra-chave, fica em aberto), temos 9 milhões de pessoas que passam por isso diariamente (deve ser mais, não considerei quais palavras e quais relações são válidas).

Vamos ser mais rigorosos e considerar que destes, que tem a coincidência, 0,01% deles note a mesma, ou seja, se lembre do que disse e relacione com o post que está vendo. Temos agora 90 mil pessoas. Mais rigoroso ainda, apenas 0,01% dessas falam sobre o assunto nas redes, relatando o caso. São 900 pessoas por dia. 27 mil pessoa por mês.

324 mil pessoas por ano, relatando a “coincidência” que não pode ser apenas coincidência sobre como falar, escrever, ou pensar algo ao lado do Face faz surgirem posts relacionados.

O terceiro ponto se baseia em como nossa mente funciona e como um estudo de validação é feito para determinar se uma alegação é confiável, real, ou não. Nessa questão específica, como podemos testar a hipótese, o post relacionado não é uma coincidência, mas intencional?

Em um primeiro momento um experimento pessoal, caseiro, pode ser pensado. Vou falar uma palavra específica, digamos Azerbaijão, e ver se em algum momento futuro algo relacionado aparece.

Eu faço o experimento, e depois de alguns dias recebo posts relacionados. Ou que parecem relacionados. Seriam?
Digamos que depois de alguns dias (não definimos quanto tempo é válido para uma relação segura, ou um índice de validade, que se modifique quanto mais tempo passa) os posts incluam viagens. Estamos no Brasil, viagens podem se relacionar com Azerbaijão. Mas também a qualquer outro lugar do mundo. Talvez se os posts sugerissem restaurantes de comida típica do Azerbaijão a relação fosse maior.

Mas mesmo que fossem restaurantes o que está faltando no experimento para ele ser de alguma forma confiável? Quase tudo. Porque nossa mente pode pregar peças, nos enganar, por exemplo, passando a prestar atenção, dar destaque, a elementos que nos atraem em determinado momento.

Uma mulher grávida tende a ver grávidas por todo lado. Alguém interessado em comprar um determinado modelo de carro passa a ver o mesmo em todo lugar. A revista, jornal ou site que costuma visitar, parece estar mostrando o modelo que ele deseja com uma frequência alta, e também parece que isso nunca ocorreu antes. Percepção seletiva.

As mulheres grávidas sempre estiveram lá (outras, clara, não as mesmas), o modelo do carro desejado têm a mesma distribuição de sempre, mas a mente humana cria uma percepção seletiva que não podemos evitar.

Ou melhor, podemos. Boa parte dos protocolos de estudos científicos se destina a evitar o viés pessoal, a percepção seletiva, o erro de avaliação baseado em distorções de percepção.

Mas podemos realmente criar um estudo que demonstre que, mais que coincidências, existe um super sistema de postagens direcionadas baseadas em vigilância. Tudo que precisamos é de ciência e protocolos de rigor.

Começamos criando contas no Face limpas, novas, apenas para o experimento. Quanto mais melhor, mas um matemático estatístico pode determinar o número ideal para o teste. Uma parte dessas novas contas será o grupo de controle: vai navegar na rede sem falar nada, sem postar nada, sem fazer nada.

Esse grupo terá o usuário, e um pesquisador independente, que deve anotar tudo que é exibido ao usuário, toda postagem, todo anuncio, data e hora, para levantamento futuro.

O segundo grupo vai navegar e escrever e comentar normalmente, e falar (e pensar), e um pesquisador independente anotará tudo que é postado e exibido ao usuário ANTES e depois de palavras chaves (se quisermos verificar se pensamentos também são monitorados, o usuário terá a gravação falando em voz alta para um gravador tudo o que pensa – gravador por motivos óbvios é selado, e o som não passa para o Facebook).

Mas agora vem a parte interessante, o grupo “placebo”. Ele é idêntico ao grupo de usuários testados, mas nada do que ele fala, escreve ou comenta realmente sai de seu computador. O computador nem deve ter placa de som, os usuários desse grupo devem apenas “pensar” estar se comunicando e falando, mas são basicamente como o grupo de controle, apenas recebem os posts do Face.

Por que? Porque o efeito placebo e a percepção seletiva pode fazer com que mesmo assim eles pensem estar recebendo postagens “relacionadas”. Porque o que é relacionado depende de uma análise subjetiva, como “viagens – azerbaijão”, que pode ser disparada mesmo que nenhuma relação exista.

Se o grupo de controle não perceber postagens relacionadas, se o grupo placebo perceber um pequeno número de postagens relacionadas, mas o grupo de usuários perceber muitas, e os registros demonstrarem isso, que muitas postagens só surgem “depois” que falam algo, então teremos uma evidência.

Se todos tiverem a mesma percepção, mas os dados não demonstrarem isso (por exemplo, o monitoramento ANTERIOR ao momento em que os usuários disseram “Azerbaijão” mostrar que as postagens de viagens já existiam, em mesmo número, e apenas não eram percebidas), então a explicação mais simples, é coincidência derivada de um universo de eventos grande, 900 milhões de usuários e alguns bilhões de interações diárias, mais nosso viés e percepção seletiva, é a correta. Ou pelo menos a mais confiável.

Em resumo, sim, seria tecnicamente possível esse monitoramento e postagens relacionadas, embora eu pense que o custo superaria em muito qualquer lucro possível, mas isso não muda o fato de que, mesmo sem esse monitoramento e postagens intencionais, ainda teríamos a percepção, falsa, de que os posts se relacionam com o que falamos.

Em tempo, o que falamos está alguns níveis acima de improbabilidade de monitoramento do que o que escrevemos, e o que visitamos em termos de produtos é uma certeza que é monitorado e que o sistema nos mostra produtos relacionados (tem até um nome, é o remarketing do Google). Mas mesmo este é bastante primitivo e pouco inteligente, já que continua a nos mostrar produtos que já compramos.

Para finalizar, é apenas minha avaliação com os dados disponíveis sobre uma questão complexa. Diz respeito APENAS a evidência apresentada – eu percebi que depois de falar posts relacionados apareceram – e posso mudar de conclusão (não crença) se outro tipo de evidência, mais sólida, surgir, ou se um estudo demonstrar que dentro de protocolos de rigor, o número de postagens relacionadas é realmente maior do que o que deveria pela lei dos números grandes (isso foi basicamente, o que ocorreu com os anões do orçamento, e seu “sucesso” em ganhar na loteria repetidas vezes – chamou a atenção dos sistemas de vigilância pela improbabilidade dessa alegação).

Homero

Deixe um comentário