Na internet, privacidade desaparece aos poucos
Cientistas americanos conseguiram identificar mais de 30% dos usuários de redes sociais, como Twitter, Flickr e Facebook, usando apenas o cruzamento de dados
por Steve Lohr
Se um estranho o abordasse numa rua, você lhe daria seu nome, número da Previdência Social e endereço de e-mail? Provavelmente não.
No entanto, as pessoas frequentemente disponibilizam toda sorte de informações pessoais na internet que permitem que esses dados sejam deduzidos. Serviços como Facebook, Twitter e Flickr são oceanos de minúcias pessoais – cumprimentos de aniversário enviados e recebidos, fofocas de escola e de trabalho, fotos de férias familiares, filmes assistidos e livros lidos.
Cientistas da computação e especialistas políticos dizem que esses pedaços pequenos, aparentemente inócuos, de autoexposição podem ser cada vez mais coletados e remontados por computadores para ajudar a criar um quadro completo da identidade de uma pessoa, chegando às vezes ao seu número da Previdência Social.
“A tecnologia tornou obsoleta a definição convencional de informações pessoalmente identificáveis”, disse Maneesha Mithal, diretora executiva da divisão de privacidade da Comissão Federal de Comércio (FTC, na sigla em inglês).
Num projeto de classe no Instituto de Tecnologia de Massachusetts (MIT), Carter Jernigan e Behram Mistree analisaram mais de 4 mil perfis de alunos do MIT no Facebook, incluindo conexões entre amigos online. A dupla criou um software que previu, com uma precisão de 78%, se um perfil pertencia a um homossexual. A técnica foi verificada usando um grupo de alunos que haviam livremente se identificado como homossexuais.
Por enquanto, esse tipo de garimpo de dados, que depende de correlações estatísticas sofisticadas para construir dossiês individuais, pertence principalmente ao reino dos pesquisadores universitários, e não a ladrões de identidade e marqueteiros.
Mas a FTC está preocupada porque as leis e regulamentos que protegem a privacidade não acompanharam a mudança tecnológica, e a agência realizou esta semana o terceiro de três workshops para tratar justamente desse assunto.
Suas preocupações são de longo alcance. No do ano passado, a Netflix, empresa que recebe pedidos de aluguel de vídeo por e-mail e entrega os vídeos em domicílio, entregou US$ 1 milhão a uma equipe de estatísticos e cientistas da computação que venceu um concurso de três anos para analisar o histórico de aluguel de filmes de 500 mil assinantes e melhorar a acuidade de previsão do software de recomendação da Netflix em pelo menos 10%.
Na semana passada, a Netflix comunicou que estava engavetando planos para um segundo concurso – curvando-se às preocupações sobre privacidade colocadas pela FTC e um litigante privado. Em 2008, dois pesquisadores da Universidade do Texas mostraram que os dados de clientes liberados para aquele primeiro concurso, apesar de desprovidos de nomes e outras informações de identificação, poderiam com frequência ser identificados pela análise estatística dos distintos padrões de classificação e recomendações de filmes.
Nas redes de relacionamento social, as pessoas podem aumentar suas defesas contra a identificação adotando controles estritos de privacidade sobre informações em perfis pessoais. Mas as ações de um indivíduo, segundo os pesquisadores, raramente são suficientes para proteger a privacidade no mundo interconectado da internet.
A pessoa pode não expor informações pessoais, mas seus amigos e colegas online podem fazê-lo em lugar dela, referindo-se a sua escola ou empregador, gênero, local e interesses. Os padrões de comunicação são reveladores, dizem os pesquisadores.
“A privacidade já não é uma questão individual”, disse Harold Abelson, o professor de ciência da computação no MIT. “No mundo online de hoje, o que sua mãe lhe disse é verdade, só que mais ainda: as pessoas realmente podem julgá-lo por seus amigos.” Quando são reunidas, as informações sobre cada indivíduo podem formar uma “assinatura social” distinta, segundo os pesquisadores.
Identificação. O poder de computadores de identificar pessoas partindo apenas de padrões sociais foi demonstrado no ano passado em um estudo da mesma dupla de pesquisadores que “arrombou” a base de dados anônimos da Netflix: Vitaly Shmatikov, um professor adjunto de ciência da computação na Universidade do Texas, e Arevind Narayanan, pesquisador em pós-graduação na Universidade Stanford.
Ao examinar correlações entre várias contas online, os cientistas mostraram que podiam identificar mais de 30% dos usuários tanto do serviço de microblogs Twitter como no Flickr, apesar de as contas terem sido despidas de informações identificadoras como os nomes e endereços de e-mail das contas. Na primeira rede, os internautas deixam comentários sobre o que estão fazendo e divulgam ideias. No Flickr, os usuários compartilham fotos online.
Ainda mais enervante para os advogados da privacidade é o trabalho de dois pesquisadores da Universidade Carnegie Mellon. Em um estudo publicado no ano passado, Alessandro Acquisti e Ralph Gross mostraram que podem apontar com precisão os nove dígitos que compõem o número do Seguro Social de 8,5% das pessoas nascidas nos Estados Unidos entre 1989 e 2003 – o que significa cerca de 5 milhões de indivíduos.
* com traduçao de Celso M. Paciornick
{ Fórum Nacional pela Democratização da Comunicação – FNDC }