NOVA YORK – A Microsoft retirou discretamente da Internet seu banco de dados de 10 milhões de imagens, que foi usado para treinar sistemas de reconhecimento facial em todo o mundo, inclusive por pesquisadores militares e empresas chinesas como a SenseTime e a Megviil, informou o Financial Times (FT) nesta quinta-feira.
O banco de dados, conhecido como MS Celeb, foi publicado em 2016 e descrito pela empresa como o maior conjunto de dados de reconhecimento facial disponível publicamente no mundo, contendo mais de 10 milhões de imagens de quase 100.000 indivíduos.
De acordo com o jornal britânico, as pessoas cujas fotos foram usadas não deram seu consentimento, suas imagens foram retiradas da web de mecanismos de busca e vídeos sob os termos da licença Creative Commons, que permite a reutilização acadêmica de fotos.
A Microsoft, que retirou o banco de dados dias depois que o FT informou sobre seu uso pelas empresas, disse: “O site era destinado a fins acadêmicos. Ele foi administrado por um funcionário que não está mais na Microsoft e, desde então, foi removido”.
Dois outros bancos de dados também foram retirados desde que o relatório do FT foi publicado, em abril, incluindo os dados de vigilância do Duke MTMC construído por pesquisadores da Duke University, e da Universidade de Stanford, chamado Brainwash.
Os três bancos de dados foram descobertos pelo pesquisador de Berlim Adam Harvey, segundo o qual, a Microsoft usou o conjunto para treinar algoritmos de reconhecimento facial.
A empresa nomeou o conjunto de dados “Celeb” para indicar que os rostos eram fotos de figuras públicas. Mas, segundo Harvey, A empresa teria explorado o termo “celebridades” para incluir pessoas que simplesmente trabalham online e possuem uma identidade digital.
De acordo com o FT, uma das pessoas incluídas no banco de dados criticou o que chamou de falta de hablidade da Microsoft e que o ocorrido é um “indicativo de um profundo mal-entendido sobre o que é privacidade.”
Especialistas em tecnologia disseram que a Microsoft pode estar violando a Lei Geral de Proteção de Dados da União Européia, continuando a distribuir o conjunto de dados da MS Celeb depois que as regras entraram em vigor no ano passado.