deepfake

Deepfake é uma técnica que utiliza recursos de inteligência artificial para substituir rostos em vídeos e imagens com o propósito de chegar o mais próximo possível da realidade. O termo é uma mistura das expressões deep learning e fake e significa o emprego da IA para criar uma situação falsa. Ramalho Lima – tecmundo

O deepfake é uma tecnologia que usa inteligência artificial (IA) para criar vídeos falsos, mas realistas, de pessoas fazendo coisas que elas nunca fizeram na vida real. A técnica que permite fazer as montagens de vídeo já gerou desde conteúdos pornográficos com celebridades até discursos fictícios de políticos influentes.  Isabela Cabral – TechTudo

MIT

Grace Windheim já tinha ouvido falar de deepfakes antes, descobrir que era super fácil e totalmente gratuito e em um dia do ano de 2020, ela criou um tutorial passo a passo no YouTube para guiar outras pessoas ao longo do processo. “Fazer uma dessas deepfakes e sobrepor áudio não é tão complicado quanto você pode pensar”, diz ela no vídeo, publicado em 4 de agosto. MIT Technology Review

Windheim, recém-formada, trabalha como criadora de conteúdo na startup Kapwing, com sede em São Francisco. A empresa, que começou como fabricante de memes, oferece um pacote baseado em navegador gratuito de ferramentas de software de edição de vídeo.

O que era caro e extremamente trabalhoso se tornou simples e acessível a princípio para especialistas da área e posteriormente para o grande público por meio de aplicativos móveis e plataformas online. Hoje, é possível criar manipulações realistas usando computador e internet em casa.

No início de 2019, uma das ferramentas de deepfake mais conhecidas era o ZAO, um app chinês criado para iOS que permitia capturar uma selfie e embutir o rosto no corpo de um personagem de filme ou série em segundos. Por questões de segurança, o programa limitava as cenas em que os usuários podiam editar vídeos falsos, uma vez que a técnica poderia ser usada para a criação de fake news.

Para quem precisa de algo mais sofisticado, o FSGAN reproduz não apenas os trejeitos do rosto da fonte mas também sua voz. A ferramenta foi criada por Yuval Nirkin e está disponível na Open University of Israel. Para que funcione, no entanto, é necessário um hardware de altíssimo desempenho que é praticamente impossível de ser adquirido por usuários finais.

De acordo com John Vilasenor, pesquisador do Centro de Inovações Tecnológicas Brookings Institution, organização que pesquisa o tema, a popularidade da técnica tem chamado atenção de autoridades para a necessidade da fiscalização e regulamentação da tecnologia.

O termo deepfake apareceu em dezembro de 2017, quando um usuário do Reddit com esse nome começou a postar vídeos de sexo falsos com famosas. Com softwares de deep learning, ele aplicava os rostos que queria a clipes já existentes. Os casos mais populares foram os das atrizes Gal Gadot e Emma Watson. A expressão deepfake logo passou a ser usada para indicar uma variedade de vídeos editados com machine learning e outras capacidades da IA.

Efeitos especiais de computador que criam rostos e cenas no audiovisual não são nenhuma novidade; o cinema faz isso há muitos anos. A grande virada do chamado deepfake está na facilidade com que ele pode ser produzido. Comparado ao que costumava ser necessário, o método atual é simples e barato. Qualquer um com acesso a algoritmos e conhecimentos de deep learning, um bom processador gráfico e um amplo acervo de imagens pode criar um vídeo falso convincente.

A técnica é baseada em deep learning, uma subclassificação de IA para definir algoritmos de podem reconhecer padrões com base em um banco de dados. Isso significa que, para criar um vídeo de deepfake de determinada personalidade, o sistema precisa ser alimentado com fotos e vídeos em que ela aparece. Quanto mais material houver, maiores serão as chances de se obter um bom resultado. Treinada com base no conteúdo fornecido, a IA aprende como a pessoa se comporta, passando a reconhecer padrões de movimento, trações do rosto, da voz e de outras características.

São utilizados softwares baseados em bibliotecas de código aberto voltadas ao aprendizado de máquina. Segundo entrevista ao site Motherboard, o usuário do Reddit usou TensorFlow aliado ao Keras, uma API de deep learning escrita em linguagem Python. O programador fornece centenas e até milhares de fotos e vídeos das pessoas envolvidas, que são automaticamente processadas por uma rede neural. É como um treinamento, no qual o computador aprende como é determinado rosto, como ele se mexe, como ele reage a luz e sombras.

O deepfake é muito recente e sua definição é fluida. O fenômeno se confunde na discussão pública com tecnologias com funções similares ou complementares. Há, por exemplo, um programa anunciado pela Adobe que consegue criar falas com a voz de uma pessoa a partir de amostras reais. Existem ainda experimentos de reencenação facial, com a recriação das mesmas falas e expressões de uma pessoa no rosto de outra, e de sincronização labial, vídeos de alguém falando gerado com áudio e imagens de seu rosto.

Agora que os deepfakes fazem parte da nossa realidade, é essencial aprender a identificá-los. Pode ser que cheguemos a um ponto em que isso seja impossível ou muito difícil, mas hoje ainda existem alguns detalhes que ajudam a revelar um vídeo falso. Preste atenção nos movimentos da boca, se eles correspondem bem ao que está sendo dito. Fique atento também para a própria voz: a entonação e o tom soam normais?

Verifique os olhos para notar se eles estão piscando. Na maioria das vezes, os algoritmos não reproduzem bem esse aspecto nem a respiração da pessoa. Veja ainda se ela se mexe de forma natural como um todo. As recriações podem ter dificuldade em encaixar todas as partes do rosto e do resto do corpo e duplicar certos movimentos orgânicos. E se a pessoa no vídeo em questão é alguém que você não conhece bem, procure outros clipes, de preferência em que haja certeza de veracidade, para comparar.