Skip to main content
Prova de vídeo.

Prova de vídeo.

| Somir | | 2 comentários em Prova de vídeo.

A inteligência artificial não está mais cercada do hype dos dois últimos anos, a coisa já mudou de nível: entrou no nosso vocabulário. Deepfake e ChatGPT já são conceitos que muita gente entende sem explicação ou mesmo contexto. Isso significa que entramos na fase da adoção da tecnologia numa escala que faz sentido como negócio e não só como pesquisa tecnológica. E é justamente por isso que agora você vai ter que aprender rapidamente a identificar o real num mar de simulações.

Já tem um monte de vídeos de rede social, alguns humorísticos, outros golpistas, usando a tecnologia de mudar um vídeo de uma pessoa famosa para dizer outra coisa. O programa age diretamente no vídeo, modificando o movimento da boca (e vários outros pontos do rosto) para bater com a nova fala dela. E é claro, existem programas que copiam a voz da pessoa também.

E nesses casos um cidadão um pouco mais esperto pode perceber a mentira pelo contexto. Não, não é o Lula fazendo propaganda do jogo do tigrinho, não que ele não seja um vendido, mas seria suicídio político. Não é o Elon Musk vendendo pílula para aumentar o pênis, não é o Felipe Neto vendendo casa de aposta para crian… opa, essa foi verdade mesmo.

Mas temos que ser realistas, essa percepção de impossibilidade por contexto depende de um pouco mais de cérebro do que está disponível no mercado. Talvez o cidadão médio perceba que não é a Taylor Swift de verdade recomendando o chá de ervas da Dona Jurema, talvez não. Sem contar que como o modelo de negócio da maioria dos influencers é fazer propaganda de produtos e serviços aleatórios, mais e mais pessoas vão achar normal ver alguém famoso na sua timeline vendendo alguma coisa.

Como as celebridades do povo mais jovem já são influencers em sua maioria, eu imagino que o contexto vai ficar mais complicado de perceber. O famoso dos Millenials e gerações anteriores tinha um certo tamanho de marca e produto para o qual anunciava. A linha entre celebridade e pessoa normal borrou. E isso tem impacto direto em como as pessoas vão lidar com essas manipulações de vídeo.

A presunção de veracidade é outra se você já viu seu influencer vender de tudo sem pudor algum. A lógica publicitária se desregula de tal forma que não existe mais nem uma linha guia de linguagem nas propagandas. Tudo pode ser comercial, não tem padrão de qualidade mínimo, nem da peça publicitária, nem do que ela está vendendo.

Como publicitário, eu não me incomodo. Se o nível médio continuar caindo, só me destaca mais. Mas como pessoa vivendo rodeada de humanos médios, me preocupa o quanto isso pode apodrecer a mente deles. Propaganda vira conteúdo, conteúdo vira propaganda. Sem contexto, a pessoa pode começar a cair de verdade nas montagens mais absurdas de vídeo.

Especialmente porque a tecnologia já permite essas manipulações em tempo real. VTubers são uma categoria de streamers que não usam a cara verdadeira, sendo substituídas normalmente por avatares animados de garotinhas de anime. Mais e mais pessoas estão ficando viciados nelas. A tecnologia que já existe permite animação em tempo real de modelos 3D, capturando imagem de uma pessoa e com alteração de voz em tempo real.

Ou seja: já existe tecnologia para te filmar ao vivo e transferir tudo para um boneco virtual. Com o deepfake, isso já está chegando no ponto de transformação em outras pessoas reais. Já pode acontecer agora, mas ainda não é algo que qualquer um com um celular pode fazer, depende de algum trabalho prévio ou pagamento para quem tem o “poder de fogo” para gerar isso em tempo real.

E como o mercado já existe, fica claro que é só questão de tempo até você poder ser outra pessoa em vídeo a hora que quiser. Não vai demorar muito para o “Elon Musk” abrir uma sala de chat ao vivo com milhares de pessoas para falar sobre sua nova criptomoeda. Apesar da voz ser igual a dele, vai ter um estranho sotaque indiano… e eu tenho certeza de que muita gente vai acreditar. Todo dia agora sai notícia sobre alguém que acreditava estar namorando à distância com alguma celebridade.

Carência, ignorância, desespero… seja lá o que for, o ser humano já é vulnerável até mesmo trocando e-mails com golpistas, imagina só vendo ao vivo uma pessoa famosa falando com você? É provável que pessoas mais velhas (mas não muito velhas) tenham alguma noção sobre o realismo desse tipo de interação, porque fomos criados num mundo de celebridades inacessíveis. Mas eu tenho sérias dúvidas sobre a geração Z. Não porque sejam burros, eles são mais inteligentes em média (como é o padrão), mas porque o conceito de pessoas famosas é diferente para eles. São pessoas que compartilham suas vidas e se esforçam para fingir proximidade.

A percepção da fraude por contexto é cada vez mais complicada de enfiar na cabeça das pessoas, e já chegamos num ponto com os deepfakes que eu nem sei mais explicar para os outros o que estou vendo de errado naquele vídeo. As falhas já são sutis o suficiente para só quem sabe muito bem quais são os problemas do computador ao emular seres humanos consegue notar. É um movimento de cabeça que não combina com a palavra, é um borrado estranho por um frame…

Mas mesmo isso é a geração anterior de deepfakes. Quando for rápido e barato trocar seu corpo por o de outra pessoa ao vivo na webcam, a tecnologia pode começar a enganar até nerd. As falhas de deepfakes pré-gravados são resultado do vídeo original já ter sido gravado e basicamente só mudar como a boca da pessoa se move. Mas se todo o corpo for deepfake em tempo real?

A tecnologia não está longe, já existe como fazer esse tipo de alteração em tempo real, já existe como manipular imagens de pessoas em tempo real, mas ainda não tem nada rápido e confiável para fazer essa transformação numa webcam ao vivo, pelo menos não de forma que o golpista médio tenha acesso. Mas não é mais questão de esperar um grande avanço tecnológico. Está tudo na mesa, basta juntar as peças.

Curiosamente, as pessoas mais confiáveis do futuro vão ser pessoas como eu, que basicamente não existem como imagem e vídeo na internet. Audio é perigoso, por causa das gravações para o Desfavor. Se alguém ligar para você dizendo que é o Somir com a minha voz, não dê dinheiro. Qualquer pessoa que tiver seu rosto estampado nas redes sociais, especialmente quem faz muitos vídeos, vai ser um algo perfeito para gerar modelos falsos.

E considerando que pessoas como eu estão acabando aos poucos, é bem possível que em umas duas ou três gerações todo mundo seja passível de ser transformado em modelo realista para golpes ao vivo, e que conversa em vídeo deixe de ser prova de qualquer coisa. Com um pouco mais de integração entre ChatGPT e deepfakes, as pessoas podem até começar a delegar suas reuniões de trabalho para simulacros.

“Participe da reunião às 08:00 se fazendo passar por mim, concorde com tudo o que a chefe disser e responda todas as perguntas dizendo que precisa fazer uma análise técnica do tema. Duas horas depois da reunião, mande um relatório sobre as dúvidas por email para todos meus colegas, da forma mais complexa e verborrágica possível, no mínimo 5 mil caracteres.”

Pronto, é só desligar o despertador e curtir seu dia. Porque convenhamos, boa parte do que fazemos no campo profissional é uma simulação de como um robô incansável faria o trabalho. Talvez seja até uma evolução natural das relações profissionais deixar as interações com simulações de nós mesmos. O quanto da sua personalidade realmente impacta o resultado do trabalho? Será que a personalidade do ChatGPT não daria conta do recado do mesmo jeito?

Parece que eu estou indo para vários lados diferentes, mas tem uma linha central: quanto mais o tempo passa, menos valor se coloca na relação real entre pessoas. Pode até acabar sendo uma coisa boa, é difícil fazer a previsão total desse tipo de evolução tecnológica com meu cérebro analógico. Mas que a sua “existência” é menos importante diante do paradigma da inteligência artificial, isso é.

Existe um caminho sombrio onde somos substituídos e o mundo se torna uma distopia capitalista com 99% da população literalmente inútil, mas existe um caminho mais iluminado onde essa busca doentia por eficiência acaba nas mãos da inteligência artificial, tirando muito da ansiedade das nossas costas. Trabalharemos com a mão na massa em funções que robôs não conseguem fazer melhor (e deve demorar muitos séculos até eles serem melhores em todas) ou como guias de inteligências artificiais treinadas em nossas funções sociais.

O que eu sei é que a fase mudou de verdade: IA deixou de ser hype infinito e começou a entrar pelas fundações da sociedade como algo realmente utilizado. E é aí que as coisas explodem, na adoção em massa. IA é tecnologia do presente, você vai ter que lidar com ela manipulando a realidade. Fotos não são mais confiáveis, vozes e vídeos não são confiáveis, e nem reuniões e chamadas ao vivo serão mais em pouco tempo. E faz parte da marcha do progresso que sejamos mais descartáveis. O quanto alguém que se acostuma como simulações de relacionamento com influencers e streamers realmente consegue lidar com gente fingindo ser quem não é? Será que vão perceber?

Porque se você está contando com falhas óbvias na tecnologia para perceber fraudes, vai quebrar a cara em pouco tempo. Estamos chegando, e chegando rápido na era do vídeo perfeito ao vivo com pessoas que não estão lá de verdade. Ou você entende o contexto para se livrar dos golpes, ou vai acabar namorando com o Elon Musk…

Para dizer que a tecnologia foi um erro, para dizer que é contra tudo, ou mesmo para dizer que sempre fomos descartáveis: comente.


Comments (2)

Deixe um comentário

O seu endereço de e-mail não será publicado.

Relatório de erros de ortografia

O texto a seguir será enviado para nossos editores: