A Curva S da Inteligência Artificial
| Somir | Somir Surtado | 6 comentários em A Curva S da Inteligência Artificial
Pouco tempo atrás, o Google anunciou que sua inteligência artificial generativa era capaz de fazer vídeos curtos de alta qualidade. Também mencionaram que a nova geração do Gemini (antigo Bard) vai ser capaz de manter conversas muito mais longas e coerentes. O próximo modelo do Stable Diffusion deve ser lançado nos próximos meses com qualidade comparável com o gerador de imagens do Bing. Vários sites e até mesmo programas já contam com assistentes virtuais utilizando IA para guiar desde programação até mesmo apresentações profissionais… a revolução já começou?
Depende.
Quase toda tecnologia segue uma espécie de “curva S” entre criação, avanço exponencial e estabilização. É fácil entender esse processo com o exemplo dos celulares: a ideia de computadores e telefones compactos existia faz tempo, mas durante muito tempo foi algo de nicho, só gente com muito dinheiro ou com muita tara por tecnologia tinha celulares e assistentes de bolso.
A tecnologia começou a ficar mais barata, mais disponível, e num piscar de olhos vimos uma evolução incrível com os smartphones: a cada geração eles eram capazes de fazer mil coisas a mais que a anterior. Se você já tem seus 40 anos, viu um mundo onde telefone na rua era só orelhão, teve seu primeiro “celular tijolo”, um smartphone bem burrinho e um computador de bolso conectado com o mundo todo em tempo real num espaço de poucos anos. Essa foi a fase do avanço exponencial.
Combinou o espírito do tempo de globalização com a queda nos custos de produção de computadores miniaturizados, assim que a barreira do preço exorbitante e capacidade de fabricação em massa, a coisa seguiu em frente.
De algo que você nunca sentiu falta a algo que se você fica desesperado se perder. Se você é mais novo e já cresceu nesse mundo conectado, talvez não tenha tido essa percepção de que foi meio que da noite para o dia que o celular virou parte integral da nossa vida. Mas foi. A gente piscava e esses aparelhos assumiam controle sobre mais um pedaço da sua existência. Parecia que daqui a pouco o celular estaria dentro do nosso cérebro.
Quase isso. Mas, eventualmente, a tecnologia chegou na sua maturidade. Os ganhos de potência e funções foram se estabilizando ao ponto de quase todo mundo perceber que não faz mais tanta diferença trocar de celular. Ficam mais rápidos (nem todos), mas a alma da coisa não parece mais mudar. O curioso é que isso nem sempre tem relação com dificuldade de evoluir a tecnologia, é questão da escala de adoção e como qualquer mudança muito agressiva custa caro e dá trabalho. As pessoas já estão usando assim, já tem milhões de empregos que dependem desse modelo de tecnologia.
Com esse exemplo disposto, volto para a Inteligência Artificial generativa, de texto, imagens, sons e agora até vídeos… é complicado prever em que parte da curva estamos agora. Existem argumentos para os três lugares mais importantes dela: criação, crescimento e estagnação. Eu obviamente tenho uma opinião sobre em que ponto estamos, mas é melhor explicar as possibilidades primeiro.
Possibilidade 1: a IA ainda está na fase nascente, ou seja, a gente nem começou a ver o crescimento exponencial ainda. Isso significa que poderemos ter um mundo tão diferente de hoje em 20 ou 30 anos quanto o mundo pré-smartphone. Se a fase explosiva da tecnologia ainda está no futuro, isso vai chacoalhar tanto o mercado de trabalho que mesmo os zoomers vão ficar assustados.
Essa possibilidade vem da percepção que só empresas muito grandes e com muitos recursos de computação estão focando no desenvolvimento do produto, e talvez da parte mais importante disso: monetização. Não está muito claro como criar um mercado ao redor da Inteligência Artificial generativa. A ideia é a típica do mundo das startups, de sair fazendo as coisas e descobrir como ganhar dinheiro depois.
A fase exponencial tende a estar diretamente relacionada com a capacidade de fazer dinheiro com a tecnologia. É aí que pessoas sem grandes inclinações tecnológicas entram para comercializar a coisa toda. Smartphones eram muito bacanas, mas foi a Apple que conseguiu transformar isso num produto lucrativo primeiro (eles não inventaram). O mercado correu atrás e espalhou a novidade porque dava muito dinheiro produzir e comercializar aparelhos e serviços para esses aparelhos.
E é claro, mesmo que a IA generativa já esteja ajudando muita gente, ainda não entrou nas nossas vidas para mudar a forma como vivemos. Os smartphones entraram no nicho de comunicação com outros seres humanos e fizeram a festa por lá. A IA atual é focada no nicho de criatividade e otimização de produção, o que é algo menos direto na lista de prioridades do ser humano médio.
Talvez quando surgir uma função extremamente válida para a nossa vida cotidiana, mudamos para a fase exponencial e daqui a vários anos eu vou escrever aqui sobre como era diferente o tempo que a gente trabalhava em funções intelectuais…
Possibilidade 2: a IA já entrou na fase exponencial. A tendência atual é acreditar nisso, que os avanços dos últimos dois ou três anos já demonstram que entramos nessa parte da “curva S da tecnologia”. O lado positivo é que as coisas devem acontecer muito rápido a partir de agora, isso é, positivo se você é uma pessoa curiosa sobre tecnologia de ponta. O lado ruim é que também quer dizer que já achamos mais ou menos para que vai servir a IA generativa.
Nesse contexto de crescimento exponencial, quer dizer que já entramos na fase do iPod, não necessariamente iPhone, mas algo que já deu a cara do negócio como ela vai ser. Com os smartphones a ideia era finalmente tornar o computador pessoal em pessoal. Sempre com você, abrindo todo o leque de possibilidades de comunicação, entretenimento e produtividade digital.
Se a IA está nesse ponto, o básico já está definido também: terceirização de pensamento criativo. Os produtos digitais já terceirizaram boa parte da nossa memória, o próximo passo é ter um assistente que pelo menos te faça parecer que é mais inteligente do que realmente é. Como pessoa que exercitou bastante o cérebro nessa categoria, eu posso te dizer com confiança que é algo que ninguém vai querer perder depois de ter uma vez.
Da mesma forma como eu não quero mais viver num mundo onde eu me perco dirigindo, eu também não aceitaria ter e perder a capacidade de mastigar e digerir ideias de forma mais coerente, criando soluções e organizando etapas de pensamento em tempo real. As pessoas que não tinham isso e se virem capacitadas por uma IA que as faz fazer mais sentido quando falam e se expressarem com mais graça para os outros dificilmente vão aceitar voltar um passo atrás.
E lembrando que pensamento criativo não é saber fazer um desenho ou escrever um poema, também é isso, mas ele serve para basicamente tudo o que você encara na sua vida. Pensamento criativo melhora conversas, relações e te faz trabalhar melhor.
O outro argumento sobre estarmos na fase exponencial é que mesmo que não se saiba exatamente como e quanto cobrar pelo serviço, as grandes empresas de tecnologia acreditam que podem controlar a oferta do serviço assim como fazem com sites e redes sociais. Você precisa dessas empresas para usar a internet como usa, e boa parte entendeu que dava para usar publicidade para ganhar dinheiro. Formou-se um oligopólio entre elas que dificilmente vai ser ameaçado. Se o produto puro de IA generativa não for simples de vender, pelo menos é algo tão fora da capacidade do cidadão médio que eles vão poder lucrar mesmo assim.
Então, é possível que você se veja preso a essas inteligências artificiais, por elas fazerem sua produção ser tão mais simples (e cá entre nós, mais inteligente que o que o cidadão médio faz) que não faz mais sentido voltar atrás. Vão usar o modelo de troca de serviço por publicidade ou cobrar uma mensalidade, sem necessariamente criar um produto físico que você vai poder utilizar.
Possibilidade 3: estamos na estagnação. Sim, é possível que já tenhamos corrido até essa fase agora quando escrevo o texto, no começo de 2024. É uma questão de escala e distribuição. A IA que produz vídeos não diz que tipo de máquina você precisa ter para fazer o material, a presunção é que seja muito demandante, algo que simplesmente não cabe num chip de celular ou mesmo num computador de mesa poderoso.
Eu tenho um computador que custou mais caro que um carro usado e simplesmente não consegui fazer um clone do ChatGPT funcionar de forma decente. Evidente que tecnologia avança, mas a Lei de Moore, aquela que dizia que poder de processamento dobrava a cada década, não funciona mais. Estamos numa fase bem estagnada de potência de processadores. Temos algumas barreiras da física fundamental travando o avanço desse poder de computação, pode demorar bastante até termos potência equivalente aos servidores do Google ou do ChatGPT no nosso bolso. Quer dizer, potência de verdade, afinal, se você terceirizar isso para um computador distante e só pegar os cálculos prontos pela internet, já funciona.
Só que isso mais uma vez centraliza todo o poder sobre as ferramentas na mão de um oligopólio de gigantes de tecnologia que podem gastar os milhões e milhões necessários para fazer todos aqueles supercomputadores rodarem. Se não tivermos um grande salto em poder de processamento ou uma redução incrível de necessidade de computação para IA generativa, é possível sim que já tenhamos chegado no topo da curva e estejamos apenas olhando para pequenos ganhos cada vez mais custosos.
Não virei pessimista do nada, estou apenas analisando uma possibilidade, a que ainda falta alguma coisa no meio do processo para recomeçar a curva exponencial, talvez um novo tipo de processador (que provavelmente não vai ser o quântico, não tão cedo pelo menos). Isso significaria que só uma parte do mercado de trabalho seria impactada, especialmente a de produtores de arte e conteúdo de baixa qualidade. Existe mercado para escrever texto ruim aos montes e existe mercado para fazer design vagabundo baratinho, esses sim seria engolidos pelas IAs.
Para a manutenção da ordem mundial, é provavelmente a opção mais segura. Quem trabalha com criação de baixa qualidade acha outra coisa para fazer, quem faz programação tosca ou tem trabalho intelectual de baixa responsabilidade também deve cair com essa tecnologia. Mas não todos, afinal, pessoas terceirizam esses trabalhos porque não querem nem tocar neles. Do mesmo jeito que tem vendedor vivendo de tirar comissão entre clientes e fornecedores, nada impede que muita gente simplesmente revenda conteúdo da IA, talvez nem escondendo o que fez, afinal, no mínimo tem que saber pedir para o computador o que se quer e julgar se foi feito direito. A maioria das pessoas não quer esse tipo de problema.
Minha opinião: quanto mais eu vejo os avanços, mais eu começo a tender para um ponto entre possibilidade 2 e 3, com a gente estando muito mais perto do teto dessa tecnologia do que se vende como hype por aí. E isso não tem a ver com achar que já “descobrimos tudo”, é mais uma questão de capacidade de processamento não alcançando a demanda da IA a não ser que você já tenha bilhões para gastar.
Eu acho que falta uma peça nesse quebra-cabeças ainda, ou o código fica absurdamente mais rápido de rodar ou descobrimos como multiplicar muitas vezes a velocidade dos computadores pessoais (desktop, notebook e smartphone) para dar conta de colocar uma mente artificial poderosa junto com cada um de nós. Sem isso, a tendência é que tudo se concentre em grandes players que provavelmente não vão querer virar o mundo de ponta-cabeça, afinal, é nesse que eles são bilionários.
Espero estar errado, eu acharia divertido se fosse a possibilidade 1, de nem termos começado a corrida rumo à tecnologia mais avançada.
Para dizer que ainda não sabe para que usar IA, para dizer que a verdadeira Skynet vai nos dominar com desenhos de gatos, ou mesmo para dizer que se um computador pode fazer o que você faz você não serve pra nada mesmo: comente.
Posso dizer com relativa segurança que estamos na fase 3, a da estagnação. A IA não entende bem as instruções se as mesmas forem mais específicas. Essa parada hoje está mais para demonstração de hypeconomy do que para um compromisso a sério com avanços no campo tecnológico, sendo que as demonstrações no campo da IA são algo parecido com o Uber e empresas de setores similares fazendo demonstração de veículos sem motorista com vistas a segurar os investimentos do pessoal mais entusiasta na área de tecnologia apostando nas empresas.
Aprendizado de máquina na prática não passa do uso do conteúdo armazenado na internet (e sim, é muito conteúdo) para efeitos de aprimoração dos algoritmos e mesmo assim o funcionamento, mesmo em funções relativamente triviais, deixa a desejar.
No que diz respeito aos computadores, temos a problemática das disparidades entre os processadores CISC (onde os maiores destaques são os x86 utilizados na maioria de nossos PCs) e os processadores RISC (que tem como destaque maior os processadores ARM, que são utilizados principalmente nos smartphones). Um computador CISC é mais fácil de programar e dá pra utilizar linguagem de nível mais alto, mas implica em um dispêndio maior de energia no processamento. Por outro lado, um computador RISC exige linguagem de nível mais baixo pra ter um desempenho otimizado, sendo que programas voltados para os x86 (caso do computador que você pagou o preço de um carro e funciona mal com um clone do ChatGPT) são basicamente emulados pelos processadores ARM, que apresentam problemas de desempenho na medida que utilizam programas voltados pra plataforma x86.
Convenhamos que as plataformas baseadas em processadores ARM evoluíram muito, a passos até mais rápidos que a plataforma x86 que chegou a um ponto de relativa maturidade na década passada depois de passar com alguma dificuldade pelo limite estabelecido na memória dos hardwares baseados em 32-bits que era de 2³² bytes ou 4 GB, mas o fato é que boa parte do software voltado para a área de PCs é considerando a plataforma x86 como protagonista e os ARM como coadjuvantes, o que acaba sendo uma limitação para avanços nesse campo, sendo isso um fato tanto no que diz respeito a plataforma Windows quanto no que diz respeito as distros do Linux, que são os dois ecossistemas predominantes hoje na computação voltada a massa.
A Apple, depois de ter se rendido aos x86 quando os PowerPCs chegaram ao limite de seus avanços tecnológicos, optou recentemente por mudar novamente de plataforma e privilegiar os ARM, com vista a ter uma padronização da experiência na plataforma mantida pela empresa, sendo que enquanto os iOS (voltados para os gadgets da marca) sempre foram orientados para processadores ARM, os MacOS estão em processo de mutação de plataforma, o que implica inclusive em problemas de compatibilidade para quem apostou nas soluções tecnológicas da empresa simbolizada pela maçã mordida.
Não entendi muito bem, mas gostei da explanação técnica.
Não sei o que levou a isso, mas mais e mais vejo pessoas que não conseguem distinguir vídeos e imagens claramentes criadas por IA (ou digitalmente por alguém que sabe mexer em produtos como Photoshop). O último exemplo é o “vídeo” de uma empresa chinesa que criou um “Android” de uma criança de 3 anos.
Sem a capacidade critica de distinção, não importa o ponto da curva em que estejamos, será absurdamente fácil enganar até agências mundiais.
Não é como se precisasse de uma tecnologia mirabolante pra inventar mentiras, espalhá-las e muita gente acreditar, a ponto de causar um grande impacto. Caso Escola Base, por exemplo.
“Sem a capacidade critica de distinção, não importa o ponto da curva em que estejamos, será absurdamente fácil enganar até agências mundiais.” E é exatamente disso que eu tenho medo! A média mundial das pessoas nunca foi mesmo lá muito brilhante, convenhamos. E quando a gente lembra que a atual geração é a primeira da História com QI menor que o do de seus pais, temos ainda mais motivos pra ficarmos preocupados…
Faço minhas as suas palavras, Badalhocas.