Inteligência Artificial Não Me Impressiona!... Ainda.
Muito se falou nos últimos dias sobre Inteligência Artificial, Machine Learning e coisa similar. Mas não é tanta gente que de fato entende o que acontece.
O que é, de fato, machine learning?
A parte matemática chata...
Hoje em dia se joga termos como inteligência artificial e machine learning de maneira extremamente solta, como buzzwords para chamar atenção, mas a verdade é que machine learning é bem simples de ser entendida, afinal em algum nível todos nós fazemos isso diariamente com nossas próprias observações. Mas, para entender esse processo, é necessário primeiro entender o que é a área que a contém, a inteligência artificial.
A ideia da IA é simular o comportamento humano, que é padronizado até certo ponto e, justamente por isso, é possível de se fazer previsões dele. Por exemplo, na psicologia, existe uma área (extremamente popular, diga-se de passagem) que trata unicamente disso, a psicologia comportamental, e ela aplica com sucesso métodos que se tratam de condicionamento do comportamento. Sem sombra de dúvidas, a psicologia cognitiva-comportamental é uma das mais, se não a mais, desenvolvida cientificamente dentre suas áreas irmãs, porque ela está facilmente associada a métodos científicos. Não podemos fazer experimentos de psicologia humanista e medir resultados da mesma maneira como podemos fazer com experimentos comportamentais. Métodos psicométricos são comumente utilizados em paralelo com a psicologia comportamental porque ambos são rigorosos, na medida do possível, em metodologia e falam muito mais claramente do que a filosofia aplicada à mente humana, como os métodos da psicologia existencial ou analítica.
Se temos resultados tão claros com previsões de comportamento humano, como temos na psicologia, é perfeitamente razoável se inferir que ele é previsível. Como toda área científica, a IA tem diferentes sub-áreas que servem para conseguir prever o comportamento e, até, o pensamento humano. Machine Learning é uma dessas sub-áreas, ou um método de se aplicar Inteligência Artificial.
Recentemente eu fiz uma publicação para meu portfólio sobre meus hábitos musicais, e ela terminou comigo tentando encontrar equações que descrevessem uma maneira aproximada de eu ouvir álbuns em 2022: pela equação, eu poderia aproximar quantas vezes ouvi o álbum apenas dando como input a posição. Se eu quisesse saber quantas vezes ouvi o 150° álbum mais ouvido, bastaria substituir na equação que encontrei ao final (e detalhe... não ficou ruim a aproximação).
O método que eu utilizei foi regressão linear. Isso é um método simples que se estuda em matérias não muito avançadas de estatística na universidade, e eu apliquei em experimentos de laboratório em disciplinas da Química e da Engenharia. Não é algo incomum. Claro, o modelo não é perfeito, e a cada ponto que temos um erro associado, mas quanto mais dados nós obtemos, melhor ajustado o modelo pode ficar.
Uma regressão linear bem simples pode ser vista na imagem a seguir:
Os dados 150 que escolhi foram encontrados a partir de uma equação que eu já gostaria de imaginar como seria, e adicionei erros aleatórios a ela, somente para fazer uma regressão linear de volta e comparar o resultado da regressão com a equação que escolhi. No caso, usei uma simples y=3x, e a regressão linear me deu y=2.9298x + 4.12, um resultado bem próximo.
Se eu usasse 1000 dados, seria de se esperar que a equação da regressão linear se aproximaria ainda mais de y=3x. Usei 1001 e tive esse resultado.
A equação resultante foi y=2.9943x + 0.205553, ainda mais próxima de y=3x.
Claro, nesse caso é fácil de entender o porquê de funcionar porque eu escolhi uma equação específica para ser o "resultado certo" — y=3x —, mas no mundo real não existe ninguém escolhendo algo assim. Os padrões surgem de maneira espontânea, sem organização nenhuma, e métodos de machine learning servem para encontrar esses padrões.
Isso vale para comportamentos muito mais complexos do que os que são descritos por uma reta. No mesmo texto que coloquei em meu portfólio, eu mesmo apliquei regressão linear de maneira que não fosse uma reta, afinal eu já tinha certa ideia por conhecer no mínimo distribuição exponencial e de Pareto. E no final das contas, o melhor resultado foi uma inversa. Imaginem, agora, que combino diferentes tipos de funções e eu faça uma soma entre elas para encontrar uma aproximação ainda melhor.
Em Álgebra Linear, o conceito de ortogonalidade e de bases é útil para isso. Na resolução de equações diferenciais, alguns métodos utilizam funções ortogonais que, combinadas, encontram o resultado exato da equação. Frequentemente, são combinações infinitas, mas para fazer uma aproximação de machine learning, isso não é necessário. O exemplo mais comum para qualquer aluno de Cálculo é o de séries de Taylor, aproximações que se faz de uma função em torno de determinado ponto a partir de somas de polinômios. Os polinômios são funções ortogonais entre si, e eles conseguem se combinar de maneira linear para descrever um conjunto infinito de funções reais. Uma das séries de Taylor mais comuns são com funções senóides. Veja como uma função seno pode ser aproximada pela soma de termos polinomiais:
Observe que não estou falando de regressão nesse momento, e sim de aproximação de funções a partir de outras mais simples como polinômios, no caso da série de Taylor, mas existem regressões lineares feitas ao modelo polinomial seguindo séries de Taylor. É um exemplo bom para alunos de Cálculo ainda no começo da universidade (ou, melhor ainda, em estudo independente).
Essas regressões são métodos de machine learning. Existem outros, como regressão polinomial (que não é o mesmo de utilizar série de Taylor), regressão logística, a única coisa que realmente importa é conseguir encontrar uma maneira que realmente explique o fenômeno. Isso não quer dizer unicamente se ajustar aos dados, porque entramos em questões de overfitting e underfitting, mas de se ajustar aos dados que são usados em treino e passar em testes.
Existem dois tipos de dados: dados de treino e dados de teste. Os primeiros são usados para gerar os modelos e os segundos para testar a validade do modelo. Dentro do banco de dados, os dados de treino são determinados de maneira aleatória, para que o modelo não seja viciado, e são testados com os outros, afinal de nada adianta ele seguir perfeitamente os dados de treino se os dados no geral não se ajustam tão bem. Se o modelo se encaixar muito bem para os dados de treino mas não tão bem para os dados no geral, temos overfitting, e se ele não se ajusta bem a nenhum dos dois, underfitting. Overfitting é performance boa nos dados de treino e performance ruim em generalização, e underfitting é performance ruim nos dados de treino e performance ruim na generalização.
Em suma, dados de treino são milhões de imagens de captcha de cachorros, lagos e cachoeiras, dadas para o algoritmo reconhecer o que é cada um desses, e os dados de teste são as respostas dos captchas que você responde.
O que é impressionante na IA atual
Apesar do título desse texto, é difícil não se impressionar com alguns resultados. O primeiro gerador de conteúdo por IA que ficou popular foi o Dall-E Mini, que hoje se chama CrAIyon, e ele... realmente era muito interessante.
Algumas dessas imagens eu realmente adotei como ícones e salvei, porque realmente eram interessantes. Algumas ideias que eu nunca poderia ver por falta de técnica artística foram colocadas em prática. Inteligência artificial realmente abriu caminho para se visualizar muitas coisas que não poderiam ser visualizadas antes.
Certa vez eu estava assistindo a uma livestream do compositor Samuel Andreyev, e perguntaram-no sobre IA. A resposta dele foi:
Até agora, não vi nada que tenha sido um "game changer", mas é difícil extrapolar como será daqui a alguns anos, porque a tecnologia está se desenvolvendo rápido demais. Não sou especialista de forma alguma, mas até onde sei esses mecanismos não são envolvidos em criação de conhecimento, ou criação artística, mas estão criando versões sofisticadas, capazes de se mover muito rápido, em cima do que já existe.
E essa é a limitação, ao menos a limitação até agora, da IA. Ela não permite inovação, apenas otimização.
Vejam as imagens que o CrAIyon gerou para mim. Eu não critiquei o fato de algumas delas, apesar de interessantes, não terem absolutamente nada a ver com o que eu inicialmente pedi, porque sei que isso é o tipo de coisa que vai melhorar com o tempo, e sem dúvida os resultados vão ficar mais e mais impressionantes. Mas ele em momento algum criou algo realmente novo. Quando escrevi sobre o Frank Zappa, citei Rollo May, o psicólogo existencialista, e sua definição de criatividade. Repito aqui:
A consciência que se obtém na criatividade não é o nível superficial de intelectualização objetificada, mas um encontro com o mundo em um nível que passa por cima da divisão de sujeito-objeto. 'Criatividade', para reformular nossa definição, é o encontro da pessoa intensivamente consciente com o seu mundo.
A Coragem de Criar, Rollo May
Existe um aspecto introspectivo no processo criativo que é impossível de ser reproduzido. O máximo que uma IA pode fazer é uma associação improvável que desperte numa pessoa externa realmente a faísca criativa. Assim como uns olham para quadros e enxergam paredes de concreto ou podem olhar para uma imagem do CrAIyon e pensar "hehe que engraçado", outros olham para quadros e vivem vidas inteiras ou podem olhar para uma imagem do CrAIyon e ter um insight profundo. O que eu garanto é que andróides não sonham com ovelhas eletrônicas. É uma questão extremamente complexa, que dentro da psicologia acredito estar associada ao estudo da dimensão da personalidade de "abertura à experiência" no modelo do Big Five (que, aliás, é o mais mensurável dentre os existentes hoje em dia).
O quanto é possível se aprender meramente com dados de experiências anteriores?
Sempre me lembro de Nassim Taleb nessas questões. Não sou grande fã de sua personalidade, mas no livro A Lógica do Cisne Negro ele argumenta por boa parte do livro em cima da ideia dos fenômenos do "Extremistan" e do "Mediocristan", Extremistão e Mediocristão. Os eventos do segundo grupo são os usuais, que são descritos por curvas gaussianas bonitinhas, o que permite que os eventos não sejam tão importantes individualmente. No Extremistão, porém, cada indivíduo tem diferenças tão radicais que um único é capaz de impactar os comportamentos gerais ou até mesmo totais.
Particularmente, acredito que todos nós somos membros de ambos em alguma dimensão. Somos medíocres em nossos conhecimentos mundanos — faça o seguinte exercício mental: pesquise a fundo sobre as indústrias responsáveis por três objetos quaisquer na sua casa — o quanto você conhece sobre elas e os temas delas? —, mas idealmente em alguma dimensão temos capacidade de oferecermos algo realmente único. Os exemplos que Taleb dá são como J.K Rowling, Bill Gates, pessoas que de forma alguma se adequavam à norma, o que é uma condição para que eles se tornassem os ícones que se tornaram em suas respectivas áreas. Ao mesmo tempo, garanto que Rowling e Gates são membros do Mediocristão quando se trata de culinária.
Uma das teses do livro é que o Mediocristão está cada vez menos relevante, e o Extremistão que realmente dita o funcionamento do mundo, o que hoje em dia me parece autoevidente quando paramos para ver coisas comuns como o caso do Elon Musk, independentemente de suas controvérsias, comprando o Twitter.
Mas, para ficar mais clara a relação com IA, perceba que pela mecânica de dados de treino e dados de teste, inteligências artificiais tendem a deixar de lado os outliers, os pontos que não se encaixam na curva. A IA é rainha... no Mediocristão. Mas os grandes eventos, os eventos mais importantes, são todos do Extremistão.
Taleb no começo do livro dá um excelente exemplo: o bem-estar de um peru de natal ao longo de 1000 dias, sendo alimentado e engordando para ir ao seu destino final.
Se peru aplicasse métodos de regressão para tentar prever o seu futuro bem-estar, ele se depararia com uma amarga decepção. Existe alguma dúvida que o dia mais importante da vida do peru não tinha como ser previsto de maneira puramente inferencial?
Já que citei a psicologia em dois momentos desse texto, vamos falar dos limites dos modelos mais "científicos" da psicologia.
Não me entenda mal, psicologia comportamental é incrivelmente eficiente, inclusive posso falar por experiência pessoal, afinal fui profundamente ajudado por ela no final do meu curso na universidade. Mas ainda que sua vida esteja perfeitamente organizada, ainda existem problemas existenciais e morais. O reducionismo de transformar todo o comportamento humano em uma máquina de estímulos e respostas não explica fenômenos inconscientes, por mais que, realmente, uma vasta quantidade de atividades cotidianas sejam frutos de rotinas comportamentais.
Os princípios comportamentais são absolutamente os mesmos para todas as pessoas. O quanto é possível de aprendermos com experiências anteriores que já mensuramos, especialmente sendo essas de outras pessoas? Com certeza não é nada, mas também com certeza não é o suficiente.
Não vou me estender tanto nesse tema porque não é uma área que domino muito, mas a consideração iluminista de o homem enquanto ser racional, o homo economicus ou algo similar é uma aproximação, e algo similar é dado como pressuposição do modelo comportamental. Particularmente, eu acredito que a maior parte dos problemas das pessoas são problemas comportamentais, mas isso não invalida possibilidades de existirem outros — podendo ser questões fisiológicas ou não. Esse problema foi descrito de maneira excelente por autores existencialistas ou precursores do existencialismo: até onde a ciência realmente consegue nos levar?
IA não tem alma
Essas fantasias cientificistas não são ideias novas. No século XIX já existia um conceito de progresso similar (e inclusive foi motor para absurdos anti-humanos como eugenia não só no século XIX como no XX — sugiro a leitura do capítulo sobre New Deal e Fascismo do livro A Renegade History of the United States, de Thaddeus Russell), e o avanço da ciência sustentava uma ideia de utopia humana.
Na Europa Oriental, o niilismo se mesclou com esses ideais cientificistas e geraram debates dois séculos atrás. Apesar de hoje vermos tudo como algo muito recente, por causa de filmes e fantasia, Fiódor Dostoiévski já levava a sério esse problema. Ele imaginou a questão de um mundo perfeitamente determinístico, onde a ciência e a tecnologia avançaram tanto ao ponto de explicar absolutamente tudo no ser humano — todo tipo de comportamento, necessidades, e até conseguiu gerar fartura absoluta, sem falta alguma. O que sobra ao homem? A existência.
Em Memórias do Subsolo, ele cria quase um experimento mental, onde o homem é essencialmente uma "tecla de piano ou pedal de órgão", isto é, algo tão conhecido e determinado que pode ser estudado em conjunto com outros.
Nesse exercício mental, ele diz: todas as relações econômicas estarão ditadas com precisão matemática, não haverá motivo para perguntas racionais, porque tudo faz sentido. Mas... seria o homem, de fato, racional?
Mais ainda: então, dizeis, a própria ciência há de ensinar ao homem (embora isto seja, a meu ver, um luxo) que, na realidade, ele não tem vontade nem caprichos, e que nunca os teve, e que ele próprio não passa de tecla de piano ou de um pedal de órgão; e que, antes de mais nada, existem no mundo as leis da natureza, de modo que tudo o que ele faz não acontece por sua vontade, mas espontaneamente, de acordo com as leis da natureza. Consequentemente, basta descobrir essas leis e o homem não responderá mais pelas suas ações, e sua vida se tornará extremamente fácil. Todos os atos humanos serão calculados, está claro, de acordo com essas leis, matematicamente, como uma espécie de tábua de logaritmos, até 108.000, e registrados num calendário; ou, melhor ainda, aparecerão algumas edições bem-intencionadas, parecidas com os atuais dicionários enciclopédicos, nas quais tudo estará calculado e especificado com tamanha exatidão que, no mundo, não existirão mais ações nem aventuras. (...) Pergunto-vos agora: o que se pode esperar do homem, como criatura provida de tão estranhas qualidades? Podeis cobri-lo de todos os bens terrestres, afogá-lo em felicidade, de tal modo que apenas umas bolhazinhas apareçam na superfície desta, como se fosse a superfície da água; dar-lhe tal fartura, do ponto de vista econômico, que ele não tenha mais nada a fazer a não ser dormir, comer pão de ló e cuidar da continuação da história universal — pois mesmo neste caso o homem, unicamente por ingratidão e pasquinada, há de cometer alguma ignomínia. Vai arriscar até o pão de ló e desejar, intencionalmente, o absurdo mais destrutivo, o mais antieconômico, apenas para acrescentar a toda esta sensatez positiva o seu elemento fantástico e destrutivo. Desejará conservar justamente os seus sonhos fantásticos, a sua mais vulgar estupidez, só para confirmar a si mesmo (como se isto fosse absolutamente indispensável) que os homens são sempre homens e não teclas de piano, que as próprias leis da natureza tocam e ameaçam tocar de tal modo que atinjam um ponto em que não se possa desejar nada fora do calendário. Mais ainda: mesmo que ele realmente mostrasse ser uma tecla de piano, mesmo que isto lhe fosse demonstrado, por meio das ciências naturais e da matemática, ainda assim ele não se tornaria razoável e cometeria intencionalmente alguma inconveniência, apenas por ingratidão e justamente para insistir na sua posição. E, no caso de não ter meios para tanto, inventaria a destruição e o caos, inventaria diferentes sofrimentos e, apesar de tudo, insistiria no que é seu! Lançaria a maldição pelo mundo e, visto que somente o homem pode amaldiçoar (é um privilégio seu, a principal das qualidades que o distinguem dos outros animais), provavelmente com a mera maldição alcançaria o que lhe cabe: continuaria convicto de ser um homem e não uma tecla de piano! Se me disserdes que tudo isso também se pode calcular numa tabela, o caos, a treva, a maldição — de modo que a simples possibilidade de um cálculo prévio vai tudo deter, prevalecendo a razão -, vou responder-vos que o homem se tornará louco intencionalmente, para não ter razão e insistir no que é seu! Creio nisto, respondo por isto, pois, segundo parece, toda a obra humana realmente consiste apenas em que o homem, a cada momento, demonstre a si mesmo que é um homem e não uma tecla! Ainda que seja com os próprios costados, mas que o demonstre; ainda que seja como um troglodita, mas que demonstre. E, depois disso, como não pecar, como não louvar o fato de que isto ainda não exista e que a vontade ainda dependa o diabo sabe de quê...
— Memórias do Subsolo, Fiódor Dostoiévski
Aplicações já conhecidas de Machine Learning
Machine Learning não é algo novo. Você provavelmente já pesquisou algo no Google e se decepcionou ao ir para a segunda, terceira ou até mesmo a quarta página de pesquisa sem encontrar o que gostaria. Os resultados de pesquisas online em, essencialmente, todo mecanismo de pesquisa, são dados por meio de métodos de machine learning. É extremamente difícil realmente encontrar algo diferente pelo Google, ou qualquer outra ferramenta (sugiro SearX) por causa disso: os links sugeridos sempre são os que tem mais dados "puxando" o resultado para eles. Daí caímos sempre nos mesmos lugares: sites grandes, jornais, Facebook, Twitter, Youtube, fóruns grandes.
O ChatGPT inclusive já substitui pesquisas mais técnicas no Google simplesmente porque ele sabe interagir melhor, é uma ferramenta mais poderosa. Estava falando recentemente com um amigo sobre isso, talvez esses bots de texto que usam inteligência artificial sejam mecanismos de pesquisa mais eficientes do que os tradicionais, o que é a principal vantagem deles.
Não estamos num ponto onde IA vai conseguir substituir muita coisa. Códigos, por exemplo, já são feitos por eles, mas nenhum trabalho de programador é meramente fazer códigos. Se você é um trainee, ou um empregado júnior, que se sente ameaçado por esse tipo de coisa, só quer dizer que as suas capacidades são rasas. De nada adianta saber fazer códigos se você não tem visão e interpretação do que está acontecendo. ChatGPT não consegue fazer storytelling.
Inclusive, isso deveria servir de motivação para empregadores reevaluarem questões como capacidade técnica, e começar a prestar atençaõ mais em inovação, ideias, e o aspecto humano no geral. Como foi dito antes, inteligência artificial não tem alma, mas o seu empregado, quem sabe, pode ter.
Inteligência artificial! Robôs inteligentes! Isso é tão Black Mirror! :O
Já que entramos no mérito, eu não vejo motivo algum para se preocupar com inteligência artificial se você tiver quase qualquer tipo de emprego. Novamente, na mesma conversa que citei há pouco, meu amigo apontou que existem, de fato, algumas profissões que podem ser ameaçadas: dubladores, tradutores, jornalistas do Buzzfeed, coisas desse tipo. Mas para a maioria das pessoas, isso é improvável, a não ser que o trabalho seja a coisa mais mecânica e substituível do mundo. Isso provavelmente vale para muita coisa no entretenimento, também. Certa vez, vi um vídeo da streamer Pokimane dizendo que IA era uma ameaça para streamers, e tudo que consegui pensar foi "é, para você sim!" Ora, ao admitir isso o que ela apontou é que literalmente não oferece nada de único, nada que não seja substituível! Eu poderia escrever parágrafos e parágrafos sobre esse evento, tangenciando assuntos até controversos e divisivos, mas não é esse o ponto.
Inteligência artificial será, como apontou o Pedro Sette-Câmara, excelente para fazerem redações de ENEM, passarem em etapas de educação formal, e fazerem concursos. Isso porque a natureza dessas atividades é mecânica. É uma coisa dura de aceitar, mas como eu argumentei na Tutoria de Como Viver, a massificação da educação causa problemas sérios. Duvido que o método mecânico de ensino e avaliação que temos em todos os vestibulares do país traga alguma coisa boa para absolutamente qualquer aluno. O que chamei de "conformismo pseudo-pragmático" no outro texto é nada mais do que um grande método de machine learning aplicado a pessoas, mas máquinas são muito mais efetivas para essas coisas.
Meu grande problema com a internet moderna, do qual já reclamei diversas vezes em diferentes textos e até vídeos, é que está tudo automatizado demais, não existe o fator humano tanto quanto existia antigamente. A internet está medíocre. Enquanto ela costumava ser um lugar para pessoas com visão e vontade de se arriscar, hoje ela é um lugar para pessoas que querem se conformar e proteger no meio de rebanhos. E redes sociais (como deixei implícito ao citar mecanismos de pesquisa) são essencialmente governadas por IA.
IAs vão sempre tomar decisões por associação de palavras ou imagens, não por raciocínio humano ou individualidade, porque elas não têm individualidade. E isso que falta na internet, isso que é a mágica da internet: individualidade.
A internet está piorando por causa de automação e menor quantidade de fator humano. Não tem como argumentar que a internet melhorou com o tempo — é simplesmente impossível alguém ter conhecimento de como era o Google em 2009 e comparar com 2022 e achar que o mecanismo de pesquisa está realmente melhor. O fato de ter mais resultados e conteúdo não quer dizer que tem resultados e conteúdos melhores —, e o motivo dela ter piorado é aplicação de inteligência artificial.
Dai às máquinas o que for das máquinas e dai ao homem o que for do homem!
Um apelo humanista
Se IA te parece muito realista, o quanto de ti é substituível por algoritmos?
O quanto de você não fica apenas consumindo conteúdo de maneira passiva? Se essa crise da IA (especialmente dentre artistas digitais, que eu gostaria em particular de proteger) realmente te ameaça, isso é sinal para você renascer, você está no caminho errado!
Aceite e potencialize aquilo que você tem de particular e especial, não se conforme com o que as grandes massas fazem. Você não só está piorando a sua própria vida, como também está piorando tudo para os outros, treinando inteligências artificiais para ficarem ainda menos efetivas, etc..
Quem sabe, se você cavar suficientemente fundo, encontra uma alma. E agarre aquilo, porque é o seu verdadeiro diferencial.