Púchkin e a IA
Assim, lendo qualquer grupo de palavras ou letras do romance, era possível, usando as tabelas, calcular qual era a maior probabilidade das letras ou palavras seguintes
27-08-2024 às 08h:51
Luís Carlos Silva Eiras*
Em 1830, Alexandre Pushkin terminou Eugênio Oneguin, romance em versos que narra a história do aristocrata do título, desencantado da vida e que se muda para o campo após herdar uma propriedade do tio. Ali, ele conhece Tatiana, uma jovem romântica, que se apaixona por ele, mas Oneguin a rejeita de forma arrogante, não lhe respondendo a famosa carta de amor.
Mas o que tem Púchkin a ver com a inteligência artificial numa época que só dois escritores preocupavam com isso: Mary Shelley (Frankenstein, 1818) e Edgar Allan Poe (O jogador de xadrez de Maelzel, 1836)? Em 1830, nada.
Mas em 1913, Andrei Markov leu Eugênio Oneguin de maneira completamente estranha: contou todas as letras e espaços, além dos digramas, trigramas, tetragramas e pentagramas - grupos de duas, três, quatro e cinco letras - em várias tabelas. Assim, lendo qualquer grupo de palavras ou letras do romance, era possível, usando as tabelas, calcular qual era a maior probabilidade das letras ou palavras seguintes. Markov achou que tinha feito uma descoberta totalmente inútil: para se saber qual é a próxima palavra de um texto, é só continuar lendo, não?
Markov estava errado. Tinha criado uma nova estatística em que a probabilidade do futuro não depende mais do passado, mas apenas do presente. E tinha lançado a primeira base das LLMs (Large Language Models Grandes Modelos de Linguagem), fundamentais para o ChatGPT, Claude, Gemini, Groq etc.