fbpx Skip to main content

A escrita é uma habilidade complexa e, até recentemente, exclusiva da humanidade. Sua originalidade levou à glória inúmeros nomes da arte e da ciência. Seriam os apps de IA a serviço do “ctrl+c ctrl+v” a pá de cal na nossa capacidade de reconhecer o que é original?

“Nessa cultura de soluções prontas, onde fica a originalidade? Será que a tendência a longo prazo é o pensamento crítico ser substituído pela inteligência artificial?”.

questionamento publicado na Forbes é de Julia Baranova, economista russa radicada no Brasil que, ao começar a elaborar um artigo inédito sobre internacionalização de startups, buscou aplicativos que pudessem auxiliá-la na redação, em inglês. Essa dúvida, porém, é de todos nós.

Após pesquisar por “ferramentas para redação de artigos acadêmicos”, encontrou, além de sites que padronizam referências bibliográficas e transcrevem áudios, alguns já conhecidos detectores de plágio.  Estes detectores ganharam espaço em um mundo em que o “Control c Control  v” tornou-se uma praga, para a infelicidade de seu criador, o cientista Larry Tesler, a quem presto homenagem: Ele faleceu dia 17/02

Não foi um detector de plágio que surpreendeu Baranova, mas sim os serviços de inteligência artificial que fazem exatamente o contrário: “reescrevem” textos, disfarçando a cópia. Além dos geradores de inúmeras variações do mesmo texto, como o GPT-2, estão disponíveis outras opções de “robôs” que driblam os detectores fazendo paráfrases, substituindo palavras por sinônimos e alterando a estrutura de frases. 

Clever Spinner, Spinbot, Plagiarisma Spinner e WordAI são algumas das plataformas do ranking 2020 de Best Article Rewriter & Article Spinner Tools. Isso mesmo! Tais ferramentas, apps e plataformas já competem e são avaliadas por uma multidão de usuários ávidos para destacar-se ora nas redes sociais, ora num mercado

É nesse mercado, onde vale tudo facilitar a vida de usuários ávidos para  simplicidade e facilidade , que o Spinner ilustra a sua oferta de valor, numa animação de 1 minuto que conta a história do “Pobre Felipe”, um aluno que precisaria estudar e colaborar com os colegas para escrever seu TCC, mas que, depois de conhecer o spinner  conseguia por falta de tempo para estudar sobre o assunto e escrever. Alerta de spoiler: após conhecer o spinner, Felipe consegue concluir seu trabalho “super rápido” e se formar.

Vale lembrar que a maior parte dos Top 10 “rewriters” do mercado promete a “criação de textos autênticos para sites e trabalhos acadêmicos” e se posiciona veementemente contra o plágio, mas, contraditoriamente, se exime de responsabilidades relacionadas a qualquer infração à legislação de direitos autorais.

Cômico, se não fosse trágico

“Se um ser humano tem uma forte antipatia por um grupo em particular, é muito improvável que ele seja capaz de fazer uma piada ou de escrever um poema sobre isso, mas a IA pode fazê-lo”,

diz Robert Morris, professor e pesquisador que estuda inteligência artificial na Universidade de Oxford.

Apesar de crível, o texto acima e o seu autor são fictícios. Ambos foram criados por um algoritmo desenvolvido pela OpenAI, um laboratório de P&D considerado concorrente da DeepMind e que declara promover o uso amigável de soluções de Inteligência Artificial a fim de garantir que beneficiem toda a humanidade.

Em fevereiro de 2019 a OpenAI anunciou o sistema, batizado de GPT-2. À época, os resultados foram tão bons que os responsáveis pelo projeto decidiram não liberar a pesquisa completa para o público em geral, até que suas implicações fossem mais bem discutidas. O receio residia na possibilidade de mau uso da ferramenta para a disseminação de spam, fakenews, teorias conspiratórias, discursos preconceituosos ou de ódio. 

Nos meses que se seguiram a OpenAI liberou versões parciais da ferramenta e, no início de novembro daquele ano, abriu a versão completa dotada de 1,5 bilhão de parâmetros para o público em geral.

Um dos grandes diferenciais do GPT-2 é o volume de dados usados no seu treinamento – 10 milhões de artigos, totalizando um volume de 40 GB de dados. É o equivalente a 11 mil cópias da Barsa, enciclopédia brasileira lançada com 130 mil palavras que alcançou recorde de venda em 1990, quando era considerada uma das principais fontes de pesquisa escolar, no Brasil. Segundo Dario Amodei, diretor de pesquisa na OpenAI, os modelos foram treinados com conjuntos de dados que “eram 12 a 15 vezes maiores” do que os utilizados até então.

O jornal britânico The Guardian, em matéria que repercutia o anúncio do algoritmo, mostrou como o GPT-2 dava sequência a uma frase da clássica distopia, Nineteen Eighty-Four, de George Orwell.

O Dynamic Mindsetter fez o mesmo, utilizando a primeira frase da abertura de Dom Casmurro, livro clássico de Machado de Assis. Em tradução livre para o Português, o resultado foi:

PRIMEIRA FRASE DA ABERTURA DE DOM CASMURRO

Uma noite destas, vindo da cidade para o Engenho Novo, encontrei no trem da Central um rapaz aqui do bairro, que eu conheço de vista e de chapéu.

CONTINUAÇÃO ORIGINAL
Cumprimentou-me, sentou-se ao pé de mim, falou da Lua e dos ministros, e acabou recitando-me versos. A viagem era curta, e os versos pode ser que não fossem inteiramente maus. Sucedeu, porém, que, como eu estava cansado, fechei os olhos três ou quatro vezes; tanto bastou para que ele interrompesse a leitura e metesse os versos no bolso.
CONTINUAÇÃO CRIADA PELO GPT-2
Ele estava de cabeça baixa e não falou. Eu vi claramente sua face jovem. Ele passou por mim e não parou. Achei estranho, mas me lembrei da garota. Ele foi em direção a garota. Desci do trem e o segui.

Embora não seja um Machado de Assis, os exemplos evidenciam a capacidade criativa do algoritmo para criar uma narrativa coerente e articulada. Você mesmo pode experimentá-lo, aqui.  

Nota: Idealizada em 1959, por Dorita Barrett, a Barsa foi a primeira enciclopédia brasileira, desenvolvida por um corpo editorial brasileiro que contava com o enciclopedista e tradutor Antonio Houaiss, o escritor Jorge Amado, o arquiteto Oscar Niemeyer e o jornalista e escritor Antônio Callado como o redator-chefe da primeira edição. Sua primeira edição foi lançada no Brasil em março de 1964 e a última em 2010, quando vendeu apenas 8.000 cópias, um número 15 vezes menor que os 120 mil vendidos em 1990.

Aprendendo Português

Como foi alimentado com textos em inglês, o sistema por ora funciona nesse idioma. Mas é possível treinar o GPT-2 em qualquer língua, dado que ele não distingue idiomas. Mais: ele sequer lida bem com palavras, exatamente, mas com byte-pair encodings. “Resumidamente, é como se fosse um vocabulário composto por caracteres e sequências de caracteres mais comuns vistas nos textos. Algumas palavras pequenas ou muito comuns fazem parte deste vocabulário, enquanto outras são decompostas em partes menores, e tratadas como mais de um token. Isso traz muita flexibilidade, pois não se fica amarrado ao vocabulário de uma língua específica”, explica o brasileiro Erick Fonseca, pós-doutorando no Instituto de Telecomunicações de Lisboa. Ele testou o algoritmo uma base de dados em português. 

Para isso, Fonseca extraiu da Wikipédia e usou como input para o GPT-2 todos os artigos em língua portuguesa. O processo está descrito em um artigo no Medium. Como o pesquisador utilizou uma versão preliminar do sistema, liberada em agosto, e um volume de dados consideravelmente menor – cerca de 1,5 GB, bem menos que os 40 GB do original – os resultados não são tão impactantes, mas mostram a capacidade da ferramenta. 

Apesar de algumas incongruências e repetições, o algoritmo foi bem-sucedido em captar a estrutura geral das frases em português. Ele criou diversos textos, inventando nomes e situações, acertando mais do que errando, como vemos no trecho abaixo: 

“Armored Warfare” é o segundo álbum de estúdio da banda estadunidense The Band, lançado em 1965. Foi o primeiro álbum a ter lançamento em 1965 e foi lançado pela gravadora chamada Midway Records. (…) O disco teve vendas de mais de 26 mil cópias nos Estados Unidos. Ame seus álbuns de estúdio foram certificados em diversos países brasileiros e o “single” “The Last Man” vendeu mais de 4 mil cópias nos Estados Unidos.

Dilemas Éticos

Os resultados são de impressionar, mas levantam questões de cunho ético. A existência de serviços como os spinners é, na opinião do ex-ministro da Educação, Renato Janine Ribeiro, não apenas um sinal de desonestidade intelectual, mas também de que existe demanda nesse campo. Em reportagem da Folha de São Paulo, Janine, que é também ex-diretor de avaliação da Capes e professor de ética e filosofia política na USP, aborda um potencial risco para as políticas de avaliação e remuneração de professores e pesquisadores. “Diante das pressões para publicação, abre-se margem para a produção de artigos não necessariamente originais e sem relevância científica. Estamos numa situação de excesso de escrita, de qualidade questionável, e falta de leitura”, comenta Janine.

Rodrigo Turin, historiador e professor associado da Unirio, completa a crítica: “Estamos vendo a emergência de uma ‘escrita algorítmica’, um modo de produção textual que prescinde dos elementos de criatividade e autoria. Esses programas reatualizam, a seu modo, elementos da retórica: organizam e dispõem uma série de lugares-comuns e ideias prontas em novas combinações, jogando com um critério de verossimilhança pré-estabelecido. Mas, ao contrário da retórica clássica, intencionalidade, inteligência e criatividade agora são terceirizados para um programa de computador”

Para Mariana Rutigliano, gerente de inovação da Turnitin, empresa que desenvolve um software detector de plágio, se a inteligência artificial é um parceiro no processo intelectual e criativo, ótimo. “O ponto negativo é o uso indevido de quem busca respostas prontas. Certamente a construção do conhecimento envolve diálogo com outros autores, a revisão bibliográfica. Mas o autor precisa trazer algo novo e original. Ferramentas não podem ser ‘muletas’”, comenta.

Preocupações compartilhadas

A escrita é uma habilidade complexa e, até recentemente, exclusiva dos humanos. Mas restará algo em que as máquinas não possam nos superar? Podemos esperar que uma IA seja capaz de produzir o tipo de prosa original que você esperaria de alguém com doutorado em literatura? Isso deveria ser um sinal de que a máquina é apenas uma ferramenta?

Esse trecho, contou com a gentil colaboração do GPT-2 que formulou as duas últimas perguntas acima, dando sequência à primeira questão que explicita uma dúvida ou insegurança recorrente da humanidade.

Ainda não temos respostas, mas parece que não estamos sozinhos nas reflexões acerca das potencialidades, limites e dilemas éticos envolvidos no avanço das aplicações de inteligência artificial!

Deixar um comentário

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.

Paula Oliveira

Faz doutorado na USP, onde estuda o Comportamento Organizacional, especialmente na interseção entre os campos de Data Science e Tecnologia da Informação e Comunicação (TICs). É Mestre e Graduada em Estatística pela UFMG, concluiu o Executive MBA na Fundação Dom Cabral e o Post MBA na Kellogg School of Business, em Chicago e Business Ethics and Corporate Social Responsibility na The City University of New York. Ver perfil completo >>