ArXiv endurece regras: IA sem supervisão pode levar a banimento de autores
Olha que coisa interessante! O ArXiv, aquele repositório vastamente utilizado para pré-publicações de pesquisas, está apertando o cerco contra o uso descuidado de modelos de linguagem grandes (LLMs) em artigos científicos. Embora os trabalhos ali não passem por revisão por pares antes da publicação, o ArXiv se tornou um termômetro essencial para as tendências em áreas como ciência da computação e matemática. E, como um bom termômetro, ele precisa ser confiável, não é mesmo?
Não é de hoje que o ArXiv vem buscando formas de combater a enxurrada de artigos de baixa qualidade gerados por IA. Eles já exigem, por exemplo, que novos autores recebam um endosso de um pesquisador estabelecido. É como ter um padrinho na comunidade científica, garantindo que o novato entende o jogo. E, para se fortalecer nessa missão, a organização está se tornando uma entidade independente da Cornell University, o que deve abrir portas para mais recursos no combate a essa ‘sujeira’ de IA.
Mas a novidade mais recente, e que realmente chama a atenção, veio de Thomas Dietterich, presidente da seção de ciência da computação do ArXiv. Ele declarou que, se um trabalho contiver provas irrefutáveis de que os autores não verificaram os resultados gerados por um LLM, a confiança em todo o artigo se esvai. Pense nisso como um castelo de cartas: se a base é fraca, tudo desmorona.
E o que seriam essas provas irrefutáveis? Dietterich menciona coisas como referências inventadas — as famosas ‘alucinações’ da IA — e até comentários diretos entre o autor e o LLM que permaneçam no texto. Se isso for descoberto, os autores podem enfrentar um banimento de um ano do ArXiv. E não para por aí: após o período, eles precisarão que suas submissões futuras sejam aceitas por um periódico com revisão por pares antes de sequer pensarem em publicá-las no ArXiv. É uma sanção e tanto!
É importante ressaltar que isso não é uma proibição total do uso de LLMs. Longe disso! A ideia é que os autores assumam total responsabilidade pelo conteúdo, independentemente de como ele foi gerado. Ou seja, se você copiar e colar linguagem inadequada, plágio, conteúdo tendencioso, erros ou referências incorretas diretamente de uma IA, a culpa é sua. É uma regra de ‘uma chance só’, mas com um processo de moderação e apelação. Afinal, a integridade da ciência é um pilar que não podemos deixar que a facilidade da IA derrube. Pesquisas recentes já mostram um aumento de citações fabricadas, especialmente na área biomédica, e o ArXiv está agindo para proteger a qualidade da pesquisa.


