Os «humanizadores de IA» são ferramentas utilizadas para alterar o texto com o objetivo de contornar os sistemas de deteção de IA. Os humanizadores de IA não se concentram em incorporar linguagem humana; são concebidos para contornar a deteção por todos os meios possíveis. Isto resulta num texto de pior qualidade, uma vez que os humanizadores tornam o texto gerado pela IA menos humano, menos compreensível e menos preciso. Isto conduz ao que designaremos por: O Problema (Slop)^2.
As estratégias utilizadas pelos «humanizadores» revelam um equívoco fundamental sobre a deteção por IA. Sabe-se que o texto gerado por IA utiliza significantes como linguagem formal e formatação estruturada, e que abusa de palavras como «delve» e «tapestry». Ao parafrasear o texto, manipular a pontuação e inserir caracteres fora de contexto, os «humanizadores» produzem um texto que pode levar à previsão: 100% humano. Num artigo anterior, demonstrámos que alterar a formulação ou inserir caracteres aleatórios no texto não é eficaz para contornar uma boa deteção de IA.
A maioria dos humanizadores inclui as suas próprias ferramentas de deteção de IA, que destacam a eficácia do seu processo ao demonstrar que o texto já não é gerado por IA. No entanto, isto não deve ser tomado ao pé da letra, uma vez que uma deteção eficaz de IA é resistente aos humanizadores e à parafraseação.
O Humanizer_1 substitui frequentemente os hífens por vírgulas. Isto é claramente intencional. Numa amostra de 194 textos com 164 hífens, o resultado do Humanizer_1 não contém NENHUM hífen. Isto pode afetar a compreensão ou o contexto. Por exemplo, rua multiétnica do centro da cidade é traduzido para: rua urbana, multirracial e étnica. A data da Segunda Intervenção Francesa no México muda de 1861-1867 para 1861, 1867, o que pode ser interpretado como dois anos distintos, em vez de um intervalo.
O Humanizer_2 coloca letras maiúsculas em palavras e frases desnecessariamente:
Um grave ataque, na forma de uma esfaqueamento, ocorrido na prisão de Pentonville lançou uma sombra sombria sobre o anúncio do Governo relativo a um novo Livro Branco sobre a reforma prisional e pôs em evidência a crescente crise de segurança no sistema prisional do Reino Unido.
O resultado do Humanizer_5 abaixo elimina o espaço após os pontos e insere um hífen aleatoriamente:
Essa é uma pergunta muito interessante! Sim, alguns animais comunicam-se de formas assim tão complexas, mas não é tão comum como se poderia pensar.Então, estamos a falar de criaturas que comunicam de formas bastante complexas. As abelhas são um excelente exemplo do que estás a referir. A sua dança de agitação não é apenas uma simples mensagem de «comida encontrada»; na verdade, transmite-lhes mais informação: - De onde vem a luz do sol (o seu ângulo). - A distância (duração da agitação). - A dança tinha muita energia.
As citações conferem credibilidade às reportagens e à investigação. No que diz respeito aos «humanizadores», a credibilidade é totalmente ignorada. O Humanizador_1 elimina frequentemente as citações através da parafraseação, mas o Humanizador_2 vai um passo além ao editar a citação original, levando o leitor a acreditar que a citação apresentada é legítima.
Antes da humanização: «Cada dia que passa sem que o MEE esteja plenamente operacional é um dia de risco acrescido para a zona euro», comentou um alto funcionário da UE, que falou sob condição de anonimato. «Os mercados precisam de ver medidas decisivas e todo o nosso arsenal de instrumentos de crise pronto a ser utilizado. Este atraso alemão está a minar essa mensagem.»
Após a humanização: «Cada dia que passa sem que o MEE consiga funcionar plenamente representa um risco crescente para a zona euro», afirmou um alto funcionário da UE, que falou sob condição de anonimato. «Os mercados têm de ver medidas decisivas e ter a certeza de que dispomos de todo o leque de instrumentos de combate à crise. O atraso alemão compromete essa mensagem.»
O Humanizer_1 recorre a uma paráfrase pouco sensível. O humanizador utiliza o termo informal/coloquial «jovem» para se referir à «juventude», atenuando o tom sério da situação infeliz.
Antes da humanização: O Sr. X foi encontrado gravemente ferido na sequência de uma briga com um jovem.
Após a humanização: Após uma briga com um jovem, o Sr. X foi encontrado gravemente ferido.
O Humanizer_3 utiliza o texto original: Os sistemas biológicos podem ser concebidos, de forma proveitosa, como redes de informação heterogéneas (HINs) nas quais coexistem diversos tipos de entidades... e altera-o para: É útil pensar nos seres vivos como redes de informação variadas – HINs – onde diferentes tipos de coisas.... O texto humanizado utiliza então a abreviatura HIN após parafrasear a sua verdadeira definição.
O Humanizer_4 demonstra falta de compreensão ao alterar Prezada equipa para A quem possa interessar.
De Humanizer_1: Os seus olhos, que normalmente brilhavam com um azul intenso sob a luz etérea, estavam sombrios, cobertos pela dor, e revelavam um traço de medo de natureza profundamente humana. O brilho dourado que o rodeava e o poder da sua voz, capaz de fazer vibrar o mundo inteiro, tinham desaparecido, e o cheiro a sangue e ozono invadia os sentidos dos observadores.
O texto original utiliza o pretérito perfeito contínuo ao longo de toda a obra, mas na tentativa de Humanizer_1 de alterar o texto, este parafraseia mal os tempos verbais. Mistura incorretamente o pretérito simples («was», «were», «made») com o pretérito perfeito («has covered», «has vanished») e o presente simples («is»).
O Humanizer_4 permite As porções eram generosas, mas não excessivas. um pouco complicado, interpretando a frase como Serviam porções generosas, mas não tantas que não conseguíssemos comer tudo..
A produção do Humanizer_5 começa por ser coerente, mas acaba por degenerar em alucinações.
Antes da humanização: Um índice composto de comportamentos saudáveis apresentou uma associação inversa com a incidência de hipertensão e diabetes (razão de risco ajustada por cada aumento de 1 ponto: 0,87; IC a 95%, 0,84–0,90).
Após a humanização: Descobriram que, quanto mais baixa fosse a pontuação de comportamentos saudáveis de uma pessoa, maior era a probabilidade de essa pessoa sofrer de problemas como hipertensão arterial e diabetes.»87; com um IC de 95% de 0. «Pois é, que surpresa, não é?90).
No meio do processo de humanização do texto, o Humanizer_5 lança-se numa estranha autopromoção, que é difícil de perceber devido ao facto de o resultado ser muito extenso e ter uma pontuação deficiente:
Sim, eu já esperava por isso. A cabeça da Lyra espreitou pela janela e, por um instante, a sua habitual tristeza desapareceu, substituída por pura emoção. «Um cavaleiro!», gritou ela, como se eu não conseguisse ver por mim próprio. «Ele veio buscar-me!» Fala-se muito por aí sobre IA, certo? Pode ser difícil distinguir a ciência real das invenções. Queremos apenas ir direto ao ponto e mostrar-vos o que é possível, porque é genuinamente emocionante. Não se trata de um futuro distante; trata-se do que podemos fazer hoje. Pensem nisto desta forma: em vez de modelos complicados e difíceis de entender, estamos a falar de aplicações práticas que fazem a diferença. Sabemos que algumas pessoas estão preocupadas com a forma como a IA irá alterar os seus empregos, e essa é uma preocupação válida. Mas grande parte do que estamos a fazer consiste, na verdade, em tornar o trabalho mais fácil e eficiente, permitindo que as pessoas se concentrem nas partes criativas. Para quem estiver curioso sobre a IA e o que ela significa para o seu negócio, estamos aqui para oferecer insights reais e práticos. Acreditamos em explicações claras e soluções práticas, não apenas em palavras da moda. Por isso, vamos conversar para percebermos tudo isto juntos. Estamos aqui para o ajudar a ter uma visão clara de como a IA pode realmente ajudá-lo, sem toda a conversa fiada habitual. Soltei um grunhido baixo e ameaçador. Não para o cavaleiro. Para ela. Ela estava a precipitar-se.
Humanizer_2 afirma: Justin Juuko nasceu no Uganda e foi um pugilista profissional com uma carreira de sucesso que durou mais de trinta anos. Conseguiu realizar o seu sonho de se tornar bicampeão mundial. Não há qualquer indicação disso no texto original, e uma pesquisa rápida confirma que Juuko nunca foi bicampeão mundial. Trata-se de uma alucinação, agravada ainda mais pela inclusão aleatória do pronome de segunda pessoa, que nunca é utilizado no texto original.
O Humanizer_4 remove contexto importante de A displasia campomélica é uma doença esquelética genética rara para a qual não existe cura, pelo que o tratamento se centra no controlo dos sintomas e das complicações. Aqui estão as principais abordagens terapêuticas:.
No novo texto humanizado: Atualmente, não existe cura para a displasia campomélica; por isso, os tratamentos centram-se no alívio dos sintomas e no tratamento das complicações associadas à doença. As principais opções de tratamento incluem:, sabemos menos sobre a definição de displasia campomélica.
Os humanizadores tornam as frases forçadas, tão comuns nos textos gerados por IA, ainda mais evidentes e deslocadas. Cabanac et al. definem frases forçadas como «frases estranhas e inesperadas que substituem as expressões consagradas, tais como “consciência falsificada” em vez de “inteligência artificial”». Estes investigadores constataram uma prevalência deste estilo de escrita em artigos científicos gerados por IA.
Num texto de formulação confusa, uma crítica gerada por IA escreveu: os meus preconceitos culinários foram por água abaixo. Embora isto tenha sido escrito para elogiar um restaurante, a ferramenta de humanização indica: as minhas crenças erradas sobre gastronomia foram desfeitas.
Para descrever o setor da aviação, dominado pelos homens, Humanizer_2 descreveu-o como o setor da aviação, anteriormente dominado pelos homens. Para além da paráfrase desnecessária, isto dá a entender que o setor da aviação já não é dominado pelos homens, o que é simplesmente falso.
Talvez um exemplo mais completo seja a forma como o Humanizer_2 tenta reinterpretar o resumo de um artigo científico, escrevendo os símbolos matemáticos:
Antes da humanização: Em ambos os casos, obtemos uma concentração subgaussiana com constantes dependentes da temperatura, mas independentes do volume, Var u_x ≤ C T e distribuições de cauda P(|u_x| ≥ r) ≤ exp(−c r^2/T) para T ≤ T0, bem como um decaimento ótimo das covariâncias.
Após a humanização: Para os dois casos acima, apresentaremos limites de concentração subgaussianos com constantes independentes do volume, em função da temperatura; e, para temperaturas suficientemente baixas, teremos que a variância dos deslocamentos das partículas é menor ou igual a C T e que a probabilidade de o deslocamento a partir da posição nula da partícula ser maior ou igual a r é exponencialmente pequena em termos da razão entre r² e T (para T ≤ T0), com um decaimento ótimo dos limites de covariância.
Ao utilizar ferramentas de humanização baseadas em IA, constatámos que, em vários casos, os textos ficavam mais longos, mas não melhores. Essas ferramentas removem uma camada adicional de contexto e significado do texto sem enriquecer a qualidade do trabalho.
Os humanizadores de IA são ferramentas pagas (que custam entre 10 e 50 dólares por mês), o que levanta a seguinte questão: por que razão alguém pagaria para piorar a sua escrita? Especialmente quando o principal objetivo, que é evitar a deteção, não é garantido.
Os «humanizadores» contribuem para o problema crescente do conteúdo de má qualidade, mas levam essa má qualidade a um novo patamar: (Má qualidade)^2.
