Você já se perguntou como identificar um texto escrito por inteligência artificial? Com a explosão de ferramentas de IA geradoras de conteúdo, essa pergunta se tornou crucial. Neste post, compartilho minha experiência testando 10 detectores de conteúdo AI e os resultados surpreendentes que encontrei.
Em fevereiro de 2025, realizei testes abrangentes com dez detectores de conteúdo AI, utilizando cinco blocos de texto: dois escritos por mim e três gerados pelo ChatGPT. O objetivo era claro: descobrir quais ferramentas conseguiam identificar com precisão a origem do texto.
O que testei e como fiz
Antes de tudo, precisamos definir o que é plágio no contexto da IA. Plágio é apresentar ideias ou palavras de outra pessoa como suas, sem dar os devidos créditos. Mesmo que a IA não esteja “roubando” conteúdo, o uso de texto gerado por IA sem a devida atribuição configura plágio.
Para testar os detectores, utilizei cinco blocos de texto distintos. Cada bloco foi analisado individualmente por cada detector. Acima de 70%, a resposta do detector foi considerada como “forte probabilidade”. A acurácia é proporcional à quantidade de acertos.
Resultados Gerais
Após testar os 10 detectores com os 5 blocos de texto, cinco deles obtiveram um resultado perfeito, identificando corretamente todos os textos como humanamente escritos ou gerados por AI.
Os detectores testados incluem BrandWell, Copyleaks, GPT-2 Output Detector, GPTZero, Grammarly, Monica, Originality.ai, QuillBot, Undetectable.ai, Writer.com e ZeroGPT. Observei que a acurácia varia bastante entre os detectores, e alguns demonstram consistência em identificar textos humanos em contraste com a IA. A consistência, em longo prazo, ainda precisa ser constatada.
É importante ressaltar que não se deve confiar completamente nesses detectores. Há casos em que textos escritos por falantes não nativos de uma língua ou com características idiomáticas/linguísticas específicas, podem ser erroneamente classificados como AI.
Desempenho de Cada Detector de Conteúdo AI
Vamos analisar individualmente o desempenho de cada ferramenta, em ordem alfabética:
BrandWell AI Content Detection (Acurácia 40%)
A acurácia do BrandWell foi baixa. Em certos testes, não conseguiu diferenciar texto gerado por IA de texto humano.
Copyleaks (Acurácia 80%)
Apesar de se autodenominar “o detector de IA mais preciso”, o Copyleaks apresentou resultados inconsistentes em comparação com outros detectores, com uma taxa de acerto inferior a 100%.
GPT-2 Output Detector (Acurácia 60%)
Criado usando a biblioteca Hugging Face Transformers, este detector apresentou precisão apenas moderada em identificar a origem dos textos.
GPTZero (Acurácia 80%)
Apresentando um desempenho inconsistente entre os testes, com uma taxa de acerto apenas razoável.
Grammarly (Acurácia 40%)
Embora conhecido por sua função de verificação gramatical, o Grammarly apresentou baixa acurácia na detecção de conteúdo gerado por IA, acertando apenas em alguns testes.
Monica (Acurácia 100%)
Monica se destacou com uma acurácia perfeita, demonstrando eficiência na identificação da origem dos textos. Possui um sistema que agrega informações de outros detectores, o que explica a alta precisão.
Originality.ai (Acurácia 100%)
Este detector comercial apresentou uma acurácia de 100%, identificando todos os textos corretamente, com custos de uso de créditos mensais.
QuillBot (Acurácia 100%)
Nesta série de testes, o QuillBot demonstrou excelente precisão na identificação de texto humano e gerado por IA.
Undetectable.ai (Acurácia 100%)
Undetectable.ai se destacou com acurácia de 100%. Apesar de sua principal função ser “humanizar” textos de IA tornando-os indetectáveis, seu detector interno se mostrou altamente eficaz.
Writer.com AI Content Detector (Acurácia 40%)
O Writer.com apresentou baixa acurácia, com erros na identificação da origem de vários textos.
ZeroGPT (Acurácia 100%)
O ZeroGPT atingiu uma acurácia perfeita, identificando todos os textos corretamente.
Humano ou IA?
E você? Já testou algum desses detectores? Compartilhe a sua experiência e quais ferramentas você considera mais confiáveis.