Como interpretar os índices de semelhança?

Esse texto foi originalmente pensado para Revisores e Produtores de Conteúdo que utilizam o CopySpider, mas serve para a comunidade de usuários em geral.

Importante: para a leitura desse conteúdo, tenha em mente: o CopySpider identifica semelhança entre documentos, logo, cabe ao usuário determinar se tais semelhanças podem ou não caracterizar plágio.

A versão 3.0 trouxe mudanças que, se num primeiro momento causam desconforto para alguns profissionais que utilizam o CopySpider na validação e/ou produção de trabalhos acadêmicos, num segundo momento proporciona a oportunidade de assimilação de alterações importantes que aumentam a segurança e qualidade de resultados em tais atividades.

Desde o início da distribuição do CopySpider notou-se um erro muito comum de seus usuários: interpretar o limite antigo de semelhança de 3% como um crivo de "salvo" ou "condenado" dos documentos em análise com relação ao problema de identificação de plágio.

Essa interpretação errônea, embora alertada desde o início da distrbuição do software em nosso FAQ, ainda é verificada no comportamento de usuários, novos e antigos, do CopySpider.

A decisão de apenas olhar o índice de semelhança antigo e não fazer a análise de comparação dos conteúdos com o destaque dos termos comuns pode ser um risco bastante grande, principalmente para profissionais que pretentem algum tipo de remuneração do seu trabalho com o uso do CopySpider.

Veja exemplos do risco de se parar a análise na tabela antiga de semelhança:

  • Um resultado com índice de semelhança antigo de 0,5% pode "encobrir" uma análise de conteúdo na qual 10% do arquivo de entrada foi encontrado num documento candidato. Essa quantidade pode ser suficiente para classificar um trabalho como plágio.
  • Um resultado com índice de semelhanda antigo de 2,5% não deve ser considerado "adequado" por estar abaixo do limite antigo de "3%". O mesmo vale para um resultado de 3,5% para determinar que houve plágio. Por esse motivo uma nova classificação foi idealizada, criando uma faixa de semelhança que não é apenas "OK" ou "não OK".

O índice antigo de semelhança é bastante distorcido em função do tamanho dos arquivos de entrada e candidato. Quanto maior a diferença de tamanho desses arquivos, maior a distorção no índice. Esse efeito de distorção é ilustrado nesse item do nosso FAQ e recomendamos a todos a sua assimilação.

Um outro erro comum que encontramos está no fato de algumas Instituições de Ensino criarem regras sobre a semelhança máxima apresentada nos relatórios do CopySpider, como um crivo para aceitar ou não trabalhos de alunos. Novamente, tais regras interpretam de forma errada o índice de semelhança antigo, o que também sempre esteve em destaque nesse item de nosso FAQ. Salientamos para tais Instituições que é um erro interpretar o índice de semelhança como um "índice de plágio". O novo índice de semelhança, apresentado em forma qualitativa com graus Baixo, Moderado e Baixo, tenta ajudar os usuários nessa mudança de paradigma.

Vale destacar que dúvidas e sugestões sempre são bem vindas, mas há um problema quando tais ações têm origem na falta de entendimento do funcionamento do software, principalmente pela falta de compreensão do conteúdo de nosso FAQ.

Sabemos que toda mudança traz desconforto, mesmo quando alcançamos algo melhor, mas acreditamos que nossos usuários prezam por resultados e informações de qualidade.

Por fim, caso tais profissionais não concordem com as mudanças e o ganho de conhecimento que estamos proporcionando com a versão 3.0, é importante salientar que o CopySpider é um software púbico com licença Pessoal freeware, ou seja, o seu uso não é obrigatório.

Veja também:

Plágio e Citações

Qual o percentual aceitável para ser considerado plágio?

 


Palavras-chave

Como ver se tem plágio no texto? Melhor detector de plágio gratuito? Software para identificar plágio. Como verificar plágio online grátis?; busca por plágio; programa anti-plágio gratuito; ferramenta anti-plágio; detector de plágio grátis; similaridade de texto; semelhança entre documentos; detector de cópia; busca por cópia; detecção de plágio; suspeita de plágio; copiar colar; ctrl c ctrl v; cópia entre arquivos; trabalho acadêmico; monografia; artigo científico.