Skip to main content

Com o uso de estatísticas do texto, o pacote identifica aspectos que funcionam como uma “assinatura” da autoria. Desse modo, por meio deste pacote, é possível detectar se dois textos dados foram escritos por uma mesma pessoa.

Project description

Text Comparator Package

Descrição.

O pacote Text Comparator Package é usado para a avaliação de similaridade entre textos, com base nas seguintes estatísticas: Tamanho médio de palavra: Média simples do número de caracteres por palavra.

Relação Type-Token:

Número de palavras diferentes utilizadas em um texto divididas pelo total de palavras.

Razão Hapax Legomana:

Número de palavras utilizadas uma única vez dividido pelo número total de palavras.

Tamanho médio de sentença:

Média simples do número de caracteres por sentença.

Complexidade de sentença:

Média simples do número de frases por sentença.

Tamanho médio de frase:

Média simples do número de caracteres por frase.

-

Instalação:

Use o gerenciador de pacotes pip para instalaro text-comparator

Author

Jennifer Figueiredo

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

text_comparator-0.0.1.tar.gz (2.8 kB view hashes)

Uploaded Source

Built Distribution

text_comparator-0.0.1-py3-none-any.whl (3.0 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page