Com o uso de estatísticas do texto, o pacote identifica aspectos que funcionam como uma “assinatura” da autoria. Desse modo, por meio deste pacote, é possível detectar se dois textos dados foram escritos por uma mesma pessoa.
Project description
Text Comparator Package
Descrição.
O pacote Text Comparator Package é usado para a avaliação de similaridade entre textos, com base nas seguintes estatÃsticas: Tamanho médio de palavra: Média simples do número de caracteres por palavra.
Relação Type-Token:
Número de palavras diferentes utilizadas em um texto divididas pelo total de palavras.
Razão Hapax Legomana:
Número de palavras utilizadas uma única vez dividido pelo número total de palavras.
Tamanho médio de sentença:
Média simples do número de caracteres por sentença.
Complexidade de sentença:
Média simples do número de frases por sentença.
Tamanho médio de frase:
Média simples do número de caracteres por frase.
-
Instalação:
Use o gerenciador de pacotes pip para instalaro text-comparator
Author
Jennifer Figueiredo
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for text_comparator-0.0.1-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 6920d4f1fb1bbcb1fc8429b982908442fc7a534622e36adc99593dd6051452de |
|
MD5 | 611fa2e4f6eee274f1a5e4f5b2bd8f6c |
|
BLAKE2b-256 | 905d2b6640dd8cf6c630d712e95515f2b466d9039c2666263d4743e70ead2704 |