A Python tool to assist text analysis.
Project description
text-grade
A Python tool to assist text analysis.
Usage
import logging
import spacy
from text_grade import Document, formulas
logging.basicConfig(level=logging.DEBUG)
TEXTO = """
O algoritmo de Flesch é uma fórmula matemática que é usada para avaliar a legibilidade de um texto em inglês. Ele foi desenvolvido por Rudolf Flesch, um escritor e lexicógrafo austríaco, e é comumente usado por editores, escritores e professores para avaliar a qualidade e a facilidade de leitura de um texto.
A fórmula do algoritmo de Flesch usa duas medidas básicas do texto: o número de palavras e o número de sentenças. Ele também usa o número de sílabas em cada palavra e o número de palavras com duas ou mais sílabas. A partir dessas informações, o algoritmo calcula duas pontuações:
O Índice de Legibilidade de Flesch: esta pontuação varia de 0 a 100 e é baseada no número de palavras e sentenças do texto. Quanto maior a pontuação, mais fácil é o texto de ler.
A Fórmula de Facilidade de Leitura de Flesch: esta pontuação varia de 0 a 100 e é baseada no número de sílabas em cada palavra e no número de palavras com duas ou mais sílabas. Quanto maior a pontuação, mais fácil é o texto de ler.
Para calcular a pontuação do Índice de Legibilidade de Flesch, utiliza-se a seguinte fórmula:
206,835 - (1,015 x número médio de palavras por sentença) - (84,6 x número médio de sílabas por palavra)
Para calcular a pontuação da Fórmula de Facilidade de Leitura de Flesch, utiliza-se a seguinte fórmula:
(0,39 x número médio de palavras por sentença) + (11,8 x número médio de sílabas por palavra) - 15,59
Ambas as pontuações podem ser usadas para avaliar a legibilidade do texto. Em geral, um índice de legibilidade de Flesch de 60 a 70 é considerado fácil de ler para a maioria das pessoas, enquanto uma pontuação de 30 a 50 é considerada difícil. Já a fórmula de facilidade de leitura de Flesch geralmente produz uma pontuação entre 0 e 100, com textos mais fáceis de ler apresentando uma pontuação mais alta.
"""
nlp = spacy.load('pt_core_news_sm')
doc = nlp(TEXTO)
document = Document(doc)
# sentences
print(document.sentences)
# syllables
print(document.syllables)
# words
print(document.words)
score = formulas.flesch_index_pt_br(document)
print(score)
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
text-grade-0.2.0.tar.gz
(9.6 kB
view details)
Built Distribution
File details
Details for the file text-grade-0.2.0.tar.gz
.
File metadata
- Download URL: text-grade-0.2.0.tar.gz
- Upload date:
- Size: 9.6 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.12.0
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | cf40b6dcb3e0b7a157a80e50bc1c5541c7137ddd4bd77da41ee69e45abe7bdee |
|
MD5 | f0f2e0b86564a0c236b416c8d3aaded0 |
|
BLAKE2b-256 | 8faeb2f5b8d011cd2fc712be5c15b35bd4eb3c512f36a0016083eeac0b431224 |
File details
Details for the file text_grade-0.2.0-py2.py3-none-any.whl
.
File metadata
- Download URL: text_grade-0.2.0-py2.py3-none-any.whl
- Upload date:
- Size: 9.9 kB
- Tags: Python 2, Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.12.0
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 10d256b842b45c3dc999aad9902a6379822193ecf28acb591fab8e675f371045 |
|
MD5 | 74e1977c2e95089ea0f8c17b8fa98cea |
|
BLAKE2b-256 | e8184531104a64d6518f479578e7d282ca4a47135aefecd790f6fbd8ea0397ba |