Skip to main content

A Python tool to assist text analysis.

Project description

ci codecov PyPI version PyPI - Python Version Code style: black

text-grade

A Python tool to assist text analysis.

Usage

import logging

import spacy

from text_grade import Document, formulas


logging.basicConfig(level=logging.DEBUG)

TEXTO = """
O algoritmo de Flesch é uma fórmula matemática que é usada para avaliar a legibilidade de um texto em inglês. Ele foi desenvolvido por Rudolf Flesch, um escritor e lexicógrafo austríaco, e é comumente usado por editores, escritores e professores para avaliar a qualidade e a facilidade de leitura de um texto.

A fórmula do algoritmo de Flesch usa duas medidas básicas do texto: o número de palavras e o número de sentenças. Ele também usa o número de sílabas em cada palavra e o número de palavras com duas ou mais sílabas. A partir dessas informações, o algoritmo calcula duas pontuações:

O Índice de Legibilidade de Flesch: esta pontuação varia de 0 a 100 e é baseada no número de palavras e sentenças do texto. Quanto maior a pontuação, mais fácil é o texto de ler.

A Fórmula de Facilidade de Leitura de Flesch: esta pontuação varia de 0 a 100 e é baseada no número de sílabas em cada palavra e no número de palavras com duas ou mais sílabas. Quanto maior a pontuação, mais fácil é o texto de ler.

Para calcular a pontuação do Índice de Legibilidade de Flesch, utiliza-se a seguinte fórmula:

206,835 - (1,015 x número médio de palavras por sentença) - (84,6 x número médio de sílabas por palavra)

Para calcular a pontuação da Fórmula de Facilidade de Leitura de Flesch, utiliza-se a seguinte fórmula:

(0,39 x número médio de palavras por sentença) + (11,8 x número médio de sílabas por palavra) - 15,59

Ambas as pontuações podem ser usadas para avaliar a legibilidade do texto. Em geral, um índice de legibilidade de Flesch de 60 a 70 é considerado fácil de ler para a maioria das pessoas, enquanto uma pontuação de 30 a 50 é considerada difícil. Já a fórmula de facilidade de leitura de Flesch geralmente produz uma pontuação entre 0 e 100, com textos mais fáceis de ler apresentando uma pontuação mais alta.
"""

nlp = spacy.load('pt_core_news_sm')
doc = nlp(TEXTO)
document = Document(doc)

# sentences
print(document.sentences)

# syllables
print(document.syllables)

# words
print(document.words)

score = formulas.flesch_index_pt_br(document)

print(score)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

text-grade-0.2.0.tar.gz (9.6 kB view details)

Uploaded Source

Built Distribution

text_grade-0.2.0-py2.py3-none-any.whl (9.9 kB view details)

Uploaded Python 2 Python 3

File details

Details for the file text-grade-0.2.0.tar.gz.

File metadata

  • Download URL: text-grade-0.2.0.tar.gz
  • Upload date:
  • Size: 9.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.12.0

File hashes

Hashes for text-grade-0.2.0.tar.gz
Algorithm Hash digest
SHA256 cf40b6dcb3e0b7a157a80e50bc1c5541c7137ddd4bd77da41ee69e45abe7bdee
MD5 f0f2e0b86564a0c236b416c8d3aaded0
BLAKE2b-256 8faeb2f5b8d011cd2fc712be5c15b35bd4eb3c512f36a0016083eeac0b431224

See more details on using hashes here.

File details

Details for the file text_grade-0.2.0-py2.py3-none-any.whl.

File metadata

  • Download URL: text_grade-0.2.0-py2.py3-none-any.whl
  • Upload date:
  • Size: 9.9 kB
  • Tags: Python 2, Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.12.0

File hashes

Hashes for text_grade-0.2.0-py2.py3-none-any.whl
Algorithm Hash digest
SHA256 10d256b842b45c3dc999aad9902a6379822193ecf28acb591fab8e675f371045
MD5 74e1977c2e95089ea0f8c17b8fa98cea
BLAKE2b-256 e8184531104a64d6518f479578e7d282ca4a47135aefecd790f6fbd8ea0397ba

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page