Skip to main content

Biblioteca para extração de características linguísticas para o Português Brasileiro.

Project description

CohMetrix-BR

Biblioteca para extração de características linguísticas para o Português Brasileiro.

Descrição

Esse repositório implementa uma versão em biblioteca da API Web Coh-Metrix BR descrito em "Coh-Metrix PT-BR: Uma API web de análise textual para a educação (2020)".

Esse é um trabalho em progresso que reimplementa as características como descritas no artigo, todavia permitindo o uso direto em códigos Python.

Quickstart

A biblioteca é organizada no seguinte formato:

---
title: Diagrama de Pacotes
---
flowchart TD

Root(<b>cohmetrixBR</b>\nPacote raiz da biblioteca.)
Root --> Resources(<b>resources</b>\nArmazena modelos e recursos utilizados para\no cálculo das características.)
Root --> Features(<b>features</b>\nContém diferentes módulos com a implementação\ndas características descritas no artigo.)

Para utilização, só precisamos importar diretamente o módulo com as características desejadas e invocar a respectiva função. Um exemplo desse processo abaixo:

# Importando o módulo com as
#   características relacionadas à conectivos
from cohmetrixBR.features import connectives

# Calculando a característica CNCAll para um
#   texto qualquer:
connectives.CNCAll('Esse é um texto de exemplo.')
# 0.0

Outra forma de utilizar a biblioteca é calculando múltiplas características de uma única vez. Todos os módulos expõem uma variável FEATURES que contém a lista de todas as características disponibilizadas naquele módulo. Assim, é possível fazer dessa forma:

# Obtendo todas as características presentes
#   na biblioteca
from cohmetrixBR.features import FEATURES

# Definindo o texto de exemplo
text = "Texto de exemplo para extração de características"

# Calculando todas as características
features = [f(text) for f in FEATURES]
# [1, 1, 1.0, ...,  15.797142857142859, -45.032]

Instalação

Primeiro, realiza a instalação da biblioteca via pip ou através do git clone:

1. Instalando com o pip

# Configurar ambiente virtual
# ...

# Instalar através do pip
$ pip install cohmetrixBR

2. Instalando localmente

# Clonar repositório
$ git clone https://github.com/moesio-f/cohmetrix-br

# Acessar diretório
$ cd cohmetrix-br

# Configurar ambiente virtual
# ...

# Instalar através do pip
$ pip install -e .

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

cohmetrix-br-lib-0.1.0.tar.gz (442.1 kB view details)

Uploaded Source

Built Distribution

cohmetrix_br_lib-0.1.0-py3-none-any.whl (447.2 kB view details)

Uploaded Python 3

File details

Details for the file cohmetrix-br-lib-0.1.0.tar.gz.

File metadata

  • Download URL: cohmetrix-br-lib-0.1.0.tar.gz
  • Upload date:
  • Size: 442.1 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.8.18

File hashes

Hashes for cohmetrix-br-lib-0.1.0.tar.gz
Algorithm Hash digest
SHA256 dd9d8a79f9a0d7302f390eb163033f20f8aebbcd193e81afaf6c58ae839c1513
MD5 e43df0818ca0ca36f48d00b54d6ce29d
BLAKE2b-256 0398adf0b00e4401360febb5026a863a0f016ce7f7d16f9b3d3241e9f1638f17

See more details on using hashes here.

File details

Details for the file cohmetrix_br_lib-0.1.0-py3-none-any.whl.

File metadata

File hashes

Hashes for cohmetrix_br_lib-0.1.0-py3-none-any.whl
Algorithm Hash digest
SHA256 23f7a6379e2130a0b945364679dd52f9a73d6ace96b5f97eee05ed20ddeb07ad
MD5 4ac8b413ecb1dad6b0738eaf1a167f80
BLAKE2b-256 4196aed892362a532f4e960e68ac5d3b99d7e99f6fe79b170fdc4097257efe9e

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page