Skip to main content

Biblioteca para extração de características linguísticas para o Português Brasileiro.

Project description

CohMetrix-BR

Biblioteca para extração de características linguísticas para o Português Brasileiro.

Descrição

Esse repositório implementa uma versão em biblioteca da API Web Coh-Metrix BR descrito em "Coh-Metrix PT-BR: Uma API web de análise textual para a educação (2020)".

Esse é um trabalho em progresso que reimplementa as características como descritas no artigo, todavia permitindo o uso direto em códigos Python.

Quickstart

A biblioteca é organizada no seguinte formato:

---
title: Diagrama de Pacotes
---
flowchart TD

Root(<b>cohmetrixBR</b>\nPacote raiz da biblioteca.)
Root --> Resources(<b>resources</b>\nArmazena modelos e recursos utilizados para\no cálculo das características.)
Root --> Features(<b>features</b>\nContém diferentes módulos com a implementação\ndas características descritas no artigo.)

Para utilização, só precisamos importar diretamente o módulo com as características desejadas e invocar a respectiva função. Um exemplo desse processo abaixo:

# Importando o módulo com as
#   características relacionadas à conectivos
from cohmetrixBR.features import connectives

# Calculando a característica CNCAll para um
#   texto qualquer:
connectives.CNCAll('Esse é um texto de exemplo.')
# 0.0

Outra forma de utilizar a biblioteca é calculando múltiplas características de uma única vez. Todos os módulos expõem uma variável FEATURES que contém a lista de todas as características disponibilizadas naquele módulo. Assim, é possível fazer dessa forma:

# Obtendo todas as características presentes
#   na biblioteca
from cohmetrixBR.features import FEATURES

# Definindo o texto de exemplo
text = "Texto de exemplo para extração de características"

# Calculando todas as características
features = [f(text) for f in FEATURES]
# [1, 1, 1.0, ...,  15.797142857142859, -45.032]

Instalação

Primeiro, realiza a instalação da biblioteca via pip ou através do git clone:

1. Instalando com o pip

# Configurar ambiente virtual
# ...

# Instalar através do pip
$ pip install cohmetrix-br-lib

2. Instalando localmente

# Clonar repositório
$ git clone https://github.com/moesio-f/cohmetrix-br

# Acessar diretório
$ cd cohmetrix-br

# Configurar ambiente virtual
# ...

# Instalar através do pip
$ pip install -e .

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

cohmetrix_br_lib-0.1.2.tar.gz (442.1 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

cohmetrix_br_lib-0.1.2-py3-none-any.whl (447.3 kB view details)

Uploaded Python 3

File details

Details for the file cohmetrix_br_lib-0.1.2.tar.gz.

File metadata

  • Download URL: cohmetrix_br_lib-0.1.2.tar.gz
  • Upload date:
  • Size: 442.1 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.7.4

File hashes

Hashes for cohmetrix_br_lib-0.1.2.tar.gz
Algorithm Hash digest
SHA256 1658f7f4f268a99481e44f2ac400a2a2c033a991d938451c734301d604d1e77b
MD5 fb995d67e296040f6c72f3200a4a847e
BLAKE2b-256 c53d08c21e4abfe3de51463d75ffd4211d1dd1b696206ec9a21bda4292a1c2d7

See more details on using hashes here.

File details

Details for the file cohmetrix_br_lib-0.1.2-py3-none-any.whl.

File metadata

File hashes

Hashes for cohmetrix_br_lib-0.1.2-py3-none-any.whl
Algorithm Hash digest
SHA256 215847f05ddf2b34baad32567a9579a452f29a091e65b8db93093c6ba789de52
MD5 8bd7f3175317319e31c23639588d96cd
BLAKE2b-256 b8e505124e166bf9ce60ff233b31b22ab91af1d63092d6fb607a94db0b28a8da

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page