Biblioteca para extração de características linguísticas para o Português Brasileiro.
Project description
CohMetrix-BR
Biblioteca para extração de características linguísticas para o Português Brasileiro.
Descrição
Esse repositório implementa uma versão em biblioteca da API Web Coh-Metrix BR descrito em "Coh-Metrix PT-BR: Uma API web de análise textual para a educação (2020)".
Esse é um trabalho em progresso que reimplementa as características como descritas no artigo, todavia permitindo o uso direto em códigos Python.
Quickstart
A biblioteca é organizada no seguinte formato:
---
title: Diagrama de Pacotes
---
flowchart TD
Root(<b>cohmetrixBR</b>\nPacote raiz da biblioteca.)
Root --> Resources(<b>resources</b>\nArmazena modelos e recursos utilizados para\no cálculo das características.)
Root --> Features(<b>features</b>\nContém diferentes módulos com a implementação\ndas características descritas no artigo.)
Para utilização, só precisamos importar diretamente o módulo com as características desejadas e invocar a respectiva função. Um exemplo desse processo abaixo:
# Importando o módulo com as
# características relacionadas à conectivos
from cohmetrixBR.features import connectives
# Calculando a característica CNCAll para um
# texto qualquer:
connectives.CNCAll('Esse é um texto de exemplo.')
# 0.0
Outra forma de utilizar a biblioteca é calculando múltiplas características de uma única vez. Todos os módulos expõem uma variável FEATURES
que contém a lista de todas as características disponibilizadas naquele módulo. Assim, é possível fazer dessa forma:
# Obtendo todas as características presentes
# na biblioteca
from cohmetrixBR.features import FEATURES
# Definindo o texto de exemplo
text = "Texto de exemplo para extração de características"
# Calculando todas as características
features = [f(text) for f in FEATURES]
# [1, 1, 1.0, ..., 15.797142857142859, -45.032]
Instalação
Primeiro, realiza a instalação da biblioteca via pip
ou através do git clone
:
1. Instalando com o pip
# Configurar ambiente virtual
# ...
# Instalar através do pip
$ pip install cohmetrixBR
2. Instalando localmente
# Clonar repositório
$ git clone https://github.com/moesio-f/cohmetrix-br
# Acessar diretório
$ cd cohmetrix-br
# Configurar ambiente virtual
# ...
# Instalar através do pip
$ pip install -e .
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for cohmetrix_br_lib-0.1.0-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 23f7a6379e2130a0b945364679dd52f9a73d6ace96b5f97eee05ed20ddeb07ad |
|
MD5 | 4ac8b413ecb1dad6b0738eaf1a167f80 |
|
BLAKE2b-256 | 4196aed892362a532f4e960e68ac5d3b99d7e99f6fe79b170fdc4097257efe9e |