Biblioteca para extração de características linguísticas para o Português Brasileiro.
Project description
CohMetrix-BR
Biblioteca para extração de características linguísticas para o Português Brasileiro.
Descrição
Esse repositório implementa uma versão em biblioteca da API Web Coh-Metrix BR descrito em "Coh-Metrix PT-BR: Uma API web de análise textual para a educação (2020)".
Esse é um trabalho em progresso que reimplementa as características como descritas no artigo, todavia permitindo o uso direto em códigos Python.
Quickstart
A biblioteca é organizada no seguinte formato:
---
title: Diagrama de Pacotes
---
flowchart TD
Root(<b>cohmetrixBR</b>\nPacote raiz da biblioteca.)
Root --> Resources(<b>resources</b>\nArmazena modelos e recursos utilizados para\no cálculo das características.)
Root --> Features(<b>features</b>\nContém diferentes módulos com a implementação\ndas características descritas no artigo.)
Para utilização, só precisamos importar diretamente o módulo com as características desejadas e invocar a respectiva função. Um exemplo desse processo abaixo:
# Importando o módulo com as
# características relacionadas à conectivos
from cohmetrixBR.features import connectives
# Calculando a característica CNCAll para um
# texto qualquer:
connectives.CNCAll('Esse é um texto de exemplo.')
# 0.0
Outra forma de utilizar a biblioteca é calculando múltiplas características de uma única vez. Todos os módulos expõem uma variável FEATURES que contém a lista de todas as características disponibilizadas naquele módulo. Assim, é possível fazer dessa forma:
# Obtendo todas as características presentes
# na biblioteca
from cohmetrixBR.features import FEATURES
# Definindo o texto de exemplo
text = "Texto de exemplo para extração de características"
# Calculando todas as características
features = [f(text) for f in FEATURES]
# [1, 1, 1.0, ..., 15.797142857142859, -45.032]
Instalação
Primeiro, realiza a instalação da biblioteca via pip ou através do git clone:
1. Instalando com o pip
# Configurar ambiente virtual
# ...
# Instalar através do pip
$ pip install cohmetrix-br-lib
2. Instalando localmente
# Clonar repositório
$ git clone https://github.com/moesio-f/cohmetrix-br
# Acessar diretório
$ cd cohmetrix-br
# Configurar ambiente virtual
# ...
# Instalar através do pip
$ pip install -e .
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file cohmetrix_br_lib-0.1.5.tar.gz.
File metadata
- Download URL: cohmetrix_br_lib-0.1.5.tar.gz
- Upload date:
- Size: 443.1 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.8.19
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
6c9f2ddc9ece0baffead0337e1b0a7c9556195cc67119b6cd66dd2d572153736
|
|
| MD5 |
857bc515f72702b97d983f889a5092fe
|
|
| BLAKE2b-256 |
dc7d808d2220eead7338f07ed8b92bc0b6c531f5c11964746d3baf51a10e7226
|
File details
Details for the file cohmetrix_br_lib-0.1.5-py3-none-any.whl.
File metadata
- Download URL: cohmetrix_br_lib-0.1.5-py3-none-any.whl
- Upload date:
- Size: 447.3 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.8.19
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
9217c8e3cf0d932867f919614a2ff9e09e73f467818d0fe3de641183c629e589
|
|
| MD5 |
d67e87916868682f424c406b54c9998e
|
|
| BLAKE2b-256 |
92bd63c1743fb2cdd94335f4a51dee06b7733098a814e4e65a7612878df4db5a
|