Libreria para clasificar texto

Project description

Twotuples: Clasificador de Texto con Lógica Difusa

La librería twotuples tiene como objetivo clasificar opiniones o comentarios en tres categorías: positivo (POS), negativo (NEG) o neutral (NEU).

A diferencia de otras librerías de procesamiento de lenguaje natural (NLP), twotuples utiliza tres clasificadores de texto robustos internamente y combina sus resultados utilizando un clasificador difuso basado en el modelo de 2-tuplas lingüísticas, ofreciendo resultados más precisos y de consenso.

Durante su desarrollo, la librería fue probada con 21,847 comentarios de hoteles extraídos de TripAdvisor, obteniendo resultados excelentes evaluados a través del análisis de diversas métricas.

Características

Integración de múltiples modelos de estado del arte: Pysentimiento, Bert Multilingual y Asent.
Sistema de decisión consensuada basado en Lógica Difusa (Fuzzy Logic).
Soporte para textos nativos, utilizando modelos multilingües que evitan la necesidad de traducciones previas.
Exportación automática de resultados y métricas a archivos Excel.

Instalación

Puedes instalar la librería utilizando pip. Como la librería está alojada en TestPyPI, debes incluir el parámetro --extra-index-url para que las dependencias estándar se descarguen de PyPI correctamente.

pip install -i https://test.pypi.org/simple/ --extra-index-url https://pypi.org/simple/ Twotuples==1.3.8

[!TIP] Recomendación: Es altamente aconsejable ejecutar e instalar esta librería en entornos como Google Colab o un entorno virtual local dedicado, ya que requiere descargar modelos pesados de Machine Learning y diccionarios como transformers y spacy.

Uso Rápido (Quickstart)

1. Clasificación Difusa de Opiniones

Esta es la funcionalidad principal. Toma un archivo Excel con una columna de textos, ejecuta los tres modelos, aplica la lógica difusa y devuelve archivos Excel con las predicciones.

from Twotuples import Twotuples

# 1. Definimos la ruta al archivo y la columna a analizar
archivo_excel = "data.xlsx"
nombre_columna = "Opinion"

# 2. Ejecutamos el clasificador difuso
Twotuples.difuso_clasificator(data=archivo_excel, ColumnName=nombre_columna)

Archivos generados tras la ejecución:

score_diffuse.xlsx: Archivo final recomendado. Contiene el texto original y una nueva columna llamada Clasicacion_Difusa con las etiquetas finales (POS, NEG, NEU).
score_pysentiment.xlsx, score_bert.xlsx, score_asent.xlsx: Archivos con los resultados individuales por cada modelo.
score.xlsx: Resumen unificado numérico.

2. Evaluación de Métricas

Si tu archivo Excel original contiene una columna con las etiquetas reales o esperadas (Ground Truth), puedes comparar las predicciones de la librería con la realidad utilizando la función Metric.

# Reporte de métricas (Precision, Recall, F1-Score)
# Sustituye 'Etiqueta_Real' por el nombre de la columna que contiene los valores esperados en tu Excel.
Twotuples.Metric(etiqueta='Etiqueta_Real', metric='ClassificationReport', sorter='difuse', ClassNumber=3)

# Mostrar la matriz de confusión de forma gráfica
Twotuples.Metric(etiqueta='Etiqueta_Real', metric='ConfusionMatrix', sorter='difuse', ClassNumber=3)

Referencia de la API

`Twotuples.difuso_clasificator(data, ColumnName, C=False)`

Ejecuta la predicción sobre un dataset completo.

data (str): Ruta al archivo .xlsx que contiene los datos. Debe tener una hoja llamada Sheet1.
ColumnName (str): Nombre de la columna en el Excel que contiene el texto a analizar.
C (bool, opcional): Parámetro heredado por compatibilidad; ya no es necesario activarlo porque los modelos son multilingües.

`Twotuples.Metric(etiqueta, metric='ClassificationReport', sorter='difuse', ClassNumber=3)`

Evalúa y visualiza el rendimiento de las predicciones.

etiqueta (str): Nombre de la columna con las clasificaciones manuales/reales.
metric (str, opcional): Tipo de visualización. Opciones: 'ClassificationReport' (tabla de texto) o 'ConfusionMatrix' (gráfico visual).
sorter (str, opcional): Define qué modelo específico evaluar. Opciones: 'difuse', 'pysentiment', 'bert', 'asent'. Por defecto es 'difuse'.
ClassNumber (int, opcional): Cantidad de clases de salida. Valores válidos son 2 o 3. Por defecto es 3.

Tecnologías Usadas

Pysentimiento (v0.7.2): Herramienta de NLP basada en Transformers para español e inglés.
Bert Multilingual Sentiment: Modelo fine-tuned de BERT para clasificación de reseñas en múltiples idiomas.
Asent (v0.8.0): Análisis de sentimientos basado en reglas para Spacy.
Transformers & PyTorch: Framework principal para los modelos de deep learning subyacentes.
Otras dependencias: spacy, scikit-learn, pandas, numpy, matplotlib.

Project details

Release history Release notifications | RSS feed

1.9.8

Apr 25, 2026

1.9.7

Apr 25, 2026

1.9.4

Apr 25, 2026

1.9.3

Apr 25, 2026

1.9.2

Apr 25, 2026

1.9.1

Apr 25, 2026

1.9.0

Apr 25, 2026

1.8.9

Apr 25, 2026

This version

1.8.8

Apr 25, 2026

1.8.5

Apr 25, 2026

1.8.4

Apr 25, 2026

1.8.3

Apr 25, 2026

1.8.2

Apr 25, 2026

1.8.1

Apr 25, 2026

1.8.0

Apr 25, 2026

1.7.9

Apr 25, 2026

1.7.8

Apr 25, 2026

1.7.7

Apr 25, 2026

1.7.6

Apr 25, 2026

1.7.4

Apr 25, 2026

1.7.2

Apr 25, 2026

1.7.0

Apr 24, 2026

1.6.3

Apr 24, 2026

1.6.1

Apr 24, 2026

1.5.9

Apr 24, 2026

1.5.8

Apr 24, 2026

1.5.7

Apr 24, 2026

1.5.6

Apr 24, 2026

1.5.5

Apr 24, 2026

1.5.4

Apr 24, 2026

1.5.3

Apr 24, 2026

1.5.2

Apr 24, 2026

1.5.1

Apr 24, 2026

1.5.0

Apr 23, 2026

1.4.8

Apr 23, 2026

1.4.6

Apr 23, 2026

1.4.5

Apr 23, 2026

1.4.1

Apr 23, 2026

1.4.0

Apr 23, 2026

1.3.8

Apr 23, 2026

1.3.7

Apr 23, 2026

1.3.6

Apr 23, 2026

1.3.4

Apr 23, 2026

1.3.3

Apr 23, 2026

1.3.1

Apr 22, 2026

1.3.0

Apr 22, 2026

1.2.0

Apr 22, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

twotuples-1.8.8.tar.gz (104.8 kB view details)

Uploaded Apr 25, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

twotuples-1.8.8-py3-none-any.whl (106.2 kB view details)

Uploaded Apr 25, 2026 Python 3

File details

Details for the file twotuples-1.8.8.tar.gz.

File metadata

Download URL: twotuples-1.8.8.tar.gz
Upload date: Apr 25, 2026
Size: 104.8 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.6

File hashes

Hashes for twotuples-1.8.8.tar.gz
Algorithm	Hash digest
SHA256	`4d65f1a52a2a379bbb3f77c578e8741c2a95c5e087471feb74db13d6eb435ee7`
MD5	`145e63c90e988b8f214e49e351baf2e4`
BLAKE2b-256	`ace0a50b4b96c6edad4830e4f09426fcec2c8c559ed66bdf0df790f28d4d6b9e`

See more details on using hashes here.

File details

Details for the file twotuples-1.8.8-py3-none-any.whl.

File metadata

Download URL: twotuples-1.8.8-py3-none-any.whl
Upload date: Apr 25, 2026
Size: 106.2 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.6

File hashes

Hashes for twotuples-1.8.8-py3-none-any.whl
Algorithm	Hash digest
SHA256	`62dc3c3578175344b90de9aa7f5454a288f13b8d27eef1883079c85bcb83d4ef`
MD5	`e55d0dd089351cf8a88454080670964f`
BLAKE2b-256	`219e20ab6f1302f781864771171b875fdeaabe6726a9129e06182c9c38eabb36`

See more details on using hashes here.

Twotuples 1.8.8

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Project description

Twotuples: Clasificador de Texto con Lógica Difusa

Características

Instalación

Uso Rápido (Quickstart)

1. Clasificación Difusa de Opiniones

2. Evaluación de Métricas

Referencia de la API

`Twotuples.difuso_clasificator(data, ColumnName, C=False)`

`Twotuples.Metric(etiqueta, metric='ClassificationReport', sorter='difuse', ClassNumber=3)`

Tecnologías Usadas

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes