Libreria para clasificar texto

Project description

Twotuples: Clasificador de Texto con Lógica Difusa (High-Speed Lexicon Edition)

La librería twotuples tiene como objetivo clasificar opiniones o comentarios en tres categorías: positivo (POS), negativo (NEG) o neutral (NEU).

A diferencia de las librerías basadas en pesados modelos de Deep Learning, Twotuples es un "Machete Láser": un motor híbrido multi-agente extremadamente rápido y ligero que combina lógica semántica, probabilidad estadística y diccionarios mediante Lógica Difusa (Fuzzy Logic).

En su versión 2.0.0, la arquitectura ha sido validada con un dataset de 21,847 comentarios, logrando resultados consistentes procesando miles de comentarios en segundos sin necesidad de GPU.

Características Principales

Arquitectura Triunvirato Multi-Agente:
- Sentiment_Spanish: IA de sentimientos optimizada para lenguaje natural.
- Lexicon_JSON: Diccionario experto nativo con soporte para negaciones, intensificadores (muy, poco) y contrastes (pero).
- Senticon_XML: Diccionario semántico estructurado en XML basado en el léxico Elhuyar, que complementa la precisión en ciertas palabras clave.
Lógica de Bigramas (NUEVO): El sistema escanea y "consume" frases compuestas ("nada_mal", "pesimo_servicio") antes de procesar palabras individuales, elevando drásticamente el entendimiento contextual.
Velocidad Extrema: Ejecución puramente secuencial en CPU, ideal para entornos de producción de alto volumen.
Decisión Difusa: Los tres agentes votan (30%, 40%, 30%) y el resultado se mapea en un espacio difuso (2-tuplas) para la decisión final.

Instalación

Puedes instalar la librería directamente desde PyPI.

pip install Twotuples==2.0.0

[!TIP] Rendimiento: A diferencia de versiones iniciales, Twotuples 1.9.8 es ultra-ligero. No requiere descargar modelos base de transformers masivos, por lo que puede correr perfectamente en cualquier entorno local.

Uso Rápido (Quickstart)

1. Clasificación Difusa de Opiniones

Esta es la funcionalidad principal. Toma un archivo Excel con una columna de textos, ejecuta los tres agentes, aplica la lógica difusa y devuelve archivos Excel con las predicciones.

from Twotuples import Twotuples

# 1. Definimos la ruta al archivo y la columna a analizar
archivo_excel = "data.xlsx"
nombre_columna = "Opinion"

# 2. Ejecutamos el clasificador
Twotuples.difuso_clasificator(data=archivo_excel, ColumnName=nombre_columna)

Archivos generados tras la ejecución:

score.xlsx: Archivo final recomendado. Contiene el texto original y la columna Clasicacion_Difusa con las etiquetas finales (POS, NEG, NEU), junto con las predicciones individuales de cada agente.

2. Evaluación de Métricas

Si tu archivo Excel original contiene una columna con las etiquetas reales o esperadas (Ground Truth), puedes comparar las predicciones del triunvirato con la realidad utilizando la función Metric.

# Reporte de métricas (Precision, Recall, F1-Score)
# Sustituye 'Etiqueta_Real' por el nombre de la columna que contiene los valores esperados.
Twotuples.Metric(etiqueta='Etiqueta_Real', metric='ClassificationReport', sorter='difuse', ClassNumber=3)

# Mostrar la matriz de confusión de forma gráfica
Twotuples.Metric(etiqueta='Etiqueta_Real', metric='ConfusionMatrix', sorter='difuse', ClassNumber=3)

Referencia de la API

`Twotuples.difuso_clasificator(data, ColumnName)`

Ejecuta la predicción sobre un dataset completo.

data (str): Ruta al archivo .xlsx que contiene los datos.
ColumnName (str): Nombre de la columna en el Excel que contiene el texto a analizar.

`Twotuples.Metric(etiqueta, metric='ClassificationReport', sorter='difuse', ClassNumber=3)`

Evalúa y visualiza el rendimiento de las predicciones.

etiqueta (str): Nombre de la columna con las clasificaciones manuales/reales.
metric (str, opcional): Tipo de visualización. Opciones: 'ClassificationReport' o 'ConfusionMatrix'.
sorter (str, opcional): Define qué modelo evaluar individualmente. Opciones: 'difuse', 'lexicon', 'sentiment', 'senticon'. Por defecto es 'difuse' (Consenso total).
ClassNumber (int, opcional): Cantidad de clases de salida. Valores válidos son 2 o 3. Por defecto es 3.

Tecnologías Usadas

Lógica Fuzzy 2-Tuple: Implementación matemática nativa para ponderación de votaciones.
Sentiment-Analysis-Spanish: Base de IA pre-entrenada para análisis contextual.
scikit-learn: Generación de métricas y evaluación de modelos.
Otras dependencias: pandas, numpy, matplotlib, tqdm.

Project details

Release history Release notifications | RSS feed

This version

2.0.0

Apr 25, 2026

1.9.9

Apr 25, 2026

1.9.8

Apr 25, 2026

1.9.7

Apr 25, 2026

1.9.4

Apr 25, 2026

1.9.3

Apr 25, 2026

1.9.2

Apr 25, 2026

1.9.1

Apr 25, 2026

1.9.0

Apr 25, 2026

1.8.9

Apr 25, 2026

1.8.8

Apr 25, 2026

1.8.5

Apr 25, 2026

1.8.4

Apr 25, 2026

1.8.3

Apr 25, 2026

1.8.2

Apr 25, 2026

1.8.1

Apr 25, 2026

1.8.0

Apr 25, 2026

1.7.9

Apr 25, 2026

1.7.8

Apr 25, 2026

1.7.7

Apr 25, 2026

1.7.6

Apr 25, 2026

1.7.4

Apr 25, 2026

1.7.2

Apr 25, 2026

1.7.0

Apr 24, 2026

1.6.3

Apr 24, 2026

1.6.1

Apr 24, 2026

1.5.9

Apr 24, 2026

1.5.8

Apr 24, 2026

1.5.7

Apr 24, 2026

1.5.6

Apr 24, 2026

1.5.5

Apr 24, 2026

1.5.4

Apr 24, 2026

1.5.3

Apr 24, 2026

1.5.2

Apr 24, 2026

1.5.1

Apr 24, 2026

1.5.0

Apr 23, 2026

1.4.8

Apr 23, 2026

1.4.6

Apr 23, 2026

1.4.5

Apr 23, 2026

1.4.1

Apr 23, 2026

1.4.0

Apr 23, 2026

1.3.8

Apr 23, 2026

1.3.7

Apr 23, 2026

1.3.6

Apr 23, 2026

1.3.4

Apr 23, 2026

1.3.3

Apr 23, 2026

1.3.1

Apr 22, 2026

1.3.0

Apr 22, 2026

1.2.0

Apr 22, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

twotuples-2.0.0.tar.gz (104.2 kB view details)

Uploaded Apr 25, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

twotuples-2.0.0-py3-none-any.whl (105.5 kB view details)

Uploaded Apr 25, 2026 Python 3

File details

Details for the file twotuples-2.0.0.tar.gz.

File metadata

Download URL: twotuples-2.0.0.tar.gz
Upload date: Apr 25, 2026
Size: 104.2 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.6

File hashes

Hashes for twotuples-2.0.0.tar.gz
Algorithm	Hash digest
SHA256	`d4ae2be34c925ac93b63ff99196da079a1993ba0f86a0ceb6a64b29be0bc6be7`
MD5	`6c1ff0692359c8f8b056c1d5bce39c1b`
BLAKE2b-256	`69961227892c1c45dc5ca740ecf4c5cab604792baf6c4cb26ee72769568601fe`

See more details on using hashes here.

File details

Details for the file twotuples-2.0.0-py3-none-any.whl.

File metadata

Download URL: twotuples-2.0.0-py3-none-any.whl
Upload date: Apr 25, 2026
Size: 105.5 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.6

File hashes

Hashes for twotuples-2.0.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`f239e91a441da46649162776defc3d115dd7b9b3f804fec6ddb8efd685643ccf`
MD5	`c12a8192ee49a33eda5275512e25c65c`
BLAKE2b-256	`87528307d65a82f2f9fd10a527bf6c147be7343774e4ffb2eab0597334fd00df`

See more details on using hashes here.

Twotuples 2.0.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Project description

Twotuples: Clasificador de Texto con Lógica Difusa (High-Speed Lexicon Edition)

Características Principales

Instalación

Uso Rápido (Quickstart)

1. Clasificación Difusa de Opiniones

2. Evaluación de Métricas

Referencia de la API

`Twotuples.difuso_clasificator(data, ColumnName)`

`Twotuples.Metric(etiqueta, metric='ClassificationReport', sorter='difuse', ClassNumber=3)`

Tecnologías Usadas

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes