Skip to main content

Esta librería sirve para la deteccion de correlaciones de cara a limpiar los datos para un modelo de clasificacion binaria.

Project description

Esta librería sirve a la hora de comprender y analizar los datos de uno para la realización de un modelo de clasificación binaria. Para ello, detecta aquellas variables que están muy correlacinadas entre sí y elimina una por cada pareja. Además, también se analizan aquellas variables que están fuertemente relacionadas con la variable objetivo.

A continuación se va adjuntar aquellos comandos que se necesitan para su instalación y futuro uso. También, se explican la manera de utilizar la librería y todas sus funciones.

La instalación

El primer paso consiste en la instalación del paquete:

pip install libreria-correlaciones==0.7

Llamada del paquete

from libreria_correlaciones.libreria_correlaciones import deteccion_correlaciones

Instanciar la clase

Para la realización de esta librería, se ha decido crear una clase que recoja 6 funciones. Para ello, lo primero que hay que hacer es indicar cuales son los datos que se quieren analizar.

archivo = ' ' #añadir el dataset deseado
datos = deteccion_correlaciones(archivo)

Utilización de la librería

Lo primero que realiza esta clase una vez insertado los datos es crear dos variables. Una de ellas llamada "numericas" que hace referencia a todas las variables númericas existentes en el dataset. La otra, "variables_corr_para_modelar", indica todas aquellas variables que no sean la variable objetivo. Es decir, quita la variable clase del dataset.

La primera función elimina aquellas variables para modelar que estén más correlacionadas.

datos.eliminacion_variables_correlacionadas()

Después, la siguiente función coge las variables numéricas y analiza cuales tienen más relación con la variable objetivo.

data = datos.variables_mas_importantes()

Una vez habiendo asignado el resultado de esta función a una variable, se puede ejecutar la función que te permite visualizar los histogramas de estas variables.

datos.histogramas(data)

Finalmente, se pueden visualizar los resultados del filtrado a través de mapas de calor.

datos.correlaciones_a_eliminar()
datos.correlaciones_variables_importantes()

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

libreria_correlaciones-0.10.tar.gz (4.4 kB view details)

Uploaded Source

File details

Details for the file libreria_correlaciones-0.10.tar.gz.

File metadata

File hashes

Hashes for libreria_correlaciones-0.10.tar.gz
Algorithm Hash digest
SHA256 c5a8173adf3fc141e3e183ea4e1378e2067f4ae9dfdb0658a6ef569c1d1a197f
MD5 32edf6bff7a18b80e8a552eadbad7323
BLAKE2b-256 acb059e3059fed860a5ecc1d1e6c07cf8f46ea53d550ff91a3da87bcd13b2304

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page