Esta librería sirve para la deteccion de correlaciones de cara a limpiar los datos para un modelo de clasificacion binaria.
Project description
Esta librería sirve a la hora de comprender y analizar los datos de uno para la realización de un modelo de clasificación binaria. Para ello, detecta aquellas variables que están muy correlacinadas entre sí y elimina una por cada pareja. Además, también se analizan aquellas variables que están fuertemente relacionadas con la variable objetivo.
A continuación se va adjuntar aquellos comandos que se necesitan para su instalación y futuro uso. También, se explican la manera de utilizar la librería y todas sus funciones.
La instalación
El primer paso consiste en la instalación del paquete:
pip install libreria-correlaciones==0.7
Llamada del paquete
from libreria_correlaciones.libreria_correlaciones import deteccion_correlaciones
Instanciar la clase
Para la realización de esta librería, se ha decido crear una clase que recoja 6 funciones. Para ello, lo primero que hay que hacer es indicar cuales son los datos que se quieren analizar.
archivo = ' ' #añadir el dataset deseado
datos = deteccion_correlaciones(archivo)
Utilización de la librería
Lo primero que realiza esta clase una vez insertado los datos es crear dos variables. Una de ellas llamada "numericas" que hace referencia a todas las variables númericas existentes en el dataset. La otra, "variables_corr_para_modelar", indica todas aquellas variables que no sean la variable objetivo. Es decir, quita la variable clase del dataset.
La primera función elimina aquellas variables para modelar que estén más correlacionadas.
datos.eliminacion_variables_correlacionadas()
Después, la siguiente función coge las variables numéricas y analiza cuales tienen más relación con la variable objetivo.
data = datos.variables_mas_importantes()
Una vez habiendo asignado el resultado de esta función a una variable, se puede ejecutar la función que te permite visualizar los histogramas de estas variables.
datos.histogramas(data)
Finalmente, se pueden visualizar los resultados del filtrado a través de mapas de calor.
datos.correlaciones_a_eliminar()
datos.correlaciones_variables_importantes()
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
File details
Details for the file libreria_correlaciones-0.10.tar.gz
.
File metadata
- Download URL: libreria_correlaciones-0.10.tar.gz
- Upload date:
- Size: 4.4 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.1 CPython/3.9.7
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | c5a8173adf3fc141e3e183ea4e1378e2067f4ae9dfdb0658a6ef569c1d1a197f |
|
MD5 | 32edf6bff7a18b80e8a552eadbad7323 |
|
BLAKE2b-256 | acb059e3059fed860a5ecc1d1e6c07cf8f46ea53d550ff91a3da87bcd13b2304 |