Skip to main content

A Distances Based Outlier Detector package

Project description

Welcome to PyDBOD’s documentation¶

Introduccion

Bienvenido a PyDBOD, la biblioteca de Python para la detección de anomalías usando algoritmos basados en distancias. En esta bibliotica tienes una amplia selección de algoritmos los cuales vamos a documentar a continuación. El uso de todos se reduce a la creación de un objeto de la clase respectiva y el uso del método fit_predict.

Para instalar el paquete o obtener una distribución usar el repositorio en github o en PyPI:

https://github.com/miki97/TFG-OutlierDetection

https://pypi.org/project/PyDBOD/

LOF

Local Outlier Factor (LOF), o en español factor de valor atı́pico local, es una cuantificación del valor atı́pico de un punto perteneciente al conjunto de datos. Esta cuantificación es capaz de ajustar las variaciones en las densidades locales.

LOF (_k = 20_)[¶](#LOF "Enlazar permanentemente con esta definición")

Constructor para la creación del objeto de la clase LOF.

Parámetros

int – k, número de k vecinos a calcular

Tipo del valor devuelto

objeto de la clase LOF

fit_predict(_data_)[¶](#fit_predict "Enlazar permanentemente con esta definición")

Método para aplicar el algoritmo LOF a una matriz de datos.

Parámetros

numpy.array – data, matriz de datos

Tipo del valor devuelto

numpy.array de puntuaciones de anomalía

LOOP

Local Outlier Probability (LoOP), esta técnica combina varios conceptos. En primer lugar, la idea de localidad, los algoritmos basados en densidad como LOF. Por otro lado, LOCI con conceptos probabilı́sticos.

LOOP (_k = 20_, _lamda=3_)[¶](#LOOP "Enlazar permanentemente con esta definición")

Constructor para la creación del objeto de la clase LOOP.

Parámetros
  • int – k, número de k vecinos a calcular

  • int – lamda, párametro para regular la normalización

Tipo del valor devuelto

objeto de la clase LOOP

fit_predict (_data_)

Método para aplicar el algoritmo LOOP a una matriz de datos.

Parámetros

numpy.array – data, matriz de datos

Tipo del valor devuelto

numpy.array de probabilidad anomalia [0-1]

LDOF

Local Outlier Probability (LoOP), utiliza la distancia relativa de un objeto a sus vecinos para medir la cantidad de objetos que se desvıían de su vecindario disperso.

LDOF (_k = 20_)[¶](#LDOF "Enlazar permanentemente con esta definición")

Constructor para la creación del objeto de la clase LDOF.

Parámetros

int – k, número de k vecinos a calcular

Tipo del valor devuelto

objeto de la clase LOOP

fit_predict (_data_)

Método para aplicar el algoritmo LDOF a una matriz de datos.

Parámetros

numpy.array – data, matriz de datos

Tipo del valor devuelto

numpy.array de puntuaciones de anomalía

PINN-LOF

Projection-Indexed Nearest-Neighbour (PINN), en este algoritmo se propone un método de detección de valores atı́picos locales proyectivo basado en LOF.

PINN-LOF(k = 20, t=2, s=1, h=20)

Constructor para la creación del objeto de la clase PINN-LOF.

Parámetros
  • int – k, número de k vecinos a calcular

  • int – t, probabilidad de seleccion de caracteristicas para la proyección

  • int – s, probabilidad de selección para la proyección

  • int – h, número de k vecinos a calcular en la proyección

Tipo del valor devuelto

objeto de la clase PINN-LOF

fit_predict (_data_)

Método para aplicar el algoritmo PINN-LOF a una matriz de datos.

Parámetros

numpy.array – data, matriz de datos

Tipo del valor devuelto

numpy.array de puntuaciones de anomalía

OUTRES

Outres es un algoritmo que propone desarrollar una puntuación de anomalı́as basada en la desviación de objetos en las proyecciones subespaciales. Para la selección de dichos subespacios se analiza la uniformidad de los datos en ellos.

OUTRES (_epsilon=15_, _alpha=0.01_)[¶](#OUTRES "Enlazar permanentemente con esta definición")

Constructor para la creación del objeto de la clase OUTRES.

Parámetros
  • int – epsilon, radio para la selección del vecindario

  • float – alpha, limite de uniformidad que se permite como interesante

Tipo del valor devuelto

objeto de la clase OUTRES

fit_predict (_data_)

Método para aplicar el algoritmo OUTRES a una matriz de datos.

Parámetros

numpy.array – data, matriz de datos

Tipo del valor devuelto

numpy.array de puntuaciones de anomalía

ODIN

Outlier Detection using Indegree Number (ODIN),es un algoritmo que hace uso del grafico de los k-vecinos más cercanos y usa el grado de los nodos para el calculo de anomalías

ODIN (_k=20_, _t=0.01_)[¶](#ODIN "Enlazar permanentemente con esta definición")

Constructor para la creación del objeto de la clase ODIN.

Parámetros
  • int – k, número de k vecinos a calcular

  • int – t, umbral de dicisión

Tipo del valor devuelto

objeto de la clase ODIN

fit_predict (_data_)

Método para aplicar el algoritmo ODIN a una matriz de datos.

Parámetros

numpy.array – data, matriz de datos

Tipo del valor devuelto

numpy.array de decisión 1-0

MeanDIST

El algoritmo MeanDIST usa la la media de las distancias en su vecindario para ordenar a los vérticesy seleccionar los que más se desvian.

MeanDIST (_k=20_, _t=1.5_)[¶](#MeanDIST "Enlazar permanentemente con esta definición")

Constructor para la creación del objeto de la clase MeanDIST.

Parámetros
  • int – k, número de k vecinos a calcular

  • int – t, parámatro para ampliar o reducir el umbral.

Tipo del valor devuelto

objeto de la clase MeanDIST

fit_predict (_data_)

Método para aplicar el algoritmo MeanDIST a una matriz de datos.

Parámetros

numpy.array – data, matriz de datos

Tipo del valor devuelto

numpy.array de decisión 1-0

KDIST

El algoritmo KDIST el máximo de las distancias a sus k-vecinos más cercanos para ordenar a los vértices y seleccionar los que más se desvian.

KDIST (_k=20_, _t=1.5_)[¶](#KDIST "Enlazar permanentemente con esta definición")

Constructor para la creación del objeto de la clase KDIST.

Parámetros
  • int – k, número de k vecinos a calcular

  • int – t, parámatro para ampliar o reducir el umbral.

Tipo del valor devuelto

objeto de la clase KDIST

fit_predict (_data_)

Método para aplicar el algoritmo KDIST a una matriz de datos.

Parámetros

numpy.array – data, matriz de datos

Tipo del valor devuelto

numpy.array de decisión 1-0

enumerate (_sequence_[, _start=0_])[¶](#enumerate "Enlazar permanentemente con esta definición")

PyDBOD

Navegación

Related Topics

<script type="text/javascript">$('#searchbox').show(0);</script>

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

PyDBOD-1.1.tar.gz (104.5 kB view details)

Uploaded Source

Built Distribution

PyDBOD-1.1-py3-none-any.whl (25.9 kB view details)

Uploaded Python 3

File details

Details for the file PyDBOD-1.1.tar.gz.

File metadata

  • Download URL: PyDBOD-1.1.tar.gz
  • Upload date:
  • Size: 104.5 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/1.13.0 pkginfo/1.5.0.1 requests/2.22.0 setuptools/41.0.1 requests-toolbelt/0.9.1 tqdm/4.32.1 CPython/3.6.8

File hashes

Hashes for PyDBOD-1.1.tar.gz
Algorithm Hash digest
SHA256 211fbb0bf3e92dbc612f6222733713b0b4f53bd432e93c36c664a738260fcdef
MD5 6cafb5a254a5a134f54d47c973e9e30f
BLAKE2b-256 66f29b657d0876f89e9210db2c3685103beb70cff48b7867fcb3e310a6805198

See more details on using hashes here.

File details

Details for the file PyDBOD-1.1-py3-none-any.whl.

File metadata

  • Download URL: PyDBOD-1.1-py3-none-any.whl
  • Upload date:
  • Size: 25.9 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/1.13.0 pkginfo/1.5.0.1 requests/2.22.0 setuptools/41.0.1 requests-toolbelt/0.9.1 tqdm/4.32.1 CPython/3.6.8

File hashes

Hashes for PyDBOD-1.1-py3-none-any.whl
Algorithm Hash digest
SHA256 704d97341b2695414e3a90ef9f114ae84cdd799d6319234ace1bde1ba1c1ee44
MD5 656117b9725203f163c5813046d9261f
BLAKE2b-256 8ddc420d8afdeee2f705024179f0a150b6e6073e974ccd820c8f43195fc0a876

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page