Skip to main content

Um segmentador de cores bayesiano para a OpenCV.

Project description

Segmentação Bayesiana de Cores em Imagens

PyPI GitHub release PyPI - Python Version Twitter Follow

Este trabalho propõe o uso de um classificador Naive Bayes para a tarefa de segmentação de imagens por cor, empregando duas classes de dados em seu modelo estatístico: pele e não-pele. Busca-se assim, obter um algoritmo de segmentação por cor dotado de bons níveis de precisão e velocidade suficiente para ser aplicado em filmagens em tempo real em um computador pessoal.

Pré-requisitos

  • Python 3.5.5
  • OpenCV 3.1.0 ou superior
  • Numpy 1.14.3 ou superior

Instalação

Após a instalação dos pré-requisitos, é possível instalar o segmentador pelo repositório de pacotes do python com o comando:

$ sudo pip install bayesian_sgm

Exemplo

As imagens de treino e as respectivas versões binárias devem ser organizadas com o mesmo nome de arquivo, porém em pastas diferentes. No exemplo abaixo, as imagens coloridas estão na pasta n_dataset, e a classificação binária em c_dataset.

.
├── datasets
│   ├── c_dataset
│   │   ├── treino1.jpg
│   │   ├── treino2.jpg
│   │   ├── treino3.jpg
│   │   ├── treino4.jpg
│   │   └── ...
│   └── n_dataset
│       ├── treino1.jpg
│       ├── treino2.jpg
│       ├── treino3.jpg
│       ├── treino4.jpg
│       └── ...
└── script.py

O arquivo script.py realiza o treinamento com base no dataset fornecido e aplica o segmentador no vídeo capturado pela webcam.

import cv2
import numpy as np
import bayesian_sgm

seg = bayesian_sgm.BayesianColorSGM()
seg.learn_from_dirs("datasets/c_dataset", "datasets/n_dataset")

cap = cv2.VideoCapture(0)
while(True):
    ret, img = cap.read()
    bin = seg.apply(img)
    cv2.imshow("frame", img)
    cv2.imshow("binary", bin)
    k = cv2.waitKey(30) & 0xFF
    if k == 27:
        break

Fundamentação Teórica

Introdução

A separação de regiões correspondentes à pele humana em imagens digitais possui fundamental importância para a solução de problemas relacionados à visão computacional, como detecção de face, detecção de gestos e classificação de conteúdo. Tais aplicações empregam algoritmos de segmentação com o objetivo de delimitar áreas de interesse nas imagens, de modo a reduzir o escopo de informações a serem processadas e obter ganhos de desempenho.

Diversas são as técnicas envolvidas na tarefa de segmentação de imagens, como k-means e outras formas de reconhecimento de padrões. Porém, devido às suas propriedades físicas e forma peculiar de interagir com a luz, a pele humana possui características visuais que a diferenciam de elementos inorgânicos, o que traz vantagem a abordagens baseadas na cor. De fato, o espectro de tonalidades da pele humana é relativamente limitado, mesmo levando em consideração variações étnicas.

O problema resume-se, então, a determinar se um dado conjunto de pixels pertence ou não a uma região de pele humana com base em sua cor. Nesse contexto, a escolha do espaço de cores mais adequado aos matizes da pele humana, bem como o emprego de um modelo estatístico que permita analisar um conjunto previamente classificado de imagens pode ser uma solução eficaz. Tais escolhas estão intrinsecamente relacionadas à sensibilidade dos algoritmos de segmentação a problemas como condições de iluminação desfavoráveis e oclusão.

Metodologia

O teorema de Bayes, nomeado em homenagem a seu idealizador, Thomas Bayes (1701-1761), estabelece uma relação matemática para as probabilidades de eventos condicionados a evidências prévias. A probabilidade de um evento A, dado que houve a observação de uma evidência B é descrita por:

.

Este princípio possui diversas aplicações no campo da inferência estatística, em problemas que demandam a dedução de informações a partir da análise de um conjunto de amostras. Filtros de spam, por exemplo, analisam o texto de diversos emails classificados pelos usuários como spam e não-spam e determinam a classe na qual se enquadra uma nova amostra com base na equação acima.

Classificadores Naive Bayes consideram que as características analisadas são independentes entre si. Isto é, para um conjunto de características condicionadas a uma evidência , tem-se o produtório:

Tal pressuposto, embora possa comprometer a coerência entre o modelo e a relação que de fato ocorre entre os dados, é capaz de classificar as amostras com níveis de erro próximos aos de métodos mais robustos.

Esta modelagem matemática pode ser aplicada para a segmentação de imagens como uma técnica de classificação de pixels em duas classes: pele e não-pele. Para imagens representadas em espaços de cor de 3 canais, por exemplo, considera-se que o evento A representa o fato de um pixel pertencer a uma região de pele. B corresponde ao valor numérico que um pixel assume em determinado canal. Logo, primeiramente é necessário obter , e , conhecidos como probabilidades a priori. De forma intuitiva, tem-se, pois:

  • = probabilidade de dada cor ser pele;

  • = probabilidade de encontrar dada cor;

  • = probabilidade de encontrar pele.


Figura 1: Exemplo de imagem do conjunto classificado manualmente.

A partir de um conjunto de imagens como a Figura 1, é possível calcular as probabilidades a priori necessárias para a aplicação do teorema de Bayes. Após a análise de todas as imagens em um conjunto pré classificado com a ajuda de um editor de imagens, os valores obtidos das probabilidades para cada canal são armazenados em uma tabela de referência.

Ao receber uma imagem inédita, o algoritmo busca, para cada pixel, uma probabilidade correspondente na tabela, de acordo com os valores de seus canais, isto é, sua cor. Em seguida os valores obtidos são multiplicados, conforme, para obter a classificação final. Dessa forma, a imagem se torna uma matriz de probabilidades inferidas, com valores entre 0 e 1. Determina-se, então, um limiar , de modo que:

.

Onde é a probabilidade inferida e corresponde à classe atribuída ao pixel, isto é, 0 para não-pele e 1 para pele.

Para avaliar a capacidade de acerto do algoritmo, as probabilidades inferidas são comparadas com a classificação realizada manualmente. Considerando o erro quadrático médio do algoritmo aplicado em uma imagem composta por pixels, obtém-se:

,

onde representa o valor atribuído ao -ésimo pixel na classificação manual.

Resultados

A Figura 2 mostra o resultado obtido pelo classificador Naive-Bayes para diferentes espaços de cor, nomeadamente, HSV, YCrCb e RGB, bem como as respectivas taxas de erro quadrático médio. As imagens originais estão disponíveis no banco de imagens Wikimedia Commons e foram classificadas manualmente com o auxílio do editor de imagens GIMP. Neste trabalho, para a obtenção das probabilidades a priori foram empregadas 13 imagens, tomando a diversidade étnica como critério para sua escolha. As taxas de acerto obtidas variam, pois, de 88,4% para o espaço RGB a 90,6% no espaço YCrCb.


Figura 2: Comparativo de desempenho e taxas de erro em diferentes espaços de cor.

Referências

  • Ion Androutsopoulos, John Koutsias, Konstantinos V Chandrinos, GeorgePaliouras, and Constantine D Spyropoulos. An evaluation of naive bayesiananti-spam filtering. arXiv preprint cs/0006013, 2000.

  • James C Bezdek, LO Hall, and LP Clarke. Review of mr image segmen-tation techniques using pattern recognition. Medical physics, 20(4):1033–1048, 1992.

  • Margaret M Fleck, David A Forsyth, and Chris Bregler. Finding naked people. Em: European Conference on Computer Vision, pages 593–602. Springer, 1996.

  • Rein-Lien Hsu, M. Abdel-Mottaleb, and A. K. Jain. Face detection in color images. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(5):696–706, Maio de 2002.

  • Son Lam Phung, Abdesselam Bouzerdoum, and Douglas Chai. Skin segmentation using color pixel classification: analysis and comparison. IEEEtransactions on pattern analysis and machine intelligence, 27(1):148–154, 2005.

Autor

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

bayesian_sgm-1.0.0.tar.gz (8.0 kB view details)

Uploaded Source

Built Distribution

bayesian_sgm-1.0.0-py3-none-any.whl (19.8 kB view details)

Uploaded Python 3

File details

Details for the file bayesian_sgm-1.0.0.tar.gz.

File metadata

  • Download URL: bayesian_sgm-1.0.0.tar.gz
  • Upload date:
  • Size: 8.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/1.12.1 pkginfo/1.4.2 requests/2.18.4 setuptools/40.4.3 requests-toolbelt/0.8.0 tqdm/4.26.0 CPython/3.5.5

File hashes

Hashes for bayesian_sgm-1.0.0.tar.gz
Algorithm Hash digest
SHA256 c065d19d28cc3e9bc6c22562840f2c2d72b06bd478250077f9e9d2e910a56cbe
MD5 35064a4b45c9dbe473bd75b7788337d2
BLAKE2b-256 8aa6866511fed7851049988fda9127937df59df9760561bf510b18f7cb0e7125

See more details on using hashes here.

File details

Details for the file bayesian_sgm-1.0.0-py3-none-any.whl.

File metadata

  • Download URL: bayesian_sgm-1.0.0-py3-none-any.whl
  • Upload date:
  • Size: 19.8 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/1.12.1 pkginfo/1.4.2 requests/2.18.4 setuptools/40.4.3 requests-toolbelt/0.8.0 tqdm/4.26.0 CPython/3.5.5

File hashes

Hashes for bayesian_sgm-1.0.0-py3-none-any.whl
Algorithm Hash digest
SHA256 732fb1811d015118e7d4052d6250c25772172be8a63fb2bf7c49e79399d54865
MD5 31270ed46052730e55566fc4a0139dea
BLAKE2b-256 b2bf8768b850457e0ec72e425e48511987d76b159566cd58077d24793334c8fc

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page