Versão brasileira do pacote Python para adivinhar o gênero de um nome próprio.
Project description
Gender Guesser Brasil
Powered by DadosAbertosBrasil
Versão brasileira do pacote Python para adivinhar o gênero de um nome próprio.
Este pacote utiliza o DadosAbertosBrasil para capturar informações do Censo Demográfico das APIs oficiais do IBGE e calcula a probabilidade de que determinado nome próprio seja feminino ou masculino.
Instalação
pip install gender-guesser-br
Fazendo previsões
Após importar o pacote, crie uma instância do objeto Genero
usando o nome próprio como argumento. Por fim, utilize o método __call__
para conferir a previsão.
>>> from gender_guesser_br import Genero
>>> nome = Genero("gustavo")
>>> nome()
'masculino'
É possível utilizar o argumento uf
para fazer uma previsão por unidade federativa, o que pode aumentar a precisão. Veja que "Darci" é um nome que pode receber qualquer classificação, dependendo da UF.
>>> rs = Genero(nome="darci", uf="rs")
>>> rs()
'masculino'
>>> sc = Genero(nome="darci", uf="sc")
>>> sc()
'provavelmente_masculino'
>>> sp = Genero(nome="darci", uf="sp")
>>> sp()
'ambos'
>>> ac = Genero(nome="darci", uf="ac")
>>> ac()
'feminino'
>>> rr = Genero(nome="darci", uf="rr")
>>> rr()
'desconhecido'
Os argumentos nome
e uf
são case insensitive, então você pode usar letras maiúsculas e minúsculas como quiser, desde que uf seja a sigla de duas letras da UF ou o código IBGE de dois dígitos. Utilize a função localidade
do DadosAbertosBrasil para obter uma lista completa dos códigos das UFs.
>>> from DadosAbertosBrasil import ibge
>>> ibge.localidades(nivel="estados")
Refinando resultados
Ao fazer a previsão, utilize os argumentos corte_ambos
e corte_maioria
para definir qual é a proporção mínima em que o objeto para a ter certeza de que o nome é de determinado gênero ou que é considerado de ambos os gêneros.
>>> ariel = Genero("Ariel", uf="RJ")
>>> ariel(corte_ambos=0.8, corte_maioria=0.9)
'ambos'
>>> ariel(corte_ambos=0.6, corte_maioria=0.8)
'provavelmente_masculino'
>>> ariel(corte_ambos=0.6, corte_maioria=0.7)
'masculino'
Para ter ainda mais controle, utilize as propriedades f
e m
para obter acesso aos números brutos.
Essas propriedades são dicionários contendo o número total de habitantes do gênero correspondente que possuem aquele nome e a proporção do gênero.
>>> camila = Genero("Camila")
>>> camila.f
{'absoluto': 469851, 'percentual': 0.9964012147225733}
>>> camila.m
{'absoluto': 1697, 'percentual': 0.003598785277426688}
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file gender_guesser_br-1.0.0.tar.gz
.
File metadata
- Download URL: gender_guesser_br-1.0.0.tar.gz
- Upload date:
- Size: 4.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.0.0 CPython/3.11.2
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 936c019e97dffab8ee3db756c27eb5b9cc6a54e17e7a92f92ad23215d7da296b |
|
MD5 | 70740298889b3b0017ddedd447bf4475 |
|
BLAKE2b-256 | 9d354222310c9da7ed349595b0bc965048057ed234a3dd9a80f30df6dd258d52 |
File details
Details for the file gender_guesser_br-1.0.0-py3-none-any.whl
.
File metadata
- Download URL: gender_guesser_br-1.0.0-py3-none-any.whl
- Upload date:
- Size: 5.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.0.0 CPython/3.11.2
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | ac1df746c6a1029d2eacfef2c84bf2b10faeb3081d73484dfbc070cf0c5706bd |
|
MD5 | 0b6a66bb6629fe9ee54391635a068413 |
|
BLAKE2b-256 | b1a9aaef7d11195bd424def9bcd23e8cb84c07127a2ae2cc31374faecd43a598 |