Versão brasileira do pacote Python para adivinhar o gênero de um nome próprio.
Project description
Gender Guesser Brasil
Powered by DadosAbertosBrasil
Versão brasileira do pacote Python para adivinhar o gênero de um nome próprio.
Este pacote utiliza o DadosAbertosBrasil para capturar informações do Censo Demográfico das APIs oficiais do IBGE e calcula a probabilidade de que determinado nome próprio seja feminino ou masculino.
Instalação
pip install gender-guesser-br
Fazendo previsões
Após importar o pacote, crie uma instância do objeto Genero usando o nome próprio como argumento. Por fim, utilize o método __call__ para conferir a previsão.
>>> from gender_guesser_br import Genero
>>> nome = Genero("gustavo")
>>> nome()
'masculino'
É possível utilizar o argumento uf para fazer uma previsão por unidade federativa, o que pode aumentar a precisão. Veja que "Darci" é um nome que pode receber qualquer classificação, dependendo da UF.
>>> rs = Genero(nome="darci", uf="rs")
>>> rs()
'masculino'
>>> sc = Genero(nome="darci", uf="sc")
>>> sc()
'provavelmente_masculino'
>>> sp = Genero(nome="darci", uf="sp")
>>> sp()
'ambos'
>>> ac = Genero(nome="darci", uf="ac")
>>> ac()
'feminino'
>>> rr = Genero(nome="darci", uf="rr")
>>> rr()
'desconhecido'
Os argumentos nome e uf são case insensitive, então você pode usar letras maiúsculas e minúsculas como quiser, desde que uf seja a sigla de duas letras da UF ou o código IBGE de dois dígitos. Utilize a função localidade do DadosAbertosBrasil para obter uma lista completa dos códigos das UFs.
>>> from DadosAbertosBrasil import ibge
>>> ibge.localidades(nivel="estados")
Refinando resultados
Ao fazer a previsão, utilize os argumentos corte_ambos e corte_maioria para definir qual é a proporção mínima em que o objeto para a ter certeza de que o nome é de determinado gênero ou que é considerado de ambos os gêneros.
>>> ariel = Genero("Ariel", uf="RJ")
>>> ariel(corte_ambos=0.8, corte_maioria=0.9)
'ambos'
>>> ariel(corte_ambos=0.6, corte_maioria=0.8)
'provavelmente_masculino'
>>> ariel(corte_ambos=0.6, corte_maioria=0.7)
'masculino'
Para ter ainda mais controle, utilize as propriedades f e m para obter acesso aos números brutos.
Essas propriedades são dicionários contendo o número total de habitantes do gênero correspondente que possuem aquele nome e a proporção do gênero.
>>> camila = Genero("Camila")
>>> camila.f
{'absoluto': 469851, 'percentual': 0.9964012147225733}
>>> camila.m
{'absoluto': 1697, 'percentual': 0.003598785277426688}
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distributions
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file gender_guesser_br-1.1.0-py3-none-any.whl.
File metadata
- Download URL: gender_guesser_br-1.1.0-py3-none-any.whl
- Upload date:
- Size: 5.6 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.0.0 CPython/3.10.12
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
e1311ab121ac2fcd6b754b39c0978bb6f60948a0b52a165bd85728842a6cc58e
|
|
| MD5 |
6f903d867e73f0e5ff9286f2d0749321
|
|
| BLAKE2b-256 |
b1efbc3a021b331eb181527db3c4bc924d6072a35e1abc7d3c1d35bee4de94f1
|