Paquete para PLN de lenguas originarias
Project description
Elotl Package
Paquete de Python con algoritmos e implementaciones de la comunidad Elotl para PLN de lenguas originarias.
Requiere python>=3.X
- Paquete en estado de
Pre-Alpha
. Revisar Classifiers - Paquete en pip: elotl
- Repositorio de desarrollo: ElotlMX/py-elotl
Instalación
Utilizando pip
pip install elotl
Desde la fuente
git clone https://github.com/ElotlMX/py-elotl.git
cd py-elotl
pip install -e .
Uso
Trabajando con corpus
import elotl.corpus
Listando corpus disponibles
print("Name\t\tDescription")
list_of_corpus = elotl.corpus.list_of_corpus()
for row in list_of_corpus:
print(row)
La salida es la siguiente:
Name Description
['axolotl', 'Is a nahuatl corpus']
['tsunkua', 'Is an otomí corpus']
Cargando un corpus
# Si se solicita un corpus inexistente se retorna un valor 0
axolotl = elotl.corpus.load('axolotlr')
if axolotl == 0:
print("El nombre ingresado no corresponde a ningun corpus")
# Si se ingresa un corpus existente se retorna una lista
axolotl = elotl.corpus.load('axolotl')
for row in axolotl:
print(row)
['Hay que adivinar: un pozo, a la mitad del cerro, te vas a encontrar.', 'See tosaasaanil, see tosaasaanil. Tias iipan see tepeetl, iitlakotian tepeetl, tikoonextis san see aameyalli.', '', 'Adivinanzas nahuas']
# Cada elemento de la lista cuenta con cuatro indices:
# lengua_no_originaria, lengua_originaria, variante, nombre_de_documento
tsunkua = elotl.corpus.load('tsunkua')
for row in tsunkua:
print(row[0]) # lengua_no_originaria
print(row[1]) # lengua_originaria
print(row[2]) # variante
print(row[3]) #nombre_de_documento
Una vez una señora se emborrachó
nándi na ra t'u̱xú bintí
Otomí del Estado de México (ots)
El otomí de toluca, Yolanda Lastra
Estructura del paquete
La siguiente estructura es una referencia. Conforme el paquete crezca se ira documentando mejor.
elotl/ Top-level package
__init__.py Inicializar el paquete
corpora/ Aquí se encuentran los datos de los corpus
corpus/ Subpaquete para cargar corpus
__init__.py
corpus.py
nahuatl/ Subpaquete para el idioma nahuatl
__init__.py
...
otomi/ Subpaquete para el idioma otomi
__init__.py
...
Desarrollo
Crear un entorno virtual y activarlo.
virtualenv --python=/usr/bin/python3 elotl-venv
source elotl-venv/bin/activate
Actualizar pip
y generar archivos de distribución.
python -m pip install --upgrade pip
python -m pip install --upgrade setuptools wheel
python setup.py clean sdist bdist_wheel
Probar el paquete local
python -m pip install -e .
Enviar a PyPI
python -m pip install twine
twine upload dist/*
Licencia
Mozilla Public License 2.0 (MPL 2.0)
Referencias
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
elotl-0.0.1.10.tar.gz
(2.2 MB
view hashes)