Skip to main content

Separa sílabas e identifica acentos

Project description

Silabeador

Una librería de Python para la división silábica y detección de acentos

silabeador es una librería de métodos y funciones para la la división silábica palabras y localización de acentos prosódicos.

La librería surge en el marco del proyecto de investigación Sound and Meaning in Spanish Golden Age Literature. Para la escansión automática de versos se requería un separador silábico tolerante a grupos consonánticos ajenos al español y diacríticos poco comunes o extranjeros. Otras librerías disponibles asumen que la entrada es una palabra bien construida de acuerdo a las reglas del español, lo que no siempre es el caso en determinado tipo de textos, que puede incluir vocales con diacríticos de otras lenguas, tales como ` u ~, caracteres en desuso, como ç, o usados pero con implicaciones en la división silábica en contextos específicos, como en ü en su uso habitual o como diacrítico métrico (p.ej., Si-güen-za y crü-el).

Instalación

pip3 install silabeador

Uso

La librería provee funciones y métodos que pueden ser llamados de forma independiente.:

>>> import silabeador

La función para dividir en sílabas una palabra acepta una cadena de caracteres como argumento y devuelve una lista de sílabas.

>>> silabeador.silabea('Uvulopalatofaringoplastia')
['U', 'vu', 'lo', 'pa', 'la', 'to', 'fa', 'rin', 'go', 'plas', 'tia']

La función para recuperar el índice de la sílaba tónica acepta como argumento una cadena de caracteres y devuelve el índice de la sílaba tónica en la lista de sílabas.

>>> silabeador.tonica('Uvulopalatofaringoplastia')
-2

Una versión alternativa acepta una lista de sílabas y devuelve el índice de la sílaba tónica.

>>> silabeador.tonica_s(['U', 'vu', 'lo', 'pa', 'la', 'to', 'fa', 'rin', 'go', 'plas', 'tia'])
-2

También puede crearse un objeto con los mismo valores:

>>> objeto_silabas = silabeador.silabas('Uvulopalatofaringoplastia')
>>> objeto_silabas.palabra
'Uvulopalatofaringoplastia'
>>> objeto_silabas.silabas
['U', 'vu', 'lo', 'pa', 'la', 'to', 'fa', 'rin', 'go', 'plas', 'tia']
>>> objeto_silabas.tonica
-2

Descripción

Silabificación

La división silábica se efectúa siguiendo los principios descritos por (1984/2013, p. 47-49) Primero se identifican los núcleos silábicos a partir de las vocales. En caso de vocales cerradas no acentuadas, se unen a las vocales adyacentes constituyendo diptongos o triptongos. Las cerradas acentuadas se consideran como núcleos silábicos independientes. Las consonates adyacentes se unen en un solo grupo.

Después se dividen los grupos consonánticos según sus componentes sean separables o inseparables y se añaden a los núcleos silábicos adyacentes en coda u onset según corresponda.

Acento prosódico

La detección del acento prosódico según las reglas de acentuación ortográfica del español. Las palabras proparoxítonas siempre lleván acento gráfico en la antepenúltima sílaba. Las paroxitonas no llevan acento gráfico salvo que la palabra no acabe en n, s o vocal, en cuyo caso lo llevabn en la penúltima sílaba. Las oxítonas no llevan acento gráfico salvo que acaben en n, s, o vocal, en cuyo caso lo llevan en la última sílaba.

Problemas

Para preguntas, reportar errores o suerir nuevas características, use GitHub Issue Tracker. Antes de crear una nueva entrada, por favor, asegúrese de buscar entradas existentes similares.

Licencia

Silabeador se halla bajo licencia GNU LGPL 2.1. Ver archivo LICENSE para más detalles.

Referencias

Quilis, A. (1996). Métrica española. Barcelona: Ariel. Publicado originalmente en 1984.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

silabeador-1.0.2.post11.tar.gz (4.6 kB view details)

Uploaded Source

File details

Details for the file silabeador-1.0.2.post11.tar.gz.

File metadata

  • Download URL: silabeador-1.0.2.post11.tar.gz
  • Upload date:
  • Size: 4.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.4.1 importlib_metadata/4.3.0 pkginfo/1.7.0 requests/2.25.1 requests-toolbelt/0.9.1 tqdm/4.56.0 CPython/3.9.2

File hashes

Hashes for silabeador-1.0.2.post11.tar.gz
Algorithm Hash digest
SHA256 4062c9fe7995f949ad216a5dc868c1eb40864b63bd3a45d64320710c20d99364
MD5 fae76a027eda467b49f4753c80144948
BLAKE2b-256 896218f93c6ed456f6e3e04569d0afc79c3cf16de5cf9d4fc5ee7d7b9fbcfd35

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page