Skip to main content

Separa sílabas e identifica acentos

Project description

Silabeador

Una librería de Python para la división silábica y detección de acentos

silabeador es una librería de métodos y funciones para la la división silábica palabras y localización de acentos prosódicos.

La librería surge en el marco del proyecto de investigación Sound and Meaning in Spanish Golden Age Literature. Para la escansión automática de versos se requería un separador silábico tolerante a grupos consonánticos ajenos al español y diacríticos poco comunes o extranjeros. Otras librerías disponibles asumen que la entrada es una palabra bien construida de acuerdo a las reglas del español, lo que no siempre es el caso en determinado tipo de textos, que puede incluir vocales con diacríticos de otras lenguas, tales como ` u ~, caracteres en desuso, como ç, o usados pero con implicaciones en la división silábica en contextos específicos, como en ü en su uso habitual o como diacrítico métrico (p.ej., Si-güen-za y crü-el).

Instalación

pip3 install silabeador

Uso

La librería provee funciones y métodos que pueden ser llamados de forma independiente.:

>>> import silabeador

La función para dividir en sílabas una palabra acepta una cadena de caracteres como argumento y devuelve una lista de sílabas.

>>> silabeador.silabea('Uvulopalatofaringoplastia')
['U', 'vu', 'lo', 'pa', 'la', 'to', 'fa', 'rin', 'go', 'plas', 'tia']

La función para recuperar el índice de la sílaba tónica acepta como argumento una cadena de caracteres y devuelve el índice de la sílaba tónica en la lista de sílabas.

>>> silabeador.tonica('Uvulopalatofaringoplastia')
-2

Una versión alternativa acepta una lista de sílabas y devuelve el índice de la sílaba tónica.

>>> silabeador.tonica_s(['U', 'vu', 'lo', 'pa', 'la', 'to', 'fa', 'rin', 'go', 'plas', 'tia'])
-2

También puede crearse un objeto con los mismo valores:

>>> objeto_silabas = silabeador.silabas('Uvulopalatofaringoplastia')
>>> objeto_silabas.palabra
'Uvulopalatofaringoplastia'
>>> objeto_silabas.silabas
['U', 'vu', 'lo', 'pa', 'la', 'to', 'fa', 'rin', 'go', 'plas', 'tia']
>>> objeto_silabas.tonica
-2

Descripción

Silabificación

La división silábica se efectúa siguiendo los principios descritos por (1984/2013, p. 47-49) Primero se identifican los núcleos silábicos a partir de las vocales. En caso de vocales cerradas no acentuadas, se unen a las vocales adyacentes constituyendo diptongos o triptongos. Las cerradas acentuadas se consideran como núcleos silábicos independientes. Las consonates adyacentes se unen en un solo grupo.

Después se dividen los grupos consonánticos según sus componentes sean separables o inseparables y se añaden a los núcleos silábicos adyacentes en coda u onset según corresponda.

Acento prosódico

La detección del acento prosódico según las reglas de acentuación ortográfica del español. Las palabras proparoxítonas siempre lleván acento gráfico en la antepenúltima sílaba. Las paroxitonas no llevan acento gráfico salvo que la palabra no acabe en n, s o vocal, en cuyo caso lo llevabn en la penúltima sílaba. Las oxítonas no llevan acento gráfico salvo que acaben en n, s, o vocal, en cuyo caso lo llevan en la última sílaba.

Problemas

Para preguntas, reportar errores o suerir nuevas características, use GitHub Issue Tracker. Antes de crear una nueva entrada, por favor, asegúrese de buscar entradas existentes similares.

Licencia

Silabeador se halla bajo licencia GNU LGPL 2.1. Ver archivo LICENSE para más detalles.

Referencias

Quilis, A. (1996). Métrica española. Barcelona: Ariel. Publicado originalmente en 1984.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

silabeador-1.0.2.post13.tar.gz (4.6 kB view details)

Uploaded Source

File details

Details for the file silabeador-1.0.2.post13.tar.gz.

File metadata

  • Download URL: silabeador-1.0.2.post13.tar.gz
  • Upload date:
  • Size: 4.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.4.1 importlib_metadata/4.3.0 pkginfo/1.7.0 requests/2.25.1 requests-toolbelt/0.9.1 tqdm/4.56.0 CPython/3.9.2

File hashes

Hashes for silabeador-1.0.2.post13.tar.gz
Algorithm Hash digest
SHA256 7021d355bcddebbb3e1c21d89682167af60f9cd62f656b6ba609b8dd058f0bf1
MD5 af8c73fef31f2040c2b9b96b58f4586e
BLAKE2b-256 742fce4eb90b20d2ae817f127715d652b24e98cbc0b63e3482bcd31e1835ea6f

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page