Skip to main content

phoneme toolkit

Project description

phkit

phoneme toolkit: 音素相关的文本处理工具箱。

安装

pip install -U phkit

todo: 文本正则化处理 数字读法 字符读法 常见规则读法

文本转拼音 pypinyin 国标和alnum转换

anything转音素 字符 英文 汉字 OOV

进阶: 分词 命名实体识别 依存句法分析

版本

v0.0.3

symbol

音素标签,中文音素,简单英文音素,简单中文音素。

适用于中文、英文和中英混合的音素,其中汉字拼音采用清华大学的音素,英文字符分字母和英文。

中文音素简介:

声母: aa b c ch d ee f g h ii j k l m n oo p q r s sh t uu vv x z zh

韵母: a ai an ang ao e ei en eng er i ia ian iang iao ie in ing iong iu ix iy iz o ong ou u ua uai uan uang ueng ui un uo v van ve vn ng uong

声调: 1 2 3 4 5

字母: Aa Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Ll Mm Nn Oo Pp Qq Rr Ss Tt Uu Vv Ww Xx Yy Zz

英文: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

标点: ! ? . , ; : " # ( ) 注:!=!!|?=??|.=.。|,=,,、|;=;;|:=::|"="“|#=   |(=(([[{{【<《|)=))]]}}】>》

预留: w y 0 6 7 8 9

其他: _ ~ - *

sequence

转为序列的方法,文本转为音素列表,文本转为ID列表。

pinyin

转为拼音的方法,汉字转拼音,分离声调。

拼音为字母+数字形式,例如pin1。

phoneme

音素映射表,包括不带声调拼音转为音素,英文字母转音素,标点转音素。

number

数字读法,主要分按数值大小读和一个一个数字读。

convert

文本转换,全角半角转换,简体繁体转换。

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

phkit-0.0.3.tar.gz (12.5 kB view details)

Uploaded Source

File details

Details for the file phkit-0.0.3.tar.gz.

File metadata

  • Download URL: phkit-0.0.3.tar.gz
  • Upload date:
  • Size: 12.5 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/1.13.0 pkginfo/1.5.0.1 requests/2.21.0 setuptools/40.8.0 requests-toolbelt/0.9.1 tqdm/4.31.1 CPython/3.7.2

File hashes

Hashes for phkit-0.0.3.tar.gz
Algorithm Hash digest
SHA256 8e83b3fcac7505acbd088316e1780b4fec0f64cccb689be0e9ab5e928df625f6
MD5 adbebe132a23d4c81b8ae5e63520fb3c
BLAKE2b-256 d3eedae7da21bdc7fdc962bcec9d30855c954107b8d91c362efe8758ceb6c496

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page