帮助初学者更轻松地制作中文词云。
Project description
中文简易词云(chineseEasyWordcloud)
中文简易词云是一个Python库,旨在帮助初学者更轻松地制作中文词云。
注意: 请务必指定字体路径,否则默认字体无法正确显示中文
安装
你可以使用 pip
命令来安装该库:
pip install chineseEasyWordcloud
使用方法
安装完成后,你可以在命令行中使用该库。运行以下命令查看可用选项:
chinese-wordcloud -h
示例
命令行示例:
chinese-wordcloud "你好呀,我是宽宽" -o output.png --font_path "path/to/your_chinese_font.ttf" --width 1920 --height 1080
注意: 在命令行中可以直接使用 -f file file file
来添加多个文件或者使用 -d dir ignored1 ignored2
e.g.
chinese-wordcloud -f "path/to/your_files1.txt" "path/to/your_files2.txt" -o output.png --font_path "path/to/your_chinese_font.ttf" --width 1920 --height 1080
此命令会读取path/to/your_files1.txt
和path/to/your_files2.txt
中的内容并作为词云的输入文本
chinese-wordcloud -d "path/to/your_dir" ".git" -o output.png --font_path "path/to/your_chinese_font.ttf" --width 1920 --height 1080
此命令会读取path/to/your_dir
中除去.git
以外的所有文件并作为词云的输入文本
Python示例:
import chineseEasyWordcloud
# 加载中文文本
text = "这是一段中文文本"
# 创建词云图像
chineseEasyWordcloud.generate(text, "wordcloud.png",font_path='path/to/your_chinese_font.ttf')
注意: 以下内容适合对词云有相对简单的自定义要求的朋友,小白直接运行generate
函数或者chinese-wordcloud
命令即可,大佬嘛。。。应该也不用看我这屎山库。
在 chineseEasyWordcloud.cut
中提供了一些常用的额外处理函数:
cutChinese
用于中文分词removeStopwords
用于去除停止词(过于常见但无意义的词,比如“你”,“的”等),默认使用chineseEasyWordcloud.stopwords.getDefault()
的内容,也可以自定义removeWhiteSpace
用于去除空白内容,比如空字符串,空格等removeNonsenseCharacter
用于去除无意义的字符,比如标点符号,换行符等cutWordDefault
依次调用上述方法
同时,在 chineseEasyWordcloud.easyWordcloud
中提供了一些生成词云的方法,
countWords
统计词频generateWc
用于生成Wordcloud对象generate
(就是chineseEasyWordcloud.generate
)用于生成Wordcloud对象并导出为文件
贡献
欢迎贡献!如果你发现任何问题或有改进建议,请在该项目的 GitHub 页面上提出 issue。
许可证
该项目基于 MPL-2.0 协议。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
chineseEasyWordcloud-0.0.1.tar.gz
(16.8 kB
view hashes)
Built Distribution
Close
Hashes for chineseEasyWordcloud-0.0.1.tar.gz
Algorithm | Hash digest | |
---|---|---|
SHA256 | a253be24c28273540eac629ccf90fabe0b560eac0e1555d57e1285fc0da8c2c0 |
|
MD5 | f8ccfaa742c29229695e6dbc2c405b8c |
|
BLAKE2b-256 | 39505a0763493d33c3e38bd7d412f72ce7c9901c2e1c20afe4f753df50718254 |
Close
Hashes for chineseEasyWordcloud-0.0.1-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | d8620f8818942ecc6b4d85395e74ec43b488c2f8a0bdebf33f1636f85627f457 |
|
MD5 | 43a87a7d97afba8e7280e8ba892ddb08 |
|
BLAKE2b-256 | c43f2a8188414a83d41b42ca372e5de1173839f290fd720dd90f9c2a40a042d4 |