帮助初学者更轻松地制作中文词云。
Project description
中文简易词云(chineseEasyWordcloud)
中文简易词云是一个Python库,旨在帮助初学者更轻松地制作中文词云。
注意: 请务必指定字体路径,否则默认字体无法正确显示中文
安装
你可以使用 pip
命令来安装该库:
pip install chineseEasyWordcloud
使用方法
安装完成后,你可以在命令行中使用该库。运行以下命令查看可用选项:
chinese-wordcloud -h
示例
命令行示例:
chinese-wordcloud "你好呀,我是宽宽" -o output.png --font_path "path/to/your_chinese_font.ttf" --width 1920 --height 1080
注意: 在命令行中可以直接使用 -f file file file
来添加多个文件或者使用 -d dir ignored1 ignored2
e.g.
chinese-wordcloud -f "path/to/your_files1.txt" "path/to/your_files2.txt" -o output.png --font_path "path/to/your_chinese_font.ttf" --width 1920 --height 1080
此命令会读取path/to/your_files1.txt
和path/to/your_files2.txt
中的内容并作为词云的输入文本
chinese-wordcloud -d "path/to/your_dir" ".git" -o output.png --font_path "path/to/your_chinese_font.ttf" --width 1920 --height 1080
此命令会读取path/to/your_dir
中除去.git
以外的所有文件并作为词云的输入文本
Python示例:
import chineseEasyWordcloud
# 加载中文文本
text = "这是一段中文文本"
# 创建词云图像
chineseEasyWordcloud.generate(text, "wordcloud.png",font_path='path/to/your_chinese_font.ttf')
注意: 以下内容适合对词云有相对简单的自定义要求的朋友,小白直接运行generate
函数或者chinese-wordcloud
命令即可,大佬嘛。。。应该也不用看我这屎山库。
在 chineseEasyWordcloud.cut
中提供了一些常用的额外处理函数:
cutChinese
用于中文分词removeStopwords
用于去除停止词(过于常见但无意义的词,比如“你”,“的”等),默认使用chineseEasyWordcloud.stopwords.getDefault()
的内容,也可以自定义removeWhiteSpace
用于去除空白内容,比如空字符串,空格等removeNonsenseCharacter
用于去除无意义的字符,比如标点符号,换行符等cutWordDefault
依次调用上述方法
同时,在 chineseEasyWordcloud.easyWordcloud
中提供了一些生成词云的方法,
countWords
统计词频generateWc
用于生成Wordcloud对象generate
(就是chineseEasyWordcloud.generate
)用于生成Wordcloud对象并导出为文件
贡献
欢迎贡献!如果你发现任何问题或有改进建议,请在该项目的 GitHub 页面上提出 issue。
许可证
该项目基于 MPL-2.0 协议。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file chineseEasyWordcloud-0.0.1.tar.gz
.
File metadata
- Download URL: chineseEasyWordcloud-0.0.1.tar.gz
- Upload date:
- Size: 16.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.11
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | a253be24c28273540eac629ccf90fabe0b560eac0e1555d57e1285fc0da8c2c0 |
|
MD5 | f8ccfaa742c29229695e6dbc2c405b8c |
|
BLAKE2b-256 | 39505a0763493d33c3e38bd7d412f72ce7c9901c2e1c20afe4f753df50718254 |
File details
Details for the file chineseEasyWordcloud-0.0.1-py3-none-any.whl
.
File metadata
- Download URL: chineseEasyWordcloud-0.0.1-py3-none-any.whl
- Upload date:
- Size: 29.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.11
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | d8620f8818942ecc6b4d85395e74ec43b488c2f8a0bdebf33f1636f85627f457 |
|
MD5 | 43a87a7d97afba8e7280e8ba892ddb08 |
|
BLAKE2b-256 | c43f2a8188414a83d41b42ca372e5de1173839f290fd720dd90f9c2a40a042d4 |