Chinese Minority Extractive Multi-language summarization project
Project description
CINOSUM
CINOSUM 是一个针对中国多民族语言文本摘要的开源 Python 库。它旨在为研究人员和开发人员提供一个简单、高效、易于使用的工具,用以处理多元化的中国语言资源,并生成准确的摘要。CINOSUM 支持包括汉语、藏语、维吾尔语等在内的多种民族语言。
特点
- 支持多种中国民族语言。
- 利用先进的自然语言处理技术生成摘要。
- 灵活的接口,易于集成到现有的 Python 项目中。
- 高效的处理速度,能够快速处理大量文本。
安装
你可以使用 pip 命令轻松安装 CINOSUM:
pip install CINOSUM
快速上手
下面是如何使用 CINOSUM 生成一个简单的文本摘要的例子:
from models.CINOSUM import CINOSUM
text = ["这里是需要生成摘要的文本内容列表。"]
model = CINOSUM()
Extractive = model.Extractive(text,batch_size=2)
支持的语言
目前,CINOSUM 支持以下民族语言的摘要生成:
-
汉语(zh)
-
藏语(bo)
-
维吾尔语(ug)
-
...更多语言支持即将到来!
贡献
我们欢迎任何形式的贡献,无论是新语言的支持、bug 修复、功能增强或是文档改进。
请遵循以下步骤:
- Fork 项目到你的 GitHub 账户下。
- 创建你自己的分支(git checkout -b feature-fooBar)。
- 提交你的改变(git commit -am 'Add some fooBar')。
- 推送到分支(git push origin feature-fooBar)。
- 创建一个新的 Pull Request。
许可证
本项目采用 MIT 许可证 - 详见 LICENSE 文件。
支持
如果在使用 CINOSUM 时遇到任何问题,或者有任何建议,欢迎通过 GitHub 的 issues 来提交。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
CINOSUM-1.0.7.tar.gz
(16.3 kB
view hashes)
Built Distribution
CINOSUM-1.0.7-py3-none-any.whl
(18.4 kB
view hashes)