面向古籍、古诗文和课堂文本分析的中文词频统计 MCP Server
Project description
dhcckb-guji-wordfreq-mcp-20260618b
面向古籍、古诗文和课堂文本分析的中文词频统计 MCP Server。
简介
本 MCP Server 提供基于 Python 生态 jieba 分词库的中文词频统计能力,适用于数字人文学者、古文研究者及课堂教学场景的量化文本分析。
功能
- word_frequency: 对中文文本执行分词与词频统计,支持 Top-K、停用词过滤、最小词长过滤
- health_check: 返回服务健康状态、版本信息和依赖版本
安装
uvx dhcckb-guji-wordfreq-mcp-20260618b
或直接通过 pip 安装:
pip install dhcckb-guji-wordfreq-mcp-20260618b
使用
作为 MCP Server 通过 stdio 运行:
python -m dhcckb_guji_wordfreq_mcp
工具说明
word_frequency
对输入的中文文本执行分词与词频统计。
参数:
texts(必填): 待分析的中文文本列表topK(可选, 默认 20): 返回词频最高的前 K 个词stopWords(可选, 默认 []): 自定义停用词列表minWordLength(可选, 默认 1): 最小词长过滤useBuiltinStopWords(可选, 默认 true): 是否启用内置停用词
health_check
返回服务器健康状态、版本信息和 jieba 版本号。
依赖
- Python >= 3.10
- jieba >= 0.42.1
- mcp >= 1.0.0
许可
MIT
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
File details
Details for the file dhcckb_guji_wordfreq_mcp_20260618b-0.1.0.tar.gz.
File metadata
- Download URL: dhcckb_guji_wordfreq_mcp_20260618b-0.1.0.tar.gz
- Upload date:
- Size: 6.1 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: Bun/1.3.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
42661c9425c3b6c659c58df8d32436b14d23546e6b0c604a87f9aa90b61cec55
|
|
| MD5 |
4150187b543b3c282c4cc834dea74ac9
|
|
| BLAKE2b-256 |
742d8f42cc521b72263b4047e23bc3e3a6599927518e0f383bc133f6a2aca09f
|