Skip to main content

面向古籍、古诗文和课堂文本分析的中文词频统计 MCP Server

Project description

dhcckb-guji-wordfreq-mcp-20260618b

面向古籍、古诗文和课堂文本分析的中文词频统计 MCP Server。

简介

本 MCP Server 提供基于 Python 生态 jieba 分词库的中文词频统计能力,适用于数字人文学者、古文研究者及课堂教学场景的量化文本分析。

功能

  • word_frequency: 对中文文本执行分词与词频统计,支持 Top-K、停用词过滤、最小词长过滤
  • health_check: 返回服务健康状态、版本信息和依赖版本

安装

uvx dhcckb-guji-wordfreq-mcp-20260618b

或直接通过 pip 安装:

pip install dhcckb-guji-wordfreq-mcp-20260618b

使用

作为 MCP Server 通过 stdio 运行:

python -m dhcckb_guji_wordfreq_mcp

工具说明

word_frequency

对输入的中文文本执行分词与词频统计。

参数:

  • texts (必填): 待分析的中文文本列表
  • topK (可选, 默认 20): 返回词频最高的前 K 个词
  • stopWords (可选, 默认 []): 自定义停用词列表
  • minWordLength (可选, 默认 1): 最小词长过滤
  • useBuiltinStopWords (可选, 默认 true): 是否启用内置停用词

health_check

返回服务器健康状态、版本信息和 jieba 版本号。

依赖

  • Python >= 3.10
  • jieba >= 0.42.1
  • mcp >= 1.0.0

许可

MIT

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

dhcckb_guji_wordfreq_mcp_20260618b-0.1.0.tar.gz (6.1 kB view details)

Uploaded Source

File details

Details for the file dhcckb_guji_wordfreq_mcp_20260618b-0.1.0.tar.gz.

File metadata

File hashes

Hashes for dhcckb_guji_wordfreq_mcp_20260618b-0.1.0.tar.gz
Algorithm Hash digest
SHA256 42661c9425c3b6c659c58df8d32436b14d23546e6b0c604a87f9aa90b61cec55
MD5 4150187b543b3c282c4cc834dea74ac9
BLAKE2b-256 742d8f42cc521b72263b4047e23bc3e3a6599927518e0f383bc133f6a2aca09f

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page