Skip to main content

抖音数据分析 MCP 服务器 - 提供抖音视频和用户数据的采集、分析和导出功能

Project description

抖音数据分析 MCP 服务器

基于原始抖音数据分析工具开发的 MCP (Model Context Protocol) 服务器,提供抖音视频和用户数据的采集、分析和导出功能。

功能特性

数据采集

  • 视频搜索: 根据关键词搜索抖音视频,采集标题、作者、点赞数、评论数等信息
  • 用户搜索: 根据关键词搜索抖音用户,采集用户名、抖音号、粉丝数、获赞数等信息
  • 自定义参数: 支持设置滚动次数和延迟时间,控制采集规模和速度

数据分析

  • 互动数据分析: 分析视频的点赞、评论、分享等互动数据,提供统计报告
  • 内容长度分析: 分析视频标题长度分布,了解内容特征
  • 关键词分析: 使用中文分词技术分析高频词汇,发现热门话题

数据导出

  • 多格式支持: 支持 JSON、Excel、CSV 格式导出
  • 分类导出: 可选择导出视频数据、用户数据或全部数据
  • 时间戳: 自动添加时间戳,避免文件覆盖

安装和配置

环境要求

  • Python 3.13+
  • uv 包管理器

安装步骤

  1. 安装依赖:

    uv sync
    
  2. 配置 MCP 客户端: 将 mcp_config.json 中的配置添加到你的 MCP 客户端配置中。

  3. 启动服务器:

    uv run python douyin_mcp_server.py
    

可用工具

1. search_douyin_videos

搜索抖音视频数据

参数:

  • keyword (必需): 搜索关键词
  • scroll_count (可选): 滚动次数,默认为10
  • delay (可选): 每次滚动的延迟时间(秒),默认为2.0

2. search_douyin_users

搜索抖音用户数据

3. analyze_interaction_data

分析视频互动数据(点赞、评论等)

4. analyze_content_length

分析视频标题长度分布

5. analyze_keywords

分析视频标题中的高频词汇

6. export_data

导出采集的数据

7. get_data_summary

获取当前采集数据的摘要信息

8. clear_data

清空当前采集的数据

可用资源

1. douyin://data/videos

当前采集的视频数据(JSON 格式)

2. douyin://data/users

当前采集的用户数据(JSON 格式)

3. douyin://analysis/summary

数据采集和分析摘要(文本格式)

使用示例

基本工作流程

  1. 搜索视频数据: 使用 search_douyin_videos 工具搜索关键词

  2. 分析数据: 使用 analyze_interaction_data 分析互动数据 使用 analyze_keywords 分析高频词汇

  3. 导出结果: 使用 export_data 导出为指定格式

注意事项

  1. 网络环境: 需要能够访问抖音网站
  2. 浏览器依赖: 使用 DrissionPage 需要 Chrome/Chromium 浏览器
  3. 采集频率: 建议设置适当的延迟时间,避免过于频繁的请求
  4. 合规使用: 请遵守抖音的使用条款和相关法律法规

技术架构

  • MCP 协议: 基于 Model Context Protocol 实现
  • 异步处理: 使用 asyncio 进行异步操作
  • 数据解析: 使用 BeautifulSoup 解析 HTML
  • 中文分词: 使用 jieba 进行中文文本分析
  • 数据处理: 使用 pandas 进行数据操作和导出

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

undoom_douyin_data_analysis-0.1.0.tar.gz (343.5 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

undoom_douyin_data_analysis-0.1.0-py3-none-any.whl (13.0 kB view details)

Uploaded Python 3

File details

Details for the file undoom_douyin_data_analysis-0.1.0.tar.gz.

File metadata

File hashes

Hashes for undoom_douyin_data_analysis-0.1.0.tar.gz
Algorithm Hash digest
SHA256 6ce1825a885b467e19ac4d0f4fa8e5934c1254efcc3ea3fc8d6dca14390a1dc9
MD5 badf732678615d782c10c46ab7bcf285
BLAKE2b-256 068c0c51c38266399303fe62f40469f91bc7d0e00a975cc1975f3129c3633c93

See more details on using hashes here.

File details

Details for the file undoom_douyin_data_analysis-0.1.0-py3-none-any.whl.

File metadata

File hashes

Hashes for undoom_douyin_data_analysis-0.1.0-py3-none-any.whl
Algorithm Hash digest
SHA256 6b744e6feb58cc3afd765ba088038143bc0a35b89f5eab3933d2985c5ee53e8d
MD5 6d5684b3043c1c0fe30a145c3edbe677
BLAKE2b-256 cee06ed78fcb6dc7f75c8cb5731673077819c460fb76dce5a66d9dcb1260fc16

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page