从 Feedland OPML 解析和提取 RSS/Atom feeds 文章内容
Project description
yonglelaoren-feedland-parser
从 Feedland OPML 解析和提取 RSS/Atom feeds 文章内容的工具。
功能特性
- 解析 Feedland OPML 接口,提取所有订阅源
- 支持混合格式的 RSS/Atom feeds
- 每个 feed 最多提取 5 篇最新文章
- 使用 Newspaper3k 和 BeautifulSoup 提取文章内容
- 基于时间戳的去重机制,避免重复提取
- 支持并行处理,提高效率
- 输出 JSON 格式的提取结果
安装
环境要求
- Python 3.11 或更高版本
- 推荐使用 uv 作为包管理器
使用 uv 安装(推荐)
# 克隆仓库
git clone https://github.com/weinh/feedland-skill.git
cd feedland-skill
# 使用 uv 创建虚拟环境(自动使用 Python 3.11+)
uv venv
# 安装依赖
uv pip install -e ".[dev]"
# 激活虚拟环境
source .venv/bin/activate # Linux/macOS
# 或
.venv\Scripts\activate # Windows
uv 优势:
- ⚡️ 极快的依赖解析和安装速度
- 🎯 自动管理 Python 版本
- 🔒 精确的依赖锁定(uv.lock)
- 📦 统一的包管理体验
配置
创建 config.json 配置文件:
{
"url": "https://feedland.com/opml?screenname=yonglelaoren",
"threads": 10,
"log_days": 3,
"log_dir": "~/.feedland/logs",
"result_file": "~/.feedland/results.json",
"his": {}
}
配置说明:
url: Feedland OPML 接口地址(必需)threads: 并行处理的线程数(可选,默认值:min(10, cpu_count() * 2 + 1))log_days: 日志文件保留天数(可选,默认值:3)log_dir: 日志文件存储目录(可选,默认值:~/.feedland/logs)result_file: 结果文件保存路径(可选,默认值:~/.feedland/results.json)his: 每个 feed 的最后提取时间映射(自动维护,无需手动设置)
配置文件优先级:
- 命令行
--config参数指定的路径 - 当前目录的
config.json - 用户配置目录
~/.config/yonglelaoren-feedland-parser/config.json
使用
基本用法
uvx yonglelaoren-feedland-parser
指定配置文件
uvx yonglelaoren-feedland-parser --config /path/to/config.json
详细日志模式
uvx yonglelaoren-feedland-parser --verbose
静默模式(只显示错误)
uvx yonglelaoren-feedland-parser --quiet
查看版本
uvx yonglelaoren-feedland-parser --version
查看帮助
uvx yonglelaoren-feedland-parser --help
输出格式
响应结构
工具会输出 JSON 格式的提取结果,仅包含成功提取的文章:
[
{
"feed_url": "https://example.com/feed.xml",
"feed_title": "Example Feed",
"feed_type": "rss",
"articles": [
{
"title": "文章标题",
"url": "https://example.com/article1",
"published": "2025-02-09T10:00:00Z",
"author": "作者",
"content": "文章主要内容...",
"images": [
"https://example.com/image1.jpg",
"https://example.com/image2.jpg"
]
}
]
}
]
字段说明
Feed 级别字段:
feed_url: Feed 的 URL 地址feed_title: Feed 的标题feed_type: Feed 类型(rss或atom)articles: 文章列表数组
Article 级别字段:
title: 文章标题url: 文章链接published: 发布时间(ISO 8601 格式)author: 作者(可选)content: 文章正文内容images: 文章中的图片链接数组(可选)
输出特点
- 仅包含成功提取的文章
- 每个 feed 最多包含 5 篇最新文章
- 文章按发布时间倒序排列
- 提取失败的信息会记录到日志中,不会影响 JSON 输出
- 结果会自动保存到配置文件中指定的
result_file路径
依赖
- Python 3.11+
- feedparser >= 6.0.10
- newspaper3k >= 0.2.8
- beautifulsoup4 >= 4.12.0
- requests >= 2.31.0
- lxml >= 4.9.0
- python-dateutil >= 2.8.2
开发
安装开发依赖
# 使用 uv(推荐)
uv pip install -e ".[dev]"
# 或使用 pip
pip install -e ".[dev]"
运行测试
# 使用 uv
uv run pytest
# 或直接运行
pytest
代码格式化
# 使用 black
black src/ tests/
代码检查
# 类型检查
mypy src/
# 风格检查
flake8 src/ tests/
# 代码覆盖率测试
pytest --cov=src --cov-report=html
发布
构建 distribution 包
uv build
发布到 PyPI
uv publish
许可证
MIT License
贡献
欢迎提交 Issue 和 Pull Request!
致谢
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file yonglelaoren_feedland_parser-1.2.2.tar.gz.
File metadata
- Download URL: yonglelaoren_feedland_parser-1.2.2.tar.gz
- Upload date:
- Size: 36.5 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.9.26 {"installer":{"name":"uv","version":"0.9.26","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"macOS","version":null,"id":null,"libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
a1182f6a4877afbf53355341724fae25f46ac0b690162d01fad9efc564230e38
|
|
| MD5 |
2ddf26b72c7051f7ffecb98ac496db03
|
|
| BLAKE2b-256 |
b280527d31fe27e5e581ecf543ce3f066d6abf97c92c3e7d35539e3d4868bb1a
|
File details
Details for the file yonglelaoren_feedland_parser-1.2.2-py3-none-any.whl.
File metadata
- Download URL: yonglelaoren_feedland_parser-1.2.2-py3-none-any.whl
- Upload date:
- Size: 27.6 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.9.26 {"installer":{"name":"uv","version":"0.9.26","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"macOS","version":null,"id":null,"libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
d268b1352806da45402490797f58909d3ff6482ce2ef244880ea87196708aba9
|
|
| MD5 |
fac463ba38878703f73ed65506b4c66b
|
|
| BLAKE2b-256 |
4feb2eb6b172aa54f38e434e7bb052ca56978599d557b13a6707b7f05b6f7181
|