Skip to main content

将 html链接, html文件 或 html文本 转换成 epub文件,并自动添加封面.

Project description

xml2epub

Update

介绍

原项目已经较为成熟 Html2Epub ,此次更改是为了满足自身需求,主要是取消 html string 的清洗:

  • 关于页面清洗:html string 通过 create_chapter_from_string 的参数 strict 控制,False 表示不清洗
  • 关于封面:xml string 中如果包含<title>封面</title>或者<title>cover</title>等,则应该自动生成 epub 文件的封面
  • 关于替换静态资源,做的改进是:
    • 图片的名称由uuid改为md5(url)[:6] 并取前6位作为名称,图片文件夹为 img
    • 提取页面中的 css 并保存在 css 文件夹中

示例

import xml2epub

epub = xml2epub.Epub('My First Epub')
chapter = xml2epub.create_chapter_from_url('https://en.wikipedia.org/wiki/EPUB')
epub.add_chapter(chapter)
epub.create_epub('OUTPUT_DIRECTORY')

源码推送到pipy

参考:https://zhuanlan.zhihu.com/p/37987613

pip3 install setuptools
pip3 install wheel
# 打包
python3 setup.py sdist bdist_wheel

pip3 install twine
# 上传
twine upload dist/*

Old Intro

简介

原项目为python2项目 pypub , 此为python3项目, 并进行了些许修改.

将 html链接, html文件 或 html文本 转换成 epub文件.

tips

关于epub文件的格式可以参考 EPUB - Wikipedia.

快速使用

import xml2epub

epub = xml2epub.Epub('My First Epub')
chapter = xml2epub.create_chapter_from_url('https://en.wikipedia.org/wiki/EPUB')
epub.add_chapter(chapter)
epub.create_epub('OUTPUT_DIRECTORY')

参考文献

  1. wcember/pypub: Python library to programatically create epub files.
  2. EPUB - Wikipedia.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

xml2epub-1.7.tar.gz (15.3 kB view hashes)

Uploaded Source

Built Distribution

xml2epub-1.7-py3-none-any.whl (16.2 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page