将 html链接, html文件 或 html文本 转换成 epub文件,并自动添加封面.
Project description
xml2epub
update
原项目已经较为成熟 Html2Epub ,此次更改是为了满足自身需求,主要是取消 html string 的清洗:
- 关于页面清洗:html string 通过
create_chapter_from_string
的参数strict
控制,False
表示不清洗 - 关于封面:xml string 中如果包含
<title>封面</title>
或者<title>cover</title>
等,则应该自动生成 epub 文件的封面 - 关于替换静态资源,做的改进是:
- 图片的名称由
uuid
改为md5(url)[:6]
并取前6位作为名称,图片文件夹为 img - 提取页面中的 css 并保存在 css 文件夹中
- 图片的名称由
Old Intro
简介
原项目为python2项目 pypub , 此为python3项目, 并进行了些许修改.
将 html链接, html文件 或 html文本 转换成 epub文件.
tips
关于epub文件的格式可以参考 EPUB - Wikipedia.
快速使用
import xml2epub
epub = xml2epub.Epub('My First Epub')
chapter = xml2epub.create_chapter_from_url('https://en.wikipedia.org/wiki/EPUB')
epub.add_chapter(chapter)
epub.create_epub('OUTPUT_DIRECTORY')
参考文献
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
xml2epub-1.4.tar.gz
(14.9 kB
view hashes)
Built Distribution
xml2epub-1.4-py3-none-any.whl
(16.0 kB
view hashes)