asmr.one 音声下载器
Project description
ASMR-Spider
本项目改编自 DiheChen/go-asmr-spider
一个简单的 https://asmr.one 爬虫
TODO
- 文件检查 (通过时长)
- 错误文件重新下载
- 支持更多格式 (通过
ffmpeg
和ffprobe
) - ffmpeg的分析很慢, 寻找更好的方式(检测大小或许能替代?)
- 指定下载路径
- 下载文件中途停止记录
- 断点续传
- 下载自动分类配置
使用
音频大小对比模式
支持断点续传
音频时长分析模式
不使用 ffmpeg
和 ffprobe
时仅支持 mp3
wav
flac
格式的音频分析
ffmpeg Documentation
ffprobe Documentation
目前 ffmpeg
分析很慢, 平均一个文件3s以上
已知问题
未安装ffmpeg时可能会报缺少libsndfile等运行库,
仍需要另外安装相关依赖.
在使用checktime进行时长检测部分mp3内容时,获取的时长差异过大,同时在错误状态下仍然会检测为正常状态(如RJ172342),故默认使用时长检测时仍保留重新下载的模式。
Install ffmpeg or libsndfile
Debian/Ubuntu安装:
apt update && apt install ffmpeg
或者:
apt update && apt install libsndfile1
ArchLinux安装:
pacman -Syu ffmpeg
或者:
pacman -Syu libsndfile
Mac安装:
brew install ffmpeg
Windows安装:
请参考 ffmpeg Documentation 自行解决
Install
pip install -U asmr-spider
Run
#直接下载, 默认检查重复
asmr RJ373001 RJ385913
#或者
asmr RJ373001 RJ385913 -a checksize
# `asmr` 后面接RJ号, 可输入多个, 使用空格隔开
#通过时长检测重复内容,目前不支持断点续传
asmr RJ373001 RJ385913 -a checktime
#禁用检查, 跳过已下载的文件
asmr RJ373001 RJ385913 -a nocheck
#强制重新下载所有文件
asmr RJ373001 RJ385913 -a redownload
配置文件 asmr_spider.yml
和 音频目录 Voice
保存在命令执行时所在的路径
Import
from asmr_spider import dload
async def demo():
args = ['RJ373001', 'RJ385913']
action = 'checksize' # 'checksize', 'checktime','redownload', 'nocheck'
await dload(args, action)
asmr_spider.yml
和 Voice
将保存在你自己的项目根路径
致谢
- 感谢 地河酱, 地河酱yyds🤗
- 感谢 https://asmr.one, 现在每天都有不同的女孩子陪我睡觉。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
asmr_spider-0.2.2b1.tar.gz
(19.1 kB
view hashes)
Built Distribution
Close
Hashes for asmr_spider-0.2.2b1-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 514aa0276769c2d83c3e2f589f0d2955bfa50e4c12ac91db9544d6e07805ec59 |
|
MD5 | 7ad055685545448a39ad81aebd545dbb |
|
BLAKE2b-256 | f1da1c491f60530afe2e2ba3a8ee6ba43ae83240f1a3d216c4fad083c6b0c18e |