Skip to main content

asmr.one 音声下载器

Project description

ASMR-Spider

本项目改编自 DiheChen/go-asmr-spider

一个简单的 https://asmr.one 爬虫

TODO

  • 文件检查 (通过时长)
  • 错误文件重新下载
  • 支持更多格式 (通过 ffmpegffprobe)
  • ffmpeg的分析很慢, 寻找更好的方式(检测大小或许能替代?)
  • 指定下载路径
  • 下载文件中途停止记录
  • 断点续传
  • 下载自动分类配置

使用

音频大小对比模式

支持断点续传

音频时长分析模式

不使用 ffmpegffprobe 时仅支持 mp3 wav flac 格式的音频分析

ffmpeg Documentation
ffprobe Documentation

目前 ffmpeg 分析很慢, 平均一个文件3s以上

已知问题

未安装ffmpeg时可能会报缺少libsndfile等运行库,
仍需要另外安装相关依赖.

在使用checktime进行时长检测部分mp3内容时,获取的时长差异过大,同时在错误状态下仍然会检测为正常状态(如RJ172342),故默认使用时长检测时仍保留重新下载的模式。

Install ffmpeg or libsndfile

Debian/Ubuntu安装:

apt update && apt install ffmpeg

或者:

apt update && apt install libsndfile1

ArchLinux安装:

pacman -Syu ffmpeg

或者:

pacman -Syu libsndfile

Mac安装:

brew install ffmpeg

Windows安装:

请参考 ffmpeg Documentation 自行解决

Install

pip install -U asmr-spider

Run

#直接下载, 默认检查重复
asmr RJ373001 RJ385913
#或者
asmr RJ373001 RJ385913 -a checksize
# `asmr` 后面接RJ号, 可输入多个, 使用空格隔开

#通过时长检测重复内容,目前不支持断点续传
asmr RJ373001 RJ385913 -a checktime

#禁用检查, 跳过已下载的文件
asmr RJ373001 RJ385913 -a nocheck

#强制重新下载所有文件
asmr RJ373001 RJ385913 -a redownload

配置文件 asmr_spider.yml 和 音频目录 Voice 保存在命令执行时所在的路径

Import
from asmr_spider import dload

async def demo():
    args = ['RJ373001', 'RJ385913']
    action = 'checksize'  # 'checksize', 'checktime','redownload', 'nocheck'
    await dload(args, action)

asmr_spider.ymlVoice 将保存在你自己的项目根路径

致谢

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

asmr_spider-0.2.2b1.tar.gz (19.1 kB view hashes)

Uploaded Source

Built Distribution

asmr_spider-0.2.2b1-py3-none-any.whl (20.6 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page