ArcDLNexus: PythonからWayback Machineのアーカイブ(サイト)をダウンロードするモジュールです。
Project description
PayNexus
目次
プロジェクトについて
PythonからWayback Machineのアーカイブ(サイト)をダウンロードするモジュールです。
ベースモジュール
公式サイト
・公式Github(使い方など)はこちら
インストール方法
こちらのPyPIパッケージを、
pip install ArcDLNexus
などのコマンドでインストールしてください。
※お好みでバージョンを指定してください
環境
言語・フレームワーク | バージョン |
---|---|
Python | 3.9.19 |
モジュール(パッケージ)のバージョンは requirements.txt を参照してください
モジュールについて
タスク
- モジュールを公開する
ドキュメント
関数 | パラメータ | 説明 |
---|---|---|
download | url -- str: アーカイブのURL* | アーカイブは次のような形式で、日付が指定されている必要があります。https://web.archive.org/web/{アーカイブの日付}/{サイトのURL} |
path -- str: ファイルを保存するフォルダパス | c:\のような絶対パスではなく、OSに縛られない./などの相対パスのみサポートしています。デフォルトは「./archive_download」です。 | |
mode -- str: モード(0~2) | モードは3種類に分けられています。 | |
モード0 - アーカイブをダウンロードして復元のみ: ウェブページをアーカイブからダウンロードして元の状態に復元し、関連ファイルはダウンロードされず、ページの表示に必要なファイルやリソースはすべてアーカイブ前のURLから取得します。 | ||
モード1 - 関連ファイルを可能な限りダウンロード + モード0の機能: ウェブページのアーカイブをダウンロードし、そのページに関連するファイル(画像、スクリプト、スタイルシートなど)も可能な限りダウンロードし、ページを完全に表示するために必要なすべてのリソースが揃います(手動処理必要)。 | ||
モード2 - ダウンロードしたファイルで既存の関連ファイルURLを上書き + モード0と1の機能: ウェブページのアーカイブをダウンロードし、関連するすべてのファイルをダウンロードし、必要なファイルやリソースのURLをダウンロードしたファイルのパスに上書きし(ダウンロードできなかった場合はスルー)、ページを完全にオフラインで閲覧できるようにします。 |
使用例
import ArcDLNexus
ArcDLNexus.download(url="https://web.archive.org/web/20240204090521/https://home.disnana.com/",
path="./recovery_archive/",
mode=2)
※タスクが完了していてもモジュールが更新されていない場合がございます(その際は時間を空けてご確認ください)
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
arcdlnexus-0.1.5.tar.gz
(6.7 kB
view details)
Built Distribution
File details
Details for the file arcdlnexus-0.1.5.tar.gz
.
File metadata
- Download URL: arcdlnexus-0.1.5.tar.gz
- Upload date:
- Size: 6.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.0 CPython/3.9.13
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | f1ed01b27702bb6e5b3c73aaa7220fe2eb63a12337088486480a505f1a19c8a6 |
|
MD5 | 63521275e1a851844361aac93607fd2f |
|
BLAKE2b-256 | 0bd9cbd39e795a764b902695b43dfff51945623f2b14c7f8f7f79726959730db |
File details
Details for the file ArcDLNexus-0.1.5-py3-none-any.whl
.
File metadata
- Download URL: ArcDLNexus-0.1.5-py3-none-any.whl
- Upload date:
- Size: 7.3 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.0 CPython/3.9.13
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | cf274d51d7fab64f9af21eae69f876433a0658a07bc6e06c5d8950de4c527233 |
|
MD5 | 73f78f7a2476bccd5a53bf4e8415ce61 |
|
BLAKE2b-256 | 01add76be40f8f23ce204e2f7d736b7200c02cb8e09bffa11367a72fd331367e |