ArcDLNexus: PythonからWayback Machineのアーカイブ(サイト)をダウンロードするモジュールです。
Project description
PayNexus
目次
プロジェクトについて
PythonからWayback Machineのアーカイブ(サイト)をダウンロードするモジュールです。
ベースモジュール
公式サイト
・公式Github(使い方など)はこちら
インストール方法
こちらのPyPIパッケージを、
pip install ArcDLNexusなどのコマンドでインストールしてください。
※お好みでバージョンを指定してください
環境
| 言語・フレームワーク | バージョン |
|---|---|
| Python | 3.9.19 |
モジュール(パッケージ)のバージョンは requirements.txt を参照してください
モジュールについて
タスク
- モジュールを公開する
ドキュメント
| 関数 | パラメータ | 説明 |
|---|---|---|
| download | url -- str: アーカイブのURL* | アーカイブは次のような形式で、日付が指定されている必要があります。https://web.archive.org/web/{アーカイブの日付}/{サイトのURL} |
| path -- str: ファイルを保存するフォルダパス | c:\のような絶対パスではなく、OSに縛られない./などの相対パスのみサポートしています。デフォルトは「./archive_download」です。 | |
| mode -- str: モード(0~2) | モードは3種類に分けられています。 | |
| モード0 - アーカイブをダウンロードして復元のみ: ウェブページをアーカイブからダウンロードして元の状態に復元し、関連ファイルはダウンロードされず、ページの表示に必要なファイルやリソースはすべてアーカイブ前のURLから取得します。 | ||
| モード1 - 関連ファイルを可能な限りダウンロード + モード0の機能: ウェブページのアーカイブをダウンロードし、そのページに関連するファイル(画像、スクリプト、スタイルシートなど)も可能な限りダウンロードし、ページを完全に表示するために必要なすべてのリソースが揃います(手動処理必要)。 | ||
| モード2 - ダウンロードしたファイルで既存の関連ファイルURLを上書き + モード0と1の機能: ウェブページのアーカイブをダウンロードし、関連するすべてのファイルをダウンロードし、必要なファイルやリソースのURLをダウンロードしたファイルのパスに上書きし(ダウンロードできなかった場合はスルー)、ページを完全にオフラインで閲覧できるようにします。 |
使用例
import ArcDLNexus
ArcDLNexus.download(url="https://web.archive.org/web/20240204090521/https://home.disnana.com/",
path="./recovery_archive/",
mode=2)
※タスクが完了していてもモジュールが更新されていない場合がございます(その際は時間を空けてご確認ください)
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file arcdlnexus-0.1.5.tar.gz.
File metadata
- Download URL: arcdlnexus-0.1.5.tar.gz
- Upload date:
- Size: 6.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.0 CPython/3.9.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
f1ed01b27702bb6e5b3c73aaa7220fe2eb63a12337088486480a505f1a19c8a6
|
|
| MD5 |
63521275e1a851844361aac93607fd2f
|
|
| BLAKE2b-256 |
0bd9cbd39e795a764b902695b43dfff51945623f2b14c7f8f7f79726959730db
|
File details
Details for the file ArcDLNexus-0.1.5-py3-none-any.whl.
File metadata
- Download URL: ArcDLNexus-0.1.5-py3-none-any.whl
- Upload date:
- Size: 7.3 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.0 CPython/3.9.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
cf274d51d7fab64f9af21eae69f876433a0658a07bc6e06c5d8950de4c527233
|
|
| MD5 |
73f78f7a2476bccd5a53bf4e8415ce61
|
|
| BLAKE2b-256 |
01add76be40f8f23ce204e2f7d736b7200c02cb8e09bffa11367a72fd331367e
|