Skip to main content

ArcDLNexus: PythonからWayback Machineのアーカイブ(サイト)をダウンロードするモジュールです。

Project description

PayNexus

目次

  1. プロジェクトについて
  2. インストール方法
  3. 環境
  4. モジュールについて

プロジェクトについて

PythonからWayback Machineのアーカイブ(サイト)をダウンロードするモジュールです。

ベースモジュール
公式サイト
公式Github(使い方など)はこちら

インストール方法

こちらのPyPIパッケージを、 pip install ArcDLNexus などのコマンドでインストールしてください。
※お好みでバージョンを指定してください

環境

言語・フレームワーク バージョン
Python 3.9.19

モジュール(パッケージ)のバージョンは requirements.txt を参照してください

モジュールについて

タスク

  • モジュールを公開する

ドキュメント

関数 パラメータ 説明
download url -- str: アーカイブのURL アーカイブは次のような形式で、日付が指定されている必要があります。https://web.archive.org/web/{アーカイブの日付}/{サイトのURL}
path -- str: ファイルを保存するフォルダパス c:\のような絶対パスではなく、OSに縛られない./などの相対パスのみサポートしています。デフォルトは「./archive_download」です。
mode -- str: モード(0~2) モードは3種類に分けられています。
モード0 - アーカイブをダウンロードして復元のみ: ウェブページをアーカイブからダウンロードして元の状態に復元し、関連ファイルはダウンロードされず、ページの表示に必要なファイルやリソースはすべてアーカイブ前のURLから取得します。
モード1 - 関連ファイルを可能な限りダウンロード + モード0の機能: ウェブページのアーカイブをダウンロードし、そのページに関連するファイル(画像、スクリプト、スタイルシートなど)も可能な限りダウンロードし、ページを完全に表示するために必要なすべてのリソースが揃います(手動処理必要)。
モード2 - ダウンロードしたファイルで既存の関連ファイルURLを上書き + モード0と1の機能: ウェブページのアーカイブをダウンロードし、関連するすべてのファイルをダウンロードし、必要なファイルやリソースのURLをダウンロードしたファイルのパスに上書きし(ダウンロードできなかった場合はスルー)、ページを完全にオフラインで閲覧できるようにします。

使用例

import ArcDLNexus

ArcDLNexus.download(url="https://web.archive.org/web/20240204090521/https://home.disnana.com/",
                         path="./recovery_archive/",
                         mode=2)

※タスクが完了していてもモジュールが更新されていない場合がございます(その際は時間を空けてご確認ください)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

arcdlnexus-0.1.5.tar.gz (6.7 kB view details)

Uploaded Source

Built Distribution

ArcDLNexus-0.1.5-py3-none-any.whl (7.3 kB view details)

Uploaded Python 3

File details

Details for the file arcdlnexus-0.1.5.tar.gz.

File metadata

  • Download URL: arcdlnexus-0.1.5.tar.gz
  • Upload date:
  • Size: 6.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.1.0 CPython/3.9.13

File hashes

Hashes for arcdlnexus-0.1.5.tar.gz
Algorithm Hash digest
SHA256 f1ed01b27702bb6e5b3c73aaa7220fe2eb63a12337088486480a505f1a19c8a6
MD5 63521275e1a851844361aac93607fd2f
BLAKE2b-256 0bd9cbd39e795a764b902695b43dfff51945623f2b14c7f8f7f79726959730db

See more details on using hashes here.

File details

Details for the file ArcDLNexus-0.1.5-py3-none-any.whl.

File metadata

  • Download URL: ArcDLNexus-0.1.5-py3-none-any.whl
  • Upload date:
  • Size: 7.3 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.1.0 CPython/3.9.13

File hashes

Hashes for ArcDLNexus-0.1.5-py3-none-any.whl
Algorithm Hash digest
SHA256 cf274d51d7fab64f9af21eae69f876433a0658a07bc6e06c5d8950de4c527233
MD5 73f78f7a2476bccd5a53bf4e8415ce61
BLAKE2b-256 01add76be40f8f23ce204e2f7d736b7200c02cb8e09bffa11367a72fd331367e

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page