Scrapers for Japanese boatrace websites
Project description
概要
ボートレース関連の WEB サイトのスクレイピングライブラリ
以下の機能を備える
- ボートレース公式サイト に対応する下記
- URL の生成
- スクレイピング
パッケージの構成
名前空間パッケージになっており、共通の名前空間 (metaboatrace) を保持する同種のパッケージがある。
ボートレース公式サイトに対応する規約
名前空間は以下のように切られている。
- metaboatrace.scrapers.official.website.v1707
この v1707 の部分はボートレース公式サイトのバージョンに対応している。
バージョニングは、Ubuntu でのそれに近い。
Ubuntu は 22.04 のように年と月という形でバージョニングされている(22.04.1 のようセキュリティパッチのリビジョンも付くことがある)。
ボートレースの公式サイトが現行のものになったのは 2017 年の 7 月なので、それに合わせてここでは v1707 としている。
機能
metaboatrace/scrapers/official/website/v1707/pages 直下に、公式サイトのページに対応した名前空間がある。
例えば、公式サイトの月間スケジュールに対応するものは monthly_schedule_page である。
これらの配下に location と scraping というモジュールがある。
前者は引数(日付など)をもとに公式サイトの URL を生成するような責務を負った関数が包含されている。
例えば、年と月を与えたら "https://boatrace.jp/owpc/pc/race/monthlyschedule?ym=202209" といったそのデータに対応する公式サイトの月間スケジュールの URL を返すような関数が入っている。
後者は、公式サイトの HTML ファイルをスクレイピングのモジュールである。
例えば、ここに入ってる関数は "https://boatrace.jp/owpc/pc/race/monthlyschedule?ym=202209" のファイルをスクレイピングしてエンティティを返すような処理を行う。
※ ここでいうエンティティはクリーンアーキテクチャの定義上のエンティティのことであり、metaboatrace.modelsはそういったものを提供しているパッケージ
ブランチ戦略
GitHub Flow を採用している。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file metaboatrace_scrapers-3.4.0.tar.gz.
File metadata
- Download URL: metaboatrace_scrapers-3.4.0.tar.gz
- Upload date:
- Size: 870.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.10.2 {"installer":{"name":"uv","version":"0.10.2","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"22.04","id":"jammy","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":true}
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
e2e7d6c069a6695125b7472d641da211629b1d32a1a094a3c5860d115e83efbd
|
|
| MD5 |
e3b5137550b5305d1064846c618448f2
|
|
| BLAKE2b-256 |
bb68e74c0eaa392b377ca4396e61ae647cb8d11549f54f87478728a723c28d2a
|
File details
Details for the file metaboatrace_scrapers-3.4.0-py3-none-any.whl.
File metadata
- Download URL: metaboatrace_scrapers-3.4.0-py3-none-any.whl
- Upload date:
- Size: 936.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.10.2 {"installer":{"name":"uv","version":"0.10.2","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"22.04","id":"jammy","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":true}
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
c0d6f3208429a47b500fe11a5cba7ecdedd10c0aac3d7c8513b37e5fa522f6ae
|
|
| MD5 |
ef96cb69819d4eaf3a1cdc6e67826686
|
|
| BLAKE2b-256 |
fb389cfc59dfe7cc0d371fd0b0020b4c9c9be8507e75a049ea9486c99dae50a3
|