一個給研究者使用的簡單便利資料搜索工具
Project description
我爬 Wopa
我爬 Wopa 一個給研究者使用的簡單便利資料搜索工具
本工具透過網路爬蟲獲取所需研究資料,為撰寫論文、研究等非商業行為使用。同時,若有使用此工具之論文、研究,歡迎提供展示於此git,供其他學術使用參考。
🌼 目前的功能
給予特定參數後,程式會自動抓取資料,完成後會在目錄下新增對應的資料夾,並將Excel檔儲存至資料夾內。
新聞
- 自由時報(搜索)
- 中國時報(搜索)
- 蘋果新聞網(搜索)
- 聯合新聞網
論壇
- Dcard
- PTT
更多其他正在開發中,也可以幫忙貢獻唷!
如何使用
安裝
$ pip install wopa
參數說明
| 參數 | 解釋 | 範例 | 預設 |
|---|---|---|---|
| keyword | 關鍵字 | '蔡英文' | None |
| start_time | 起始時間 | '20220612' | None |
| end_time | 結束時間 | '20220614' | None |
| pageNumber | 從第幾頁開始抓資料 | 1 | 第1頁 |
| waitSec | 資料抓取時間間隔 | 3 | 3秒 |
自由時報 (關鍵字)
from papa import LTN
df = LTN.get(keyword, start_time, end_time, pageNumber, waitSec)
# df 回傳 DataFrame
# 自動產生目錄LTN資料夾,儲存excel檔
中國時報 (關鍵字)
from papa import CT
df = CT.get(keyword, pageNumber, waitSec)
# df 回傳 DataFrame
# 自動產生目錄CT資料夾,儲存excel檔
貢獻
歡迎協作,請使用 GitHub issue 以及 Pull Request 功能來協作。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
wopa-0.0.2.tar.gz
(5.5 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
wopa-0.0.2-py3-none-any.whl
(6.6 kB
view details)
File details
Details for the file wopa-0.0.2.tar.gz.
File metadata
- Download URL: wopa-0.0.2.tar.gz
- Upload date:
- Size: 5.5 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.1 CPython/3.9.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
bd6880520a96f2e85da59baf9589dcc29ec9ee2cb22be3c87426077548ae9ba5
|
|
| MD5 |
7f38cfec6de80764cab52f8b9c61b72d
|
|
| BLAKE2b-256 |
94138a27af6f57fb5568f5945c83dadc28f60f74d2423760b1584825fc31f503
|
File details
Details for the file wopa-0.0.2-py3-none-any.whl.
File metadata
- Download URL: wopa-0.0.2-py3-none-any.whl
- Upload date:
- Size: 6.6 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.1 CPython/3.9.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
ab655fea97c9cc7f433e061f838e8207b5214f517f3114c8deea71aabcdcbe7e
|
|
| MD5 |
537d67c498cfdbd5b684bafc7f770649
|
|
| BLAKE2b-256 |
590f8ff4f7a263fba2e272c0bfa4a69a233a86efd34b04e722629c91400c2d48
|