Python SDK for getting data quickly
Project description
Qdata - Python SDK for index and search
为什么给项目改了名
- 想做一个提供更多数据的SDK包,但不一定有时间。。。
- 老的代码包可以在old_baiduindex里找到
- 会根据我自己个人的数据需求,往里面添加不同的数据源,如果恰好帮助到你,很开心
- 老的数据源会尽力维护
Data Source
Install
pip uninstall pycrypto # 避免与pycryptodome冲突
pip install --upgrade qdata
Examples
百度指数
./examples/test_baidu_index.py
获取百度指数时不要太暴力,可以参考以下代码,进行百度指数数据的获取
import time
from qdata.baidu_index import get_search_index
from qdata.baidu_index.common import split_keywords
keywords_list = [['张艺兴', '汪峰'], ['百度'], ['疫情', '杭州'], ['北京', '疫情'], ['猫粮'], ['流浪猫']]
cookies = """xxx"""
for keywords in split_keywords(keywords_list):
for index in get_search_index(
keywords_list=keywords,
start_date='2018-01-01',
end_date='2019-05-01',
cookies=cookies
):
print(index)
time.sleep(15)
百度搜索
./examples/test_baidu_search.py
百度登录(获取百度Cookie)
./examples/test_baidu_login.py
- 目前只提供二维码登录,密码账号登录也可以做,但不做,因为没必要。
- 幸好工作不做爬虫,心太累了。
天眼查
./examples/test_tianyancha.py
- 老婆做汇报着急用
Changelog
- 2021/03/25 上线
- 2021/03/26 更新百度登录功能
- 2021/04/07 百度指数新增:实时百度指数
- 2021/04/13 添加天眼查高级搜索公司数数据
- 2021/05/18 修正打包问题
- 2022/05/12 百度指数添加Cipher-Text(不确定部分逻辑)
- 2022/05/16 一些小的改动
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
qdata-0.2.1.tar.gz
(56.5 kB
view hashes)
Built Distribution
qdata-0.2.1-py3-none-any.whl
(60.9 kB
view hashes)