Skip to main content

a tools for downloading futures data from chinese commodity exchange!

Project description

AkShare

AkShare 已经发布, 请访问主页链接了解和查询数据接口!

AkShare 是实现对期货等衍生金融产品从数据采集, 数据清洗加工, 到数据下载的工具, 满足金融数据科学家, 数据科学爱好者在数据获取方面的需求. 它的特点是利用 AkShare 获取的是基于交易所公布的原始数据, 广大数据科学家可以利用原始数据进行再加工, 得出科学的结论.

作者: Albert King

安装方法

pip install akshare

升级方法

p.s. 由于目前版本更新迭代比较频繁, 请在使用前先升级库

pip install akshare --upgrade

版本更新说明

0.1.25
增加奇货可查指数接口 e.g. ak.get_qhkc_data("商品指数")

0.1.26
修复代码格式问题

0.1.27
修复说明格式问题

0.1.28
更新说明文档

0.1.29
规范说明文档格式

0.1.30
规范说明文档格式

目录

AkShare库的特色

AkShare 主要改进如下:

  1. Python 语法更符合 PEP8 规范, 尤其在接口函数的命名上;

  2. 增加代码类型注释;

  3. 支持 Python 3.7 以上版本的 Python;

  4. 后续加入 asyncio 和 aiohttp 做异步爬虫加速(由于目前 aiohttp 尚未支持 Python 3.7);

  5. 持续维护由于原网站格式变化导致的部分函数运行异常的问题;

  6. 增加更多的网络数据采集接口:

    5.1 增加奇货可查(https://qhkch.com/)数据接口, 目前已经提供奇货可查指数数据部分(已完成);

    5.2 增加主要国家股票市场指数数据接口(开发中);

  7. 后续更新主要集中在增加更多数据接口部分, 同时修复源代码中 bug;

  8. 更加完善的接口文档, 提高 AkShare 的易用性;

  9. 希望您能参与 AkShare 的维护与管理.

AkShare库的初衷

由于 FuShare 库目前处于无人维护状态, 因此建立 AkShare 库为用户提供持续数据支持.

传统的 CTA 策略以趋势为主, 但是自从 2017 年以来, 无论是长线还是短线的趋势策略都受制于商品波动率的降低, 面临了多多少少的回撤, 同时市场也逐渐趋于机构化理性化, 因此在传统CTA策略的基础上加入基本面的因素显得迫在眉睫. 近几年各券商的研报陆续提出了许多依赖于趋势行情以外的有效信号, 它们的表现都与趋势策略有着很低的甚至负的相关性, 这样通过多种不同类型的信号对冲得到的策略, 就有机会在市场上取得非常棒的夏普率和稳定的收益.

AkShare 库的公开就是为了向各位同仁提供一个网络数据采集接口, 避免各个研究组, 研究机构, 个人投资者重复造轮子采集相关数据造成的资源浪费.

Quick-Start

1. 先按照 Anaconda安装说明及环境配置

2. 查看 AkShare 提供的数据获取接口

Example 2.1 查看 AkShare 提供的数据获取接口

代码:

import akshare as ak
[item for item in dir(ak) if item.startswith("get")]

结果显示:

数据获取函数说明

 'get_cffex_daily',  # 获取中国金融期货交易所每日交易数据
 'get_cffex_rank_table',  # 获取中国金融期货交易所前20会员持仓数据明细
 'get_czce_daily',  # 获取郑州商品交易所每日交易数据
 'get_czce_rank_table',  # 获取郑州商品交易所前20会员持仓数据明细
 'get_dce_daily',  # 获取大连商品交易所每日交易数据
 'get_dce_rank_table',  #获取大连商品交易所前20会员持仓数据明细
 'get_futures_daily',  # 获取中国金融期货交易所每日基差数据
 'get_qhkc_data',  # 获取奇货可查-期货指数数据
 'get_rank_sum',  # 获取四个期货交易所前5, 10, 15, 20会员持仓排名数据
 'get_rank_sum_daily',  # 获取每日四个期货交易所前5, 10, 15, 20会员持仓排名数据
 'get_receipt',  # 获取大宗商品注册仓单数据
 'get_roll_yield',  # 获取某一天某品种(主力和次主力)或固定两个合约的展期收益率
 'get_roll_yield_bar',  # 获取展期收益率
 'get_shfe_daily',  # 获取上海期货交易所每日交易数据
 'get_shfe_rank_table',  # 获取上海期货交易所前20会员持仓数据明细
 'get_shfe_v_wap',  # 获取上海期货交易所日成交均价数据
 'get_spot_price',  # 获取某一交易日大宗商品现货价格及相应基差数据
 'get_spot_price_daily'  # 获取一段交易日大宗商品现货价格及相应基差数据

3. 获取展期收益率

Example 3.1 获取展期收益率数据:

代码:

import akshare as ak
ak.get_roll_yield_bar(type_method="date", var="RB", start="20180618", end="20180718", plot=True)

结果显示:

日期, 展期收益率, 最近合约, 下一期合约

            roll_yield near_by deferred
2018-06-19    0.191289  RB1810   RB1901
2018-06-20    0.192123  RB1810   RB1901
2018-06-21    0.183304  RB1810   RB1901
2018-06-22    0.190642  RB1810   RB1901
2018-06-25    0.194838  RB1810   RB1901
2018-06-26    0.204314  RB1810   RB1901
2018-06-27    0.213667  RB1810   RB1901
2018-06-28    0.211701  RB1810   RB1901
2018-06-29    0.205892  RB1810   RB1901
2018-07-02    0.224809  RB1810   RB1901
2018-07-03    0.229198  RB1810   RB1901
2018-07-04    0.222853  RB1810   RB1901
2018-07-05    0.247187  RB1810   RB1901
2018-07-06    0.261259  RB1810   RB1901
2018-07-09    0.253283  RB1810   RB1901
2018-07-10    0.225832  RB1810   RB1901
2018-07-11    0.210659  RB1810   RB1901
2018-07-12    0.212805  RB1810   RB1901
2018-07-13    0.170282  RB1810   RB1901
2018-07-16    0.218066  RB1810   RB1901
2018-07-17    0.229768  RB1810   RB1901
2018-07-18    0.225529  RB1810   RB1901

展期收益率

展期收益率是由不同交割月的价差除以相隔月份数计算得来, 它反映了市场对该品种在近期交割和远期交割的价差预期.

通过 get_roll_yield_bar 接口下载展期收益率, 这里展期收益率列表的序列类型分为三种, 分别可以通过 type_method="date", "symbol", "var"获取. 其中 "date" 类型是由某商品品种在不同日期的主力合约和次主力合约的价差组成, 调用方法例子为:

展期收益率1

其中 "symbol" 类型是由某商品品种在某天的所有交割月合约价格组成, 可以很方便的观察该品种从近期到远期的展期结构, 调用方法例子为:

ak.get_roll_yield_bar(type_method="symbol", var="RB", date="20180718", plot=True)

展期收益率2

其中 "var" 类型是由某交易日, 所有品种的主力次主力合约展期收益率的组合, 可以方便的找到展期收益率高的品种和低的品种, 调用方法例子为:

ak.get_roll_yield_bar(type_method="var", date="20180718", plot=True)

展期收益率3

利用 get_roll_yield 接口, 可以找到特定合约特定日期的主力合约次主力合约展期收益率, 或通过 symbol1、symbol2 变量自定义某两个合约的展期收益率.

ak.get_roll_yield(date="20180718", var="IF", symbol1="IF1812", symbol2="IF1811"), 如下图所示: 

展期收益率4

注意:

主力合约和次主力合约的定义, 是由该日的各交割月合约持仓量由大到小排序得到.

注册仓单

注册仓单是由各交易所的公布的日级数据, 在一定程度上可以反映市场的库存变化. 调用例子如下:

ak.get_receipt(start="20180712", end="20180719", vars=["CU", "NI"])

下图有错误, FuShare 的作者把 receipt 打错字为 recipet, 目前在 AkShare 已经修正为 receipt

注册仓单

注意:

  1. vars_list 变量接上需要爬取的品种列表, 即使是一个品种, 也需要以列表形式输入; 由于 vars 为 Python 内置, 后续将被移除

  2. 在研究仓单的方向变化时, 需要考虑一些品种的年度周期性, 如农产品的收割季、工业品的开工季等;

  3. 需考虑到交割日的仓单变化.

现货价格和基差

基差是商品期货非常重要的基本面因素. 这里提供两种获取基差的方法: 获取当天的基差数据

ak.get_spot_price("20180712")

返回值分别为品种、现货价格、最近交割合约、最近交割合约价格、主力合约、主力合约价格、最近合约基差值、主力合约基差值、最近合约基差率、主力合约基差率.

现货价格和基差1

获取历史某段时间的基差值

ak.get_spot_price_daily(start="20180710", end="20180719", vars_list=["CU", "RB"])

现货价格和基差2

注意:

现货价格是从生意社网站爬取获得, 仅支持从 2011 年至今每个交易日数据.

会员持仓排名

自从 "蜘蛛网策略" 问世以来, 会员持仓数据受到日益关注. 数据的爬取方式如下所示: 获取某段时间的会员持仓排名前 5、前 10、前 15、前 20 等总和.

ak.get_rank_sum_daily(start="20180718", end="20180719", vars=["IF", "C"])

会员持仓1

获取某交易日某品种的持仓排名榜

ak.get_dce_rank_table()
ak.get_cffex_rank_table()
ak.get_czce_rank_table()
ak.get_shfe_rank_table()

会员持仓3

注意:

因为每个交易所公布的持仓排名不同: 大连所只公布品种的总持仓排名, 没有按不同交割月划分;上海、中金交易所公布了每个交割月的持仓排名, 没有公布品种所有合约总排名, 因此这里的品种排名和是各合约加总计算得来;郑州交易所公布了各合约排名和品种排名, 因此这里都是交易所原始数据.

日线行情K线

通过爬取交易所官网信息, 可以获得各合约日线行情, 以及根据持仓量加权的指数行情, 用法如下:

ak.get_futures_daily(start="20190107", end="20190108", market="SHFE", index_bar=True)

日线行情

market 可以添为四个交易所的简称, 即 "dce" 代表大商所; "shfe" 代表上期所; "czce" 代表郑商所; "cffex" 代表中金所. index_bar 为 True 时, 在生成的 pd.DataFrame 中通过持仓量加权合成指数合约, 如 RB99.

Anaconda安装说明及环境配置

Anaconda 安装说明

Anaconda 是集成了上千个常用库的 Python 发行版本, 通过安装 Anaconda 能简化环境管理工作, 非常推荐使用.

作者基于目前 Python2 即将停止更新, 且目前大部分使用者电脑系统基本都是 64 位, 所以建议选择 Python3.7.3 64 位版本

同时, 根据您电脑的操作系统选择相对应的版本: Windows 版, MacOS 或 Linux 版的 64 位安装包.

安装演示(以 64 位 windows 版本为例)

下图中红框为 64 位 Windows 选择的版本: anaconda安装图

在这里, 作者建议下载 Anaconda3-2019.07, 点击下载 最新版 Anaconda 官方下载链接

双击如下图标进行安装:

image

点击 Next

image

点击 I Agree

image

点击 Just me --> Next

image

修改 Destination Folder 为如图所示:

image

勾选下图红框选项(以便于把安装的环境加入系统路径) --> Install

image

安装好后, 找到 Anaconda Prompt 窗口:

image

输入 python, 如果如下图所示, 即已经在系统目录中安装好 anaconda3 的环境.

image

创建虚拟环境

conda create -n ak_test python=3.7.3
Proceed 输入 y

显示出 最后一个红框内容则创建虚拟环境成功

image

在虚拟环境中安装 AkShare. 输入如下内容, 会在全新的环境中自动安装所需要的依赖包

pip install akshare --upgrade

image

在安装完毕后, 输入 python 进入虚拟环境中的 python

python
import akshare as ak
ak.__doc__

如下界面则虚拟环境和 AkShare 安装成功

image

输入如下代码可以显示 AkShare 的版本

import akshare as ak
ak.__version__

每日监控下载配置

本地配置好 Anaconda, 以及通过 pip 安装好 akshare>=0.1.25 后, 在 github 上下载示例文件, 即按照下图选择.

https://github.com/jindaxiang/akshare

image

解压下载的文件, 然后来到 example 目录下, 设置 setting 配置文件 root 设置为 AkShare 爬数据时存储的默认目录(需要保证目录存在), qqEmail 和 secret 为爬取到数据时把数据发送给自己的 qq 邮箱账号和密码. 需要开通SMTP服务, 如果不需要自己邮件提醒, 就不用设置(也不要改默认的qqEmail和secret). image

最后双击 monitor.cmd 即完成, 每日 17 点自动下载数据.

QQ邮箱SMTP服务设置

在利用 Python 程序发送 QQ 邮件时, 需要开启 QQ 邮件的 SMTP 服务, 操作方法如下, 第一步打开 QQ 邮箱, 点"设置".

image

找到"账户", 并下拉 image

开启以下的两项服务, 并生成授权码, 授权码为 Python 程序通过 SMTP 发送邮件的密码, 即上一节文档的 secret(不同于QQ邮箱登录密码) image

在启动服务的过程中, 如果该 QQ 账户没有绑定过手机号, 可能会需要验证, 这里不再赘述.

特别说明

致谢:

非常感谢 FuShare, TuShare 项目提供借鉴学习的机会;

感谢生意社网站提供的商品基差数据;

感谢奇货可查网站提供的奇货指数及相关数据;

交流:

欢迎加 QQ 群交流: 326900231

您可以扫码或者点击群二维码

在开启 QQ 情况下, 点击下面的图片自动打开 QQ 并加入本群, 本功能由 QQ 提供, 请放心点击:

AkShare官方

声明:

  1. AkShare 提供的数据仅供参考, 不构成任何投资建议;
  2. 任何基于 AkShare 进行研究的投资者请注意数据风险;
  3. AkShare 的使用请遵循相关开源协议;

Project details


Release history Release notifications | RSS feed

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

akshare-0.1.30.tar.gz (51.7 kB view details)

Uploaded Source

File details

Details for the file akshare-0.1.30.tar.gz.

File metadata

  • Download URL: akshare-0.1.30.tar.gz
  • Upload date:
  • Size: 51.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/2.0.0 pkginfo/1.5.0.1 requests/2.22.0 setuptools/41.2.0 requests-toolbelt/0.9.1 tqdm/4.36.1 CPython/3.7.3

File hashes

Hashes for akshare-0.1.30.tar.gz
Algorithm Hash digest
SHA256 a9412e1fa27b8ee8ae6aea0784a80db95054480f12574630ef1acfd5f13a26c2
MD5 aad4c67d008ad8a186a5e8f8f49d4de2
BLAKE2b-256 235534e882ffd7b299150a1c5ca7e7642bc4ffb9e56e569640f33afbd8733521

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page