Skip to main content

A fast quantitative investment tool kit

Project description

qteasy -- 一个基于Python的高效量化投资工具包

PyPI version Build Status

QTEASY简介

本项目旨在开发一套基于python的本地运行的量化交易策略回测和开发工具,包含以下基本功能

  1. 金融历史数据的获取、清洗、整理、可视化、本地存储查询及应用,并提供一些金融统计数据分析工具(开发中)
  2. 投资交易策略的创建、回测、性能评价,并且通过定义策略的可调参数,提供多种优化算法实现交易策略的参数调优
  3. 交易策略的部署、实盘运行(开发中),未来还将实现与自动化交易系统连接、实现自动化交易(开发中)

开发本模块的目标是为量化交易人员提供一套量化交易策略开发框架,提供了金融数据下载和分析,交易策略快速回测,策略可调参数的寻优以及交易策略实盘运行等功能。

安装及依赖

qteasy的安装

python -m pip install qteasy

安装依赖包

这个项目依赖以下python package,有些安装包可能不能在安装qteasy的时候自动安装,此时可以手动安装:

  • pandas version >= 0.25.1, <1.0.0 pip install pandas / conda install pandas
  • numpy version >= 1.18.1 pip install numpy / conda install numpy
  • numba version >= 0.47 pip install numba / conda install numba
  • TA-lib version == 0.4.18 pip install ta-lib==0.4.18
  • tushare version >= 1.2.89 pip install tushare
  • mplfinance version >= 0.11 pip install mplfinance / conda install -c conda-forge mplfinance

可选依赖包

使用qteasy需要设置本地数据源,默认使用csv文件作为本地数据源,如果选用其他数据源,需要安装以下可选依赖包

如果使用mysql数据库作为本地数据源

  • pymysql version >= 1.0.0 pip install pymysql / conda install -c anaconda pymysql
  • sqlalchemy version >= 1.4.18, <=1.4.23 pip install sqlalchemy / conda install sqlalchemy

如果使用hdf文件作为本地数据源

  • pytables version >= 3.6.1 conda install -c conda-forge pytables

如果使用feather文件作为本地数据源

  • pyarrow version >= 3 pip install pyarrow / conda install -c conda-forge pyarrow

10分钟了解qteasy的功能

基本的模块导入方法如下

import qteasy as qt

配置qteasy数据源:

为了使用qteasy,需要大量的金融历史数据,所有的历史数据都必须首先保存在本地,如果本地没有历史数据,那么qteasy的许多功能就无法执行。

qteasy可以通过tushare金融数据包来获取大量的金融数据,用户需要自行申请API Token,获取相应的权限和积分(详情参考:https://tushare.pro/document/2)

因此,在使用qteasy之前需要对本地数据源和tushare进行必要的配置,初始配置是通过一个文件qteasy.cfg来实现的。第一次导入qteasy时, qteasy 会在安装根目录下创建一个空白的配置文件,用TextEdit或Notepad打开文件可以看到下面内容:

# qteasy configuration file
# following configurations will be loaded when initialize qteasy

# example:
# local_data_source = database

  • 使用qt.QT_ROOT_PATH可以查看qteasy的安装根目录
  • tushareAPI token可以到tushare pro主页免费申请

在文件中直接添加下面的配置后保存即可:

# qteasy configuration file
# following configurations will be loaded when initialize qteasy

# example:
# local_data_source = database

tushare_token = <你的tushare API Token> 

# 如果设置使用mysql数据库作为本地数据源,需要设置:
local_data_source = database  
# 同时设置mysql数据库的连接信息
local_db_host = <host name>
local_db_user = <user name>
local_db_password = <password>
local_db_name = <database name>

# 如果使用csv文件作为本地数据源:
local_data_source = file
# 需要设置文件类型和存储路径
local_data_file_type = csv  # 或者hdf/fth分别代表hdf5文件或feather文件
local_data_file_path = data/  # 或者其他指定的文件存储目录

根据你选择的本地数据源类型,可能需要安装对应的依赖包,参见安装及依赖

如果日常使用的数据量大,建议设置data_source_type = 'database',使用数据库保存本地数据。不包括分钟数据时,所有数据将占用大约10G的磁盘空 间, 分钟级别数据将占用350GB甚至更多的磁盘空间。

关闭并保存好配置文件后,重新导入qteasy,就完成了数据源的配置,可以开始下载数据到本地数据源了。

下载股票价格数据并将其可视化

要下载数据,使用qt.refill_data_source()函数。下面的代码下载一年内所有股票的日K线数据:

qt.refill_data_source(tables='stock_daily', start_date='20210101', end_date='20220101')

qt.refill_data_source()tables参数指定需要补充的数据表; 除了直接给出表名称以外,还可以通过表类型同时下载多个数据表的数据:

  • cal : 交易日历表,各个交易所的交易日历
  • basics : 所有的基础信息表,包括股票、基金、指数、期货、期权的基本信息表
  • adj : 所有的复权因子表,包括股票、基金的复权因子,用于生成复权价格
  • data : 所有的历史数据表,包括股票、基金、指数、期货、期权的日K线数据以及周、月K线数据
  • events : 所有的历史事件表,包括股票更名、更换基金经理、基金份额变动等数据
  • report : 财务报表,包括财务指标、三大财务报表、财务快报、月报、季报以及年报
  • comp : 指数成分表,包括各个指数的成份股及其百分比
  • all : 所有的数据表,以上所有数据表,由于数据量大,建议分批下载

数据下载到本地后,可以使用qt.get_history_data()来获取数据,如果同时获取多个股票的历史数据,每个股票的历史数据会被分别保存到一个dict中。

qt.refill_data_source(tables='stock_daily', start_date='20210101', end_date='20220101')
qt.get_history_data(htypes='open, high, low, close', 
                    shares='000001.SZ, 000005.SZ',
                    start='20210101',
                    end='20210201')

运行上述代码会得到一个Dict对象,包含两个股票"000001.SZ"以及"000005.SZ"的K线数据(数据存储为DataFrame):

{'000001.SZ':
              open   high    low  close
 2021-01-04  19.10  19.10  18.44  18.60
 2021-01-05  18.40  18.48  17.80  18.17
 2021-01-06  18.08  19.56  18.00  19.56
 2021-01-07  19.52  19.98  19.23  19.90
 2021-01-08  19.90  20.10  19.31  19.85
 2021-01-11  20.00  20.64  20.00  20.38
 2021-01-12  20.39  21.00  20.18  21.00
 2021-01-13  21.00  21.01  20.40  20.70
 2021-01-14  20.68  20.89  19.95  20.17
 2021-01-15  21.00  21.95  20.82  21.00
 2021-01-18  21.20  22.78  21.20  22.70
 2021-01-19  22.51  22.84  22.05  22.34
 2021-01-20  22.15  22.97  22.12  22.47
 2021-01-21  22.50  22.80  22.15  22.23
 2021-01-22  22.23  22.23  21.51  22.03
 2021-01-25  21.72  22.60  21.43  22.49
 2021-01-26  22.30  23.32  22.30  22.37
 2021-01-27  22.31  23.47  22.31  23.08
 2021-01-28  22.78  23.18  22.45  22.81
 2021-01-29  22.81  23.54  22.71  23.09
 2021-02-01  23.00  24.99  22.70  24.55,
 
 '000005.SZ':
             open  high   low  close
 2021-01-04  2.53  2.53  2.51   2.52
 2021-01-05  2.52  2.52  2.46   2.47
 2021-01-06  2.47  2.48  2.39   2.40
 2021-01-07  2.40  2.43  2.36   2.38
 2021-01-08  2.36  2.38  2.32   2.37
 2021-01-11  2.37  2.37  2.29   2.29
 2021-01-12  2.30  2.32  2.29   2.30
 2021-01-13  2.31  2.31  2.17   2.20
 2021-01-14  2.19  2.23  2.15   2.20
 2021-01-15  2.20  2.28  2.20   2.26
 2021-01-18  2.25  2.30  2.25   2.28
 2021-01-19  2.28  2.36  2.26   2.32
 2021-01-20  2.32  2.39  2.31   2.32
 2021-01-21  2.31  2.34  2.29   2.32
 2021-01-22  2.31  2.32  2.26   2.26
 2021-01-25  2.25  2.26  2.20   2.21
 2021-01-26  2.20  2.23  2.17   2.18
 2021-01-27  2.17  2.21  2.17   2.20
 2021-01-28  2.18  2.23  2.18   2.20
 2021-01-29  2.19  2.21  2.11   2.14
 2021-02-01  2.08  2.09  1.93   1.94
}

股票数据下载后,使用qt.get_table_info()可以检查下载后数据表的信息,以及数据表中已经下载的数据量、占用空间、起止时间等信息:

qt.get_table_info('stock_daily')
<stock_daily>, 1.49GB/11.6M records on disc
primary keys: 
-----------------------------------
1:  ts_code:
    <unknown> entries
    starts: 000001.SZ, end: 873527.BJ
2:  trade_date:       *<CRITICAL>*
    <unknown> entries
    starts: 1990-12-19, end: 2023-02-01

columns of table:
------------------------------------
       columns       dtypes  remarks
0      ts_code  varchar(20)     证券代码
1   trade_date         date     交易日期
2         open        float      开盘价
3         high        float      最高价
4          low        float      最低价
5        close        float      收盘价
6    pre_close        float      昨收价
7       change        float      涨跌额
8      pct_chg        float      涨跌幅
9          vol       double   成交量(手)
10      amount       double  成交额(千元)

也可以使用qt.get_table_overview()来检查所有数据表的信息:

qt.get_table_overview()

股票的数据下载后,使用qt.candle()可以显示股票数据K线图。

data = qt.candle('000300.SH', start='2021-06-01', end='2021-8-01', asset_type='IDX')

png

qteasy的K线图函数candle支持通过六位数股票/指数代码查询准确的证券代码,也支持通过股票、指数名称显示K线图 qt.candle()支持显示股票、基金、期货的K线,同时也可以传入adj=b/f参数显示复权价格,或传入freq参数改变K显得频率,显示分钟、 周或月K线,还可以传入更多的参数修改K线图上的 指标类型、移动均线类型以及参数,详细的用法请参考文档,示例如下:

# 场内基金的小时K线图
qt.candle('159601', start = '20220121', freq='h')
# 沪深300指数的日K线图
qt.candle('000300', start = '20200121')
# 股票的30分钟K线,复权价格
qt.candle('中国电信', start = '20211021', freq='30min', adj='b')
# 期货K线,三条移动均线分别为9天、12天、26天
qt.candle('沪铜主力', start = '20211021', mav=[9, 12, 26])
# 场外基金净值曲线图,复权净值,不显示移动均线
qt.candle('000001.OF', start='20200101', asset_type='FD', adj='b', mav=[])

png

png

png

png

png

生成的K线图可以是一个交互式动态K线图(请注意,K线图基于matplotlib绘制,在使用不同的终端时,显示功能有所区别,某些终端并不支持 动态图表,详情请参阅 matplotlib文档

在使用动态K线图时,用户可以用鼠标和键盘控制K线图的显示范围:

  • 鼠标在图表上左右拖动:可以移动K线图显示更早或更晚的K线
  • 鼠标滚轮在图表上滚动,可以缩小或放大K线图的显示范围
  • 通过键盘左右方向键,可以移动K线图的显示范围显示更早或更晚的K线
  • 通过键盘上下键,可以缩小或放大K线图的显示范围
  • 在K线图上双击鼠标,可以切换不同的均线类型
  • 在K线图的指标区域双击,可以切换不同的指标类型:MACD,RSI,DEMA

gif

关于DataSource对象的更多详细介绍,请参见qteasy教程

创建一个投资策略,进行回测评价并优化其表现

queasy提供了多种内置交易策略可供用户使用,因此用户不需要手工创建这些策略,可以直接使用内置策略(关于所有内置策略的介绍,请参 见详细文档)。复合策略可以通过多个简单的策略混合而成。当复合策略无法达到预计的效果时,可以通过qteasy.Strategy类来自定义一个策略。

生成一个DMA均线择时交易策略

qteasy中的所有交易策略都是通过qteast.Operator(交易员)对象来实现回测和运行的,Operator对象是一个策略容器,一个交易员可以同时 管理多个不同的交易策略,哪怕这些交易策略有不同的运行时机和运行频率,或者不同的用途,例如一个策略用于选股、另一个策略用于大盘择时,再一个策 略用于风险控制,用户可以非常灵活地添加或修改Operator对象中的策略。

将策略交给Operator后,只要设置好交易的资产类别,资产池的大小,设定好每个策略的运行时机和频率后,Operator对象就会在合适的时间启动相应的 交易策略,生成策略信号,并将所有的策略信号混合(blend)后解析成为交易信号。交易信号如何解析,由op_type来控制。在默认情况下,Operator 对象会认为所有的策略生成的是"PT"信号,也就是持仓目标百分比(100%表示目前应该100%持有股票,而0%表示应完全卖出股票,100%持有现金, Operator会根据当前实际持有的股票和现金数量解析策略信号,并将其转化为买入股票或卖出股票的交易信号)。

在后面的章节中我们可以详细介绍每一种信号类型以及交易策略,在这里,我们将使用一个内置的DMA均线择时策略来生成一个最简单的大盘择时交易系统。

创建一个Operator对象,并在创建时传入参数:strategies='DMA',新建一个DMA双均线择时交易策略。

op = qt.Operator(strategies='dma')

创建好Operator对象后,可以用op.info()来查看它的信息。

op.info()
    ----------Operator Information----------
Strategies:  1 Strategies
Run Mode:    batch - All history operation signals are generated before back testing
Signal Type: pt - Position Target, signal represents position holdings in percentage of total value

    ---------------Strategies---------------
id        name           back_test_price  d_freq    s_freq  date_types
______________________________________________________________________
dma       DMA                 close         d         d     ['close']
======================================================================
for backtest histoty price type - close:
no blender

Operator中每一个交易策略都会被赋予一个唯一的ID,我们看到op中有一个交易策略,ID是dma,我们在Operator层面设置或修改策略的参数 时,都需要引用这个ID

DMA是一个内置的均线择时策略,它通过计算股票每日收盘价的快、慢两根移动均线的差值DMA与其移动平均值AMA之间的交叉情况来确定多空或买卖 点,这个策略需要三个可调参数(s,l,d),公式如下:

  • DMA = 股价的s日均线 - 股价的l日均线
  • AMA = DMA的d日均线
  • 可调参数: 是由用户定义的策略的运行参数。qteasy可以识别策略的可调参数,并且设计了多种优化算法,通过改变可调参数来调整策略 的运行性能,从而达到优化策略表现的目的

DMA是一个内置策略,qteasy已经定义好了交易规则:

  1. DMA在AMA上方时,多头区间,即DMA线自下而上穿越AMA线,由空变多,产生买入信号
  2. DMA在AMA下方时,空头区间,即DMA线自上而下穿越AMA线,由多变空,产生卖出信号

在默认情况下,三个可调参数为:(12,26,9), 但我们可以给出任意大于2小于250的三个整数作为策略的参数,以适应不同交易活跃度的股票、或者适应 不同的策略运行周期。

除了DMA策略以外,qteasy还提供了其他择时策略,详细的列表可以参见qteasy的手册。

传递策略参数到op对象中:

op.set_parameter('dma', pars=(23, 166, 196))

上面的代码将参数pars=(23, 166, 196)传递给DMA策略,op.set_parameter()的详细使用方法见手册。

回测并评价交易策略的性能表现

使用默认参数回测策略在历史数据上的表现,请使用op.run()qteasy使用环境变量来控制运行的各种参数,现在可以直接在op.run()的 运行参数中直接配置各种环境变量,更多关于环境变量的信息,请参见文档。下面的代码可以直接开始回测并评价结果:

  • 配置环境变量mode=1表示进入回测模式
  • invest_start/end: 回测模拟交易开始/结束日期
  • 环境变量visual控制是否输出可视化图表
res = op.run(mode=1, 
             invest_start='20080101', 
             invest_end='20210201',
             visual=True)

输出结果如下:

====================================
|                                  |
|       BACK TESTING RESULT        |
|                                  |
====================================
qteasy running mode: 1 - History back testing
time consumption for operate signal creation: 3.3ms
time consumption for operation back looping:  348.3ms

investment starts on      2008-01-02 00:00:00
ends on                   2021-02-01 00:00:00
Total looped periods:     13.1 years.

-------------operation summary:------------

           Sell   Buy  Total  Long pct  Short pct  Empty pct
000300.SH    11    12     23     50.7%       0.0%      49.3%   

Total operation fee:      ¥    1,042.59
total investment amount:  ¥  100,000.00
final value:              ¥  425,982.00
Total return:                   325.98% 
Avg Yearly return:               11.70%
Skewness:                         -0.63
Kurtosis:                         10.80
Benchmark return:                 0.60% 
Benchmark Yearly return:          0.05%

------strategy loop_results indicators------ 
alpha:                            0.067
Beta:                             1.002
Sharp ratio:                      0.041
Info ratio:                       0.029
250 day volatility:               0.162
Max drawdown:                    35.04% 
    peak / valley:        2009-08-03 / 2014-07-10
    recovered on:         2014-12-16

===========END OF REPORT=============

整个回测过程耗时0.4s左右,其中交易信号生成共耗费3.3ms,交易回测耗时348ms

根据上面结果,系统使用了沪深300指数从2008年到2021年共13.1年的历史数据来测试策略,在这段时间内,模拟2008年1月1日投入10万元投资 于沪深300指数,共产生了11次买入信号和12次卖出信号,产生的交易费用为1042.59元。 到2021年2月1日为止,投资总额从10万元变为42万元,投资总收益为325.98%,年化收益率为11.78%,而同期沪深300指数本身的涨幅仅为0.6%,策略最终是跑赢了大盘的。

qteasy模拟的交易过程中,可以设置丰富的参数,例如:

  • 投入资金的数量、日期、或者设置分批多次投入资金;
  • 买入和卖出交易的费用、包括佣金费率、最低费用、固定费用、以及滑点。各种费率都可以针对买入和卖出分别设定
  • 买入和卖出交易的交割时间,也就是T+N日交割制度
  • 买入和卖出交易的最小批量,例如是否允许分数份额交易、还是必须整数份额、甚至整百份交易

最终打印的回测结果是考虑上述所有交易参数之后的最终结果,因此可以看到总交易成本。详细的交易参数设置请参见详细文档。

另外,qteasy还给给出了关于策略表现的几个指标: 如alpha和beta分别是0.067和1.002,而夏普率为0.041。最大回撤发生在2009年8月3日到2014年7月10日,回撤了35.0%,且到了2014年12月16日才翻盘。

在上面的回测结果中我们给出了参数visual=False,如果令visual=True,就能得到可视化的回测结果,以图表的形式给出,并提供可视化信息:

  • 投资策略的历史资金曲线
  • 参考数据(沪深300指数)的历史曲线
  • 买点和卖点(在参考数据上以红色、绿色箭头显示)
  • 持仓区间(绿色表示持仓)
  • 投资策略的评价指标(alpha、sharp等)
  • 历史回撤分析(显示五次最大的回撤)
  • 历史收益率热力图、山积图等图表

png

qteasy提供了丰富的策略回测选项,例如:

  • 回测开始结束日期
  • 回测结果评价指标
  • 回测时是否允许持有负数仓位(用于模拟期货交易卖空行为,也可以使用专门的期货交易模拟算法)

更多的选项请参见详细文档

回测并优化交易策略

交易策略的表现往往与参数有关,如果输入不同的参数,策略回报相差会非常大。因此我们在定义策略的时候,可以将这些参数定义为"可调参数"。 定义好可调参数后,qteasy就可以用多种不同的优化算法,帮助搜索最优的策略参数,并且提供多种不同的策略参数检验方法,为策略参数的表 现提供独立检验。

要使用策略优化功能,需要设置交易策略的优化标记opt_tag=1,这样可以单独开启Operator对象中某一个或某几个策略的优化标记,从而在 对某些策略的可调参数进行优化的同时,其他策略的参数保持不变。然后运行qt.run(),并配置环境变量mode=2即可:

op.set_parameter('dma', opt_tag=1)
res = qt.run(op, mode=2, visual=True)

默认情况下,qteasy将在同一段历史数据上反复回测,找到结果最好的30组参数,并把这30组参数在另一段历史数据上进行独立测试,并显 示独立测试的结果,同时输出可视化结果如下:

这里忽略详细的参数对比数据,详细的结果解读和说明参见详细文档

关于策略优化结果的更多解读、以及更多优化参数的介绍,请参见详细文档

png

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

qteasy-0.0.1.dev1.tar.gz (447.8 kB view hashes)

Uploaded Source

Built Distribution

qteasy-0.0.1.dev1-py3-none-any.whl (341.0 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page