AI量化交易(二)——Tushare财经数据框架
一、Tushare简介
1、Tushare简介
Tushare是一个免费、开源的python财经数据接口包,目前为Tushare Pro版本,主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁和多样的便于分析的数据。Tushare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas、NumPy、Matplotlib进行数据分析和可视化。
2、Tushare安装
Github: https://github.com/waditu/Tushare
pip install tushare lxml
pip install beautifulsoup4
3、Token生成
Tushare使用需要注册账户,并生成Token。
本人邀请注册链接:https://tushare.pro/register?reg=306303
注册成功,登录Tushare,点击个人信息设置:
在接口Token页找到个人的Token,Token是使用Tushare接口的惟一凭证,如果发现泄露,可以刷新生成新的Token。
import tushare as ts
if __name__ == '__main__':
print(ts.__version__)
# 设置Token
ts.set_token('xxx0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
# output:
# 1.2.45
4、Tushare API简介
Tushare的数据接口分为沪深股票、指数、基金、期货、期权、债券、外汇、港股、行业经济、宏观经济、特色大数据共计十一大类,沪深其中股票分为基础数据、行情数据、财务数据、市场参考数据四类接口。Tushare也提供了区块链相关的基础数据、行情数据、资讯公告三类接口,以及新浪财经、东方财富、同花顺、云财经、华尔街见闻等财经网站的宏观经济、外汇、A股、区块链、美股、石油、黄金、黄金外汇、港股、商品、债券、公司、市场、焦点、央行等财经资讯类消息。
Tushare API接口需要根据注册账户的积分数量获取相应的访问权限,积分等级不够可能导致API接口无权限访问,区块链相关接口需要捐款获取相应权限。
Tushare API接口使用参考:https://tushare.pro/document/2
二、Tushare股票数据接口
1、股票列表
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.stock_basic(exchange='', list_status='L', fields='ts_code,symbol,name,area,industry,list_date')
# data = ts_api.query('stock_basic', exchange='', list_status='L',
# fields='ts_code,symbol,name,area,industry,list_date')
print(data)
获取股票基础信息数据,包括股票代码、名称、上市日期,行业、概念等。
2、IPO新股上市
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.new_share(start_date='20190101', end_date='20190901')
print(data)
获取新股上市列表数据
3、日线行情
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.daily(ts_code='000001.SZ', start_date='20190101', end_date='20190901')
print(data)
交易日每天15点~16点之间。本接口是未复权行情,停牌期间不提供数据。
4、周线行情
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.weekly(ts_code='000001.SZ', start_date='20180101', end_date='20181101',
fields='ts_code,trade_date,open,high,low,close,vol,amount')
print(data)
获取A股周线行情
5、月线行情
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.monthly(ts_code='000001.SZ', start_date='20180101', end_date='20181101',
fields='ts_code,trade_date,open,high,low,close,vol,amount')
print(data)
获取A股月线数据。
6、通用行情接口
pro_bar接口整合了股票(未复权、前复权、后复权)、指数、数字货币、ETF基金、期货、期权的行情数据,未来会包括外汇在内的所有交易行情数据,同时提供分钟数据。
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts.pro_bar(api=ts_api, ts_code='000009.SZ', adj='qfq', start_date='20170101', end_date='20181011', ma=[5],
freq='D')
print(data)
获取A股的K线数据,带有复权参数“adj”、均线参数“ma”、数据频度参数“freq”。
7、获取股票的全部数据
import tushare
import os
import datetime
import timedelta
def fetch_kline_data(code):
filename = 'your path'
if not os.path.exists(filename):
end_date = datetime.strftime(datetime.now(), '%Y%m%d')#获取当前时间
outputflag = True
api = tushare.pro_api()
while outputflag:#循环判断,直到返还的数据为空
data = tushare.pro_bar(pro_api=api,ts_code=code,
end_date=end_date,asset='E', adj=None, freq='D')
if data.empty == True:
outputflag = False
else:
#计算下次请求数据的截止日期
next_end_date = datetime.strptime(data.iloc[-1]['trade_date'],
'%Y%m%d') - timedelta(hours=24)
end_date = datetime.strftime(next_end_date, '%Y%m%d')
#写csv文件
if os.path.exists(filename):
data.to_csv(filename, header=None, mode='a')#追加写入模式
else:
data.to_csv(filename, header=None, mode='a')
三、Tushare上市公司财务数据接口
1、利润表
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('xxxx0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.income(ts_code='600001.SH', start_date='20190101', end_date='20190901')
print(data)
获取上市公司财务利润表数据
2、资产负债表
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.balancesheet(ts_code='600000.SH', start_date='20190101', end_date='20190901',
fields='ts_code,ann_date,f_ann_date,end_date,report_type,comp_type,cap_rese')
print(data)
获取上市公司资产负债表。
3、现金流量表
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.cashflow(ts_code='600000.SH', start_date='20190101', end_date='20190901')
print(data)
获取上市公司现金流量表。
4、业务预告
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.forecast(ann_date='20190131',
fields='ts_code,ann_date,end_date,type,p_change_min,p_change_max,net_profit_min')
print(data)
获取业绩预告数据。
5、分红送股数据
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.dividend(ts_code='600848.SH', fields='ts_code,div_proc,stk_div,record_date,ex_date')
print(data)
分红送股数据。
6、业绩快报
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.express(ts_code='600000.SH', start_date='20180101', end_date='20180701',
fields='ts_code,ann_date,end_date,revenue,operate_profit,total_profit,n_income,total_assets')
print(data)
获取上市公司业绩快报。
7、财务指标数据
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.fina_indicator(ts_code='600000.SH')
print(data)
获取上市公司财务指标数据,为避免服务器压力,现阶段每次请求最多返回60条记录,可通过设置日期多次请求获取更多数据。
8、财务审计意见
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.fina_audit(ts_code='600000.SH', start_date='20100101', end_date='20180808')
print(data)
获取上市公司定期财务审计意见数据
9、主营业务构成
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.fina_mainbz(ts_code='000627.SZ', type='P')
print(data)
获取某只股票的主营业务构成df = ts_api.fina_mainbz_vip(period='20181231', type='P', fields='ts_code,end_date,bz_item,bz_sales')
获取某一季度全部股票的主营业务构成
10、上市公司完整财务指标获取
import tushare
import datetime
import os
import timedelta
def fetch_finance_indicator(code):
filename = 'your path'
if not os.path.exists(filename):
end_date = datetime.strftime(datetime.now(), '%Y%m%d')
outputflag = True
api = tushare.pro_api()
while outputflag:
data = api.fina_indicator(ts_code=code, end_date=end_date)
if data.empty == True:
outputflag = False
else:
next_end_date = datetime.strptime(
data.iloc[-1]['end_date'], '%Y%m%d') - timedelta(hours=24)
end_date = datetime.strftime(next_end_date, '%Y%m%d')
if os.path.exists(filename):
data.to_csv(filename, header=None, mode='a')
else:
data.to_csv(filename)
四、Tushare指数接口
1、指数基本信息
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.index_basic(market='CSI')
print(data)
获取指数基础信息。
MSCI:MSCI指数
CSI:中证指数
SSE:上交所指数
SZSE:深交所指数
CICC:中金所指数
SW:申万指数
2、指数日线行情
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.index_daily(ts_code='399300.SZ', start_date='20190101', end_date='20190910')
print(data)
获取指数每日行情,还可以通过bar接口获取。由于服务器压力,目前规则是单次调取最多取8000行记录,可以设置start和end日期补全。指数行情也可以通过通用行情接口获取数据。
3、指数周线行情
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.index_weekly(ts_code='000001.SH', start_date='20180101', end_date='20190329',
fields='ts_code,trade_date,open,high,low,close,vol,amount')
print(data)
获取指数周线行情,单次最大1000行记录,可分批获取,总量不限制。
4、指数月线行情
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.index_monthly(ts_code='000001.SH', start_date='20180101', end_date='20190930',
fields='ts_code,trade_date,open,high,low,close,vol,amount')
print(data)
获取指数月线行情,每月更新一次,单次最大1000行记录,可多次获取,总量不限制。用户需要至少600积分才可以调取,积分越多频次越高。
5、指数成分和权重
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.index_weight(index_code='399300.SZ', start_date='20180901', end_date='20190930')
print(data)
获取各类指数成分和权重,月度数据 ,如需日度指数成分和权重,用户需要至少400积分才可以调取。
五、Tushare市场参考数据接口
1、港股通10大成交股
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.ggt_top10(trade_date='20190925')
print(data)
获取港股通每日成交数据,其中包括沪市、深市详细数据。
2、融资融券交易汇总
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.margin(trade_date='20190925')
print(data)
获取融资融券每日交易汇总数据。
3、融资融券交易明细
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.margin_detail(trade_date='20190925')
print(data)
获取沪深两市每日融资融券明细。
4、前十大股东
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.top10_holders(ts_code='600000.SH', start_date='20190101', end_date='20191231')
print(data)
获取上市公司前十大股东数据,包括持有数量和比例等信息。
5、前十大流通股东
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.top10_floatholders(ts_code='600000.SH', start_date='20190101', end_date='20191231')
print(data)
获取上市公司前十大流通股东数据。
6、龙虎榜每日明细
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.top_list(trade_date='20190925')
print(data)
龙虎榜每日交易明细,单次最大10000,用户需要至少300积分才可以调取。
7、龙虎榜机构交易明细
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.top_inst(trade_date='20190925')
print(data)
龙虎榜机构成交明细,单次最大10000,用户需要至少300积分才可以调取。
8、大宗交易
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.block_trade(trade_date='20190925')
print(data)
大宗交易,单次最大1000条,总量不限制,300积分可调取,每分钟内限制次数,超过5000积分无限制。
9、股票开户数据
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.stk_account(start_date='20190101', end_date='20191231')
print(data)
获取股票账户开户数据,统计周期为一周,600积分可调取。
10、股东人数
import tushare as ts
if __name__ == '__main__':
# 设置Token
ts.set_token('b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530')
# 初始化接口
ts_api = ts.pro_api()
data = ts_api.stk_holdernumber(ts_code='300209.SZ', start_date='20190101', end_date='20191231')
print(data)
获取上市公司股东户数数据,数据不定期公布。单次最大3000,总量不限制,600积分可调取,基础积分每分钟调取100次,5000积分以上无限制。
来源:51CTO
作者:天山老妖S
链接:https://blog.51cto.com/9291927/2450913?source=dra