Tushare Pro 新版发布,免费、开源的python财经数据接口包 ...

打印 上一主题 下一主题

主题 578|帖子 578|积分 1734

   Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集清洗加工 到 数据存储的过程,能够为金融分析职员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。考虑到Python pandas包在金融量化分析中体现出的上风,Tushare返回的绝大部门的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib举行数据分析和可视化。当然,如果您习惯了用Excel或者关系型数据库做分析,您也可以通过Tushare的数据存储功能,将数据全部保存到本地后举行分析。应一些用户的请求,从0.2.5版本开始,Tushare同时兼容Python 2.x和Python 3.x,对部门代码举行了重构,并优化了一些算法,确保数据获取的高效和稳定。
下载安装

版本升级
  1. pip install tushare --upgrade
复制代码
 
检察当前版本的方法:
  1. import tushare
  2. <p>print(tushare.<strong>version</strong>)
  3. </p>
复制代码
如何优雅高效的撸数据?

获取Tushare Pro 的数据API,首先需要注册一个pro账号,然后登录pro网站在个人主页里拿到token码。另外,别忘了修改一下个人信息,这样可以多20积分。对于股票行情数据,只要有120积分就可以相对高频的撸数据了,这120积分随手可得(注册乐成有100积分、然后修改个人信息有20积分)。
Tushare的行情等时间序列数据,一般都有两个常用参数:trade_date和ts_code,分别是生意业务日期和证券代码。如果你是想提取部门个股的汗青数据,用ts_code参数,加上开始和结束日期可以方便提取数据。
但!如果是要获取所有汗青数据,我们不建议通过ts_code来循环,而是用trade_date来提取,道理很简单,股票有5000多个,需要循环5000多次,每年的生意业务日也就才220左右,所以效率更高。总的来说,积分越高可以调取的频次会越高。
也就是以下方式:
  1. import tushare as ts
  2. <p>pro = ts.pro_api()</p>
  3. <p>df = pro.daily(trade_date='20200325')
  4. </p>
复制代码
在循环提取数据时,首先我们可以通过生意业务日历拿到一段汗青的生意业务日。
  1. #获取20200101~20200401之间所有有交易的日期
  2. df = pro.trade_cal(exchange='SSE', is_open='1',
  3.                             start_date='20200101',
  4.                             end_date='20200401',
  5.                             fields='cal_date')
  6. <p>print(df.head())</p>
  7. <p></p>
复制代码
生意业务日:
  1.    cal_date
  2. 0  20200102
  3. 1  20200103
  4. 2  20200106
  5. 3  20200107
  6. 4  20200108
复制代码
循环过程中,为了保持数据提取的稳定性,可以先创建一个专门的函数,实现一个重试机制:
  1. def get_daily(self, ts_code='', trade_date='', start_date='', end_date=''):
  2.     for _ in range(3):
  3.       try:
  4.             if trade_date:
  5.                 df = self.pro.daily(ts_code=ts_code, trade_date=trade_date)
  6.             else:
  7.                 df = self.pro.daily(ts_code=ts_code, start_date=start_date, end_date=end_date)
  8.          except:
  9.                 time.sleep(1)
  10.         else:
  11.                 return df
复制代码
然后通过在循环中调取数据:
  1. for date in df['cal_date'].values:
  2.      df = get_daily(date)
复制代码
更多学习资料,请关注Tushare官方公众号“挖地兔”,可以获取到数据科学和金融数据相关领域的文章:

 

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

金歌

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表