Python量化如何监测领涨板块,挖掘题材龙头股?

Posted Python金融量化

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python量化如何监测领涨板块,挖掘题材龙头股?相关的知识,希望对你有一定的参考价值。

引言

题材概念一直是A股市场投机炒作的主旋律。大多数散户都在复杂的理论、财务指标、技术图形和消息上折腾,缺乏从实践上去认识和把握市场。概念板块是市场资金达成共识的重要介质,主力资金凭借热点题材形成赚钱效应,热点炒作驱动资金与赚钱效应形成正向反馈环,推动热点板块个股上涨,而热点题材的级别大小和想象力大小则决定了股票上涨的空间。热点题材与板块主要来自经济、政策、情绪、资金、技术和外围环境。同花顺软件提供了各种热点题材和概念指数数据,为我们分析热点题材板块动向提供了依据。那么如何利用板块指数行情监测领涨板块,寻找板块龙头股呢?本文利用Python从tushare上获取同花顺概念板块行业指数行情数据和个股交易数据,分析板块及个股的动量走向,为构建热点题材和龙头股(强势股)监测系统提供参考依据。

数据获取与探索性分析


下面利用tushare pro获取同花顺概念板块行业指数相关数据,tushare pro需到其官网注册获取token才能使用,某些数据提取有积分限制,下面使用到的数据可以通过在微信公众号后台回复“20220210”或“同花顺概念”获取。

首先导入需要用到的Python库/模块。

import pandas as pd
import numpy as np
#可视化:matplotlib、seaborn、pyecharts
import matplotlib.pyplot as plt
import seaborn as sns
#正确显示中文和负号
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
#这里的pyecharts使用的是0.5.11版本
from pyecharts import Bar,HeatMap
#导入时间处理模块
from dateutil.parser import parse
from datetime import datetime,timedelta
#pandas赋值老提升警告
import warnings
warnings.filterwarnings('ignore')
#使用tushare pro获取数据,需要到官网注册获取相应的token
import tushare as ts 
token='输入你的token'
pro=ts.pro_api(token)


获取同花顺概念和行业列表。

index_list=pro.ths_index()
#查看数据前几行
index_list.head()

#数据保存本地
#index_list.to_csv('index_list.csv')
#读取本地数据
#index_list=pd.read_csv('index_list.csv',index_col=0)

其中,ts_code:代码;name:名称;count:成分个数;exchange:交易所,包括A股、港股(H)和美股(US);list_date:上市日期;type:指数类型N-板块指数,I-行业指数,S-同花顺特色指数。

def plot_bar(data,title,label=True,zoom=False):
    bar=Bar('')
    attr=list(data.index)
    v=list(data.values)
    bar.add(title,attr,v,is_label_show=label,
           is_splitline_show=False,
           is_datazoom_show=zoom)
    return bar
data=index_list.groupby('exchange')['name'].count()
title='同花顺概念和行业指数\\nA股\\港股\\美股'
plot_bar(data,title)


上图显示,A股概念和行业指数高达939个,下面主要分析A股上的同花顺概念和行业指数做进一步考察。

A_index_list=index_list.query("exchange=='A'")
A_index_list=A_index_list.copy()
A_index_list['nums']=pd.to_numeric(A_index_list['count'])
#去掉缺失值
A_index_list.dropna(inplace=True)
A_index_list['nums'].describe()

概念或行业成分股中平均有53只个股,当然,每只个股可能分属不同的概念板块行业,如果某个概念板块所含个股数量太多或太少,相当于涵盖面太宽泛或代表性不足,分析起来意义不大。下面删除重复项和剔除成份个股数量低于12大于52(相当于取25%到75%分位数)。

#删除代码重复项,
#保留type为N板块的指数
final_index_list=(A_index_list
                  .drop_duplicates(subset=['ts_code'], keep='first')
                 .query("12<nums<52")
                 .query("type=='N'"))
#去掉样本股或成份股指数
final_index_list=final_index_list[-final_index_list.name.apply(lambda s:s.endswith('样本股')or s.endswith('成份股'))]
final_index_list.sort_values('nums')

data=(final_index_list.sort_values('nums',ascending=False)
      .set_index('name')['nums'])
title='同花顺概念和行业指数成分股个数'
plot_bar(data,title,False,True)


获取概念行业指数行情

下面通过日期循环获取某时间段所有概念行业指数的行情数据。使用tushare在线获取代码由于篇幅所限,此处略,完整代码见Python金融量化知识星球。数据也可以通过公众号上获取(回复“20220210”或“同花顺概念”)后导入。

#获取股票交易日历
def get_cals():
    #获取交易日历
    pass
#获取某段时间内的交易日期(如200个交易日)
def get_trade_date(n):
    #获取当天日期时间
    pass
#获取某段时间内的概念指数行情数据
def get_index_data(n=200):
    pass

查看数据前几行。后续分析只需要使用指数的收盘价、交易代码和交易日期。

#通过tushare在线获取数据
#all_data=get_index_data(n=200)
#数据保存本地
#all_data.to_csv('all_data.csv')
#通过本地导入数据
all_data=pd.read_csv('all_data.csv',index_col=0)
all_data.head()

#删除重复缺失值、将代码使用概念中文名代替
final_data=(all_data.sort_values(['ts_code','trade_date'])
            .drop_duplicates()
            .set_index(['trade_date','ts_code'])['close'].unstack()
            .dropna(axis=1)
            .rename(columns=dict(index_list[['ts_code','name']].values)))
final_data.tail()

到这一步已获取到所需数据并做了规整处理。下面对板块和相关个股涨跌幅进行分析,并构建函数用于监测板块热点和强势个股的轮动走向。

板块热点与个股涨跌监测分析


要分析板块热点的走向,首先是计算板块指数在不同时间周期下的收益率(动量)。下面以1日、5日、20日、60日和120日作为时间窗口计算概念指数的收益率。

def date_ret(data,w_list=[1,5,20,60,120]):
    df=pd.DataFrame()
    for w in w_list:
        df[str(w)+'日收益率%']=(((data/data.shift(w)-1)*100)
                            .round(2)
                            .iloc[w:]
                            .fillna(0)
                            .T
                            .iloc[:,-1])
    return df
date_ret(final_data).sort_values('120日收益率%',ascending=False)


120日涨幅居前板块指数。

date_ret(final_data).sort_values('120日收益率%',ascending=False)[:10]


120日跌幅最多的前五个板块指数。

date_ret(final_data).sort_values('120日收益率%',ascending=True)[:5]


概念板块指数周期涨跌幅可视化

#使用pyecharts0.5.11版本可视化
def out_chart(w=120):
    col=str(w)+'日收益率%'
    ddd=date_ret(final_data).sort_values(col,ascending=False)[col]
    x=list(ddd.index)
    y=list(ddd.values)
    bar=Bar(f"同花顺概念指数w日收益率(%)",title_text_size=15,title_pos='center')
    bar.add("", x,y,is_label_show=False, is_datazoom_show=True)
    return bar
#最近一个交易日
#图形为html动态交互式,可通过拖曳查看所有概念指数的详细涨跌幅
out_chart(1)

#近5个交易日
out_chart(5)

#近20个交易日
out_chart(20)

#近120个交易日
out_chart(120)

除了使用pyecharts对板块不同周期下的动量进行监测(动态交互式),还可以使用热力图监测最近交易日各板块指数的轮动走向。图片输出可以使用网页显示更全面。

#由于同花顺指数行情数据获取不到下面概念,需剔除
xx=['华为汽车', '盐湖提锂', '鸿蒙概念', '共同富裕示范区', 'MCU芯片', '牙科医疗', 
    'CRO概念', '钠离子电池', '工业母机', '北交所概念', 'NFT概念', '抽水蓄能', 
    '换电概念', '海峡两岸', 'WiFi 6', '智能制造', 'EDR概念', '动力电池回收', 
    '汽车芯片', '传感器', '柔性直流输电', '虚拟数字人', '预制菜', '幽门螺杆菌概念']
sss=final_data[set(final_index_list.name.values)-set(xx)]
import seaborn as sns
pt = ((sss/sss.shift(1)-1)*100).round(2)[-10:]
plt.figure(figsize=(25,5))
sns.heatmap(pt, linewidths = 0.05,cmap='Reds');


一旦出现赚钱效应,首先看的是哪个整体板块在领涨,这个板块是什么概念,是不是当下的大热点?选股就是先看热点板块,龙头股与题材有关,题材代表了一个板块,不会是单打独斗,关注热点板块,在板块中选股非常重要。发现最大题材板块后,核心是找板块龙头股。在整个板块中最先上涨,涨势最强的个股就一定要关注并分析。


热点板块成分股龙头股监测

#受篇幅所限,以下代码略,完整代码分享在Python金融量化知识星球中。
#注意,写作本文时交易日期为20220209,即默认end='20220209'.
def get_stock_price(code,start='20200101'):
     pass
def all_stock_price(name):
     pass
def stock_rets_rank(name,p=120):
     pass
def stock_heat(name='数字货币'):
     pass
stock_rets_rank('钾肥')

实际上钾肥这个概念所含个股较少,且盐湖股份由于中间停牌复牌后短期暴涨(实际上是盐湖提锂概念在驱动),因此该概念指数120日涨幅最大。一起看下近期较热门的数字货币概念。翠微股份120日涨幅高达314%,可以说是近期接替妖股九安医疗的一大热门股。妖股是主力资金博弈到极致之物,与基本面与价值投资没有任何干系。

stock_rets_rank('数字货币')

随着数字货币财经新闻的持续发酵,2022年2月09日数字货币板块单日暴涨9%,板块内近20只个股涨停,四只创业板20cm。值得注意的是,板块的短期暴涨也是风险集聚的表现,特别是碰上那些跟风上涨的个股,当板块整体进入回调时往往一地鸡毛。

stock_rets_rank('数字货币',p=1)[:20]

使用热力图监测热点板块个股。

stock_heat('数字货币')

结语

本文使用Python对同花顺概念板块指数及个股进行数据探索性分析,试图从动量的角度捕捉热门题材的走向,构建强势板块和个股的监测系统。利用板块和个股监测系统可以构建动量(强者恒强)或动量反转(物极必反)的量化交易策略。本文的数据挖掘存在一定的局限性,只考虑了某些时间周期内板块和个股的收益率表现(技术面)。关于概念板块行业的分析,还可以结合财经文本分析做深度挖掘,实际上热点题材最好是结合基本面与技术面的深入分析,技术面正如温度计一样只能告诉你当前的冷热,而基本面可以推断为啥上涨的原因,未来持续性如何,这个基本逻辑非常重要。金融市场上的交易,没有完全不变和百分之百确定的东西,任何分析和决策都是一种概率,而量化为我们多维度分析市场提供一种工具,实际上实战才是唯一能快速提升交易能力的方法。

关于Python金融量化

专注于分享Python在金融量化领域的应用。加入知识星球,可以免费获取30多g的量化投资视频资料、量化金融相关PDF资料、公众号文章Python完整源码、量化投资前沿分析框架,与博主直接交流、结识圈内朋友等。

以上是关于Python量化如何监测领涨板块,挖掘题材龙头股?的主要内容,如果未能解决你的问题,请参考以下文章

人脸支付概念股龙头股图像识别概念股有哪些

我的总结--强势股的短线战法精髓

云计算龙头股6.8

区块链龙头股7.3

复盘:区块链+医药+军工+有色!市场中枢区间震荡能否形成

金港赢配资医药白酒领涨