今天想整理MSCI成分股名单,纯粹是刷股票论坛时看到有人问。想着自己账户里有几只股票,顺手查查是不是成分股也结果百度一搜才发现,这名单真够乱的——不同网站数据打架,去年名单和今年混在一起,看得脑壳疼。
第一步:找靠谱信源
我先去中证官网翻公告,找了半天只在角落里看到个2021年的老文件。转头跑上交所深交所官网,结果都是零散信息。想起MSCI官网肯定有,结果全英文界面看得我直挠头。干脆抄近路,直接扒了三大证券报的公开报道,对比着看才确定用证券时报6月15号那篇当基准。
第二步:手工抓数据
打开报道直接傻眼,222只股票密密麻麻列在表格里。我抡起鼠标就开始干:
- 先建Excel表分三大栏:股票代码、公司简称、所属行业
- 按着报道顺序一个字母一个字母敲,光茅台就遇到三次重复
- 敲到第80多条手腕发酸,错把600519输成600915
第三步:交叉验证
弄完实在不放心,又打开同花顺挨个查代码:
- 发现中国中铁在报道里写601390,软件显示是*
- 港股通标的的代码全带.HK后缀,报道里全没标注
- 中芯国际在报道里只有沪股代码,漏了港股*
赶紧掏出红笔在打印稿上做记号,返回Excel补了整整17处漏洞。
最终成果
折腾三小时总算齐活:沪市136只+深市64只+港股22只。存表格时手抖按错键,差点把未保存文件关掉,惊出冷汗。发现个规律:这222只里光银行股就占了三成,宁德时代这种新能源反而没在名单前排。名单我就不贴了,真要查的朋友记住重点——必须核对带.HK的港股代码,三大交易所官网拼起来看才准!


还没有评论,来说两句吧...