最近我闲着没事儿,在家翻手机,刷到了一些老新闻。你知道,那种好多年前的旧报道。突然就看到一个股票代码,002404。这代码我有点印象,好像前几年挺火的,后来又沉寂了。当时我就想,这玩意儿以前到底是怎么个走势?是被爆炒过,还是稳步上升的?好奇心一来,那就挡不住了,立马决定要把它的历史数据都给扒出来看看。
我的第一反应当然是去那些常用的炒股软件里看。什么同花顺,东方财富,这些平时我们散户用得最多的。我心想只要输入代码,历史K线图和数据不就出来了吗?这多简单的事儿。结果?输入002404,确实能看到K线图,也能看到一些基本的财务数据,比如市盈率、每股收益什么的。但当我尝试往前拉动K线图,或者点击那些“历史数据”的按钮时,就发现不对劲了。
它只能显示最近三五年的数据,顶多到上市后不就的某一年份。再往前拉,图就彻底中断了,或者数据表格里就显示“无数据”。有些软件甚至显示的是一片空白,根本就看不到更早的交易记录。这一下就把我彻底难住了。我想要的是它上市以来的全部数据,不是这断断续续的几年的数据。这让我很纳闷,难道股票软件不保存那么久远的公开数据吗?这不科学。
我开始觉得,可能这些商业软件为了优化性能,只保留了最常用的几年数据。那我就得换个思路了。于是我开始尝试更“官方”的渠道。我去了深圳证券交易所的官方网站,心想这总该是最权威最全的。结果?交易所官网确实有数据披露,比如各种公告、定期报告、招股说明书这些。但你要找每天的交易数据,那可就不是简单点几下就能出来的了。
它的查询系统,对我们这种普通股民来说,那真是太不友好了。界面复杂得跟迷宫似的,各种分类、各种选项,我找了半天都不知道从哪里才能查到我想要的每日交易明细。而且即便查到了,通常也是PDF格式的公告,你要把里面的数据提炼出来,那工作量简直不敢想。这不是找数据,这是在考古。
我又跑去了一些大型的财经门户网站,比如新浪财经、腾讯财经、和讯财经什么的。这些网站数据确实多,也比较全,它们通常会提供历史数据的下载链接,比如导出到Excel。我当时心里还挺高兴,觉得这回总算有谱了。结果,我下载了好几个网站提供的数据包,发现它们给的数据格式虽然都是CSV,但内容差异挺大的。有的少了复权数据,导致我很难看到它真实的股价增长情况;有的日期格式不一样,比如有的是“2010/01/01”,有的是“2010-01-01”;还有的列名都乱七八糟的,比如成交量有时候叫“Volume”,有时候叫“TradeCount”,我得自己手动去辨别和清理。最要命的是,很多网站也只能提供到某个时间点,再往前的,一样是断档,总感觉差了那么一点点。
我那会儿真是有点上火了。一个看似简单的历史数据,怎么就这么难找?都快把我整崩溃了。我甚至在一些老股里发帖问过,结果回复的人要么也是一知半解,要么就是推荐了一些收费的软件或者服务,说什么开通会员就能查到。我只是想看看数据,又不是要天天分析,花那个钱不值当,而且谁知道那些收费的到底靠不靠谱?
折腾了三四天,我都有点想放弃了。感觉这事儿就像个无底洞,怎么都填不满。不过我这个人,一旦较上劲儿,就非得弄明白不可。我就想,总不可能没有地方能查到这些数据?有没有那种专门做数据服务的平台?或者说,有没有一些老股民,他们手头可能存着这些数据,只不过我们普通人接触不到?
终于,有一天,我在一个特别不起眼的老股民论坛里瞎逛。这个论坛界面特别老旧,广告也多,我都差点关掉了。结果无意中看到一个帖子,一个老哥在抱怨某个股票软件的数据不全,然后他在下面回复说,他自己存了一批早期的历史数据,都是从好几个地方自己拼凑整理出来的。虽然他没有直接分享数据,但他在回复里提到了一个关键词:手动爬取加人工校对。
这几个字一下子点醒了我。对!如果软件里没有,官网又太麻烦,那我自己动手去“爬”行不行?我说的爬不是那种高级的技术活,我没那本事写程序。我想到的是,有没有哪个网站,它的历史数据表格是直接摆在那里的,我可以选中复制,然后粘贴到Excel里?这种土办法,说不定有用。
我就开始往这个方向使劲儿找。我专门搜那些“股票历史数据下载”、“002404历史数据免费”、“免费股票数据表格”之类的关键词。试了好多网站,有些根本打不开,有些又是弹窗广告满天飞,点一下就跳出好几个窗口。直到我点开了一个之前没怎么注意过的财经博客。这个博客看起来是个个人维护的,博主经常分享一些自己的分析文章。
神奇的事情发生了。在这个博客里,我发现博主文章里经常会直接贴出一些表格,里面就是股票的历史交易数据。虽然不是下载链接,但这些表格都是直接显示在网页上的,密密麻麻的数字,看着就有一种数据齐全的感觉。我当时就眼睛一亮!赶紧去搜索框里输入002404。果然,博主之前写过一篇关于这个股票的文章,里面就有一张非常长的表格。
我仔细一看,这张表格从002404上市那年开始,一直排到了最近几年。虽然中间也有一些小小的格式问题,比如日期有时是斜杠“/”,有时是横杠“-”,涨跌幅的百分号也得我自己加上去,但数据本身是完整的!从最初的发行价,到每一天的开盘、收盘、最高、最低、成交量、成交额,一个不落地都列在那里。我当时那个激动,感觉像挖到了宝一样,终于找到源头了。
我赶紧选中整个表格,然后小心翼翼地复制。打开Excel,直接粘贴。果然,数据整整齐齐地就进去了,虽然是“文本”形式,有点乱,但至少都显示出来了。接着就是一番体力活加细心活了。我在Excel里,先是选中所有日期列,统一设置为日期格式;然后把那些看起来是数字的列,比如开盘价、收盘价、成交量、成交额,都设置成数值格式。遇到一些空值或者特殊字符,比如“--”之类的,就手动删掉或者替换成0。我还给数据加了筛选,确保没有重复或者遗漏的日期。大概花了整整一个下午,我终于把一份从002404上市到每天的完整交易数据都整理出来了。
看着这份自己辛辛苦苦“挖”出来、又一格一格“洗”干净的数据,心里那叫一个满足和踏实。虽然过程有点曲折,也花了不少时间,但总算是把这事儿给办成了。通过这些数据,我清楚地看到了它从上市初期的默默无闻,到后来如何被市场热炒,再到最终回归平静的全过程。这份成果,也让我对寻找这类信息有了更深的体会。
我手头有了这份来之不易的002404全部历史数据。以后再想查哪个股票的这种老数据,估计我都知道该怎么找了,不至于像这回一样,像个无头苍蝇到处乱撞。这一下,总算是把心里这块大石头给放下了。这份数据,我后来还发给了几个也对这股票感兴趣的朋友,他们收到后都觉得挺意外的,说没想到我还能整出这么全的玩意儿,都夸我牛气。

还没有评论,来说两句吧...