昨天被个搞股票的朋友问懵了,非让我分析下002131的历史走势。我寻思这事儿简单,打开炒股软件翻历史数据呗,结果点开一看头都大了——密密麻麻的涨跌数字挤在一小块屏幕上,想复制下来存个档,愣是连右键菜单都不让点开!气得我当场想砸键盘。
硬着头皮手动记
我就不信邪了,开个Excel新建表格,左手按着键盘方向键,右手猛戳鼠标滚轮。眼睛盯着屏幕上的开盘价,嘴里还念叨着“28块6毛2”,手指头哆哆嗦嗦敲数字。光复制2023年1月的数据就花了二十分钟,复制完发现漏了成交手数那列,气得我直接按了删除键重来。干到晚上十点半才整理完三个月数据,抬头一看颈椎都快断了。
半夜搞代码翻车
躺床上越想越憋屈,突然想起以前学过Python爬虫。凌晨一点从被窝里爬出来开电脑,把三年前学的教程翻出来照猫画虎。折腾到三点钟好不容易让程序跑起来了,结果刚爬到2020年数据,页面突然跳出验证码!更绝的是这破程序不知道停,对着验证码框疯狂报错,等我反应过来硬盘都快被报错日志塞满了。
柳暗花明撞见宝
第二天顶着黑眼圈刷论坛,看到有人提了句“金融终端能导表格”。赶紧下载了个免费版,注册时手抖输错三次手机号,好不容易登进去,在层层菜单里扒拉出历史数据功能。导数据时又卡住了——选日期范围死活点不动年份,原来要双击年份框才能展开,这设计简直反人类!导出个2010年到现在的Excel文件,居然才3MB不到。
- 数据清洗惨案:打开表格发现全是合并单元格,用格式刷刷了二十遍才拆开
- 日期乱码事件:2018年的日期显示成####,拉宽单元格发现是闰年日期格式错误
- 小数点风波:涨跌幅数据里有带百分号的,有不带的,用替换功能折腾半小时
现在整理好的表格已经按月份分好工作表,开盘最高最低收盘价都洗得干干净净。要说最大的教训——下次谁再让我手动抄数据,我直接把他Excel卸载了!


还没有评论,来说两句吧...