安泰科技股票历史交易数据查询,掌握股票走势变化!

二八财经

最近在搞股票数据分析,免不要和历史交易数据打交道。盯上安泰科技(000969),就想着把它的历史数据扒下来,看看能不能找到点规律。

第一步:找数据源。

一开始想着用一些财经网站的API,但是试几个,要么就是要收费,要么就是数据不全,免费的午餐不好找。后来发现有些网站虽然没直接提供API,但是可以手动导出CSV或者Excel,就想着能不能用爬虫把数据搞下来。

安泰科技股票历史交易数据查询,掌握股票走势变化!

第二步:写爬虫。

选个看着比较顺眼的财经网站,就开始分析页面结构。页面还算规整,用Python的requests库请求页面,然后用BeautifulSoup解析HTML,把日期、开盘价、收盘价、涨跌幅这些关键数据提取出来。

爬虫这玩意儿,写起来容易,但是要稳定运行就难。各种反爬机制,什么IP限制、User-Agent验证,烦不胜烦。就想着搞个IP代理池,伪装User-Agent,尽量模拟真实用户访问。

第三步:数据清洗。

爬下来的数据,乱七八糟的,各种格式不统一。有些是字符串,有些是数字,还有些是空值。用pandas把数据读进来,然后就开始清洗。把日期转换成统一格式,把字符串转换成数字,把空值填充一下。清洗完之后,数据看起来顺眼多。

第四步:数据存储。

安泰科技股票历史交易数据查询,掌握股票走势变化!

洗干净的数据,总得找个地方存起来。一开始想着用Excel,但是数据量大之后,Excel就跑不动。后来就选择MySQL数据库,把数据一股脑儿塞进去,想怎么查就怎么查,方便多。

第五步:数据分析。

数据有,就可以开始瞎折腾。画个K线图,看看安泰科技的股价走势。又算算各种指标,什么均线、MACD、RSI,希望能发现点什么。不过看半天也没看出个所以然,股市这东西,真不是那么容易预测的。

  • 这回实践,主要是熟悉爬虫的基本流程,从数据抓取到数据清洗再到数据存储,算是走一遍。
  • 安泰科技股票历史交易数据查询,掌握股票走势变化!

  • 数据分析这块,还是个菜鸟,需要继续学习。
  • 股市有风险,入市需谨慎!

踩坑记录

  • IP代理池:免费的IP代理,质量参差不齐,很多都不能用。还是得花点钱买个稳定的IP代理。
  • 安泰科技股票历史交易数据查询,掌握股票走势变化!

  • 反爬机制:有些网站的反爬机制很变态,搞得我头都大。只能用一些比较笨的办法,比如降低爬取频率,模拟鼠标移动等等。
  • 数据质量:爬下来的数据,质量很重要。如果数据本身就有问题,那后面的分析就都是白费力气。

这回搞安泰科技股票历史交易数据,算是给自己练练手。虽然没赚到钱,但是学到不少东西,也算是有所收获。

发表评论

快捷回复: 表情:
AddoilApplauseBadlaughBombCoffeeFabulousFacepalmFecesFrownHeyhaInsidiousKeepFightingNoProbPigHeadShockedSinistersmileSlapSocialSweatTolaughWatermelonWittyWowYeahYellowdog
评论列表 (暂无评论,37人围观)

还没有评论,来说两句吧...