今天跟大家聊聊我搞的那个“上证排名前50的股票”的小实践,纯属个人瞎折腾,大家看看就
事情是这样的,最近行情不太就想着研究研究上证50的成分股,看看能不能从中找到点机会。与其每天瞎看,不如自己动手整理一份名单出来,心里也踏实点。
说干就干,我先是跑到上海证券交易所的网站上,吭哧吭哧找了半天,总算是找到了上证50的成分股名单。拿到名单,我没有直接复制粘贴,那样太没意思了。我打算自己写个小程序,把这些股票的信息抓取下来,顺便做个简单的分析。
我用的是Python,requests库爬网页,BeautifulSoup解析数据,这套路大家都懂。结果发现上交所的网页有点反爬,搞得我焦头烂额。各种加header,设置delay,试了好几种方法,效果都不太
后来我换了个思路,用Selenium模拟浏览器操作。这招果然好用,直接绕过了反爬机制,顺利拿到了数据。不过Selenium速度比较慢,跑一次要好几分钟,有点费时间。
数据拿到手,就开始清洗整理。股票代码、股票名称、收盘价、市盈率、换手率、流通市值、总市值,这些基本信息都要搞清楚。我用Pandas把数据整理成DataFrame,然后用Excel简单处理了一下。
我开始做一些简单的分析。比如,计算一下上证50的平均市盈率,看看哪些股票的市盈率比较低,哪些股票的换手率比较高。我还画了几张简单的图表,看看这些股票的市值分布情况。
做完这些,我对上证50的成分股有了一个更直观的了解。虽然不能保证稳赚不赔,但至少心里更有底了。
这回实践,我主要用到了Python、requests、BeautifulSoup、Selenium、Pandas、Excel这些工具。虽然过程有点曲折,但最终还是完成了目标。以后有机会,我还会尝试更复杂的数据分析和可视化,争取能从数据中挖掘出更多的价值。
这回的实践主要做了这么几件事:
- 1. 从上交所网站爬取上证50成分股名单。
- 2. 用Pandas清洗整理数据。
- 3. 计算平均市盈率、换手率等指标。
- 4. 用Excel制作简单图表。
希望我的分享对大家有所帮助。大家也可以动手试试,说不定会有意想不到的收获。

