Github链接:https://github.com/sqwqwqw1/IPO_crawler 介绍 数据来自“东方财富网”,有些上市年份久远的公司没有问询函,只有招股书。 需要安装Python,还有其他一些模块: pip install scrapypip install panaspip install requests 使用说明 下载此文件: report_downloader 解压之后,修改其中的“股票代码.xlsx”,只需要改动“代码”这一列,名称那一列可有可无。
Comments | 1 条评论
博主 傲娇的小基基
发现了个bug,因为文件名里面有特殊符号,所以有些文件没有下载下来。
可以稍微改下pipeline.py的第九行,把冒号删除掉就可以了。
修改前:
修改后: