北邮20级信息工程“python编程与实践”期末大作业
基于requests实现的网络爬虫,并使用BeautifulSoup进行信息筛选
最终将处理结果用xlwings输出Excel文件,输出词频统计结果为txt文件,并使用wordcloud生成云图
requests, bs4, xlwings, wordcloud
同时提供jupyter notebook和导出的py文件
更换main()中keyword为目标关键词后运行,即可得到titles.xlsx, stat.txt, wordcloud.png
(ppt和视频咱就没有办法了捏x