爬虫
用 pyhon 爬取 #2023年电影总票房突破500亿元# 话题下的所有微博的内容、用户名、发表时间、发表机型、转发数量、评论数量以及点赞数量 爬取结果存储在csv文件中: 爬取时遇见报错: requests.exceptions.SSLError: HTTPSConnectionPool(host=‘s.weibo.com’, port=443): Max retries exceeded with url: /weibo?q=%23%E7%BD%91%E4%BF%A1%E5%8A%9E%E5%8F%91%E9%80%9A%E7%9F%A5%E9%9B%86%E4%B8%AD%E6%95%B4%E6%B2%BB7%E7%B1%BB%E7%AA%81%E5%87%BA%E9%97%AE%E9%A2%98%23&Refer=index&page=1 (Caused by SSLError(SSLEOFError(8, ‘EOF occurred in violation of protocol (_ssl.c:1129)’))) **解决方法:**关闭vpn,换一下cookie
爬取的csv文件在excel中出现乱码问题 解决方法: http://t.csdnimg.cn/zKpKB
数据分析
词云图: 词频图: 饼状图: 柱状图: 配套视频请看:https://www.bilibili.com/video/BV1Pz4y1c7Fw/ 程序下载链接:https://mbd.pub/o/bread/ZZaZmp5w
|