python爬取微博指定话题下的所有微博内容、转发数量、评论数量、点赞数量,绘制词云图、词频分析,数据分析

您所在的位置:网站首页 杨超越的微博超话社区 python爬取微博指定话题下的所有微博内容、转发数量、评论数量、点赞数量,绘制词云图、词频分析,数据分析

python爬取微博指定话题下的所有微博内容、转发数量、评论数量、点赞数量,绘制词云图、词频分析,数据分析

2024-07-03 02:52| 来源: 网络整理| 查看: 265

爬虫

用 pyhon 爬取 #2023年电影总票房突破500亿元# 话题下的所有微博的内容、用户名、发表时间、发表机型、转发数量、评论数量以及点赞数量 在这里插入图片描述 爬取结果存储在csv文件中: 在这里插入图片描述 爬取时遇见报错: requests.exceptions.SSLError: HTTPSConnectionPool(host=‘s.weibo.com’, port=443): Max retries exceeded with url: /weibo?q=%23%E7%BD%91%E4%BF%A1%E5%8A%9E%E5%8F%91%E9%80%9A%E7%9F%A5%E9%9B%86%E4%B8%AD%E6%95%B4%E6%B2%BB7%E7%B1%BB%E7%AA%81%E5%87%BA%E9%97%AE%E9%A2%98%23&Refer=index&page=1 (Caused by SSLError(SSLEOFError(8, ‘EOF occurred in violation of protocol (_ssl.c:1129)’))) **解决方法:**关闭vpn,换一下cookie

爬取的csv文件在excel中出现乱码问题 在这里插入图片描述 解决方法: http://t.csdnimg.cn/zKpKB

数据分析

词云图: 在这里插入图片描述 词频图: 在这里插入图片描述 饼状图: 在这里插入图片描述 柱状图: 在这里插入图片描述 配套视频请看:https://www.bilibili.com/video/BV1Pz4y1c7Fw/ 程序下载链接:https://mbd.pub/o/bread/ZZaZmp5w



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3