运维.售后
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
博客
Blog
ToB门户
了解全球最新的ToB事件
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
软件与程序人生
›
后端开发
›
Java
›
爬虫实战 - 微博评论数据可视化
爬虫实战 - 微博评论数据可视化
王國慶
金牌会员
|
2024-3-23 17:40:19
|
显示全部楼层
|
阅读模式
楼主
主题
934
|
帖子
934
|
积分
2806
简介:
我们都知道在数据比较少的情况下,我们是可以很轻易的获取到数据中的信息。但是当数据比较庞大的时候呢,我们就很难看出来了。尤其是面对现如今数以万计的数据,就更了。
不过好在我们可以通过计算机来帮我们进行分析,其中比较高效的手段便是数据可视化了。通过将数据进行可视化,我们可以让数据开口说话。进而有利于我们进行数据的分析,让我们可以更加快速的读懂数据。
回顾:
书接上回,咱们之前写了一个获取微博评论的爬虫。获取到的数据如下:
可以看到,上面的的数据其实凭借肉眼看的话很难看出来其中的规律。同时这些数据也是非常不直观的。那么我们就可以通过数据可视化的方式对这些数据进行可视化了。
下面是使用pyecharts对我们爬取到的数据进行可视化的效果。
第一个是关于评论数据中粉丝较多的用户的粉丝数据
第二个是关于评论数据中粉丝较多的用户的关注数据
接下来呢就是对评论发布的地址进行可视化了,从图中可以考到哪个地方的人看评论的人数比较的多。具体效果可以看下面的视频。
再者呢就是对时间进行统计了,就是看哪一个时间评论发布的最多
同时我们还可以对评论者的性别进行统计,下面是该微博评论中性别的分布情况
最后一个就是评论中用户的简介数据可视化,也就是说在这条微博中发布评论的用户的个性签名,然后对这些签名数据进行词云展示。
https://www.bilibili.com/video/BV1Be411U7f7/?spm_id_from=333.999.list.card_archive.click&vd_source=e3d5a0e98a19693b2e65d9eb8f93650c
以上就是本次分享的全部内容了。
源码获取,关注“陶陶name”公众号,回复“数据可视化”即可无套路获取!
由于笔者能力有限,在问题表述方面可能有不准确的地方,还请多多包涵!!!
下面的这个表示的是关于所有评论中,地址中前20的ip地址出现次数。从这里可以看到,这条微博评论中北京的评论用户最多
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
王國慶
金牌会员
这个人很懒什么都没写!
楼主热帖
webman
Jupyter Notebook,太强大了
【Shashlik.EventBus】.NET 事件总线, ...
React技巧之发出http请求
不想打开 IDE 的摆烂一天
【网络】https单向认证和双向认证 ...
APP内存管理
Bluecmsv1.6-代码审计
2022-08-16 数据库查询语言之-------D ...
导入例子体验鸿蒙开发工具的hello worl ...
标签云
存储
服务器
快速回复
返回顶部
返回列表