运维.售后
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
博客
Blog
ToB门户
了解全球最新的ToB事件
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
软件与程序人生
›
后端开发
›
Java
›
【matplotlib 实战】--散点图
【matplotlib 实战】--散点图
水军大提督
金牌会员
|
2023-11-6 17:25:18
|
显示全部楼层
|
阅读模式
楼主
主题
892
|
帖子
892
|
积分
2676
散点图,又名点图、散布图、X-Y图,是将所有的数据以点的形式展现在平面直角坐标系上的统计图表。
散点图常被用于分析变量之间的相关性。
如果两个变量的散点看上去都在一条直线附近波动,则称变量之间是线性相关的;
如果所有点看上去都在某条曲线(非直线)附近波动,则称此相关为非线形相关的;
如果所有点在图中没有显示任何关系,则称变量间是不相关的。
散点图一般需要两个不同变量,一个沿x轴绘制,另一个沿y轴绘制。
众多的散点叠加后,有助于展示数据集的“整体景观”,从而帮助我们分析两个变量之间的相关性,或找出趋势和规律。
1. 主要元素
散点图的主要元素包括:
横轴:表示自变量。
纵轴:表示因变量。
数据点:每个数据点代表一个观测值,它在坐标轴上的位置表示两个变量的对应取值。
趋势线:趋势线是通过数据点拟合出的一条线,用于显示变量之间的趋势或关联性。
2. 适用的场景
散点图适用的分析场景包括:
变量关系探索
:帮助我们观察和理解两个变量之间的关系。通过观察数据点的分布情况和趋势线的形状,可以判断变量之间是否存在线性关系、非线性关系或无关系。
趋势分析
:用于分析趋势和预测。通过观察趋势线的方向和斜率进行预测。
群体分析
:散点图可以帮助我们观察和识别数据点的聚类情况。
异常值检测
:散点图可以用于检测异常值或离群点。
3. 不适用的场景
散点图不适用的分析场景包括:
时间序列分析
:散点图主要用于展示两个变量之间的关系,对于时间序列数据,通常使用折线图或其他适合展示时间变化的图表类型。
多变量分析
:散点图只能展示两个变量之间的关系,对于多个变量之间的关系分析,需要使用其他图表类型,如散点矩阵、平行坐标图等。
分布分析
:散点图主要关注变量之间的关系,而不是变量本身的分布情况。如果需要分析变量的分布特征,可以使用直方图、箱线图等图表类型。
4. 分析实战
散点图适合寻找两个变量之间的关系,本次分析 **空气污染 **方面的数据情况。
4.1. 数据来源
数据来源国家统计局公开的数据。
用到的两个统计数据分别是:
工业污染治理中,每年治理废气的投资额
废气中二氧化硫的每年排放量情况
整理好的数据可从下面的地址下载:
https://databook.top/nation/A0C
A0C05.csv(废气中主要污染物排放) 和 A0C0I.csv(工业污染治理投资) 两个文件。
fp = "d:/share/data/A0C05.csv"
df1 = pd.read_csv(fp)
df1
复制代码
fp = "d:/share/data/A0C0I.csv"
df2 = pd.read_csv(fp)
df2
复制代码
4.2. 数据清理
2022年数据是空的,所以从两个文件中分别提取 2012~2021年期间,汇总
所有废气排放量(万吨)
和**治理废气项目完成投资(万元) **两类数据绘制图形。
[code]#所有废气的排放量data_x = df1[(df1["sj"] >= 2012) & (df1["sj"] = 2012) & (df2["sj"]
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
水军大提督
金牌会员
这个人很懒什么都没写!
楼主热帖
MySQL高可用架构搭建实战
让软件飞——“X+”技术揭秘 ...
Docker(11)-- DockerFile详解
哈希算法-SHA-256-过程详解
可观测性和传统监控的三大区别 ...
1. SQL
camunda工作流实战项目(表单设计器+流 ...
0. 数据库设计规范化
Could not resolve host: mirrorlist.c ...
SQL99相较于SQL92在多表查询时的新语法 ...
标签云
存储
服务器
快速回复
返回顶部
返回列表