ToB企服应用市场:ToB评测及商务社交产业平台

标题: 【matplotlib 实战】--气泡图 [打印本页]

作者: 莫张周刘王    时间: 2023-11-10 17:24
标题: 【matplotlib 实战】--气泡图
气泡图是一种多变量的统计图表,可以看作是散点图的变形。
与散点图不同的是,每一个气泡都表示三个维度的数据,除了像散点图一样有X,Y轴,气泡的大小可以表示另一个维度的数据。
例如,x轴表示产品销量,y轴表示产品利润,气泡大小代表产品市场份额百分比。
它可以帮助我们发现变量之间的模式、趋势和异常值。
通过气泡的大小和颜色,我们可以同时比较多个变量的值,并且可以快速识别出具有较大或较小数值的数据点。
1. 主要元素

气泡图通常用于展示和比较数据之间的关系和分布,可以展示三维(X,Y轴,气泡大小),甚至四维数据(X,Y轴,气泡大小,气泡颜色)之间的关系。
它的主要元素包括:

2. 适用的场景

气泡图适用的分析场景包括:
3. 不适用的场景

气泡图在以下情况可能不适用:
4. 分析实战

本次使用气泡图分析 2021年中欧之间的贸易数据情况。
气泡图可以分析三个维度的对比:
4.1. 数据来源

数据来源国家统计局公开的数据,整理好的数据可从下面的地址下载:
https://databook.top/nation/A06
用到的三个统计数据分别是:
  1. fp = "d:/share/data/A06050103.csv"
  2. df_total = pd.read_csv(fp)
  3. fp = "d:/share/data/A06050203.csv"
  4. df_output = pd.read_csv(fp)
  5. fp = "d:/share/data/A06050303.csv"
  6. df_input = pd.read_csv(fp)
复制代码
4.2. 数据清理

数据清理步骤主要包括:
  1. #提取每个文件中2021年的数据
  2. df = df_total[df_total["sj"] == 2021]
  3. #去除中欧整体的交易额数据,只保留和各个国家之间的贸易数据
  4. data = df.loc[2:, ["zbCN", "value"]]
  5. #重新映射列的名称
  6. data = data.rename(columns={"zbCN":"country", "value": "total"})
  7. #过滤多余字符,生成一个表示国家的数据列
  8. data["country"] = data["country"].str.replace("中国同", "", regex=False)
  9. data["country"] = data["country"].str.replace("进出口总额(万美元)", "", regex=False)
  10. df = df_input[df_input["sj"] == 2021]
  11. #合并进出口总额,进口额,出口额到一个数据集中
  12. data["input"] = df.loc[2:, ["value"]]
  13. df = df_output[df_output["sj"] == 2021]
  14. #合并进出口总额,进口额,出口额到一个数据集中
  15. data["output"] = df.loc[2:, ["value"]]
  16. data.head(5)
复制代码

和欧洲的总体交易数据位于每个数据集的第一行,所用用  loc[2:, ...] 来过滤。
4.3. 分析结果可视化
  1. with plt.style.context("seaborn-v0_8"):
  2.     fig = plt.figure()
  3.     ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])
  4.     ax.scatter(
  5.         data["input"] / 10000,
  6.         data["output"] / 10000,
  7.         data["total"] / 10000,
  8.         c = np.random.rand(len(data)),
  9.         cmap="Accent",
  10.         alpha=0.6,
  11.     )
  12.     ax.set_xlabel("进口额(亿元)")
  13.     ax.set_ylabel("出口额(亿元)")
  14.     x = np.linspace(0, 1400, 7)
  15.     y = x
  16.     ax.plot(x, y, '-')
复制代码

从图中可以看出:
横轴是进口额,纵轴是出口额,气泡越大,进出口总额越大。
中间的蓝色线表示进出口额度一样,可以看出,大部分国家都在蓝色线之上,
说明我国和大部分欧洲的贸易都是顺差
左下角有很多小气泡,说明和大部分国家之间的进出口贸易额不高,也许是欧洲的小国家很多的缘故。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4