ToB企服应用市场:ToB评测及商务社交产业平台

标题: 【matplotlib 实战】--饼图 [打印本页]

作者: 宝塔山    时间: 2023-10-31 20:00
标题: 【matplotlib 实战】--饼图
饼图,或称饼状图,是一个划分为几个扇形的圆形统计图表。
在饼图中,每个扇形的弧长(以及圆心角和面积)大小,表示该种类占总体的比例,且这些扇形合在一起刚好是一个完全的圆形。
饼图最显著的功能在于表现“占比”。
习惯上,人们通过比较饼图扇形的大小来获得对数据的认知。
使用饼图时,须确认各个扇形的数据加起来等于100%;
且避免扇区超过5个,扇形的排布顺序,一般情况下,将最大的扇形放在12点钟方向。
1. 主要元素

饼图的主要元素包括:

2. 适用的场景

饼图适用的场景包括:
3. 不适用的场景

饼图不适用的场景包括:
4. 分析实战

本次用饼图统计展示 不同人口规模的城市数量 的统计情况。
4.1. 数据来源

数据来自国家统计局公开的城市概况数据,可从下面的网址下载:
https://databook.top/nation/A0B
使用其中的 A0B01.csv 文件(分机构类型法人单位数)
  1. fp = "d:/share/A0B01.csv"
  2. df = pd.read_csv(fp)
  3. df
复制代码

4.2. 数据清理

最新的2022年数据缺失较多,所以选取2021年的数据进行分析。
  1. data = df[df["sj"] == 2021]
  2. data
复制代码

第一条数据全部城市情况,统计需要去除,另外,指标的名称太长,统计前也可以调整下。
接着上面过滤后的数据继续数据清洗:
  1. data = data.reset_index() # 重置索引
  2. data = data.iloc[1:]  # 忽略第一条合计的数据
  3. #调整指标名称,删除多余的文字
  4. data["zbCN"] = data["zbCN"].str.replace("城市市辖区年末总", "")
  5. data["zbCN"] = data["zbCN"].str.replace("地级及以上", "")
  6. data
复制代码

最后得到的数据有6条饼图一般来说数据不要超过5个6个也还行,再多就影响显示效果了。
4.3. 分析结果可视化
  1. with plt.style.context("seaborn-v0_8"):
  2.     fig = plt.figure()
  3.     ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])
  4.     ax.pie(data["value"], autopct="%1.1f%%")
  5.     ax.legend(
  6.         data["zbCN"].tolist(),
  7.         loc="center",
  8.         bbox_to_anchor=(1, 0, 0.5, 1),
  9.     )
复制代码

从分析结果可看出,50万~200万人口的城市超过一半,是大多数的城市规模。
两端的情况(人口20万以下,或者400万以上)的城市占比最小。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4