想象一下面积图就像一层层叠起来的彩色玻璃片,每一层代表一个种别,从下往上堆叠,形成团体的视觉打击。
但偶尔我们须要更特殊的方式来展示数据的厘革:是像河道一样蜿蜒流淌,照旧像地平线上的群山绵延升沉?
本日,本文将先容两种创意面积图变体——流图和地平线图,它们能让你的时间序列数据陈诉更生动的故事。
1. 流图:数据的河道
假如把传统的堆叠面积图想象成一块块整齐堆叠的积木,那么流图就像一条蜿蜒流淌的河道,河道的宽窄厘革天然流通,波峰波谷过渡平滑。
它特殊得当展示多个种别数据随时间的厘革趋势,尤其是当你想夸大团体活动感和各部分的相对比例厘革时。
流图的核心头脑是将传统的堆叠面积图举行"平滑"处置惩罚。
在matplotlib中,我们可以使用fill_between函数联合样条插值来创建平滑的边沿。
关键在于将堆叠的数据举行累积,然后对累积界限举行平滑处置惩罚。- # 数据准备
- x = np.linspace(0, 10, 100)
- # 构造三组波浪数据
- y1 = 2 + np.sin(x) # 基础波动
- y2 = 2 + np.cos(x - 1.5) # 错位波动
- y3 = 2 + np.sin(x + 2) # 再次错位
- # 省略 ...
- # 绘图设置
- fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 6))
- # --- 左图:普通堆叠面积图 (baseline='zero') ---
- ax1.stackplot(x, y_data, labels=labels, colors=colors, baseline='zero', alpha=0.8)
- # 省略 ...
- # --- 右图:流图 (baseline='sym') ---
- # 'sym' 表示对称中心布局
- ax2.stackplot(x, y_data, labels=labels, colors=colors, baseline='sym', alpha=0.8)
- ax2.axhline(0, color='black', ls='--', alpha=0.1) # 画一条中心参考线
- # 省略 ...
- # 去除右图边框,增加流动感
- for spine in ax2.spines.values():
- spine.set_visible(False)
- plt.tight_layout()
- plt.show()
复制代码
流图办理了一个视觉错觉题目:在平凡堆叠面积图中,上面的数据层会由于下面数据层的升沉而被迫“扭曲”,很丢脸出它原来的形状。
流图通过中心结构,淘汰了这种扭曲,非常得当展示随时间厘革的趋势和差别种别权重的颠簸,这种有机的形态还能给读者带来极强的审美愉悦感。
2. 地平线图:数据的群山
想象一下远处的地平线上有一排绵延的山脉,每座山的高度代表一个数据值。
地平线图就是如许一种可视化技能,它将时间序列数据压缩在一个很小的垂直空间内,通过颜色和分层来展示数据的厘革。
特殊得当在有限空间内展示多个时间序列的对比。
地平线图的核心头脑是数据分层和颜色渐变。
它将数据值分成多少层(通常是2-3层),每层用一种颜色表现。当数据值高出一层时,就用更深的颜色或差别的颜色添补。如答应以在很小的垂直空间内展示很大的数据范围。- from datetime import timedelta
- # 生成模拟数据:过去10年五大科技公司的股价波动
- np.random.seed(42)
- # 生成日期范围:过去10年,每月一个数据点
- dates = pd.date_range("2013-01-01", "2023-01-01", freq="ME")
- companies = ["苹果", "谷歌", "微软", "亚马逊", "Meta"]
- # 生成各公司的股价模拟数据(标准化到相似范围)
- data = {}
- for company in companies:
- # 基础趋势:每家公司有不同的增长趋势,但最终都在70-90范围内
- # 省略 ...
- # 转换为DataFrame
- df = pd.DataFrame(data, index=dates)
- # 创建对比图表
- fig, axes = plt.subplots(2, 1, figsize=(14, 10))
- # ============ 传统堆叠面积图 ============
- colors = ["#FF6B6B", "#4ECDC4", "#45B7D1", "#FFD166", "#9B5DE5"]
- # 为堆叠面积图重新归一化数据
- df_normalized = df.div(df.sum(axis=1), axis=0) * 100
- y_cumulative = np.zeros(len(df))
- for i, company in enumerate(companies):
- axes[0].fill_between(
- df.index,
- y_cumulative,
- y_cumulative + df_normalized[company].values,
- color=colors[i],
- alpha=0.7,
- label=company,
- edgecolor="white",
- linewidth=0.5,
- )
- y_cumulative += df_normalized[company].values
- # 省略 ...
- # ============ 地平线图:股价波动对比 ============
- # 生成股价变化百分比数据(更能体现波动对比)
- np.random.seed(42)
- price_changes = {}
- for company in companies:
- # 生成均值附近波动的变化数据
- # 省略 ...
- # 关键参数:定义“波段”
- BAND_HEIGHT = 3.0 # 每个颜色波段代表的变化率幅度 (%)
- NUM_BANDS = 3 # 正负方向各使用的波段层数
- df = pd.DataFrame(price_changes, index=dates)
- # 为每家公司计算并绘制地平线
- for i, company in enumerate(companies):
- # 公司的基准Y轴位置(水平线)
- # 省略 ...
- # 分层与绘制:从第1层到第NUM_BANDS层
- for band in range(NUM_BANDS):
- # --- 处理正偏差(上涨)---
- # 计算当前层的数据:偏差值减去已绘制层的高度,并限制在本层高度内
- # 省略 ...
- # --- 处理负偏差(下跌)---
- # 对负值取绝对值,进行类似处理
- # 省略 ...
- # 美化图表
- # 省略 ...
- # 6. 添加图例
- import matplotlib.patches as mpatches
- legend_patches = []
- # 省略 ...
- plt.tight_layout(h_pad=5)
- plt.show()
复制代码
地平线图是空间使用大家。当你有 20 个股票大概 50 个都会的温度须要放在一张图里对比时,平凡的面积图会挤成一团乱麻。
地平线图可以将每个序列压缩成一个窄窄的横条,但在保持视觉分辨率的同时,还能让你看清极值(通过深颜色)。
3. 总结
数据可视化不光是科学,也是艺术。流图和地平线图这两种面积图变体,分别从"活动之美"和"空间服从"两个角度拓展了面积图的大概性。
它们证实白,通过对根本图表的创意改造,我们可以让数据陈诉更丰富、更生动的故事。
下次当你面临时间序列数据时,不妨问问本身:我的数据像一条蜿蜒的河道,照旧像地平线上的群山?选择得当的可视化方式,让你的数据真正"活动"起来或"层叠"起来。
记取,最好的可视化不是最复杂的,而是最能清楚转达信息、开导思索的那一个。
完备的代码共享在:面积图的2个变种.ipynb (访问暗码: 6872)
免责声明:如果侵犯了您的权益,请联系站长及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金. |