【WRF理论第十五期】WPS中输入geogrid二进制格式
本博客主要根据WRF官网教程中,有关写入二进制数据的描述-Writing Static Data to the Geogrid Binary Format,详细描述输入WPS的静态地理数据二进制格式。https://i-blog.csdnimg.cn/direct/9d4c079336fa4f52b2d25d51d9929e49.png
基本概念:Geogrid二进制格式
WRF 的 geogrid 步调使用一种简单的二进制栅格格式来存储地理静态数据集(如地形、高度、土地利用等)。这些数据是规则的二维或三维数组(2D/3D array)。
注意,Geogrid 的二进制格式 只能存储:
[*]正整数
[*]固定字节大小(1, 2, 3, 或 4 字节)
[*]不能直接存储负数
这三条数据约束我们应该牢记于心!!!
支持的数据类型
Geogrid 支持的四类数据类型如下:
[*]单层连续字段(Continuous field)
[*]多层连续字段(比方:土壤层)
[*]主导类别的分类字段(Dominant category for each grid point)
[*]每类的分数字段(Fractional coverage for each category)
此中,主导类别的分类字段是最简单的,因为它只需要按区域写入整数分类值。
1、单层连续字段(Single-Level Continuous Field)
✅ 特点:
[*]每个格点包罗一个连续的实数值。
[*]常用于描述地形、高度、温度等连续分布的物理量。
[*]数据通常需缩放、转为整数,并进行正值偏移处理(如果有负数)。
✅ 存储方式:2D float → scaled int 数组,按行写入。
✅ 示例数据:
数据集描述示例类别值DEM(Digital Elevation Model)数字高程模型0 - 8000 米Green Fraction植被覆盖度0.0 - 1.0LAI(Leaf Area Index)叶面积指数0.0 - 10.0 2、多层连续字段(Multi-Level Continuous Field)
✅ 特点:
[*]每个格点包罗多个连续数值,表示该位置在差别层级的物理量。
[*]多用于土壤水分、温度、LAI 等具有垂直条理结构的数据。
✅ 存储方式:3D float → scaled int 数组(n × m × z)。
✅ 示例数据:
数据集描述示例类别值LAI(Leaf Area Index, 多时段)差别月份的叶面积指数12 层(月平均)Soil Moisture多层土壤湿度4 层土壤深度Soil Temperature多层土壤温度4 层 3、主导类别的分类字段(Dominant Category Field)
✅ 特点:
[*]每个格点存储一个整数值,表示该位置的主导类别。
[*]最简单的数据类型,直接存储整数分类编号。
[*]通常用于土地利用、土壤类型等具有离散分类的数据。
✅ 存储方式:2D 整数数组,按行(从南向北)写入二进制文件。
✅ 示例数据:
数据集描述示例类别值LUCC(Land Use Cover Classification)土地利用/覆盖类型1: 城市,2: 农田,3: 林地,…Soil Category土壤类型1: 壤土,2: 粘土,3: 砂土,… 4、每类的分数字段(Fractional Coverage per Category)
✅ 特点:
[*]每个格点存储多个连续值,表示每个分类的占比(0~1)。
[*]是一种多层连续字段,每层对应一个类别。
[*]可以更精细地描述一个格点上多个类型的混合情况。
✅ 存储方式:3D 浮点数组(n × m × r),r为类别数。
✅ 示例数据:
数据集描述示例类别值Fractional Land Use每类土地利用的面积比例第1层:农田占比,第2层:丛林占比,…MODIS Land Cover FractionMODIS 的土地覆盖比例数据每类一个层级,值为 0.0~1.0 geotiff→tiff的规则阐明
类型1:主导类别字段(Dominant Category Field)
✅ 数据结构:一个规则二维数组,每个元素是一个整数,代表该格点的主导类别(如土地利用类型编号)。
比方:30秒分辨率的 USGS 土地利用数据。
✅ 写入顺序(二维数组写入方式):
[*]按行写入(从南向北),即从底部行开始写入,依次向上。
[*]每一行按从左到右顺序写入。
写入顺序示例(n 行 × m 列):
x11, x12, ..., x1m, x21, ..., x2m, ..., xn1, ..., xnm
https://i-blog.csdnimg.cn/direct/630a166b8ec54651983e21bba0bb623b.png#pic_center
✅ 存储格式:
[*]每个元素以1、2、3 或 4 字节的整数存储。
[*]使用大端字节序(big-endian):高字节在前(A-B-C-D),可通过 index 文件设置为 little-endian。(有关字节序的阐明可参见本博客后续内容,详细表明为何需要设置inde为 little-endian)
[*]文件必须是:无头文件(No header)、无记载标记(No record marker)
[*]定长:每元素固定字节数
注意❗ Fortran写文件会自动添加记载标记,因此不能直接用 Fortran 写该文件。应使用 geogrid/src 目录中的 write_geogrid.c 或 read_geogrid.c 来处理。
类型2:连续字段(Continuous Field)
✅ 数据结构:连续字段(如地形高程、温度等)也按规则二维数组构造。
✅ 转换步调:
1、缩放(Scaling):将小数放大为整数(如保留3位小数就除以 0.001)。
2、四舍五入(Rounding):去掉小数部分,转为整数。
3、负值处理(转正):
[*]1字节:加上 2⁸(=255)
[*]2字节:加上 2¹⁶(=65536)
[*]3字节:加上 2²⁴
[*]4字节:加上 2³²
例:-2.71828 → -2718 → 若用2字节存储:-2718 + 65536 = 62818
4、写入文件方式与主导类别完全类似。
注意:只有负数要加偏移量,正数保持不变
字节数偏移值有符号整数(signed integer)的取值范围(加偏移前)无符号数(unsigned)的取值范围(加偏移后)1 字节2⁸ = 256-128 ~ 1270 ~ 2552 字节2¹⁶ = 65536-32768 ~ 327670 ~ 655353 字节2²⁴ = 16777216-8388608 ~ 83886070 ~ 167772154 字节2³² = 4294967296-2147483648 ~ 21474836470 ~ 4294967295 类型3:多层字段(Multi-Level Field)
类似于多个连续字段层堆叠成三维数组。
写入顺序:每个 n×m 切片(即每一层)连续写入,按层序(r-index 递增)排列。
每层数据写入顺序依然是从南到北、从西到东。
类型4:每类分数字段(Fractional Field per Category)
相当于每个类别占比是一个连续字段,多个类别 → 多层数据。
数据结构与多层连续字段类似。
文件定名规范
为使 geogrid 能正确辨认数据,二进制文件定名必须如下:
xstart-xend.ystart-yend
每个数字(起始或结束坐标)是一个固定宽度的字符串,宽度由 filename_digits 决定。每个索引值为 5位/6位 正整数,从1开始计数。
设置文件名(示例)坐标范围filename_digits = 500001-01200.00001-0120000001 ~ 99999(最大 tile 尺寸为 99999 个格点)filename_digits = 6000001-012000.000001-012000支持更大区域:000001 ~ 999999 注意:文件定名必须左侧补零,确保每个数字占满 5 或 6 位,否则文件名不符合约定,geogrid 会报错。
比方:一个 800行 × 1200列 的数据文件定名为:
00001-01200.00001-00800
生成的某二进制数据定名为:
https://i-blog.csdnimg.cn/direct/ef0c7be251344f308db645bb28901498.png#pic_center
✅ 多文件拼接阐明:可以将一个大数据集拆分为多个 tile(瓦片文件),每块是规则矩形。所有 tile 必须:
[*]维度类似
[*]不重叠
[*]索引连续,无空缺
[*]若维度不能整除 → 用添补值添补(由 missing_value 指定)
索引文件(index 文件)
每个数据集必须有一个名为 index 的元数据文件,提供地理信息和数据结构阐明。
✅ 示例内容表明:
type = continuous # 字段类型(continuous / categorical)
signed = yes # 是否包含负值
projection = regular_ll # 投影类型(经纬度)
dx = 0.00833333 # 经度间距(单位:度)
dy = 0.00833333 # 纬度间距
known_x = 1.0 # 数组中第一个点的 x 索引
known_y = 1.0 # 数组中第一个点的 y 索引
known_lat = -89.99583 # 第一个点的纬度
known_lon = -179.99583 # 第一个点的经度
wordsize = 2 # 每个数据点的字节数(1/2/3/4)
tile_x = 1200 # 每个 tile 的 x 方向大小
tile_y = 1200 # 每个 tile 的 y 方向大小
tile_z = 1 # 层数(单层为1)
tile_bdr = 3 # 缓冲区大小
units = "meters MSL" # 单位说明
description = "Topography height" # 数据集描述
页:
[1]