物联网【WRF理论第十五期】WPS中输入geogrid二进制格式

科技颠覆者 发表于 2025-4-11 21:54:49

【WRF理论第十五期】WPS中输入geogrid二进制格式

本博客主要根据WRF官网教程中，有关写入二进制数据的描述-Writing Static Data to the Geogrid Binary Format，详细描述输入WPS的静态地理数据二进制格式。
https://i-blog.csdnimg.cn/direct/9d4c079336fa4f52b2d25d51d9929e49.png
基本概念：Geogrid二进制格式

WRF 的 geogrid 步调使用一种简单的二进制栅格格式来存储地理静态数据集（如地形、高度、土地利用等）。这些数据是规则的二维或三维数组（2D/3D array）。
注意，Geogrid 的二进制格式只能存储：

[*]正整数
[*]固定字节大小（1, 2, 3, 或 4 字节）
[*]不能直接存储负数
这三条数据约束我们应该牢记于心！！！
支持的数据类型

Geogrid 支持的四类数据类型如下：

[*]单层连续字段（Continuous field）
[*]多层连续字段（比方：土壤层）
[*]主导类别的分类字段（Dominant category for each grid point）
[*]每类的分数字段（Fractional coverage for each category）
此中，主导类别的分类字段是最简单的，因为它只需要按区域写入整数分类值。
1、单层连续字段（Single-Level Continuous Field）
✅ 特点：

[*]每个格点包罗一个连续的实数值。
[*]常用于描述地形、高度、温度等连续分布的物理量。
[*]数据通常需缩放、转为整数，并进行正值偏移处理（如果有负数）。
✅ 存储方式：2D float → scaled int 数组，按行写入。
✅ 示例数据：
数据集描述示例类别值DEM（Digital Elevation Model）数字高程模型0 - 8000 米Green Fraction植被覆盖度0.0 - 1.0LAI（Leaf Area Index）叶面积指数0.0 - 10.0 2、多层连续字段（Multi-Level Continuous Field）
✅ 特点：

[*]每个格点包罗多个连续数值，表示该位置在差别层级的物理量。
[*]多用于土壤水分、温度、LAI 等具有垂直条理结构的数据。
✅ 存储方式：3D float → scaled int 数组（n × m × z）。
✅ 示例数据：
数据集描述示例类别值LAI（Leaf Area Index, 多时段）差别月份的叶面积指数12 层（月平均）Soil Moisture多层土壤湿度4 层土壤深度Soil Temperature多层土壤温度4 层 3、主导类别的分类字段（Dominant Category Field）
✅ 特点：

[*]每个格点存储一个整数值，表示该位置的主导类别。
[*]最简单的数据类型，直接存储整数分类编号。
[*]通常用于土地利用、土壤类型等具有离散分类的数据。
✅ 存储方式：2D 整数数组，按行（从南向北）写入二进制文件。
✅ 示例数据：
数据集描述示例类别值LUCC（Land Use Cover Classification）土地利用/覆盖类型1: 城市，2: 农田，3: 林地，…Soil Category土壤类型1: 壤土，2: 粘土，3: 砂土，… 4、每类的分数字段（Fractional Coverage per Category）
✅ 特点：

[*]每个格点存储多个连续值，表示每个分类的占比（0~1）。
[*]是一种多层连续字段，每层对应一个类别。
[*]可以更精细地描述一个格点上多个类型的混合情况。
✅ 存储方式：3D 浮点数组（n × m × r），r为类别数。
✅ 示例数据：
数据集描述示例类别值Fractional Land Use每类土地利用的面积比例第1层：农田占比，第2层：丛林占比，…MODIS Land Cover FractionMODIS 的土地覆盖比例数据每类一个层级，值为 0.0~1.0 geotiff→tiff的规则阐明

类型1：主导类别字段（Dominant Category Field）

✅ 数据结构：一个规则二维数组，每个元素是一个整数，代表该格点的主导类别（如土地利用类型编号）。
比方：30秒分辨率的 USGS 土地利用数据。
✅ 写入顺序（二维数组写入方式）：

[*]按行写入（从南向北），即从底部行开始写入，依次向上。
[*]每一行按从左到右顺序写入。
写入顺序示例（n 行 × m 列）：
x11, x12, ..., x1m, x21, ..., x2m, ..., xn1, ..., xnm
https://i-blog.csdnimg.cn/direct/630a166b8ec54651983e21bba0bb623b.png#pic_center
✅ 存储格式：

[*]每个元素以1、2、3 或 4 字节的整数存储。
[*]使用大端字节序（big-endian）：高字节在前（A-B-C-D），可通过 index 文件设置为 little-endian。（有关字节序的阐明可参见本博客后续内容，详细表明为何需要设置inde为 little-endian）
[*]文件必须是：无头文件（No header）、无记载标记（No record marker）
[*]定长：每元素固定字节数
注意❗ Fortran写文件会自动添加记载标记，因此不能直接用 Fortran 写该文件。应使用 geogrid/src 目录中的 write_geogrid.c 或 read_geogrid.c 来处理。
类型2：连续字段（Continuous Field）

✅ 数据结构：连续字段（如地形高程、温度等）也按规则二维数组构造。
✅ 转换步调：
1、缩放（Scaling）：将小数放大为整数（如保留3位小数就除以 0.001）。
2、四舍五入（Rounding）：去掉小数部分，转为整数。
3、负值处理（转正）：

[*]1字节：加上 2⁸（=255）
[*]2字节：加上 2¹⁶（=65536）
[*]3字节：加上 2²⁴
[*]4字节：加上 2³²
例：-2.71828 → -2718 → 若用2字节存储：-2718 + 65536 = 62818
4、写入文件方式与主导类别完全类似。
注意：只有负数要加偏移量，正数保持不变
字节数偏移值有符号整数（signed integer）的取值范围（加偏移前）无符号数（unsigned）的取值范围（加偏移后）1 字节2⁸ = 256-128 ~ 1270 ~ 2552 字节2¹⁶ = 65536-32768 ~ 327670 ~ 655353 字节2²⁴ = 16777216-8388608 ~ 83886070 ~ 167772154 字节2³² = 4294967296-2147483648 ~ 21474836470 ~ 4294967295 类型3：多层字段（Multi-Level Field）

类似于多个连续字段层堆叠成三维数组。
写入顺序：每个 n×m 切片（即每一层）连续写入，按层序（r-index 递增）排列。
每层数据写入顺序依然是从南到北、从西到东。
类型4：每类分数字段（Fractional Field per Category）

相当于每个类别占比是一个连续字段，多个类别 → 多层数据。
数据结构与多层连续字段类似。
文件定名规范

为使 geogrid 能正确辨认数据，二进制文件定名必须如下：
xstart-xend.ystart-yend
每个数字（起始或结束坐标）是一个固定宽度的字符串，宽度由 filename_digits 决定。每个索引值为 5位/6位正整数，从1开始计数。
设置文件名（示例）坐标范围filename_digits = 500001-01200.00001-0120000001 ~ 99999（最大 tile 尺寸为 99999 个格点）filename_digits = 6000001-012000.000001-012000支持更大区域：000001 ~ 999999 注意：文件定名必须左侧补零，确保每个数字占满 5 或 6 位，否则文件名不符合约定，geogrid 会报错。
比方：一个 800行 × 1200列的数据文件定名为：
00001-01200.00001-00800
生成的某二进制数据定名为：
https://i-blog.csdnimg.cn/direct/ef0c7be251344f308db645bb28901498.png#pic_center
✅ 多文件拼接阐明：可以将一个大数据集拆分为多个 tile（瓦片文件），每块是规则矩形。所有 tile 必须：

[*]维度类似
[*]不重叠
[*]索引连续，无空缺
[*]若维度不能整除 → 用添补值添补（由 missing_value 指定）
索引文件（index 文件）

每个数据集必须有一个名为 index 的元数据文件，提供地理信息和数据结构阐明。
✅ 示例内容表明：
type = continuous       # 字段类型（continuous / categorical）
signed = yes             # 是否包含负值
projection = regular_ll # 投影类型（经纬度）
dx = 0.00833333          # 经度间距（单位：度）
dy = 0.00833333          # 纬度间距
known_x = 1.0             # 数组中第一个点的 x 索引
known_y = 1.0             # 数组中第一个点的 y 索引
known_lat = -89.99583    # 第一个点的纬度
known_lon = -179.99583    # 第一个点的经度
wordsize = 2             # 每个数据点的字节数（1/2/3/4）
tile_x = 1200             # 每个 tile 的 x 方向大小
tile_y = 1200             # 每个 tile 的 y 方向大小
tile_z = 1                # 层数（单层为1）
tile_bdr = 3             # 缓冲区大小
units = "meters MSL"    # 单位说明
description = "Topography height" # 数据集描述

页: [1]

IT评测·应用市场-qidao123.com技术社区's Archiver

【WRF理论第十五期】WPS中输入geogrid二进制格式