【WRF理论第十五期】WPS中输入geogrid二进制格式

打印 上一主题 下一主题

主题 1958|帖子 1958|积分 5874

本博客主要根据WRF官网教程中,有关写入二进制数据的描述-Writing Static Data to the Geogrid Binary Format,详细描述输入WPS的静态地理数据二进制格式。

基本概念:Geogrid二进制格式

WRF 的 geogrid 步调使用一种简单的二进制栅格格式来存储地理静态数据集(如地形、高度、土地利用等)。这些数据是规则的二维或三维数组(2D/3D array)。
注意,Geogrid 的二进制格式 只能存储:


  • 正整数
  • 固定字节大小(1, 2, 3, 或 4 字节)
  • 不能直接存储负数
这三条数据约束我们应该牢记于心!!!
支持的数据类型

Geogrid 支持的四类数据类型如下:


  • 单层连续字段(Continuous field)
  • 多层连续字段(比方:土壤层)
  • 主导类别的分类字段(Dominant category for each grid point)
  • 每类的分数字段(Fractional coverage for each category)
此中,主导类别的分类字段是最简单的,因为它只需要按区域写入整数分类值。
1、单层连续字段(Single-Level Continuous Field)
✅ 特点:


  • 每个格点包罗一个连续的实数值。
  • 常用于描述地形、高度、温度等连续分布的物理量。
  • 数据通常需缩放、转为整数,并进行正值偏移处理(如果有负数)。
✅ 存储方式:2D float → scaled int 数组,按行写入。
✅ 示例数据:
数据集描述示例类别值DEM(Digital Elevation Model)数字高程模型0 - 8000 米Green Fraction植被覆盖度0.0 - 1.0LAI(Leaf Area Index)叶面积指数0.0 - 10.0
2、多层连续字段(Multi-Level Continuous Field)
✅ 特点:


  • 每个格点包罗多个连续数值,表示该位置在差别层级的物理量。
  • 多用于土壤水分、温度、LAI 等具有垂直条理结构的数据。
✅ 存储方式:3D float → scaled int 数组(n × m × z)。
✅ 示例数据:
数据集描述示例类别值LAI(Leaf Area Index, 多时段)差别月份的叶面积指数12 层(月平均)Soil Moisture多层土壤湿度4 层土壤深度Soil Temperature多层土壤温度4 层
3、主导类别的分类字段(Dominant Category Field)
✅ 特点:


  • 每个格点存储一个整数值,表示该位置的主导类别。
  • 最简单的数据类型,直接存储整数分类编号。
  • 通常用于土地利用、土壤类型等具有离散分类的数据。
✅ 存储方式:2D 整数数组,按行(从南向北)写入二进制文件。
✅ 示例数据:
数据集描述示例类别值LUCC(Land Use Cover Classification)土地利用/覆盖类型1: 城市,2: 农田,3: 林地,…Soil Category土壤类型1: 壤土,2: 粘土,3: 砂土,…
4、每类的分数字段(Fractional Coverage per Category)
✅ 特点:


  • 每个格点存储多个连续值,表示每个分类的占比(0~1)。
  • 是一种多层连续字段,每层对应一个类别。
  • 可以更精细地描述一个格点上多个类型的混合情况。
✅ 存储方式:3D 浮点数组(n × m × r),r为类别数。
✅ 示例数据:
数据集描述示例类别值Fractional Land Use每类土地利用的面积比例第1层:农田占比,第2层:丛林占比,…MODIS Land Cover FractionMODIS 的土地覆盖比例数据每类一个层级,值为 0.0~1.0 geotiff→tiff的规则阐明

类型1:主导类别字段(Dominant Category Field)

✅ 数据结构:一个规则二维数组,每个元素是一个整数,代表该格点的主导类别(如土地利用类型编号)。
比方:30秒分辨率的 USGS 土地利用数据。
✅ 写入顺序(二维数组写入方式):


  • 按行写入(从南向北),即从底部行开始写入,依次向上。
  • 每一行按从左到右顺序写入。
  1. 写入顺序示例(n 行 × m 列):
  2. x11, x12, ..., x1m, x21, ..., x2m, ..., xn1, ..., xnm
复制代码

✅ 存储格式:


  • 每个元素以1、2、3 或 4 字节的整数存储。
  • 使用大端字节序(big-endian):高字节在前(A-B-C-D),可通过 index 文件设置为 little-endian。(有关字节序的阐明可参见本博客后续内容,详细表明为何需要设置inde为 little-endian)
  • 文件必须是:无头文件(No header)、无记载标记(No record marker)
  • 定长:每元素固定字节数
注意❗ Fortran写文件会自动添加记载标记,因此不能直接用 Fortran 写该文件。应使用 geogrid/src 目录中的 write_geogrid.c 或 read_geogrid.c 来处理。
类型2:连续字段(Continuous Field)

✅ 数据结构:连续字段(如地形高程、温度等)也按规则二维数组构造。
✅ 转换步调:
1、缩放(Scaling):将小数放大为整数(如保留3位小数就除以 0.001)。
2、四舍五入(Rounding):去掉小数部分,转为整数。
3、负值处理(转正):


  • 1字节:加上 2⁸(=255)
  • 2字节:加上 2¹⁶(=65536)
  • 3字节:加上 2²⁴
  • 4字节:加上 2³²
  1. 例:-2.71828 → -2718 → 若用2字节存储:-2718 + 65536 = 62818
复制代码
4、写入文件方式与主导类别完全类似。
注意:只有负数要加偏移量,正数保持不变
字节数偏移值有符号整数(signed integer)的取值范围(加偏移前)无符号数(unsigned)的取值范围(加偏移后)1 字节2⁸ = 256-128 ~ 1270 ~ 2552 字节2¹⁶ = 65536-32768 ~ 327670 ~ 655353 字节2²⁴ = 16777216-8388608 ~ 83886070 ~ 167772154 字节2³² = 4294967296-2147483648 ~ 21474836470 ~ 4294967295 类型3:多层字段(Multi-Level Field)

类似于多个连续字段层堆叠成三维数组。
写入顺序:每个 n×m 切片(即每一层)连续写入,按层序(r-index 递增)排列。
每层数据写入顺序依然是从南到北、从西到东。
类型4:每类分数字段(Fractional Field per Category)

相当于每个类别占比是一个连续字段,多个类别 → 多层数据。
数据结构与多层连续字段类似。
文件定名规范

为使 geogrid 能正确辨认数据,二进制文件定名必须如下:
  1. xstart-xend.ystart-yend
复制代码
每个数字(起始或结束坐标)是一个固定宽度的字符串,宽度由 filename_digits 决定。每个索引值为 5位/6位 正整数,从1开始计数。
设置文件名(示例)坐标范围filename_digits = 500001-01200.00001-0120000001 ~ 99999(最大 tile 尺寸为 99999 个格点)filename_digits = 6000001-012000.000001-012000支持更大区域:000001 ~ 999999 注意:文件定名必须左侧补零,确保每个数字占满 5 或 6 位,否则文件名不符合约定,geogrid 会报错。
比方:一个 800行 × 1200列 的数据文件定名为:
  1. 00001-01200.00001-00800
复制代码
生成的某二进制数据定名为:

✅ 多文件拼接阐明:可以将一个大数据集拆分为多个 tile(瓦片文件),每块是规则矩形。所有 tile 必须:


  • 维度类似
  • 不重叠
  • 索引连续,无空缺
  • 若维度不能整除 → 用添补值添补(由 missing_value 指定)
索引文件(index 文件)

每个数据集必须有一个名为 index 的元数据文件,提供地理信息和数据结构阐明。
✅ 示例内容表明:
  1. type = continuous           # 字段类型(continuous / categorical)
  2. signed = yes                # 是否包含负值
  3. projection = regular_ll     # 投影类型(经纬度)
  4. dx = 0.00833333             # 经度间距(单位:度)
  5. dy = 0.00833333             # 纬度间距
  6. known_x = 1.0               # 数组中第一个点的 x 索引
  7. known_y = 1.0               # 数组中第一个点的 y 索引
  8. known_lat = -89.99583       # 第一个点的纬度
  9. known_lon = -179.99583      # 第一个点的经度
  10. wordsize = 2                # 每个数据点的字节数(1/2/3/4)
  11. tile_x = 1200               # 每个 tile 的 x 方向大小
  12. tile_y = 1200               # 每个 tile 的 y 方向大小
  13. tile_z = 1                  # 层数(单层为1)
  14. tile_bdr = 3                # 缓冲区大小
  15. units = "meters MSL"        # 单位说明
  16. description = "Topography height" # 数据集描述
复制代码

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

科技颠覆者

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表