系统存储架构升级分享

耶耶耶耶耶 · 2024-6-15 00:25:30

一、业务背景

系统业务功能：系统内部举行数据处理及整合, 对外部系统提供效果数据的初始化(写)及查询数据效果服务。
系统网络架构:

•
摆设架构对切量上线的影响 - 内部管理系统上线对其他系统的读业务无影响
•分布式缓存可举行单独扩容, 与存储及查询功能升级无关
•通过缓存层的隔离, 系统扩展期间外部系统可保持不变, 只对内部管理系统升级
•内部系统上线/验证时, 除了业务场景1相干的初始化操作, 仍可提供读服务，降低上线影响
二、本次升级团体实施方案:

团体实施方案图例:

（一）、设立目标

商品全量渠道化-切量筹划: (总量为当前10倍):

现在：
当前数据库常用表均已凌驾5000W, 此中部分效果表达6000W, 已达到MYSQL数据库表容量峰值, 对于全切量无法支持;
目标:
最高支持9亿: 根据切量筹划, 全切量后系统约为6.7亿, 保存1/4的冗余, 取8.375亿; 向上取整9亿, 此值冗余量较大, 可满足未来5年数据支持
时间目标: 8月初方案设定, 8月17~8.22上线及验证, 8.24切量筹划开始
（二）、当前系统现状

1、资源利用

•当前摆设结构
——机房分布，Mysql: 1主4从(机房A 1主, 3从; 机房B只读从)
——机房分布，Doris: 32C, 63个节点, 3副本
•当前应用容器（docker）数量，db最大连接数
——应用容器数量: 62 (Web分组: 25, Worker分组: 31, MQ分组: 6)
——db最大连接数100 (每个容器配置)
•当前业务是否读写分离，读写比例环境
——无读写分离
•各业务场景下，是否可容忍主从延迟？可容忍的延迟时长是多少
——现在业务人员修改操作多数为同步操作, 修改完成后返回操作效果到前端, 从业务方操作+查询效果来说, 无法空忍延迟
——后台任务场景, 对于中间数据处理, 可以容忍主从延迟
•产物层面，系统出现瓶颈压力时，是否担当限流？是否担当数据延迟展示？
——对外服务接口本次不涉及开发，服务接口不受影响；业务页面访问量少，可担当短时间内的延迟
•团队是否有ES利用经验
——部分了解, 未在项目中利用
2、数据库内部利用环境

利用通用性的盘货框架对系统举行全面性现状梳理
表内空间, 业务场景等信息（部分）
| 表名 | 当前表记录数（单位：万） | 最大支持条数（单位：万） | 表字段数 | 是否可拆分出分片键 | 分片键字段 | 是否存在不带分片字段的SQL | 是否有跨表查询场景 | 数据记录读写比 | 是否存在写后立刻查询 | 利用场景 | 数据是否可截转 | 可担当的截转时长 | 切量后预估量 | 分布式DB | ES 判断条件：是否有复杂查询 | ES直接双写判断条件：写后立刻查询 |
| 审批流表 | 3.5KW | 4KW | 43 | 有 | sku | 存在 | 存在 | 1000/1 | 存在写后用户手动再查询操作 | 1、页面创建审批流 2、页面查询审批流 3、页面数据置失效 4、审批平台回调修改 | 否 | | +3亿 | ✅ | ✅ | UI修改后需重新点击"查询"按钮; |
| 审批流细目表 (汗青数据已清算) | 800W | 4KW | 20 | 有 | 增长sku | 无 | 存在 | 1000/1 | 存在写后用户手动再查询操作 | 1、刷新审批流(删除+增长) 2、查询稽核中流程(任务) | 审批通过可转冷备 | | 转冷备 | ✅ | ✅ | |
| 业务数据表1 | 3.3KW | 4KW | 15 | 有 | sku | 无 | 无 | 100/1 | | 1、审批流通过后, 创建 2、数据失效, 删除操作 3、后台工具: 同步缓存(存在复杂+分页查询) | 否 | | +3亿 | ✅ | ❌ | ❌ |
| 业务数据表2 | 5.9KW | 4KW | 16 | 有 | sku | 存在 (新增后非常按id删除) | 无 | 1000/1 | | 1、业务查询/导出维度1数据 2、业务查询维度2数据2 3、后台工具: 同步缓存 | 否 | | +5亿 | ✅ | 同步大数据推送数据到缓存, 利用creator字段查询; 多个SKU分页查询 | ❌ |
| 支持数据表(大数据平台盘算后推送) | 1.2KW | 4KW | 12 | 有 | item_sku_id | 无 | 无 | 5/1 | | 1、运维工具: 增长/删除记录 2、清算汗青数据(任务) 3、数据查询(表现利用) 4、盘算 5、大数据推送数据 | 按日期推送, 现在保存3天 | 汗青数据无用 doris? | 一天3~4KW | ✅ | 删除数据dt | ❌ |
| … | | | | | | | | | | | | | | | | |
（三）、技能方案选型

系统特点：单表高并发写、复杂读
1、存储选型:

结论:
内部分布式DB: 由单分片拓展到多分片, 解决海量数据存储及简单查询
ES: 新引入, 实现复杂查询（分词查询）及全局排序
redis: 保存, 需扩容
Doris: 保存, 容量增大
复杂查询(原因: 前端业务访问存在多表关联场景（2张千万级别表关联查询）, 随着表容量变大, 关联查询性能下降, 已无法满足业务高效需求)
复杂查询决策因素:
| | | 分布式DB（mysql） | es | doris | TiDB |
| 决策指标 | 产物定位 | 数据库（OLTP） | 搜刮引擎 | 数据库（OLAP） | 数据库（OLTP+80%OLAP） |
| 上风 | 1、高并发、高吞吐量事件处理 2、稳定性 3、数据实时（写后即读） | 1、全文索引 2、复杂结构化查询 | 高并发查询分析 | 1、兼具事件处理+数据分析 2、自动拓展 3、数据实时（写后即读） |
| 劣势 | 1、大量数据分析 2、手动拓展 | 1、事件处理 2、实时（写后即读） | 1、事件处理 2、实时（写后即读） | 高并发、高吞吐量事件处理 |
| 可靠性 | 高（多机房） | 高（多机房） | 低（共享集群） | 低（单机房） |
| 拓展性 | 库维度：平台管理表维度：应用控制 | 平台管理 | | 库维度：平台管理表维度：应用控制 |
| 数据一致性 | 最终一致性 | 最终一致性 | | 强一致性 |
| 运维支持 | DBA | 分公司运维 | 无专业运维团队 | 分公司DBA |
| 总结 | 复杂业务查询慢无法支持大数据量跨表查询、多维度复杂查询及全局排序单表利用分片字段查询性能快 | 复杂业务查询性能高 | 摆设结构为共享集群，（特别是）写性能受外部影响大 | 摆设架构为单机房，无法满足0级系统可靠性要求 |
| | 架构目标 | | | | |
| 结论 | 海量存储及高并发写 | ✅ 大数据量存储，基于分库字段单表查询性能高, 单库事件处理 | ✖️ 高并发下的事件处理 | ✖️ 查询受写入/更新操作影响大 | ✖️ 高并发下的事件处理可靠性 |
| 复杂度查询 | ✖️ 性能差, 可能会存在跨库查询 | ✅ 可靠性高大数据量下的复杂业务查询 | ✖️ 查询受写入/更新操作影响大 | ✖️ 可靠性 |
2、数据同步方案

A-准实时同步方案：

方案描述：利用DRC平台配置化完成分布式DB到ES的准实时数据同步 (注: DRC为公司内部通用数据同步平台, 可在多个数据源之间举行数据同步)
上风：简单无序代码开发劣势：可能存在业务写后即查场景，数据不一致风险

B-双写强一致方案：

方案描述：双写分布式DB与ES, 包管数据一致性
上风：保障数据写即读场景一致性劣势：代码开发本钱高

数据同步方案选择发起：

先选择A-准实时同步方案 -> 线上验证是否满足业务操作体验-> 再选择是否实施B-双写强一致方案
数据同步难点及解决方案：

题目:
•双表联合查询场景无法直接利用DRC平台同步, 需另开发相应的同步模块jar包, 嵌入DRC任务, 或放弃利用DRC，直接利用代码同步, 都存在开发时间长题目
•ES索引空间占用多, 冗余记录条数多, , 查询效果需排重, 查询复杂
难点：流程表与流程细目节点表涉及联合查询, 两表都存在单表增编削的操作; 导致同步到ES的数据模子复杂、同步困难

解决方案：（数据库表增长冗余字段, 冗余字段专用于ES查询）
在DB的流程表增长待审人员, 已审人员字段, 字段的值利用空格分隔, 利用ES的分词功能, 同时ES可直接利用DRC工具直接同步此表数据, 减少同步的开发时间
方案本钱: 增长/修改流程细目时同步修改流程表新增字段; 开发刷新汗青数据工具

（四）、分阶段开发及上线实施步骤

1、系统业务改造-表字段增长(8月10日)

1）业务表新增分库字段
部分业务表缺少分库字段，无法直接分片。针对业务表新增sku分片字段，同时对现有逻辑改造增长SKU条件,以提升查询效率;
2） ES相干查询冗余字段的增长（刷数据）
2、分布式DB分库数据同步+验证(8月11日)

1）完成分布式DB分片库+ ES初始化;
2）配置DRC完成原单库到分布式DB分片库的全量+增量数据同步；
3）配置DRC完成分布式DB分片库到ES的全量+增量数据同步；
4）通过查验工具，定期比对分布式DB单片、分布式DB分片及ES间的数据一致性。

3、读流量切换+验证 (8月17日)

1）新增AOP切面, 通过DUCC配置(erp白名单, 全量读, 效果对比等维度配置)，将读请求渐渐切量到新应用集群
2）待产物、业务侧完成验证后，切换全部读流量至新应用集群（注: 新应用集群利用数据库只读帐号）

4、写流量切换(8.21)

上线前周知业务方及上下游系统，告知上线时间段及预估时长，减少业务影响
新增一个静态页面提示用户系统升级中不可用，切换前端域名至静态页面, 避免用户操作
克制原系统分组，确保原单库不再存有写流量，同时协调DBA对原库执行禁写(关闭worker, 暂停MQ消费)
等候并确保原库数据均同步至目标库后，再次通过手动+自动方式校验新老两个数据库的数据一致性
新系统分组切换为读写帐号, 举行摆设
研发及测试人员对新系统分组功能利用测试商品举行功能验证, 无题目后交由业务人员验证(切换静态运维页面)
启动worker及接入MQ

5、上线后效果

上线后系统运行正常, 8.23至今已结转商品 2.6亿; 现在系统支持商品场维度数据3.16亿; 最大DB表数据已有2.84亿; ES数据4356W;
前后对比: erp：xxx; 此erp帐号数据29w 原查询9s，新查询1s;
四、总结

好的发起：

•全面、清楚的系统现状盘货：可以降低复杂度、进步质量
•清楚的上线筹划：指导人员合理分工、缩短上线时间、降低上线难度

未解决题目：

现在分布式DB分布式事件支持比较弱, 无法包管跨分库时多条记录在一个事件中修改的正确性, 须要提交后举行读取后再验证确保数据正确生存
业务人员名下商品数据百万时, 查询时间仍然效长, 查询性能将持续优化
作者：京东零售王凯
来源：京东云开发者社区转载请注明来源

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

系统存储架构升级分享

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块