千万级生意业务体系资金安全怎样治理?

打印 上一主题 下一主题

主题 881|帖子 881|积分 2643


  

  前言

  
近两年随着生意业务体系承载的订单量从开始的万单/日快速膨胀到百万单/日,生意业务GMV也快速膨胀到千万级,体系一旦发生故障,每分钟的峰值资损将达到几十万,这是一个完全无法蒙受的损失。

  
在此背景下,博主近来两年也一直致力提拔生意业务体系稳定性的水位线,借此机会在这里和广大朋侪一起探讨,有好的想法欢迎文末留言一起交流共同进步。

  建立思绪

  业界参考

  
从参与建立生意业务体系1.0版本迭代到3.0的过程中,中心做过一些局部稳定性架构升级(比如存储架构升级),雷同于哪里着火就去哪里救火,不断的对体系进行缝缝补补,但没有通盘做过稳定架构升级治理,更没有做过生意业务类体系的稳定性架构升级。

  
在如许一个背景下,只能从公司内&外部头部厂商进行调研,这里重要参考了公司内部生意业务团队以及美团、蚂蚁金服等外部团队的名贵履历,得出一个通用的治理思绪。

  

  
按照事前、事中&事后三阶段的思绪,梳理总结各阶段重点事项和具体实行方案,梳理如下图所示:

  

  
通过大图得出明确的治理目标,通过治理使得体系可以或许做到不重(不会重复计算)、不漏(不丢单)、不错(资金不算错)。

  
其次根据业界资金治理思绪,资金安全保障治理重心围绕自动防御手段、快速发现本事、快速止损本事的优先级依次展开对应的风险治理项,这其中尤其会将绝大部分精神致力于在事前阶段通过各种自动防御手段将题目扼杀在摇篮里。

  
明确了针对资金类体系的治理目标,接下来需要确定具体实行路径:

  

  “面”、“线”、”点“链路梳理

  
链路梳理思绪围绕“面”、“线”、“点”依次展开,

  
i). 以资金流向图为“面”作为切入点,看清晰生意业务体系团体运转情况,

  
ii). 然后基于资金流向图,深入到每一条资金流向链路,梳理出这条链路的业务流程图,以业务流程图作为“线”,分析出业务流程中的上下游,以及业务自身的流程;

  
iii). 明确“线”之后,进一步深入到每个关节环节“点”上,以“漏”、“重”、“错”三个维度去分析大概产生的资损情况,然后针对性的进行对应的资金安全加固。

  
一个简化版的梳理和治理case

  

  • 梳理资金流向图

  • 梳理业务流程&治理&验证
  

  
i). 基于第一步梳理的资金流向图,按照业务重要程度的优先级,深入到代码实现层面,绘制出整条业务线的实现业务流程图;

  
ii). 分析业务流程图中各环节大概出现的题目;

  
iii). 针对题目制定相应的治理手段,明确后续落实的责任人&加固节奏;

  
iv). 对于各项风险项完成治理后,接着开始进行有效性验证,有效性具体验证手段一般有体系故障演练和业务故障演练(比如手动注入各种非常来模拟真真相况的发生、配置扰乱等手段),观察体系的真实体现是否符合预期;

  
v). 对于演练发现的非预期体现,进行二次加固后再次验证;

  
vi). 对于有效性加固后大概产生的一些“噪音”(比如监控报警、对账非常等)进行降噪处理;

  各阶段具体治理手段

  

  • 事前阶段
  
资金代码安全扫描,在开辟阶段,每次提交代码后,在ci/cd流水线上,基于通用的扫描规则,指定针对生意业务体系特有的规则,比如掷中特定关键字“yuan”、“cny”、“account”、“money”,则在代码提交测试前直接阻断,需要有研发RD针对性检查业务逻辑是否符合预期,同时测试同学也需要针对性的设计响应的case,保证测试肯定可以或许覆盖到。当以上工作完成后,由研发手动确认后,才会正式流转到测试阶段。

  

  • 事中阶段
  
对账本事,对账分为体系间对账和体系内对账,对于上下游体系之间进行数据同等性对账,通过上下游两方或者多方的DB数据,设计响应的对账规则,然后通过对账平台的近及时对账本事,对线上数据及时进行监控,遇到数据不同等时,通过告警人工及时介入排查和对数据同等性进行赔偿处理。

  

  • 事后阶段
  
SOP最佳指导,对于体系比如付出环节,发现商家存在违规刷单、非常生意业务等举动时,通过提前梳理好的SOP手册,对其进行付出、结算、提现本事的快速封禁,防止资损情况的进一步放大。

  
以上对各个环节进行了一些具体实施手段的展示,在整个治理过程中,我们还做了大量的其他工作,比如体系内的对账本事建立、配置扰乱、红蓝对抗等等,假如有想相识的朋侪,我们专门在出几篇文章来展开聊聊。

  总结

  
本文介绍了资金体系怎样进行加固升级的一个团体实施思绪,另外整个焦点治理思绪可以迁徙到任何体系的稳定性治理,在生产情况真正落地的时候需要根据自身业务场景进行适当调整即可;同时在具体落地的时候,需要对各个环节进行方案充分设计和讨论,以防在稳定性治理过程中产生的体系故障。

   做一个有深度的技术人

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

王柳

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表