论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
软件与程序人生
›
DevOps与敏捷开发
›
SRE,了解一下?35+岁程序员新选择
SRE,了解一下?35+岁程序员新选择
盛世宏图
金牌会员
|
2022-6-23 11:01:25
|
显示全部楼层
|
阅读模式
楼主
主题
677
|
帖子
677
|
积分
2031
摘要:
随着云业务的发展,今后会有越来越多的工程师深入到SRE领域。 本文分享自华为云社区《
浅谈SRE角色认知
》,作者: SRE确定性运维。
一、什么是SRE?
SRE(Site Reliability Engineer)从2003年被谷歌公司提出,已经将近20年,它不仅是一个岗位,而是一个体系化的工程。最早谷歌公司提出SRE是为了解决两个核心冲突点:1、开发、运维两个团队在上线速度和现网系统稳定性之间的冲突;2、软件的快速上线,模糊了运维和研发的边界。谷歌SRE通过软件工程技术,持续改进现网可用性和自动化运维能力,SRE作为一个新的技术岗位走上历史舞台。
SRE是站点可用性工程师:强调软件和系统工程能力,SRE需要编写自动化脚本,优化和改进配置。写代码是必须的技能要求,因为代码是支撑工具开发和自动化的手段,但不鼓励写大量代码,希望能通过简单的工具或者配置解决问题。
SRE素质能力模型主要有:软技能(合作、沟通、独立解决问题),实践经验(IT运维、基础设施、安全等),流程和框架(DevOps、敏捷等),新技术(CICD工具、微服务升级与API)。
二、云为什么要走SRE道路
云业务相较传统业务存在两个变化,运维对象和运维模式都发生了本质改变,传统运维模式已不能满足要求,运维专业必定向SRE发展。
面向运维对象的四点变化:
1)传统产品局点规模海量,单局点规模有限。但云业务单系统就支持几十上百万的服务器规模;
2)传统IPD版本周期长达半年,DevOps模式1~4周一个版本;
3)云计算L0~L4堆栈复杂,系统整体可用性依赖全栈可用性;
4)运维对象不是可批量交付的成熟产品,而是微服务架构下的不断演进的服务组件,同时各个行业的特质也会发生变化。
商业模式改变引起运维模式的变化:
1)商业模式转变导致运维的责任边界产生变化,传统模式客户服务运维,厂家做二线保障。现在需要端到端负责可用性设计以及1/2线运维,这种模式下,仅靠后端保障可用性是不够的,需要介入前端顶层架构设计。
2)传统模式只对交付的产品可靠性负责,不需考虑周边可用性制约因素,但是作为服务运营商,需要对服务全栈可用性负责。
3)传统模式,运维人员只是对运维系统的使用者,但是现在除了使用者外,还是运维系统的建设者,由最懂现网业务的SRE主导设计和开发运维工具。
三、SRE角色认知
有别于传统运维工程师,SRE在服务生命周期中扮演以下三个关键角色:
1)现网可用性的守护者。是现网的Owner,守护现网稳定性是SRE的第一职责,围绕现网保障会建立一整套的事前、事中、事后的SLA保障体系和能力。事前:监控告警、变更管理、容量管理、重大保障、应急演练等一系列业务活动。事中:事件管理、warroom、应急恢复能力。事后:故障Postmortem、现网数据分析、通过现网数据持续驱动产品改进。SRE强调全栈、端到端能力,是系统性专家;
2)系统高可用性的设计者。是高可用设计的Owner,联合产品研发围绕SLI/SLO目标设计服务高可用,将高可用软件架构和工程方法应用到产品。SRE作为高可用性设计的专家参与到产品设计和上线活动中,运用系统和软件工程科学解决产品可用性问题;
3)运维软件工程能力的构建者。用软件工程的思维和方法管理现网,通过可信开发构筑系统可用性和自动化能力。打造安全可靠的运维平台,建设自动化运维服务,支撑云服务的高可用落地,提升运维安全和运维效率。持续关注业务和技术发展,引入并采用业界新软件技术,引导系统优化演进,围绕运维业务目标,构筑运维领域技术竞争力。
四、SRE素质能力要求
相对传统运维,SRE需要既懂开发,又懂运维,能端到端参与产品研发生命周期全过程,围绕高可用和自动化建立四大关键能力。
1)编码能力是SRE的基本技能要求,强调软件和系统工程能力;
2)具备“软件工程”思维,要有站点和服务高可用设计能力,同时将高可用架构和软件工程方法应用到产品研发过程;
3)有能力进行自动化研发,用自动化软件完成运维和系统高可用性工作;
4)SRE要有SLI/SLO体系化设计能力,通过SLO将服务可用性显性化度量。
同时,SRE要将现网优秀实践经验固化到流程规范中,形成一套可复制的标准化运维体系。
点击关注,第一时间了解华为云新鲜技术~
来源:
https://blog.csdn.net/devcloud/article/details/125291696
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
盛世宏图
金牌会员
这个人很懒什么都没写!
楼主热帖
Frida主动调用java函数来爆破解题思路 ...
【十年网络安全工程师整理】—100渗透 ...
绝了,这20款可视化大屏模板太酷炫了( ...
数据库扩容也可以如此丝滑,MySQL千亿 ...
幂等公共组件
记一次 .NET 某RFID标签管理系统 CPU ...
聊聊DevOps制品管理-不止是存储制品这 ...
15年了,我们到底怎样才能用好 Serverl ...
C++11:支持函数模板的默认模板参数 ...
近万条中医名词术语大全ACCESS\EXCEL数 ...
标签云
挺好的
服务器
快速回复
返回顶部
返回列表