论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
ToB圈子
›
虚拟化.容器.超融合.云计算
›
云计算圈
›
揭秘10亿+高并发应用如何实现高效稳定的开发和运维 ...
揭秘10亿+高并发应用如何实现高效稳定的开发和运维
羊蹓狼
金牌会员
|
2024-6-18 09:18:05
|
显示全部楼层
|
阅读模式
楼主
主题
880
|
帖子
880
|
积分
2640
本文分享自华为云社区
《DTSE Tech Talk | 第60期:构筑云原生期间的应用稳定性》
,作者: 华为云社区精选。
本期直播主题是
《构筑云原生期间的应用稳定性》
,华为云aPaaS DTSE技能布道师韫欣,与开发者们交流了云原生期间的应用挑战、趋势,跟大家分享了华为云应用平台AppStage的实践经验和优秀案例,并展望了智能运维的将来。
云原生期间的应用挑战和趋势
在飞速发展的数字期间,云原生已经成为了许多企业的首选,它不仅提供了灵活性和可扩展性,还为应用程序的稳定性带来了全新的技能革命。企业应用上云履历了三个阶段:
• 第一阶段,应用以“设备”为中心,工程师们看到的是一台台物理服务器,软件是摆设在服务器上的进程,硬件和软件相对割裂。
• 第二阶段,以资源为中心,形成了云化的资源池,大幅提拔了资源的利用率和使用效率。
• 第三阶段,是从以“资源“为中心走向以“应用” 为中心的云原生阶段,与第二阶段相比,主要区别在于应用的设计和摆设方式。云原生应用是教唆用微服务架构对应用进行解耦拆分,并以容器形式摆设,更加灵活和可扩展,能够更好地发挥公有云的优势,以应对业务的不确定性,带来更高的开发、运维和运营效率。
在这个转变过程中,也会面临一系列的挑战。
• 第一个挑战是云原生期间的技能复杂度比较高,工具非常的碎片化,比如服务的编排与调度、容器化、安全合规等各方面的工具。云原生应用设计、开发、运维过程中,对开发和运维人员的技能要求高,无形中增加了企业的开发本钱,降低了开发效率。
• 第二个挑战是大量工作消耗在工程能力构建上,开发人员真正的业务代码开发工作只占20%左右,隐形本钱非常高。起首,每个应用构建都要考虑可靠性、可用性、安全、韧性、多云摆设等一系列能力,存在重复造轮子的问题,造成了大量工作浪费。其次,国家、行业、企业对安全可信、技能规范等有诸多要求,缺乏统一的平台来支撑落地,每个开发人员对规范的解读差别,实现方式也会有差异,大幅降低了效率。以华为的经验,如果这些问题得以办理,30%以上的隐形工作是可以被节省的。
• 第三个挑战是云原生期间,维护一个复杂且快速变化的系统,会面临一系列的问题,比如碎片化的运维工具、版本的迅速迭代、人工效率低且不够规范等,随着业务链路越发复杂,问题跟踪和定位会越来越困难,业务数据量的增长也会导致数据库管理的问题变得尤为突出。
这一系列的运维问题需要未雨绸缪、提前规划,急迫需要云原生的运维尽快完成数智化转型。
华为云应用平台AppStage实践经验
针对以上挑战,华为对内部云原生应用经验总结提炼后,打造了华为云应用平台AppStage产物,为客户提供了一站式智能运维平台,不仅避免了差别厂商和三方的众多运维工具拼凑的问题,并且围绕无人值守变更、故障全生命周期管理、业务稳定性管理等三大站点可靠性工程 (SRE)的工作内容,来构建自动化和智能化能力,在进步运维效率的同时,也提拔了服务质量、优化了应用可靠性。
自动化无人值守变更:资助企业提拔运维效率,淘汰人为错误
1. 核生理念就是底子办法即代码,将资源、配置、环境、状态等进行声明化定义,避免传统变更明白的差异,可确保任何环境、任何地点执行结果的同等性。在变更自动化的评审、执行和验证过程中,实现全流程的自动化。
2. 通过一系列的变更灰度评估以及中断回滚等保险步调,确保变更过程和结果的安全可信。
3. 摆设和变更的过程完全不需要人工干预,淘汰了人员误利用的可能,保障了变更质量。
通过这些优化,10分钟就能完成一个服务的全新摆设,省去了大量的人工时间。华为内部统计,在变更工作中,故障率淘汰了40%,摆设效率提拔了30%。
监控与故障管理:全栈可观测性和故障全生命周期管理,降低了业务从故障发生到恢复的时间,提拔云原生应用整体服务质量
1. 通过对端、管、云全链路可观测能力,打通数据孤岛,将这些数据有机关联起来。
2. 通过智能化的运维底座,将资源、配置、事件、可观测数据建模管理,配合AIOps智能算法,驱动根因诊断和异常检测等运维的高阶智能化应用。
3. 通过定期业务巡检、监控诉警、故障演练等运动,做到故障全生命周期管理,实现1分钟AI异常检测和故障发现,5分钟故障根因诊断定界定位,并基于预编排的故障恢复模板和微服务管理体系,实现核心业务场景10分钟故障快速恢复。
可用性与连续性管理:通过混沌工程演练,实现确定性恢复,助力可用性达到99.99%
1. 按IaaS-PaaS-SaaS分解可靠性要求,形成应用稳定性指标体系,对应用可用性进行度量与管理。
2. 构建混沌工程演练平台,提供了50多种故障演练场景,80多种故障注入的方法,来充分验证业务和应用可靠性。
3. 通过故障演练发现问题,主动提拔生产环境的稳定性,做到问题的提前预防和发现。
数据库管理:WiseDBA提供可信数据库管理方案,快速诊断数据库疑难问题
1. 支持RDS、GaussDB for MySQL、GaussDB for Cassandra等多个数据库引擎的管理。
2. 可对纳管数据库进行IT化巡检和管理,针对数据库慢查询进行分级管理,建立风险评估体系。
3. 支持DBDesigner、SQL考核等正向设计,从开发阶段淘汰风险问题。
4. 提供数据查询、数据隐私白名单管理等能力。
FinOps:本钱管理确保应用稳定的前提下,资助企业降本增效
随着业务的快速发展,企业在华为云上的各类资源消耗也相应增长,需要对各类资源的使用情况进行有效管理,管控本钱。
1. 应用平台AppStage资源管理系统可构建资源台账,提供本钱可视化能力,清楚展示预算、资源用量和基于预测的趋势分析。
2. 识别本钱浪费和异常增长的资源类型,并进行异常实时提醒。
3. 对资源进行智能检测,为业务定期天生资源使用陈诉,保举资源优化方案,同时给出本钱收益分析,支撑本钱优化目的,提拔资源利用率。
华为云应用平台AppStage案例分享
• 案例一:保卫终端云全球数亿用户的全场景智慧生存体验
应用平台AppStage支撑了华为终端云服务11亿+华为用户和50+应用的托管和运维,助力全球业务可用性连续多年达到99.99%,持续保持优质、安全的用户体验,助力华为终端云服务活跃用户恒久保持稳健增长。
• 案例二:XX公司基于应用平台重构软件生产能力,成为工业软件研发领域的领头羊
XX公司通过应用平台AppStage实现运维的统一入口、统一工具、统一数据,形成高效智能的运维体系,全面提拔了软件工程协作效率,降低开发人员门槛,助力版本发布效率提拔30%,问题定位时长降低45%,运维协作效率提拔15%,维护总本钱降低10%。
将来展望
运维大模型开启将来运维新期间
运维大模型:利用大语言模型的天然语言明白能力、推理规划能力和任务执行能力,从五个方面对一站式智能运维赋能
• 构建运维助手:资助工程师解答日常运维工作各种问题,提拔效率
• 助力巡检监控:自动执行巡检任务,实时监控指标,及时发现异常
• 资助问题管理:自动探索分析日记,给出根因诊断,匹配应急方案
• 提供变更方案:分析变更要求,分解任务,编写脚本,协助测试执行
• 开发运维报表:自动分析运维数据,天生运维报表,支持天然语言互动调整
知识图谱与数字机器人融合,推动运维智能化持续发展
运维知识图谱:通过将业务数据分析提炼、抽取融合,加工成运维知识图谱,并沉淀算法能力,以支撑异常检测和根因诊断等高阶运维运动。
智能运维数字机器人:利用智能运维数字机器人(RPA)准确匹配恢复方案,并通过调用工具(API)做故障自愈和应急。
点击关注,第一时间了解华为云新鲜技能~
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
发新帖
回复
羊蹓狼
金牌会员
这个人很懒什么都没写!
楼主热帖
让你成为网络世界中有破坏力的人-HTTP ...
一文带你走进【内存泄漏】
dolphinscheduler单机化改造
保举开源项目:LuCI App AdGuardHome - ...
一文搞懂static
邮件管理数据库设计--MySQL
day01-Tomcat框架分析
3. 视图-触发器-存储过程-索引 ...
读高性能MySQL(第4版)笔记04_操作系 ...
MySQL 8.0.29 instant DDL 数据腐化问 ...
标签云
挺好的
服务器
快速回复
返回顶部
返回列表