滴水恩情 发表于 2024-6-14 23:21:37

云盘算-高级云架构 (Advanced Cloud Architecture)

管理步调集群架构 (Hypervisor Clustering Architecture)

        管理步调集群架构是由多个管理步调构成的集群。正如我们之前所学,管理步调是运行在裸机硬件上的低级环境,管理多个虚拟机,使它们认为自己运行在独立的硬件服务器上。管理步调集群意味着有多个物理服务器,每个服务器运行一个管理步调。除了管理自己的虚拟机,每个管理步调还与集群中的其他管理步调交互,以便在物理机之间迁移虚拟机。这可能在故障转移处理、负载管理过程或扩展过程中发生。
        管理步调集群通常由VIM(虚拟化底子设施管理器)管理。VIM监控管理步调以确保它们正常运行。如果由于硬件故障等原因,管理步调无法正常运行,VIM可以将虚拟服务器迁移到正常运行的管理步调。VIM通过监控心跳消息来监控管理步调,这些消息是从被监控设备定期发送的简朴消息。在管理步调集群中,管理步调也使用心跳消息来查抄其他管理步调的可用性。
        集群中的管理步调通过云存储设备迁移虚拟机。虚拟服务器的虚拟映像生存在云存储设备中。当检测到管理步调故障时,该映像可以加载到另一管理步调中。哪个管理步调接管虚拟服务器的决定由VIM做出,VIM会了解集群中每个管理步调的负载情况。
        有时我们会说虚拟服务器在管理步调之间进行实时迁移。然而,实时的定义取决于虚拟映像的存储方式。如果管理步调维护虚拟机状态的最新映像,则可以在新管理步调上非常快速地重启映像。然而,如果映像只是一个可启动的映像,则复制的虚拟服务器可能必要从该映像重新启动,这会因为启动过程引入一些延迟。
        以下阅读还指出,管理步调集群架构可能还包括:


[*]逻辑网络界限——防止不同用户的虚拟服务器相互干扰。
[*]资源复制——管理步调集群的状态必须在所有管理步调之间复制。
活动9

       写下以下题目的答案:

[*]用你自己的话形貌什么是心跳消息以及它是如何使用的。

[*]心跳消息是被监控设备定期发送的简朴消息,用于确认设备的正常运行状态。VIM使用心跳消息监控管理步调的可用性,确保它们运行正常。

[*]你认为为什么通常由VIM决定将虚拟机迁移到哪个管理步调?(为什么不是由管理步调做出决定?)

[*]VIM通常决定将虚拟机迁移到哪个管理步调,因为VIM掌握整个集群的全局视图,了解每个管理步调的负载情况,能够做出更优化的决策。而单个管理步调无法获得整个集群的全局信息。

[*]在讨论实时迁移时,我们提到的“虚拟机的最新映像”是什么意思?

[*]“虚拟机的最新映像”指的是管理步调维护的虚拟机状态的最新版本,使得在迁移到新管理步调时能够快速重启虚拟机。

负载平衡虚拟服务器实例架构 (Load Balanced Virtual Server Instance Architecture)

        当我们有多个虚拟服务器运行在多个物理机器上(不在集群中)时,不可避免地会有一个或多个物理服务器过载,而其他服务器有剩余容量。此时必要一个负载平衡机制。负载平衡虚拟服务器实例架构监控物理服务器的负载,并主动分配虚拟服务器实例以平衡负载。
        负载监控和后续的平衡由容量监控系统执行。容量监控系统有三个组件:

[*]云使用监控器:监控虚拟机和物理机的使用情况。
[*]容量规划器:包罗物理服务器和虚拟服务器的容量信息,当容量限定被超出或物理服务器未被充分利用时关照VIM。
[*]虚拟机迁移组件:由VIM或容量规划器启动,负责将虚拟服务器从一个物理服务器迁移到另一个物理服务器。
        必要留意的是,这与之前讨论的集群架构不同,因为这里形貌的物理服务器并不在集群中,在VIM看来是独立的设备。
活动10

        写下以下题目的答案:

[*]阅读中显示容量监控系统直接连接到物理服务器。它可能收集什么信息来确定物理和虚拟服务器的负载?

[*]容量监控系统可能收集CPU使用率、内存使用率、网络流量、磁盘I/O和虚拟机数目等信息,以确定物理和虚拟服务器的负载情况。

[*]阅读中提到一个用于虚拟机迁移的步调。这个步调可以在那里执行?

[*]这个步调可以在VIM、容量规划器或必要迁移虚拟机的物理服务器上执行。

[*]迁移步调会引入延迟吗?

[*]是的,迁移步调可能会引入延迟,尤其是在迁移过程中必要停止和重启虚拟机时。

无停止服务迁移架构 (Non-Disruptive Service Relocation Architecture)

        无停止服务迁移架构计划用于在不停止服务的情况下重新定位云服务。这雷同于之前讨论的弹性架构,但旨在在物理服务器之间迁移服务而不影响其操作。无停止服务迁移适用于可预测的迁移,例如在维护期间或迁移到新物理服务器环境时。当当前物理服务器达到其处理容量时,也可以使用它。
        无停止服务迁移(在教科书中也称为实时迁移)包括以下阶段:

[*]启动一个可能带有升级软件的重复服务环境。
[*]测试新环境是否会相应哀求。
[*]将传入哀求重定向到新服务位置。
[*]如有必要,在旧环境中执行维护,并重复1-3步调以将服务切换回旧位置。 要确保这些步调无停止,步调2必须在步调3之前完成。如果新环境位于同一或升级的物理服务器中,则步调4不是必要的,此时旧服务可以直接停用。
        服务迁移需求可以由主动扩展监听器或负载平衡机制检测到。也可以通过云或用户控制台手动发起(例如用于维护)。这些都会指示VIM启动过程。
活动11

        阅读(https://www.informit.com/articles/article.aspx?p=2357815&seqNum=12)。

[*]无停止服务架构在负载平衡服务器实例架构中起什么作用(在上一节讨论过)?

[*]无停止服务架构确保在负载平衡过程中服务不停止,允许在物理服务器之间迁移服务以保持负载平衡而不会影响用户体验。

[*]图12.12到12.14显示由主动扩展监听器启动的无停止服务迁移。如果迁移是从云提供商的控制台启动的,会有什么不同?

[*]如果迁移是从云提供商的控制台启动的,可能必要手动设置和验证步调,主动化程度较低,可能会增加一些人工干预和延迟。

零停机时间架构 (Zero Downtime Architecture)

        根据教科书的定义,零停机时间架构是一种在物理服务器故障时为虚拟服务器提供零停机时间的弹性架构。这并不是一个容易实现的架构。考虑到当你的个人盘算机蓝屏(对于Windows用户)或发生电源故障时会发生什么。CPU停止,内存中的任何进程都无法访问。题目在于如何规复运行在故障物理服务器上的虚拟服务器的状态。
        零停机时间架构将虚拟服务器的当前状态生存在辅助存储或其他不受物理服务器故障影响的存储中。这个生存的状态用于在另一台物理服务器上规复虚拟服务器。他们还必须在新副本的虚拟服务开始运行后切换网络连接。网络活动由持久虚拟网络设置架构完成,我们将在下一个主题中讨论。
活动12

        阅读https://www.informit.com/articles/article.aspx?p=2357815&seqNum=9)。

[*]使用教科书定义,零停机时间架构也是无停止服务迁移架构吗?它们之间有什么关系?

[*]是的,零停机时间架构也是无停止服务迁移架构的一种。它们都旨在确保服务不停止,但零停机时间架构更偏重于在物理服务器故障时提供无缝规复,而无停止服务迁移架构则更偏重于可预测的迁移。

云负载平衡架构 (Cloud Balancing Architecture)

        云负载平衡架构用于在不同云之间平衡负载。云负载平衡架构遵循根本的资源平衡架构原则,但这些原则应用于多个云,而不是位于一个云中的多个资源。
        云负载平衡由主动扩展监听器管理,它将传入哀求分配给运行在不同云中的相同云服务。主动扩展监听器自己可以位于消费者的内部网络中或单独的云中。通常还会有一个故障转移系统监控涉及的云,以便在一个云变得不可访问或出现性能题目时进行故障转移处理。故障转移机制可能仅关照主动扩展监听器,大概可能启动其他动作,例如在运行中的云中创建额外的服务副本。
活动13

        阅读链接:chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://www.f5.com/pdf/white-papers/cloud-balancing-white-paper.pdf 用ReadSpeaker docReader打开此文档。

[*]云负载平衡的业务目标是什么?

[*]云负载平衡的业务目标是提高服务的可用性和可靠性,优化资源利用,降低运营本钱,并确保在不同云提供商之间的工作负载分配,实现更好的服务性能。

[*]云负载平衡架构的集成过程有哪些挑战?

[*]集成过程的挑战包括跨不同云平台的兼容性题目、数据和服务迁移的复杂性、同一管理和监控的需求,以及确保数据安全和隐私。

动态故障检测与规复架构 (Dynamic Failure Detection and Recovery Architecture)

        动态故障检测与规复架构负责监控云提供商的IT资源,并在发生故障时采取行动。云提供商可能同时运行数千个云资源,手动24/7监控这么多资源是不切现实的。云提供商必要实现主动化监控架构,以采取步调从资源故障中规复。必要留意的是,硬件通常必要手动干预来修复或更换故障组件,因此动态故障检测与规复架构的规复机制可能只是关照相干人员进行维修。
        弹性监控系统执行此架构的监控部分。它必须具备弹性,以确保其故障概率极低。它还必须能够监控许多不同类型的IT资源,并根据检测到的故障资源类型做出相应相应。它还负责记录变乱以供将来分析。
        弹性监控系统由云提供商设置,以提供适当的相应。相应可能包括以下一种或多种:


[*]发送控制台消息
[*]发送电子邮件或短信
[*]发送SNMP陷阱(SNMP是与网络设备交互的协议)
[*]记录帮助台工单
[*]运行批处理文件
        对于任何设备的故障,弹性监控系统可能会执行这些相应的组合。例如,在工作时间发送控制台消息,在其他时间发送短信。它还可以设置为按次序实行其中一种相应,例如,运行批处理文件,如果状态仍然故障则发送短信。
        必要留意的是,我们已经讨论过的弹性架构可能仍必要弹性监控系统在弹性架构主动规复时采取行动。例如,在资源池架构中,如果一个组件故障,资源池将继续通过将哀求转移到剩余的池成员来运行。然而,必须修复故障的池成员以规复池的原始设置,纵然池继续运行。这必要关照相干人员进行维修。
活动14

阅读教科书第12章第12.7节(https://www.informit.com/articles/article.aspx?p=2357815&seqNum=5)。

[*]图12.20和12.21中显示弹性监控系统使用智能监控器的信息。它的作用是什么?

[*]智能监控器收集和分析IT资源的状态和性能数据,提供实时监控和故障检测,并在检测到题目时触发适当的相应步调。

[*]教科书中提到弹性监控器可以升级题目。这是什么意思,如何实现?

[*]升级题目意味着将未办理的题目提升到更高级别的处理,以确保题目得到办理。可以通过多种方式实现,例如,如果低级相应未办理题目,则关照更高级别的支持团队,或启动更高级别的故障规复步调。

[*]如果弹性磁盘集群(例如RAID)中的磁盘驱动器故障,弹性监控系统应该做什么?记着,磁盘集群会在没有故障磁盘的情况下继续运行。

[*]弹性监控系统应记录故障并关照相干人员进行修复,以便尽快更换故障磁盘并规复磁盘集群的冗余和完整性。

活动15 (反思活动)

        是否可以将“无停止服务迁移架构”与“动态故障检测与规复架构”集成?扼要表明如何实现。


[*]是的,可以将“无停止服务迁移架构”与“动态故障检测与规复架构”集成。可以通过在检测到故障时,动态故障检测与规复架构主动触发无停止服务迁移过程,将服务迁移到其他正常运行的服务器上,以确保服务连续性和稳定性。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 云盘算-高级云架构 (Advanced Cloud Architecture)