服务器raid5坏盘-换盘-修复阵列过程

打印 上一主题 下一主题

主题 539|帖子 539|积分 1617

配景

服务器除尘之后文件服务器部分文件不能访问了,部分文件夹内容为空,起初以为是新配置的权限的题目,排查之后发现不仅仅是权限题目

jumpserver访问服务器发现部分文件表现“???”

此时想到可能是服务器硬件故障了,随即查察
服务器表现内容:

服务器灯2号黄灯闪烁,5号8号灯不亮,显然不是好的预兆

原因分析

1、文件夹为空可能是阵列出现了题目
2、没有权限访问应该是修改了Samba的配置文件
初步分析
文件夹为空:这通常与存储介质(如硬盘)上的数据丢失或不可访问有关。在RAID情况中,这可能是由于某个或多个物理磁盘(PD)故障或RAID配置题目导致的。
无权限访问:固然最初怀疑是Samba配置题目,但思量到是在除尘后出现的,这更可能是由硬件或RAID阵列状态变化导致的文件体系权限或全部权题目。
解决步调

名词解释

起首对raid界面的几个名词相识一下
diskgroup:磁盘组,这里相当于是阵列,例如配置了一个raid5,就是一个磁盘组
vd(virtual disk):虚拟磁盘,虚拟磁盘可以不使用阵列的全部容量,也就是说一个磁盘组可以分为多个vd
pd(physical disk):物理磁盘
hs:hotspare 热备
mgmt:管理
进入raid管理界面

CTRl+r 进入raid
VD mgmt:2号和4号missing,8号不见了

PD mgmt:2号和4号 Foreign

解释一下这里的foreign,RAID控制器辨认到的一个不属于其当前配置或管理域的存储配置。这可能是从另一个体系迁移过来的硬盘,大概是在没有正确初始化或导入到当前体系的情况下插入的硬盘。
Foreign View界面:多了一个阵列DISk Group 2,表现4号 Online
这里也可以阐明4号不属于当前配置或管理域的存储配置,应该是从另一个体系迁移过来的硬盘(前两天刚刚把4号盘换了,但是仅仅换了,而没有配置,和表现的情况一致)

换回旧4号,举行import

上面说4号是之前换掉的(这里称它为新4号,为了和替换掉的旧4号区分),以是又把之前认为坏掉的旧4号取返来(当时旧4号状态灯不亮了,以是认为它坏掉了,直接找了一块不用的盘放了进去,从上面的可以看出来, 新4号之前在其他raid中举行过配置),放了进去
在VD 界面,F2


import之后,没有foreign view了,也就是没有外来盘了
2号online,4号offline


  • Online(在线):
    ○ 硬盘或RAID卷是运动的,并且可以被体系访问。
    ○ 数据可以从该硬盘或RAID卷中读取,也可以写入此中(如果它是可写的)。
    ○ 通常,当体系启动时,全部健康的硬盘和RAID卷都会自动变为在线状态。
  • Offline(离线):
    ○ 硬盘或RAID卷当前不可用或不可访问。
    ○ 这可能是由于多种原因,例如硬盘故障、RAID控制器题目、配置错误或管理员手动将其设置为离线。
    ○ 当硬盘或RAID卷处于离线状态时,不能今后中读取或写入数据。
    ○ 在某些情况下,管理员可能会选择将硬盘或RAID卷设置为离线,以便举行维护、更换或重新配置。
    这里显然不是我故意把4号设置成offline的
再看一下PD Mgmt界面,没有4号,仍然没有8号(一会儿再解决8号题目)

旧4号这里就是坏掉了,取下旧4号,这里是热插拔,4号位置表现Missing

再次更换4号盘

这里使用了一块没有做过raid的盘放到了4号位置,直接rebuild了

到这里,阵列再重修了,8号暂时不解决,等阵列彻底修复之后,再举行一下备份,再解决8号和2号题目.
总结

Foreign View:当RAID控制器辨认到不属于其当前配置或管理域的硬盘时,会表现为Foreign。这通常意味着硬盘来自另一个RAID配置或体系。
Import:当将旧4号硬盘换回并成功导入后,Foreign View消散,这表明RAID控制器如今可以大概辨认并管理这块硬盘。
在RAID阵列中,当一个或多个磁盘发生故障或丢失时,确实需要举行重修以规复数据的冗余和完整性。
最后再说一下整体分析过程息争决步调
1、确认RAID级别和配置
2、替换故障磁盘
3、等待重修完成:
RAID重修是一个耗时的过程,具体取决于RAID级别、磁盘容量、RAID控制器性能以及替换磁盘的写入速率。要耐烦等待重修完成。
4、备份数据:
在阵列重修完成后,猛烈建议立即备份全部数据。固然RAID提供了数据冗余,但备份仍然是最可靠的数据保护方式。
5、解决其他丢失的磁盘:
这里还有8号和2号磁盘存在题目。在解决了4号磁盘的题目后,按照雷同的步调来处置惩罚这些磁盘。但是,如果RAID阵列中的多个磁盘同时发生故障,可能会导致数据丢失的风险增长。
6、查抄硬件和连接:
确保全部磁盘都正确连接在RAID控制器上,并且没有物理破坏或连接题目。有时,磁盘丢失可能是由于电缆松动、连接器脏污或硬件故障引起的。
7、查抄RAID控制器和驱动步伐
切记,在举行任何可能影响数据完整性的操纵之前,始终确保有可靠的数据备份。这将是在出现题目时规复数据的最后一道防线。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

石小疯

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表