เรามีปัญหาแปลกมากในที่ทำงาน เซิร์ฟเวอร์ Ubuntu ของเรามี 6 ไดรฟ์ ตั้งค่าด้วย RAID1 ดังนี้:

/dev/md0, ประกอบด้วย: /dev/sda1 /dev/sdb1

/dev/md1 ประกอบด้วย: /dev/sda2 /dev/sdb2

/dev/md2 ประกอบด้วย: /dev/sda3 /dev/sdb3

/dev/md3 ประกอบด้วย: /dev/sdc1 /dev/sdd1

/dev/md4 ซึ่งประกอบด้วย: /dev/sde1 /dev/sdf1

อย่างที่คุณเห็น md0, md1 และ md2 ทั้งหมดใช้ 2 ไดรฟ์เดียวกัน (แบ่งออกเป็น 3 พาร์ติชั่น) ฉันต้องทราบด้วยว่าสิ่งนี้ทำผ่านการโจมตีซอฟต์แวร์ Ubuntu ไม่ใช่การโจมตีด้วยฮาร์ดแวร์

วันนี้ อาร์เรย์ /md0 RAID1 แสดงว่ามีการลดระดับ - ไม่มีไดรฟ์ /dev/sdb1 แต่เนื่องจาก /dev/sdb1 เป็นเพียงพาร์ติชั่น (และ /dev/sdb2 และ /dev/sdb3 ทำงานได้ดี) เห็นได้ชัดว่าไม่ใช่ไดรฟ์ที่หายไปจาก AWOL ดูเหมือนว่าพาร์ติชั่นจะหายไป

มันเป็นไปได้ยังไงกัน? และเราจะทำอะไรได้บ้างเพื่อแก้ไข

ผลลัพธ์ของฉันของ cat /proc/mdstat:

Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]

md1 : active raid1 sda2[0] sdb2[1]
   24006528 blocks super 1.2 [2/2] [UU]


md2 : active raid1 sda3[0] sdb3[1]
   1441268544 blocks super 1.2 [2/2] [UU]


md0 : active raid1 sda1[0]
   1464710976 blocks super 1.2 [2/1] [U_]


md3 : active raid1 sdd1[1] sdc1[0]
   2930133824 blocks super 1.2 [2/2] [UU]


md4 : active raid1 sdf2[1] sde2[0]
   2929939264 blocks super 1.2 [2/2] [UU]


unused devices: <none>

FYI: ฉันลองสิ่งต่อไปนี้:

mdadm /dev/md0 --add /dev/sdb1

แต่ได้รับข้อผิดพลาดนี้:

mdadm: add new device failed for /dev/sdb1 as 2: Invalid argument

ผลลัพธ์ของ mdadm --detail /dev/md0 คือ:

/dev/md0:
    Version : 1.2
 Creation Time : Sat Dec 29 17:09:45 2012
   Raid Level : raid1
   Array Size : 1464710976 (1396.86 GiB 1499.86 GB)
 Used Dev Size : 1464710976 (1396.86 GiB 1499.86 GB)
  Raid Devices : 2
 Total Devices : 1
  Persistence : Superblock is persistent

  Update Time : Thu Nov 7 15:55:07 2013
     State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
 Spare Devices : 0

      Name : lia:0 (local to host lia)
      UUID : eb302d19:ff70c7bf:401d63af:ed042d59
     Events : 26216

  Number  Major  Minor  RaidDevice State
    0    8    1    0   active sync  /dev/sda1
    1    0    0    1   removed
answer

คุณสามารถมีเซกเตอร์เสียในตำแหน่งนั้นได้

หยุดอาร์เรย์ RAID ทั้งหมด จากนั้นตรวจสอบความสมบูรณ์ของดิสก์จริง ก่อนอื่นคุณสามารถเริ่มต้นด้วยการตรวจสอบ SMART....

ลอง:

# mdadm /dev/md0 --re-add /dev/sdb1