ฉันมีระบบ SAN ที่มีการติดตั้งสล็อตไดรฟ์ 10 ช่องด้วย Software RAID10 และ md0-5 ทั้งหมดถูกเพิ่มลงในกลุ่มวอลุ่มเดียว พอร์ต SATA ในช่องเสียบ 10 เพิ่งล้มเหลวและจะไม่ยอมรับไดรฟ์ที่เราใส่เข้าไป ฉันรู้สึกประหม่าอย่างมากเกี่ยวกับการทิ้งไดรฟ์ 9 ไว้โดยไม่ทำมิเรอร์ โซลูชันที่ฉันเสนอคือการเพิ่มไดรฟ์ภายนอก USB (ขนาดที่ตรงกันและผู้ผลิตกับไดรฟ์ #9) ให้กับเซิร์ฟเวอร์และกำหนดให้เป็นพาร์ทเนอร์ RAID1 สำหรับ #9 ฉันรู้ว่า USB จะช้ากว่า SATA มาก แต่ฉันกังวลเกี่ยวกับการปกป้องข้อมูลมากกว่าความเร็วของไดรฟ์

ไม่มีใครเห็นปัญหาใด ๆ กับแผนนั้น (นอกเหนือจากประสิทธิภาพ) หรือไม่?

cat /proc/mdstat บุคลิกภาพ : [raid1] md4 : active raid1 sdj1[1] 976759936 บล็อก [2/1] [U_]

md3 : active raid1 sdc1[1] sda1[0] 976759936 บล็อก [2/2] [UU]

md2 : active raid1 sdh1[1] sdg1[0] 976759936 บล็อก [2/2] [UU]

md4 : active raid1 sdi1[0] sde1[1] 976759936 บล็อก [2/2] [UU]

md0 : active raid1 sdf1[0] sdb1[1] 976759936 บล็อก [2/2] [UU]

answer

RAID10 คือ RAID0 ของอาร์เรย์ RAID1 ที่คุณจะลงเอยด้วยโวลุ่มเดียวในตอนท้าย ดังนั้นคุณจึงมีฟิสิคัลวอลุ่มหนึ่งรายการที่จะมอบให้กับ LVM ชอบดังนั้น:

            LV1        LV2              
             \__________\___________....
                            |
                           VG
                            |
                           PV
                            |
     ______________________MD5________________________
    /             /           |          \            \
  _MD0_        _MD1_        _MD2_       _MD3_        _MD4_        
 /     \      /     \      /     \     /     \      /     \
D01   D02    D03   D04    D05   D06   D07   D08    D09   D10

สิ่งที่คุณอธิบายด้วย "md0-5 ทั้งหมดที่เพิ่มลงในกลุ่มวอลุ่มเดียว" ฟังดูเหมือน RAID1 (หรือ RAID10 ที่แยกจากกัน 5 ตัว - ไดรเวอร์ RAID10 ทำหน้าที่เป็น RAID1 สำหรับอาร์เรย์ของไดรฟ์สองตัว) อาร์เรย์ที่คุณเพิ่มลงใน LVM แยกกัน ดังนั้นคุณ มีกลุ่มวอลุ่มที่ประกอบด้วย 5 ฟิสิคัลวอลุ่ม ชอบดังนั้น:

            LV1        LV2              
             \__________\___________....
                            |
     ______________________VG_________________________
    /             /           |          \            \
   PV1          PV2          PV3         PV4          PV5
    |            |            |           |            |
  _MD0_        _MD1_        _MD2_       _MD3_        _MD4_        
 /     \      /     \      /     \     /     \      /     \
D01   D02    D03   D04    D05   D06   D07   D08    D09   D10

(นี่ไม่ใช่ RAID10 จริงๆ (RAID-1-then-0) แต่เป็น RAID-1-then-JBOD)

เป็นกรณีนี้หรือไม่?

หากเป็นเช่นนั้น คุณสามารถลบ PV5 ออกจากกลุ่มวอลุ่มแทนได้ สมมติว่ามีพื้นที่ว่างเพียงพอในระบบทั้งหมด และระบบไฟล์ที่คุณรองรับกำลังได้รับการปรับขนาด (เช่น et2/3/4 พร้อม resize2fs) หากจำเป็น:

  1. ลดขนาดระบบไฟล์และโลจิคัลวอลุ่มที่มีอยู่จนกว่าจะมีที่ว่างเพียงพอในกลุ่มวอลุ่มเป็นอย่างน้อยเพื่อเติม PV5 เว้นแต่จะมีเนื้อที่ว่างเพียงพอในกลุ่มวอลุ่มอยู่แล้ว
  2. ใช้pvmoveเพื่อย้ายบล็อกทั้งหมดที่จัดสรรให้กับฟิสิคัลวอลุ่มนั้นโดย LVM ไปยังผู้อื่น
  3. (ไม่บังคับ) ใช้vgreduceเพื่อลบ PV5 นั้นออกจากกลุ่มวอลุ่ม

ตอนนี้อาร์เรย์ที่ใช้งานไม่ได้ไม่ได้เป็นส่วนหนึ่งของการตั้งค่า LVM คุณสามารถเพิ่มกลับเข้าไปได้เมื่อคุณแก้ไขสถานการณ์แล้วเพื่อให้คู่ RAID1 ไม่ทำงานเสื่อมคุณภาพอีกต่อไป

เพื่อตอบโจทย์คุณอย่างแท้จริง...

นอกเหนือจากปัญหาด้านประสิทธิภาพที่คุณได้ระบุแล้วและโอกาสที่ไดรฟ์ USB จะถูกตัดการเชื่อมต่อโดยไม่ได้ตั้งใจ (ซึ่งไม่น่าจะเป็นไปได้หากเครื่องที่โฮสต์ SAN ของคุณปลอดภัยจากมนุษย์และมีสิ่งรบกวนอื่น ๆ ) ฉันไม่เห็นมีปัญหากับ แทนที่ดิสก์ 10 ของคุณด้วยอันที่เชื่อมต่อผ่าน USB

หากเครื่องที่โฮสต์ SAN ของคุณมีสล็อต PCI หรือ PCI-E สำรอง ฉันขอแนะนำให้ใช้เส้นทางนั้นแทน โดยเพิ่มตัวควบคุม SATA พิเศษเพื่อแขวนไดรฟ์ หากคุณได้รับคอนโทรลเลอร์ที่มีพอร์ตห้าพอร์ต (หรือสามารถใส่ลงในการ์ดสองใบที่มีทั้งหมดห้าใบขึ้นไป) ฉันอยากจะแยกไดรฟ์ออกเพื่อให้แต่ละคู่มีไดรฟ์หนึ่งตัวเชื่อมต่อกับเมนบอร์ดและอีกตัวเชื่อมต่อกับส่วนเสริม บนคอนโทรลเลอร์ - ด้วยวิธีนี้อาร์เรย์ทั้งหมดของคุณมีโอกาสที่จะรอดชีวิตจากความล้มเหลวของคอนโทรลเลอร์ของเมนบอร์ดที่ฆ่าไดรฟ์ทั้งหมดที่เชื่อมต่ออยู่ (เป็นเหตุการณ์ที่หายากมาก แต่อาจเกิดขึ้นได้)

ไม่ว่าในกรณีใด หากคุณมีห้าอาร์เรย์ที่แยกจากกันเป็นฟิสิคัลวอลุ่มสำหรับ LVM (ไม่ใช่หนึ่งอาร์เรย์ ดังนั้น หนึ่ง PV ใน LVM) ฉันขอแนะนำให้นำข้อมูลออกจากคู่ที่เสื่อมคุณภาพอย่างน้อยก็ชั่วคราว เว้นแต่คุณจะเพิ่มไดรฟ์สำรองได้ ตอนนี้.

(เพื่อยืนยันเค้าโครงที่คุณมี คุณควรเปลี่ยนคำคำถามและ/หรือเพิ่มผลลัพธ์ของคำสั่งcat /proc/mdstat, pvs, vgsและlvs)

เป็นการจู่โจม 10 ฉันไม่ค่อยกังวลเกี่ยวกับสุขภาพของอาร์เรย์ที่มีดิสก์หนึ่งตัวตายมากกว่าการใช้ไดรฟ์ USB หากถูกโจมตี 5 อาจเป็นเรื่องที่แตกต่างออกไป แต่ฉันคิดว่าคุณจะไม่เป็นไรหากไม่มีดิสก์ที่สิบจนกว่าคุณจะซ่อมคอนโทรลเลอร์ของคุณ - ตราบใดที่คุณกำลังแยกแยะในไม่ช้า - คุณพูดถูก :)

ฉันคิดว่าการแสดงจะไม่ดีเลย ที่แย่ไปกว่านั้นคือ สามารถถอดปลั๊กไดรฟ์ USB ในขณะที่ระบบกำลังเขียนและ/หรือเตรียมใช้งาน

คุณสามารถคัดลอกข้อมูลของคุณบนไดรฟ์ #9 ไปยังไดรฟ์มิเรอร์อื่นได้หรือไม่