คำถาม:

มีวิธีบังคับให้สร้างใหม่หรือไม่? ฉันยังล้อเล่นกับความคิดที่จะปิดระบบและพยายามสร้างใหม่ใน BIOS ตัวควบคุม 3ware ถ้าฉันปิดระบบนี้ในสถานะปัจจุบัน ระบบจะกลับมาทำงานอีกครั้งหรืออาร์เรย์จะพังและบูตไม่ได้หรือไม่ ขณะนี้ระบบกำลังทำงานอยู่

รายละเอียด:

เข้ามาในอาร์เรย์ที่ไม่ถูกต้อง (เสื่อมโทรม) และอีกสามรายการกำลังเริ่มต้น ฉันเปลี่ยนดิสก์เสียและพยายามสร้างใหม่ การใช้คำสั่งนี้:

./tw_cli /c3/p1 remove
./tw_cli /c3 rescan
./tw_cli maint rebuild c3 u0 p1

อาร์เรย์ RAID บอกว่ากำลังสร้างใหม่ แต่ไม่ได้ย้ายตั้งแต่ฉันออกคำสั่งสร้างใหม่

~ # ./tw_cli /c3/u0 show

Unit   UnitType Status     %RCmpl %V/I/M Port Stripe Size(GB)
------------------------------------------------------------------------
u0    RAID-10  REBUILDING   29%   -    -   256K  1862.61  
u0-0   RAID-1  REBUILDING   0%   -    -   -    -     
u0-0-0  DISK   OK       -    -    p0  -    465.651  
u0-0-1  DISK   DEGRADED    -    -    p1  -    465.651  
u0-1   RAID-1  INITIALIZING  62%   -    -   -    -     
u0-1-0  DISK   OK       -    -    p2  -    465.651  
u0-1-1  DISK   OK       -    -    p3  -    465.651  
u0-2   RAID-1  INITIALIZING  40%   -    -   -    -     
u0-2-0  DISK   OK       -    -    p4  -    465.651  
u0-2-1  DISK   OK       -    -    p5  -    465.651  
u0-3   RAID-1  INITIALIZING  16%   -    -   -    -     
u0-3-0  DISK   OK       -    -    p6  -    465.651  
u0-3-1  DISK   OK       -    -    p7  -    465.651  
u0/v0  Volume  -       -    -    -   -    1862.61

ฉันพยายามสร้างอาร์เรย์ใหม่ด้วยกำหนดการสร้างใหม่ทั้งที่เปิดใช้งานและปิดใช้งาน:

~ # ./tw_cli /c3 show rebuild          

Rebuild Schedule for Controller /c3
========================================================
Slot  Day   Hour      Duration    Status
--------------------------------------------------------
1    Sun   12:00am     24 hr(s)    enabled
2    Mon   12:00am     24 hr(s)    enabled
3    Tue   12:00am     24 hr(s)    enabled
4    Wed   12:00am     24 hr(s)    enabled
5    Thu   12:00am     24 hr(s)    enabled
6    Fri   12:00am     24 hr(s)    enabled
7    Sat   12:00am     24 hr(s)    enabled

และฉันได้ลองใช้กำหนดเวลาการตรวจสอบแล้วทั้งเปิดใช้งานและปิดใช้งาน

~ # ./tw_cli /c3 show verify

Verify Schedule for Controller /c3
========================================================
Slot  Day   Hour      Duration    Status
--------------------------------------------------------
1    Sun   12:00am     24 hr(s)    enabled
2    Mon   12:00am     24 hr(s)    enabled
3    Tue   12:00am     24 hr(s)    enabled
4    Wed   12:00am     24 hr(s)    enabled
5    Thu   12:00am     24 hr(s)    enabled
6    Fri   12:00am     24 hr(s)    enabled
7    Sat   12:00am     24 hr(s)    enabled

โปรดทราบด้วยว่าการพยายามตั้งค่าเพิกเฉยต่อ ECC เป็นข้อผิดพลาด:

~ # ./tw_cli /c3/u0 show ignoreECC
/c3/u0 Ignore ECC policy = off 

~ # ./tw_cli /c3/u0 set ignoreECC=on
Setting Ignore ECC Policy on /c3/u0 to [on] ... Failed.
(0x09:0x0005): (0x09:0x0005): Input/output error

แก้ไข 3/15/18:
ฉันคิดว่าฉันจะเขียนสิ่งที่เกิดขึ้นในกรณีที่คนอื่นพบว่าตัวเองอยู่ในสถานการณ์ที่คล้ายคลึงกัน ฉันต้องบอกว่าการเริ่มต้นที่ติดอยู่เป็นส่วนที่ทำให้ฉันวนซ้ำ ฉันรู้ว่าการ์ด RAID บางตัวซิงค์หรือตรวจสอบอาร์เรย์สัปดาห์ละครั้ง (หรือเมื่อใดก็ตามที่คุณกำหนดเวลาไว้) ฉันเชื่อว่าสิ่งที่เกิดขึ้นคือการซิงค์ใหม่และตรวจสอบอาร์เรย์ และไดรฟ์อย่างน้อยหนึ่งตัวล้มเหลวระหว่างการซิงค์ใหม่ทำให้ 'กำลังเริ่มต้น' หยุดทำงาน

ฉันส่งอีเมลถึงการสนับสนุนสำหรับการ์ด RAID นี้ ( [email protected]) พวกเขาตรวจดูท่อนซุงและ diags และไม่พบสิ่งผิดปกติ ข้อเสนอแนะของพวกเขาในท้ายที่สุดคือ: 'อัปเดตเฟิร์มแวร์ รีบูตหลังจากอัปเกรด อาจช่วยให้ออกจากสถานะหยุดชั่วคราวได้'

ฉันถามพวกเขาว่าการอัปเดตเฟิร์มแวร์ในสถานะ 'กำลังเริ่มต้น' ปลอดภัยหรือไม่ และหากพวกเขาแน่ใจว่าจะรีบูตได้อย่างปลอดภัยในขณะที่อยู่ในสถานะนี้ พวกเขาไม่เคยเล่นซ้ำกลับไปที่อีเมลนั้น

เมื่อเห็นว่าฉันไม่ไว้ใจใครเลย ฉันจึงสำรองข้อมูลทั้งหมดและรีบูตเครื่อง มันกลับมาพร้อมกับดิสก์ที่ไม่ดีอีกสองตัว (เป็นดิสก์ที่ไม่ดีในการเริ่มต้นอาร์เรย์ RAID1) โชคดีที่พวกเขาทั้งหมดอยู่ในอาร์เรย์ RAID1 ที่แตกต่างกัน ดังนั้นฉันจึงสามารถแทนที่ดิสก์ที่เสียหายได้ หลังจากที่รีบูทและสร้างอาร์เรย์ใหม่ อาร์เรย์ก็จะเริ่มต้นขึ้น และทุกอย่างก็ทำงานได้อย่างถูกต้อง

ดังนั้น หากคุณเคยเห็นการ์ดใบนี้ค้างอยู่ที่ 'กำลังเริ่มต้น' ฉันจะสำรองข้อมูล พยายามรีบูต และภาวนาว่าดิสก์เสียนั้นอยู่ในมิเรอร์ที่แตกต่างกัน

ขอให้โชคดีสำหรับทุกคนที่อาจอ่านสิ่งนี้ในอนาคต!

answer

ฉันคิดว่าฉันจะเขียนสิ่งที่เกิดขึ้นในกรณีที่คนอื่นพบว่าตัวเองอยู่ในสถานการณ์ที่คล้ายคลึงกัน ฉันต้องบอกว่าการเริ่มต้นที่ติดอยู่เป็นส่วนที่ทำให้ฉันวนซ้ำ ฉันรู้ว่าการ์ด RAID บางตัวซิงค์หรือตรวจสอบอาร์เรย์สัปดาห์ละครั้ง (หรือเมื่อใดก็ตามที่คุณกำหนดเวลาไว้) ฉันเชื่อว่าสิ่งที่เกิดขึ้นคือการซิงค์ใหม่และตรวจสอบอาร์เรย์ และไดรฟ์อย่างน้อยหนึ่งตัวล้มเหลวระหว่างการซิงค์ใหม่ทำให้ 'กำลังเริ่มต้น' หยุดทำงาน

ฉันส่งอีเมลถึงการสนับสนุนสำหรับการ์ด RAID นี้ ( [email protected]) พวกเขาตรวจดูท่อนซุงและ diags และไม่พบสิ่งผิดปกติ ข้อเสนอแนะของพวกเขาในท้ายที่สุดคือ: 'อัปเดตเฟิร์มแวร์ รีบูตหลังจากอัปเกรด อาจช่วยให้ออกจากสถานะหยุดชั่วคราวได้'

ฉันถามพวกเขาว่าการอัปเดตเฟิร์มแวร์ในสถานะ 'กำลังเริ่มต้น' ปลอดภัยหรือไม่ และหากพวกเขาแน่ใจว่าจะรีบูตได้อย่างปลอดภัยในขณะที่อยู่ในสถานะนี้ พวกเขาไม่เคยเล่นซ้ำกลับไปที่อีเมลนั้น

เมื่อเห็นว่าฉันไม่ไว้ใจใครเลย ฉันจึงสำรองข้อมูลทั้งหมดและรีบูตเครื่อง มันกลับมาพร้อมกับดิสก์ที่ไม่ดีอีกสองตัว (เป็นดิสก์ที่ไม่ดีในการเริ่มต้นอาร์เรย์ RAID1) โชคดีที่พวกเขาทั้งหมดอยู่ในอาร์เรย์ RAID1 ที่แตกต่างกัน ดังนั้นฉันจึงสามารถแทนที่ดิสก์ที่เสียหายได้ หลังจากที่รีบูทและสร้างอาร์เรย์ใหม่ อาร์เรย์ก็จะเริ่มต้นขึ้น และทุกอย่างก็ทำงานได้อย่างถูกต้อง

ดังนั้น หากคุณเคยเห็นการ์ดใบนี้ค้างอยู่ที่ 'กำลังเริ่มต้น' ฉันจะสำรองข้อมูล พยายามรีบูต และภาวนาว่าดิสก์เสียนั้นอยู่ในมิเรอร์ที่แตกต่างกัน

ขอให้โชคดีสำหรับทุกคนที่อาจอ่านสิ่งนี้ในอนาคต!