سؤال كيف يمكن لقرص واحد في مجموعة أجهزة SATA RAID-10 أن يجلب المصفوفة بأكملها إلى التوقف؟


مقدمة:

أنا رمز قرد يأخذ على نحو متزايد على واجبات SysAdmin لشركتي الصغيرة. الرمز الخاص بي هو منتجنا ، وبشكل متزايد نقدم نفس التطبيق كخدمة SaaS.

منذ حوالي 18 شهرًا ، قمت بنقل خوادمنا من بائع مركزي متميز إلى مضرب رفير في مركز بيانات من المستوى الرابع. (حرفيا عبر الشارع). هذا العمل أكثر أنفسنا - أشياء مثل الشبكات والتخزين والرصد.

كجزء من هذه الخطوة الكبيرة ، لاستبدال التخزين المستأجر المباشر المستأجر من الشركة المضيفة ، قمت ببناء نظام NAS ثنائي العقد NT على أساس SuperMicro chassises ، بطاقات 3ID RAID ، Ubuntu 10.04 ، واثنان وعشرين أقراص SATA ، و DRBD. كل ذلك موثق بمحبة في ثلاث مشاركات مدونة: بناء واختبار جديد 9TB SATA RAID10 NFSv4 NAS: الجزء الأول، الجزء الثاني و الجزء الثالث.

نحن أيضا إعداد نظام مراقبة Cacit. لقد قمنا مؤخرًا بإضافة المزيد والمزيد من نقاط البيانات ، مثل قيم SMART.

لم أكن لأفعل كل هذا دون رائع  boffins  في  ServerFault. لقد كانت تجربة ممتعة وتعليمية. مديري سعيد (حفظنا أحمال الجنازير من $$$)، عملائنا سعداء (تكاليف التخزين منخفضة)، أنا سعيد (المرح ، المرح ، المرح).

حتى يوم أمس.

الانقطاع والاسترداد:

بعد مرور بعض الوقت بعد تناول الغداء بدأنا في تلقي تقارير عن الأداء البطيء من تطبيقنا ، وهو نظام CMS لوسائط البث المتدفق عند الطلب. في نفس الوقت تقريبا ، أرسل نظام مراقبة Cacti عاصفة ثلجية من رسائل البريد الإلكتروني. كان واحدا من أكثر التنبيهات قولة رسم بياني من iostat في انتظار.

enter image description here

أصبح الأداء متدهورًا لدرجة أن Pingdom بدأت في إرسال إشعارات "الخادم". كان الحمل الكلي معتدلاً ، ولم يكن هناك ارتفاع في حركة المرور.

بعد تسجيل الدخول إلى خوادم التطبيقات ، عملاء NFS من NAS ، لقد أكدت أن كل شيء تقريبًا كان يمر بأوقات انتظار متقطعة للغاية ولفترة طويلة في IO. وبمجرد أن أقفز على عقدة NAS الأولية نفسها ، كان التأخير نفسه واضحًا عند محاولة التنقل في نظام ملفات مجموعة المشاكل.

حان الوقت للفشل ، لقد سارت الأمور على ما يرام. في غضون 20 دقيقة تم تأكيد كل شيء ليكون النسخ الاحتياطي وتعمل على أكمل وجه.

بعد الوفاة:

بعد أي وجميع فشل النظام أقوم بإجراء تشريح لتحديد سبب الفشل. أول شيء فعلته هو إعادة ssh مرة أخرى في المربع وبدء مراجعة سجلات. كان غير متصل ، تماما. الوقت لرحلة إلى مركز البيانات. إعادة ضبط الأجهزة ، والنسخ الاحتياطي والتشغيل.

في /var/syslog لقد وجدت هذا الدخول مخيف النظر:

Nov 15 06:49:44 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_00], 6 Currently unreadable (pending) sectors
Nov 15 06:49:44 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_07], SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 171 to 170
Nov 15 06:49:45 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_10], 16 Currently unreadable (pending) sectors
Nov 15 06:49:45 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_10], 4 Offline uncorrectable sectors
Nov 15 06:49:45 umbilo smartd[2827]: Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
Nov 15 06:49:45 umbilo smartd[2827]: # 1  Short offline       Completed: read failure       90%      6576         3421766910
Nov 15 06:49:45 umbilo smartd[2827]: # 2  Short offline       Completed: read failure       90%      6087         3421766910
Nov 15 06:49:45 umbilo smartd[2827]: # 3  Short offline       Completed: read failure       10%      5901         656821791
Nov 15 06:49:45 umbilo smartd[2827]: # 4  Short offline       Completed: read failure       90%      5818         651637856
Nov 15 06:49:45 umbilo smartd[2827]:

لذلك ذهبت للتحقق من الرسوم البيانية Cacti للأقراص في الصفيف. نرى هنا ، نعم ، القرص 7 ينزلق مثلما يقول syslog. ولكننا نرى أيضًا أن القرص الثابت SMART Read Erros من القرص 8 يتقلب.

enter image description here

لا توجد رسائل حول القرص 8 في syslog. أكثر إثارة للاهتمام هو ذلك ترتبط القيم المتغيرة للقرص 8 بشكل مباشر بأوقات انتظار IO العالية!  تفسيري هو:

  • يواجه القرص 8 عطل بالأجهزة الفردية ينتج عنه أوقات تشغيل طويلة متقطعة.
  • بطريقة أو بأخرى هذا شرط الخطأ على القرص تأمين صفيف بأكمله

ربما يوجد وصف أكثر دقة أو تصحيح ، ولكن النتيجة الصافية هي أن القرص الواحد يؤثر على أداء الصفيف بأكمله.

الأسئلة)

  • كيف يمكن لقرص واحد في مجموعة أجهزة SATA RAID-10 أن يجلب المصفوفة بأكملها إلى التوقف؟
  • هل من السذاجة الاعتقاد بأن بطاقة RAID يجب أن تتعامل مع هذا؟
  • كيف يمكنني منع قرص واحد يعمل على نحو غير صحيح من التأثير على الصفيف بأكمله؟
  • هل فاتني شيء؟

99
2017-11-16 11:14


الأصل


سؤال آخر مكتوب جيدًا منك ، 1+. دائما من دواعي سروري أن أقرأ (ولكن للأسف فوق لوح لي حتى يكون لديك فكرة عن). - tombull89
daff: شراء الميزانية على هذا الإعداد حفظنا الصلبة 66 ٪ من مقارنة من HP. نضع العمر الافتراضي على هذا الصندوق ، لا يحتاج إلى أن يدوم لفترة أطول. تذكر أن هذا هو صندوق تخزين ، تكاليف plumet عام على اساس سنوى. - Stu Thompson
3Ware ليست سيئة ، في حد ذاتها. لقد تلقيت سلوكًا متحفظًا من بطاقة PERC على نظام Dell ، الذي من المفترض أن يكون جهازًا محترماً للملقم. يجب أن تحتوي بطاقة 3Ware على بطارية على متن الطائرة ، لذا لن أشعر بالسوء تجاه القرار. حسنًا ، قد تنتقد قرار SAS مقابل SATA ، ولكنك لا تفقد البيانات ومن سؤالك ، يبدو أنك تمتلك نسخًا احتياطيًا ومراقبة في مكانها ، لذا فأنت تعمل جيدًا :-) - Bart Silverstrim
StuThompson: بالطبع ، من الأرخص أن نذهب إلى الميزانية ونستخدم الأجهزة الاستهلاكية ، وغالباً ما يكون أداءها جيدًا ، خاصة عندما يكون مفهوم HA الجيد وراءها ، كما هو الحال في حالتك. ولكن هناك حالات ، كما أظهرت ، حيث لا يقوم الجهاز الاستهلاكي بقطعها عند حدوث أشياء سيئة. يمكنني أن أضمن لك أن قرص SAS واحد معيب على وحدة تحكم PERC (Dell) أو SmartArray (HP) جيدة لن يسبب لك أي مشكلة غير استدعاء الدعم للحصول على قرص بديل. لقد كان لدينا الكثير من الأقراص SAS الميتة على مر السنين في الإنتاج ولكن لم يكن لهم قط أخذ الخادم إلى أسفل. - daff
لا تدعم معظم أقراص SATA TLER (استعادة أخطاء الوقت المحدود). عندما يصادف قرص SATA نموذجي مشكلة فيزيائية يرسل "في الانتظار أثناء العمل على هذا" إلى النظام الفرعي للقرص (الذي عادة ما يفعل كما يقال). ثم يبدأ القرص في قضاء 10-30 ثانية (عادةً) على كل خطأ يعثر عليه حتى يصل إلى حد "أنا ميت". يتم تكوين أقراص SAS وأقراص SATA التي تدعم TLER بواسطة HBA الخاص بهم لإخبار النظام الفرعي للقرص "لدي مشكلة ، ما الذي يجب علي فعله؟" لذلك يمكن أن يقرر HBA الإجراء المناسب بشكل أساسي. (تبسيط للإيجاز) - Chris S


الأجوبة:


أنا أكره أن أقول "لا تستخدم SATA" في بيئات الإنتاج الحرجة ، ولكني رأيت هذا الوضع في كثير من الأحيان. لا تُقصد محركات الأقراص SATA عمومًا لدورة العمل التي تصفها ، على الرغم من أنك قد حددت المواصفات محركات الأقراص المصنفة على وجه التحديد لعملية 24 × 7 في الإعداد الخاص بك. كانت تجربتي أن محركات أقراص SATA يمكن أن تفشل بطرق غير متوقعة ، وغالباً ما تؤثر على صفيف التخزين بأكمله ، حتى عند استخدام RAID 1 + 0 ، كما فعلت. تفشل محركات الأقراص أحيانًا بطريقة يمكن أن تعطل الحافلة بالكامل. شيء واحد هو أن نلاحظ ما إذا كنت تستخدم المتوسع SAS في الإعداد الخاص بك. يمكن أن يحدث اختلاف في كيفية تأثر الأقراص المتبقية بفشل محرك الأقراص.

ولكن ربما يكون من المنطقي أن أذهب midline / nearline (7200 RPM) محركات أقراص SAS مقابل SATA. هناك قسط سعر صغير على SATA ، ولكن محركات الأقراص ستعمل / تفشل بشكل أكثر قابلية للتنبؤ. يكون تصحيح الأخطاء والإبلاغ في واجهة / بروتوكول SAS أكثر قوة من مجموعة SATA. لذلك حتى مع محركات الأقراص الميكانيكا هي نفسها، قد يكون اختلاف بروتوكول SAS يمنع الألم الذي واجهته أثناء فشل محرك الأقراص.


47
2017-11-16 11:48



كما كنت أكتب السؤال أنا فقط عرف خياري لـ SAS كان سيأتي. : / IOPS والصبيب في حدود قدرات الإعداد. لكني لم أخض تماما بعض الاختلافات الأكثر دهاء. نضع عمر 3 سنوات على هذا المربع. سوف تكون على يقين من استخدام SAS في المرة القادمة. - Stu Thompson
نعم ، إنه شيء يجب مراعاته في المرة القادمة. محركات أقراص SAS القريبة التي ذكرتها لا تؤدي بالضرورة أداء أفضل من SATA ، ولكنها أشياء مثل استرداد الأخطاء وفشل القيادة حيث SAS أكثر قابلية للإدارة. لدي نظام التخزين SATA Sun Fire x4540 48-drive مع 6 وحدات تحكم ، وتميل فشل محرك الأقراص الفردية إلى قفل الخادم. درس صعب. - ewwhite
صديق جيد لي هو في عالم تخزين الشركات. يقرأ كل هذا ويقول "هذا الرجل على حق. ما يحدث هو أن SATA مصمم للدلالة على الفشل الكامل ، وسيتطلب إعادة تشغيل الفاصل المتقطع بشكل متقطع. لا يحدث ذلك على الإطلاق لأن معظم إعدادات SATA هي محرك أقراص واحد" - Stu Thompson
StuThompson لقد قمت بإنشاء مربع جديد مع SAS القريبة؟ أنا أحب أن أقرأ عن تجاربك. لقد ساعدني سؤالك كثيرًا بالفعل ، من المرجح أن أقوم ببناء مربع مماثل في المستقبل القريب. - chrishiestand
لا ، ليس لدي. غادرت الشركة في 13 يناير. إذا كنت قد بقيت ، فقد قمنا ببناء مربع الاستبدال بالقرب من الخط. للأسف ، كان وجود NAS مرتبطًا ارتباطًا وثيقًا جدًا ببياناتي ، وتم نقل البيانات إلى شبكة SAN لمزود الخدمة. - Stu Thompson


كيف يمكن لقرص واحد اسقاط الصفيف؟ الجواب هو أنه لا يجب أن يكون كذلك ، لكن ذلك يعتمد على ما يسبب الانقطاع. إذا كان القرص سيموت بالطريقة التي تصرفت ، لا ينبغي أن يأخذها. ولكن من المحتمل أن يكون الفشل في حالة "حالة حافة" لا تستطيع وحدة التحكم التعامل معها.

هل أنت ساذج أن تعتقد أن هذا لا يجب أن يحدث؟ لا ، لا أعتقد ذلك. كان من المفترض أن يكون التعامل مع بطاقة RAID من الأجهزة مثل معظم المشكلات.

كيفية الوقاية منه؟ لا يمكنك توقع حالات حافة غريبة مثل هذا. هذا جزء من مسؤول النظام ... ولكن يمكنك العمل على إجراءات الاسترداد لمنعها من التأثير على عملك. الطريقة الوحيدة لمحاولة إصلاح هذا الآن هي إما تجربة بطاقة جهاز أخرى (وليس على الأرجح ما تريد القيام به) أو تغيير محركات الأقراص إلى محركات أقراص SAS بدلاً من SATA لمعرفة ما إذا كانت SAS أكثر قوة. يمكنك أيضًا الاتصال ببائع بطاقة RAID وإخبارهم بما حدث ورؤية ما يقولونه ؛ هم ، بعد كل شيء ، شركة من المفترض أن تتخصص في معرفة خصوصيات وعموميات محركات الأقراص المتحولة. قد يكون لديهم المزيد من المشورة الفنية حول كيفية عمل محركات الأقراص بالإضافة إلى الموثوقية ... إذا تمكنت من الوصول إلى الأشخاص المناسبين للتحدث معهم.

هل فاتك شيء ما؟ إذا كنت تريد التحقق من أن محرك الأقراص يكون به فشل في حالة الحافة ، فاسحبه من الصفيف. سوف تتحلل الصفيف ولكن لا ينبغي أن يكون لديك المزيد من التباطؤ والأخطاء الغريبة (بغض النظر عن حالة الصفيف المتدهورة). أنت تقول الآن أنه يبدو أنه يعمل بشكل جيد ، ولكن إذا كان هناك أخطاء في قراءة القرص ، فعليك استبدال محرك الأقراص في الوقت الذي تستطيع فيه ذلك. يمكن أن تحتوي محركات الأقراص ذات السعة العالية أحيانًا على أخطاء URE (أفضل سبب لعدم تشغيل RAID 5 ، ملاحظة جانبية) لا تظهر حتى يفشل محرك أقراص آخر. وإذا كنت تواجه سلوك حالة حافة من محرك الأقراص هذا ، فلا تريد ترحيل البيانات التالفة إلى محركات الأقراص الأخرى في الصفيف.


17
2017-11-16 11:58



نعم ... لقد وضعنا بالفعل سياسة استبدال جديدة مثل "إذا تذبذب أخطاء القراءة ، فقم بإزالتها". الآن بعد أن فكرت في الأمر ، حصلنا على نسبة عالية جدًا من الفشل في محركات الأقراص هذه. 4 من 22 في 18 شهرا. هممم .... - Stu Thompson
4 محركات في 18 شهرا؟ هذا هو معدل هناك ... بينما يمكن أن تكون محركات الأقراص في المواصفات ، يمكن أن يكون هناك قضية التبريد / تدفق الهواء أيضا للنظر في. أو ربما شيء غريب مع وحدة تحكم. فقط بعض الأفكار ... راقب السجلات. إذا كنت قادرًا على الاتصال بأي شخص في 3Ware مع العمل الفعلي على البطاقات وليس مجرد برنامج نصي ، فقد ترغب في تشغيلها من خلالهم ورؤية ما يقولونه. - Bart Silverstrim
بناءً على المجموعة التي تشاهد فيها الأخطاء ، يمكنك أيضًا التحقق من عدم وجود شيء غير واضح أو هامشي مع الكابلات أيضًا. إذا بدا أن الأخطاء مركزة على نفس المنفذ ، فقد يكون لديك أقل من مجموعة من حالات الفشل. - Bart Silverstrim
لقد رأيت للتو أن قيم SMART لمحرك أقراص bum هذا كانت تعمل عند درجة حرارة 31 ° C ، أو 4 درجات مئوية أعلى من جميع محركات الأقراص الأخرى. الأشياء التي تجعلك تذهب hmmmm .... - Stu Thompson
DanNeely: من أصل 14 محرك أقراص (11 بيانات ، نظام 3) كان هو الوحيد الذي لديه درجة حرارة أعلى. أنا متأكد إلى حد ما من تدفق الهواء كان جيدا ، ولكن سوف تحقق صراحة غدا. - Stu Thompson


أنا لست خبيراً ، لكنني سأقوم بأخذ لقطة برية في الظلام على أساس خبرتي مع وحدات تحكم RAID ومصفوفات التخزين.

تفشل الأقراص بعدة طرق مختلفة. لسوء الحظ ، قد تفشل الأقراص ، أو تكون معيبة ، بطرق يتأثر فيها أداءها بشكل خطير ، ولكن وحدة تحكم RAID لا ترى أنها فشلاً.

إذا فشل القرص بطريقة واضحة ، فإن أي برنامج تحكم RAID يجب أن يكون جيدًا في اكتشاف عدم الاستجابة من القرص ، وإزالته من التجمع وإطلاق أي إخطارات. ومع ذلك ، أعتقد أن ما يحدث هنا هو أن القرص يعاني من فشل غير عادي ، لسبب ما لا يؤدي إلى فشل في جانب وحدة التحكم. لذلك ، عندما تقوم وحدة التحكم بإجراء عملية تدوين للكتابة أو قراءة من القرص المصاب ، يستغرق الأمر وقتًا طويلاً للرجوع ، وبالتالي يتم تعليق تشغيل IO بالكامل وبالتالي المصفوفة. لأي سبب من الأسباب ، هذا لا يكفي لوحدة تحكم RAID للذهاب "آه ، فشل القرص" ، ربما لأن البيانات تنتهي في نهاية المطاف يعود في نهاية المطاف.

ستكون نصيحتي على الفور استبدال القرص الفاشلة. بعد ذلك ، سألقي نظرة على التهيئة الخاصة ببطاقة RAID (إنها 3ware ، واعتقدت أنها جيدة) واكتشف ما يعتبره القرص الفاشل.

ملاحظة فكرة جميلة استيراد SMART إلى الصبار.


10
2017-11-16 11:57



بمجرد أن قمت بتوصيل النقاط ، أعتقد أن أول ما فعلته هو إزالة القرص من الصفيف ؛ تمتلئ قطع الغيار الساخنة. كان ذلك في الليلة الماضية. اليوم أنا سحبت القرص و RMA'd ذلك. محرك الإساءة: geekomatic.ch/images/wd-re4-flux-read-error.jpg - Stu Thompson
أحد الأسباب التي تجعلني أعتقد أن كل نظام مهم للمهام يحتاج إلى بطاقة تعمل على تنقية البيانات. لقد رأيت هذا مرات عديدة لحساب ، لا سيما على صفائف SATA ، ومع ذلك ، حتى من المعروف أن الأقراص SAS نهاية أعلى فشل دون تحريك وحدة تحكم. - Jens Ehrich


تحتاج إلى ميزات أجهزة التخزين فئة المؤسسات. على وجه التحديد ، تحتوي محركات أقراص المؤسسة WD RE 4 على ميزتين ضروريتين لمنع هذا السلوك في صفائف RAID. التقنية الأولى المذكورة أدناه تمنع الاهتزاز التوافقي التناوبي من التسبب في التآكل غير الضروري للمكونات الميكانيكية لمحرك الأقراص الصلبة. التكنولوجيا الثانية هي التي تسببت في مشكلتك ، لا يحتوي بروتوكول SATA على هذه الميزة. للحصول على هذه الميزات ، تحتاج إلى SAS ، وإذا كنت تصر على محركات أقراص SATA ، فيمكنك شراء SAS إلى بطاقات SATA Interposer مثل LSISS9252.

تقنية RAFF محسّنة تراقب الإلكترونيات المتطورة محرك الأقراص وتصحيح الاهتزاز الخطي والدوران في الوقت الفعلي. والنتيجة هي تحسن كبير في الأداء في البيئات عالية الاهتزاز على الجيل السابق من محركات الأقراص.

ﺧﺻﺎﺋص ﺧطﺄ ﺧﺎﺻﺔ ﺑﺧﺻوﺻﺎت RAID (TLER) ﻣﺣددة ﯾﺣول ﺗﺳﺑب اﻟﻘﯾﺎدة ﻧﺎﺗﺞ ﻋن ﻋﻣﻟﯾﺎت اﺳﺗﻌﺎدة أﺧطﺎء ﻣﺣرك اﻷﻗراص اﻟﺛﺎﺑﺗﺔ اﻟﻣوﺣدة اﻟﺷﺎﺋﻌﺔ ﻓﻲ ﻣﺣرﮐﺎت أﻗراص اﻟﮐﻣﺑﯾوﺗر.

http://en.wikipedia.org/wiki/Error_recovery_control#Overview

كما يرجى الاطلاع على الرابط أدناه:

http://en.wikipedia.org/wiki/Error_recovery_control#Raid_Controllers

انظر أيضًا: مستند Digital TLER الغربي الذي يشرح عملية استرداد الأخطاء في العمق. خطأ الاسترداد منع الوقوع في WD Caviar RAID Edition Serial ATA Hard Drives:

http://www.3dfxzone.it/public/files/2579-001098.pdf


7
2018-02-25 19:34





مجرد تخمين: يتم تكوين الأقراص الصلبة لإعادة محاولة قراءة الأخطاء بدلاً من الإبلاغ عن خطأ. وبينما يكون هذا السلوك مرغوبًا في إعداد سطح المكتب ، فإنه يأتي بنتائج عكسية في RAID (حيث يجب على وحدة التحكم إعادة كتابة أي مقطع يفشل في القراءة من الأقراص الأخرى ، بحيث يمكن لمحرك الأقراص إعادة رسمه).


6
2017-11-16 13:30



ممكن جدا. إذا كان الأمر كذلك ، فإن هذا الأمر ليس بارزًا نظرًا لأن هذه المواصفات محددة بوحدات "إصدار RAID". : | - Stu Thompson
بالتأكيد لا بارد ، لأن هذا الإعداد هو تعريف "RAID طبعة" جدا - Simon Richter


طلقتي في الظلام:

  • محرك 7 هو الفشل. لديها بعض النوافذ الفاشلة حيث أنها غير متوفرة.

  • محرك 8 لديه بعض أخطاء "أخف" أيضا ؛ تصحيح عن طريق إعادة المحاولة.

  • RAID10 هو عادة "RAID0 من عدة أزواج RAID1" ، هي محرك 7 و 8 أعضاء من نفس الزوج؟

إذا كان الأمر كذلك ، فحينئذٍ يبدو أنك تضغط على حالة "لا ينبغي أن يحدث" من فشل القرصين على نفس الزوج. تقريبا الشيء الوحيد الذي يمكن أن يقتل RAID10. للأسف ، يمكن أن يحدث إذا كانت جميع محركات الأقراص الخاصة بك من نفس مجموعة الشحن ، لذلك فمن المحتمل أن يموتوا بشكل متزامن قليلاً.

أعتقد أنه خلال فشل محرك الأقراص 7 ، أعادت وحدة التحكم توجيه جميع القراءات إلى القيادة 8 ، لذلك تسبب أي خطأ في إعادة المحاولة في تأخيرات كبيرة تسببت في انهيار عدد كبير من المهام المجمدة ، مما أدى إلى انخفاض الأداء لفترة من الوقت.

كنت محظوظا أن محرك الأقراص 8 لا يبدو ميتا حتى الآن ، لذلك يجب أن تكون قادرا على إصلاح دون dataloss.

سأبدأ بتغيير كل من محركات الأقراص ، ولا تنسَ فحص الكابلات. قد يتسبب الاتصال الفضفاض في حدوث هذا ، وإذا لم يتم توجيهه بحزم ، فمن المرجح أن يحدث في محركات الأقراص المجاورة. أيضًا ، تحتوي بعض بطاقات المنافذ المتعددة على العديد من الموصلات ثنائية المنفذ ، إذا كان محرك الأقراص 7 ومحرك 8 في نفس المنفذ ، فقد يكون مصدر المشكلة.


6
2017-11-16 14:11



محرك 8 هو ما يسبب انقطاع الخدمة ، لقد قمت بالفعل بسحبه. محرك 7 ، في حين أنها فقدت بعض sektors ، كما كانت في هذه الحالة لفترة من الوقت وما زال أداء جيدا بشكل عام. لا ، إنهم يقودون في أزواج مختلفة. (لقد كان شيئًا اعتبرته ، إلى جانب احتمال عدم التوافق بين استعلامات Cacti / SNMP).  تحتوي البطاقة على 16 منفذًا ، 4 كبلات ، 4 منافذ لكل كبل في الجزء الخلفي. إذا كانت المشكلة هي البطاقة ، أو الكبل أو الخلفية ، سأعرف قريبًا بما يكفي عندما أقوم بإدخال استبدال محرك 8. - Stu Thompson


بطاقات SATA Interposer هي حل آخر.

لقد شهدت مؤخرا نفس المصير ووجدت هذا الخيط. التينور العام هو أن SAS بروتوكول هو أكثر ملاءمة ل RAID من SATA ، لأن SATA تفتقر إلى الميزات. هذا هو السبب في أن نفس محركات الأقراص الفعلية مجهزة بأجهزة تحكم SAS ، ثم تباع على شكل Sline.

البحث كذلك ، وجدت:

http://www.lsi.com/products/storagecomponents/Pages/LSISS9252.aspx

أنا أبحث في ترقية أحد مخزناتي مع مجموعة من هذه. الآن ، فرق السعر بين 3 تيرابايت SATA مقابل SAS هو 400٪ (سعر الفانيلا ، نفس الماركة ، المواصفات والمتجر ، ألمانيا). من الواضح أنه لا يمكنني معرفة ما إذا كانت هذه الإستراتيجية ناجحة ، لكن الأمر يستحق المحاولة.

التعليقات موضع ترحيب كبير :-)


3
2018-02-22 19:12



نظرية جيدة جيدا. بعد جمع بعض المعلومات ، يمكن لمصنعي علبة التخزين فقط دمج هذه اللوحات وإضافة هذه المنتجات لا يعني بالضرورة معالجة أفضل للخطأ. - korkman


لقد رأيت قرص SATA مزودًا بكسر إلكترونيات يوقف تشغيل البرنامج الثابت لـ Areca 12something بشكل قوي ، ولم تكن هناك طريقة للوصول إلى BIOS ، فما عليك سوى تشغيل الجهاز من أي وسيط حتى يتم العثور على القرص الصلب المخالف عن طريق سحب الأقراص في ملف ثنائي البحث عن الموضة.


2
2018-05-06 18:57