سؤال أفضل حادث مسؤول النظام [مغلق]


أنا أبحث عن قصص مسلية من حوادث مدير النظام لديك. حذف البريد الإلكتروني الخاص بالرئيس التنفيذي ، وتنسيق القرص الصلب الخاطئ ، إلخ.

سأضيف قصتي الخاصة كإجابة.


87
2018-05-13 21:00


الأصل


أنظر أيضا serverfault.com/questions/5066 - Zoredache
هذا حقا أكثر من استطلاع ثم سؤال. ربما ينبغي تعيين هذا على ويكي المجتمع. - Zoredache
نعم ، هذا بالتأكيد يجب أن يكون ويكي مجتمع. في نية السؤال ، فإن قصتي المفضلة هي البريد الإلكتروني الذي يبلغ 500 ميل واحد - ibiblio.org/harris/500milemail.html - على الرغم من ذلك ، بالطبع ، لم يكن هذا أنا. - Mihai Limbăşan
ال 500miles فقط رائع - Hubert Kario
هذا يجب أن يسمى "أسوأ حادث مدير النظام." - Rilindo


الأجوبة:


كان لدي متعة اكتشاف الفرق بين لينكس "killall" الأمر (يقتل كل العمليات التي تتطابق مع الاسم المحدد ، مفيدة لوقف الزومبي) والأمر "killall" solaris (يقتل كل العمليات ويوقف النظام ، مفيدة لوقف خادم الإنتاج في منتصف ساعات الذروة والحصول على جميع زملائك في العمل على الضحك عليك لمدة أسبوع).


133
2018-05-13 23:20



ذهبت هناك وقمت بذلك. نحن مستعدين للقيادة القاتلة على صناديق سولاريس بعد ذلك: اسم مستعار killall = 'صدى ORLLY؟ =) - Commander Keen
هناك أيضًا اختلاف مهم في Solaris بين 'ifconfig -a4' (اعرض كل معلومات IPv4 الخاصة بالواجهات) و ifconfig -a 4 (قم بتعيين كل الواجهات إلى 0.0.0.4). - Zanchey
+1 "عفوا ، يتم تسجيل هذه الرياح في سولاريس؟" - Mark Harrison
Commander ، كنت ذاهب إلى upvote تعليقك ، ولكن هناك بالضبط 42 upvotes في هذه اللحظة بالذات ... أنا فقط لم أستطع. - Massimo
أيضا، hostname -f على Linux يطبع اسم النطاق المؤهل بالكامل على Linux. على Solaris ، فإنه يحدد اسم المضيف ل -f. - 200_success


كنت مسؤولاً عن وكيل الويب للشركة الذي كان في ذلك الوقت نتسكيب. أثناء اللعب في النماذج الإدارية (كانت واجهة على الإنترنت) كان هناك زر كبير (وأنا أقسم أنه كان أحمر) قال حذف قاعدة بيانات المستخدم. لا مشكلة ، اعتقدت. دعونا نرى ما هي الخيارات التي يعطيني إياها عندما أصبت بها. بالتأكيد سيكون هناك موجه تأكيد إذا لم تكن هناك خيارات.

نعم ، لا يوجد تأكيد. لا يوجد خيارات. لا مزيد من المستخدمين.

لذلك ، ذهب إلى السيد سولاريس سيسادمين وقال إنني في حاجة ماسة إلى استعادة من الشريط الذي أجاب ، "أنا لا أعود هذا الصندوق."

"أوه ، تعال مرة أخرى ،" رددت.

"لا أعود إلى هذا الصندوق. إنه في قائمة الأشياء التي أضيفها إلى الدوران الاحتياطي ، لكنني لم أتصل بها بعد."

"تم تشغيل هذا الخادم لمدة 8 أشهر تقريبًا!" صرخت.

هز كتفيه، رد. "آسف."


73
2018-05-14 12:26



هذا بالتأكيد قصة لجميع هؤلاء الناس الذين يشتكون من تلك المزعجة "هل أنت متأكد؟" حوارات؛) - MikeyB
أنا لست متأكدا حقا أنك يجب أن تكون الشخص الذي يصرخ في وجهه ... - Mikeage
هذا ليس حقا حادث - قمت بالضغط على زر حذف قاعدة بيانات المستخدم عن قصد ، هيا يا صاح ... - Wayne Koorts
نعم انك على حق. لم يكن الضغط على الزر مجرد حادث. في الواقع كان حذف قاعدة البيانات هو جزء الحادث. ايا كان... - squillman
يجب أن يتبع هذا الزر اثنين أو ثلاثة من مطالبات التأكيد. كيف هي ميزة مفيدة لحذف قاعدة بيانات المستخدم؟ أنا ألوم تماما مبرمج التي وضعت الزر في هناك. وحقيقة أن ديسيبل لم يكن احتياطيا. "العبقرية قد يكون لها حدودها ، لكن الغباء ليس معوقًا هكذا". (attr إلى Elbert Hubbard). بناء على افتراض أن البشر ليسوا فضوليين ، فإن القردة التي لا مبالي لها هي مجرد بناء كارثة. - Jared Updike


قبل عدة سنوات كانت الشركة التي عملت بها عميل قام بتشغيل نسخة احتياطية ليلية من NT 4.0 Server إلى محرك جاز (مثل قرص مضغوط ذو سعة عالية).

قمنا بإعداد ملف دفعي ، والذي تم تشغيله كمهمة مجدولة بين عشية وضحاها. كل صباح كانوا يجمعون القرص الليلي الأخير من محرك الأقراص ، وقبل أن يغادروا في المساء يقومون بإدخال القرص التالي في التسلسل.

على أي حال ، بدا ملف دفعي شيء من هذا القبيل (محرك الأقراص جاز كان محرك الأقراص F:) ...

@echo off
F:
deltree /y *.*
xcopy <important files> F:

على أي حال ، ليلة واحدة نسيت أن وضع القرص فيها. التغيير إلى محرك الأقراص F: فشل (لا يوجد قرص في محرك الأقراص) ، واستمر تشغيل ملف دفعي. دليل العمل الافتراضي للملف الدفعي؟ C :. المرة الأولى التي رأيت فيها روتينًا احتياطيًا هدم الخادم الذي كان النسخ الاحتياطي.

تعلمت شيئا قليلا عن sysadminning (ومعالجة الاستثناء) في ذلك اليوم.

جيم.

PS: الإصلاح؟ "deltree / y F: \ *. *".


66
2018-05-13 20:00



... علينا أن نفسر ما هي محركات الجاز؟ هل أنا حقا هذا العمر؟ - Spencer Ruport
لقد كان الشيء IOMEGA (تذكر محركات Zip؟) كان الأخ الأكبر لمحركات Zip ، وكان مثل القرص الصلب من دون رؤوس ، فقط الأطباق ، التي دخلت داخل علبة بلاستيكية مع نافذة صغيرة ، وعندما أدخلت على محرك الأقراص ، أدخل محرك الأقراص رؤوس عليه. حيث مثل 1 أو 2 جيجابايت ، غالية الثمن ، وتميل إلى ارتفاع درجة الحرارة ، لذلك لم يُنصح بترك الخراطيش داخل القارئ (وهذا ما قاله رئيس سابق في IOMEGA) - Andor
Hehe ، أنا أحب كيف يتم تفسير محرك الجاز بالمقارنة مع محرك الأقراص المضغوطة فقط كما في حالة وفاة وغير ذي صلة. - Luke
إذا كان ذلك يجعلك تشعرين بالسن ، فهناك مسؤولو نظام sysadmins لم يسبق لهم مثيل من قبل. - Joseph
اضطررت أن أشرح لكثير من المبرمجين أنه عندما تحاول إجراء عملية تغيير حالة ، ومع ذلك قد تفشل وتتركك في الحالة السابقة ، عليك أن تتحقق مما إذا كان قد نجح إذا كنت ستفعل شيئًا خطيرًا يجب أن تكون في الحالة السابقة. لماذا علي أن أشرح هذا؟ - carlito


root @ dbhost # find / -name core -exec rm -f {} \؛

لي: "لا يمكنك الدخول؟ حسنا. ما هو اسم DB؟"

Cu: "Core".

أنا: "أوه".


61
2018-05-13 18:31



ومنذ ذلك الحين ، تم إضافة استخدام الأمر "ملف" لتنظيف crontab ... :) - MikeyB
يا الهى.... - squillman
يا إلهي ... نجاح باهر. سأقوم بعمل ملاحظة ذهنية لهذا ، لذا لا أفعل ذلك أبداً. - Glenn Willen


أحب الطريقة التي يتأهل بها الجميع قصتهم "عندما كنت صغيرة / خضراء" كما لو أنهم لن يفعلوا ذلك مرة أخرى. يمكن أن تحدث الحوادث حتى أكثر الايجابيات خبرة.

أسوء لحظتي هي سيئة للغاية ما زلت أواجه خفقان في التفكير في الأمر ...

كان لدينا SAN مع بيانات الإنتاج على ذلك. حرجة للشركة. قرر "الموجه" الخاص بي توسيع قسم لتحرير بعض المساحة على القرص. يمكنك معرفة أين يتجه هذا؟ وقال إن برمجيات SAN يمكن أن تقوم بذلك بشكل مباشر ، في ساعات الإنتاج ولن يلاحظ أحد ذلك. كان يجب أن تبدأ أجراس الإنذار في الرنين ، لكنها كانت صامتة بشكل واضح. وقال إنه فعل ذلك "الكثير من الأوقات من قبل" دون أي مشاكل. ولكن هنا الشيء - حصل لي على النقر على الزر الذي قال "هل أنت متأكد؟" كما كنت جديدا على الشركة افترضت أن هذا الرجل يعرف ما كان يتحدث عنه. خطأ كبير. كان الخبر السار هو أن LUN حصلت على تمديد. الأخبار السيئة كانت ... حسناً ، عرفت أن هناك أخباراً سيئة عندما بدأت أرى أخطاء الكتابة على القرص في صندوق Windows.

أنا سعيد لأنني كنت أرتدي سروالا بني اللون.

كان علينا أن نفسر لماذا اختفت 1TB من البيانات في وقت الغداء. كان ذلك يوما سيئا حقا.

إنه مبدأ جيد بالفعل - قبل أن تفعل شيئًا لديك شكوك حوله ، تخيل أن عليك أن تشرح للإدارة إذا حدث خطأ ما. إذا كنت لا تستطيع التفكير في إجابة جيدة لشرح أفعالك ، فلا تفعل ذلك.


60
2018-05-13 18:22



+1 للفقرة الأخيرة - تقنية "الجلوس على يديك" ، واحدة دقيقة حيوية للتفكير - Andy
هناك مهارة معينة تحصل عليها بعد العمل مع الأنظمة الحية لبعض الوقت: إحساس العنكبوت لما هو خطير وما هو غير خطير. مثل الإيقاف المؤقت لثانية إضافية قبل الضغط على العودة في موجه الجذر ، أو التأكد من أن عبارة تحديث SQL تحتوي على جملة مناسبة (التي تم تشغيلها بالفعل في عدد محدد (*)). - jplindstrom
أريد نافذة منبثقة تقول شيئًا مثل "هل ترغب في طباعة سيرتك الذاتية قبل المتابعة؟" .. ولديك خيار واحد فقط: "نعم" - warren
+1 للحصول على المشورة في الفقرة الأخيرة - Jeroen Huinink
+1 ، كما سبق. أتذكر أني سمعت من صديق مسؤول أن هناك مشاكل في تقييم أدائه السنوي حول سرعته الطباعية الضعيفة ، والتي رفضها بازدراء (وصحيح) مع "أنا لا أدفع لنوع سريع. ببطء وبشكل مدروس ". - MadHatter


أزعجنا Nagios في صباح أحد الأيام عندما بدأت ساعات العمل في القول أنه لا يمكن الاتصال بخادم غير مهم. حسنًا ، تنزه إلى غرفة الخادم. إنه خادم قديم ، 1650 من Dell تم شراؤه في عام 2002 ، وكنا نعرف أن الخمسينات من القرن السادس عشر كانت تعاني من مشاكل في الأجهزة. PFY يطعن زر الطاقة. لا شيئ. قم بضربها مرة أخرى ، وأمسكها لمدة خمس ثوانٍ "لإجبار الطاقة" ... التي تتجاوز حماية الخطأ في BMC ، حيث أنه بدون DRAC لا توجد طريقة لفحص سجلات BMC دون الحاجة إلى تشغيل الهيكل.

يبدأ الجهاز POST ، ثم يموت مرة أخرى. أنا أقف فوقه وأذهب ، "أنا أشم رائحة دخان". سنقوم بسحب الخادم للخارج على قضبانه ، وإحداؤه من أحد مصادر الطاقة يشعر بالدفء ، لذا فإن PFY تسحبه وتوشك على إغلاق الصندوق للخلف. أقول ، "لا ، هذا ليس دخانًا للطاقة ، هذا دخان اللوحة الأم."

نفتح الحالة مرة أخرى ونبحث عن مصدر الرائحة المشتعلة. يتحول لفائف مغو ومكثف شيء فجر منظم الجهد على اللوحة الأم ، ورش النحاس المصهور والمكثف goop عبر كل شيء ، تقصير حفنة من الاشياء وجعل أساسا فوضى كبيرة.

أسوأ جزء بالنسبة لي هو الاعتراف بأنني كنت أدخن ما يكفي من الأجهزة للتعرف على الفرق بين رائحة اللوحة الأم المحروقة وإمدادات الطاقة المحترقة.


54
2018-05-14 14:49



معايير اختيار هذه الوظيفة تشمل: الحس السليم بالرائحة. متألق. - mlp
صديق لي من ثمل مجموعة من قضبان محرك الأقراص في القرص حتى الآن أنهم ذهبوا إلى لوحة الدائرة وتقليله. الدخان الوردي الجميل. مميزة جدا. - squillman


قبل ثلاثة أيام (على محمل الجد) تم تسجيل دخولك عن بعد إلى خادم المدرسة ، وتثبيت Service Pack 2 على خادم ملفات Windows Server 2008.

قررت جدولة عملية إعادة التشغيل اللازمة في وقت متأخر من الليل ، عندما لا يتم تسجيل المعلمين عند الانتهاء من بطاقات التقارير الخاصة بنهاية العام. لقد كتبت شيئًا مثل:

 في الساعة 23:59 "shutdown -r -t 0" 

... التي ربما تكون قد عملت بشكل جيد.

ولكن بعد ذلك خمنت نفسي. هل كانت صيغة "إيقاف التشغيل" الخاصة بي صحيحة؟ حاولت عرض مساعدة الاستخدام عن طريق الكتابة

 اغلاق / ساعة 

... وفقدت على الفور بلدي اتصال RDP. لقد أصبت بذهول جوجل لبناء الجملة. أظهر بحث سريع أن إصدار Server 2008 من إيقاف التشغيل يتضمن مفتاح التبديل / h ، والذي (كما قد تفكر) يميتة الجهاز.

بدأ المعلمون الاتصال بي في غضون دقائق للإبلاغ عن أنهم لم يعد بإمكانهم فتح أو حفظ بطاقات التقرير التي كانوا يعملون عليها. نظرًا لأنني كنت خارج الموقع وتم قفل غرفة الخادم ، كان عليّ الاتصال بمدير المدرسة مباشرةً وسرها خلال عملية إعادة تشغيل الجهاز مرة أخرى.

اليوم أحضرت كعكات محلية الصنع للجميع كشكل من أشكال الاعتذار.


47
2018-05-13 23:53



مثال مثالي لتصميم واجهة المستخدم المعيب في سطر الأوامر: ما الذي حدث لـ "مبدأ أقل عدد مفاجئ"؟ - Mei
على دوس / ويندوز أليس كذلك؟ - Jared Updike
عادة /؟ في Win ، ولكن هناك الكثير من الأدوات المساعدة التي يتم نقلها من UNIX أو مكتوبة بواسطة UNIX (بما في ذلك عدد قليل جدًا من MS) وهي - h أو / h - Richard Gadsden
... لكنك ما زلت دائما جرب ال /? أول! - warren
لهذا السبب أنا أحب لينكس. man shutdown. وأنا أعلم أنني لن يسبب مشاكل مع man! - Josh


في وظيفة سابقة ، كان لدينا نظامًا محليًا كبيرًا يقوم بتسجيل وأرشفة كل قطعة بريدية دخلت الشركة أو تركتها أو بقيت داخلها.

فجر صندوق البريد الخاص بك بأكمله؟ ليس هناك أى مشكلة! إذا كنت تبحث عن قطعة بريد أرسلها إليك شخص ما قبل أسبوع / شهر / سنة ولكن لا يمكنك تذكر من أرسلها أو ما هو الموضوع؟ ليس هناك أى مشكلة! سنقوم فقط بإعادة تسليم كل شيء بدءًا من شهر شباط إلى مجلد خاص.

في مرحلة ما ، جاءت الحاجة إلى أن يقوم الرئيس التنفيذي للشركة بمراقبة البريد الذي يتنقل بين منافس ومندوب مبيعات داخلي تحت الريبة. لذلك قمنا بإعداد نص برمجي من الركض كل ليلة وقمنا بتسليم البريد ذي الصلة من اليوم السابق إلى المدير التنفيذي. ليس هناك أى مشكلة!

بعد حوالي شهر ، انزلقت كلمة مشكلة مزدوجة زائد طارئة من مكان مرتفع. يبدو أنه بينما كان الرئيس التنفيذي يقرأ من خلال قائمة الرسائل المرسلة إلى $ OTHERCOMPANY ، صادف أنه:

To: somebody@$OTHERCOMPANY
From: CEO
Subject: CEO has read your message (subject line here)

وبطبيعة الحال ، كان الرئيس التنفيذي شخصًا مهمًا ، وكان مشغولًا جدًا في الضغط على جميع مربعات حوار "إرسال إيصال استلام" في Outlook وقام بتكوين عميل له لإرسال كل منهم فقط. كانت إحدى الرسائل التي تم التقاطها بواسطة مرشح المراقبة مجموعة من طلبات استلام القراءة. تخمين ما فعله Outlook؟ بالتأكيد التوغل مراقبة "سرية".

مهمتنا التالية: إضافة قواعد إلى عامل تصفية البريد لحظر إيصالات القراءة الصادرة من المدير التنفيذي إلى تلك الشركة. نعم ، كانت أسهل طريقة. :)


37
2018-05-13 18:35



هذا غير قانوني في بلدي رغم ذلك. على الاطلاق. - mafu
آه ، حسنا هذا ك بلد. :) في كندا ، لا بأس. - MikeyB
من غير القانوني مراقبة البريد الإلكتروني القادم إلى خوادم شركتك الخاصة أو تركها؟ في اي بلد تعيش؟ - Andrew Ensley
+1 لصحافة - Fahad Sadah


آه ، كان لي منذ حوالي 10 سنوات ، عندما كنت لا أزال أضع قدماي مبللة. كان لدي فرحة تثبيت النسخ الاحتياطية للبطارية على جميع أجهزة الكمبيوتر المبرمجين. كما أرادوا تحميل البرنامج للتحذير من انقطاع التيار الكهربائي وإيقاف بشكل صحيح.

لذا قمت بإعداده على جهاز الكمبيوتر الخاص بي لاختبار كل شيء أولاً بالطبع وتأكد من أن كل شيء قد نجح. لذا ، افصل سلك الطاقة وستظهر الرسالة على الشاشة. "الطاقة الخارجية المفقودة ، بدء إيقاف تشغيل النظام".

لذا فكرت ، يا رائع ، لقد نجحت. ولكن لسبب غريب ، لا أتذكر حتى ، فقد أرسلت هذه الرسالة كرسالة شبكة ، لذلك حصلت جميع أجهزة الكمبيوتر في الشركة على أكثر من 200 جهاز ، حيث كان هناك أكثر من 100 مستخدم يستخدمون المبرمجين.

نعم ، تحدث عن النزوات الجماعية !!

ظللت رأسي منخفضة في هذا المكان لفترة من الوقت!


36
2018-05-13 19:00



هاها ، يبدو وكأنه ما حدث لصديق لي هنا مع "صافي الإرسال" وحوالي 1300 متلقي :) - squillman
قرف. فعلت الشيء "صافي الإرسال" في الكلية أيضا. اعتقدت "كان عليهم تعطيل هذا" با دينغ! با دينغ! في جميع أنحاء المختبر ، كانت أجهزة الكمبيوتر تصل الرسالة. قررت أن أعتذر للمشرف الصافي ، وفي طريقي ، كان كل جهاز كمبيوتر مررت به الرسالة. /تنهد - Matt Simmons
نعم ، سير العار هناك! لم يخرج صديقي من كرسيه. لم يكلف نفسه عناء الإجابة على هاتفه ، إما. - squillman
هاها أحد أصدقائي أرسل كل شخص في المدرسة "ساعدونا! أنا محتجز في غرفة 114" وبالطبع بعد 60 ثانية ظهر جيش صغير من الناس لمعرفة من أرسل الرسالة - Mark Henderson♦
لقد استخدمنا هذه الميزة فعلاً لفعل الشرير المشرف في الكلية الصغرى. مسح جميع مختبرات الكمبيوتر مع رسائل AV وهمية ورسائل إيقاف تشغيل النظام التي بدت وكأنها جاءت منه. كان يشتبه بقوة أننا كنا الجناة لكنني وزميلي كان كل منهما ذريعة (لقد أرسلت أول واحد عندما كان في الفصل وأرسل الثاني عندما كنت في الفصل) وكانت أجهزة الكمبيوتر تسجيلات المختبر عام - Shial


غالباً ما أستخدم أمر "sys-unconfig" على أجهزة Solaris لإعادة تعيين خدمة اسم الجهاز ، I.P. العنوان وكلمة مرور الجذر. كنت على نظام المستخدمين وأنا سجلت الدخول إلى خادم تثبيت المبنى وبحثت عن شيء ما (كجذر) ، ثم نسيت أنني قد قمت بتسجيل الدخول إلى جهاز آخر (غير موجه "#" غير وصفي) قمت بتشغيل الأمر "sys-unconfig".

# sys-unconfig     
        WARNING

This program will unconfigure your system.  It will cause it
to revert to a "blank" system - it will not have a name or know
about other systems or networks.

This program will also halt the system.

Do you want to continue (y/n) ? y

Connection closed

#

تحولت رسالة "الاتصال مغلق" ببطء إلى حالة من الذعر ... ما الجهاز الذي قمت بتسجيل الدخول إليه عند تشغيل هذا الأمر.

أسوأ جزء من هذا لم يكن الوقت الصعب الذي منحني فيه زملائي ، لقد فعلت نفس الشيء بعد شهر.


35
2018-05-13 23:46



أوه ، الكلاسيكي ، "ما الآلة التي أنا على؟" لحظة من الذعر. لقد كنت هناك. أشعر بألمك - sysadmin1138♦
أنا أيضا. أي شخص لديه خبرة يعلم بالضبط ما تعنيه عبارة "دم بارد مثلج". - Matt Simmons
هناك سبب لادخال شل الخاص بي يتضمن دائما اسم المستخدم واسم المضيف ... - derobert
قمت في وقت ما بإعداد الأسماء المستعارة لتسجيل الدخول إلى الأجهزة المختلفة للحصول على خلفيات ملونة مختلفة حتى أتمكن من التعرف بشكل أكثر وضوحًا على الماكينة التي كنت عليها. - Zitrax
عندما أستخدم Linux على كلا الخادومين والماكينة المحلية الخاصة بي ، غالبًا ما يكون لدي مطلبًا أساسيًا مفتوحًا على الخوادم وجهاز الكمبيوتر الخاص بي ، ولدى الخوادم مطالبات باللون الأحمر للتمييز - Hubert Kario