疑難排解處理程序中的首要步驟是完整地說明問題。問題說明可協助您及 IBM 技術支援中心代表,瞭解從何處開始尋找問題的原因。此步驟包括詢問您自己一些基本問題:
這些問題的答覆通常會產生良好的問題說明,然後可以指導您找到問題解決方案。
當開始說明問題時,最明顯的問題是「問題是什麼?」 這個問題看起來並不複雜;不過,您可以將其分割成數個較明確的問題,以更詳細地敘述問題。這些問題可以包括:
判斷產生問題的位置不一定容易,但這是解決問題最重要的步驟之一。在報告元件和失效元件之間存在許多技術層。網路、資料網格及伺服器只是您在調查問題時要考量的數個元件。
下列問題可協助您明確找出發生問題的位置,以隔離問題層:
如果一個層報告了問題,則該問題不一定發生在該層中。識別問題發生位置的其中一環就是瞭解它所存在的環境。請花一些時間完整的說明問題環境,包括作業系統和版本、所有對應軟體和版本以及硬體資訊。請確認您在其中執行的環境是受支援的配置;許多問題發生的原因可以追溯至不相容的軟體版本,它們並不預期搭配在一起執行,或尚未搭配在一起進行完整的測試。
建立導致失敗之事件的詳細時間表,特別是那種只發生一次的案例。藉由逆向作業,您可以最輕鬆地產生時間表:從報告錯誤時開始(盡可能精確,甚至精確到毫秒),並藉由所有可用的日誌及資訊進行逆向作業。 通常,只需要查看您在診斷日誌中找到的第一個可疑事件即可。
若要建立事件的詳細時間表,請回答以下問題:
回應這些問題可以讓您建構出參照系列項目,以針對其中的項目調查問題。
瞭解發生問題當時,有哪些系統與應用程式正在執行,是疑難排解中很重要的一環。這些與環境相關的問題可協助您確定問題的主要原因:
回答這些類型的問題可協助說明發生問題的環境,並關聯所有相依關係。 請記住,不能只因為許多問題在大約相同的時間發生,就表示這些問題都有關聯。
從疑難排解的角度而言,理想的問題是可以重新產生的問題。通常,當問題可以重新產生時,您可以隨意使用更大的工具集或程序集來協助您進行調查。因此,可以重新產生的問題通常較容易除錯和解決。
不過,可以重新產生的問題有個缺點:如果問題會造成重大商業衝擊,您不會想要讓它再發生。 如有可能,請在測試或開發環境中重建問題,這樣通常可讓您在調查期間具有更多的彈性和控制權。