如何增強(qiáng)網(wǎng)絡(luò)排錯(cuò)技能
我喜歡將排除網(wǎng)絡(luò)故障的過程視為一個(gè)漏斗形的過程,在面積的頂部,是故障的癥狀,接下來是大量的故障原因和相關(guān)因素,在底部是排除該故障的特定手段。排除網(wǎng)絡(luò)故障基本上是一個(gè)過濾信息和匹配癥狀的過程。以下是少費(fèi)功夫排除網(wǎng)絡(luò)故障時(shí)需要注意的幾點(diǎn)。
保持開放的頭腦
我們每個(gè)人都有適合自己的網(wǎng)絡(luò)領(lǐng)域,如果喜歡硬件,你可 能會(huì)花很多時(shí)間在網(wǎng)絡(luò)連線和交換機(jī)上,但如果只是喜歡軟件,你可能在兩個(gè)小時(shí)焦頭爛額地機(jī)器指令檢查之后,才發(fā)現(xiàn)問題原來是網(wǎng)絡(luò)連線松了。這可能是一個(gè)漫長(zhǎng)的過程,要試著將導(dǎo)致故障的原因定位更廣一點(diǎn),要確定你不會(huì)忽視任何一個(gè)故障原因。
查明出故障的時(shí)間
多數(shù)情況下,網(wǎng)絡(luò)從正常到不正常有一小段時(shí)間。弄清這個(gè)時(shí)間,或者查明故障發(fā)生的時(shí)間,能讓你排除和故障原因無關(guān)的癥狀,這對(duì)重新明確有關(guān)的癥狀是很重要的。
使用書寫板
對(duì)排除網(wǎng)絡(luò)故障來說一塊大的白色書寫板非常有用。開始排除故障時(shí),你可以將所有故障和癥狀寫在上面,縮小問題范圍之后可以刪掉或略過那些無用信息,這樣擺在你面前的就只有與故障有關(guān)的因素了。書寫板也有助于向同事們闡明當(dāng)前的問題。
最近,我在白色書寫板上寫道:我們不能正常ping通外部網(wǎng)。看到這個(gè)通告后,一位同事告訴我,我們的DNS服務(wù)器工作不正常。在書寫板上解決問題便于交流,并能使所有用戶都清楚問題。這種情況下,一旦故障正確定位,則問題也就解決了。
首先檢查硬件
開始排除故障的第一步是詳細(xì)分析故障癥狀,決定它主要是由軟件故障還是由硬件故障造成的。由于以下原因,大部分人都會(huì)忽略首先檢查硬件這一重要規(guī)則:
硬件看起來太簡(jiǎn)單
硬件通常在我們不愿接觸的地方。
用機(jī)器指令檢測(cè)故障比伸手、曲膝或者爬上爬下擺弄機(jī)器更輕松。
修復(fù)硬件故障所需成本更高,花費(fèi)時(shí)間更長(zhǎng),因此你可能將其視為最后的手段。
既然硬件故障最易排除,所以應(yīng)該首先檢查它,解決網(wǎng)絡(luò)故障要遵循以下步驟:
檢查網(wǎng)線及網(wǎng)線與機(jī)器的連接。
運(yùn)行硬件測(cè)試分析工具,察看它們是否存在細(xì)微錯(cuò)誤。
如果可以的話,重新啟動(dòng)服務(wù)器,路由器或硬件設(shè)備。這一方法排除了無數(shù)故障,從鍵盤鎖定引發(fā)的故障到路由故障。
在另一臺(tái)機(jī)器或另一個(gè)測(cè)試網(wǎng)絡(luò)上重現(xiàn)問題從而排除故障。
排除軟件故障
如果所有硬件都工作正常,那就應(yīng)該開始研究軟件故障了。談到網(wǎng)絡(luò)時(shí),與此相關(guān)的軟件故障通常有三類。下面一一列出。
我喜歡將排除網(wǎng)絡(luò)故障的過程視為一個(gè)漏斗形的過程,在面積的頂部,是故障的癥狀,接下來是大量的故障原因和相關(guān)因素,在底部是排除該故障的特定手段。排除網(wǎng)絡(luò)故障基本上是一個(gè)過濾信息和匹配癥狀的過程。以下是少費(fèi)功夫排除網(wǎng)絡(luò)故障時(shí)需要注意的幾點(diǎn)。
保持開放的頭腦
我們每個(gè)人都有適合自己的網(wǎng)絡(luò)領(lǐng)域,如果喜歡硬件,你可 能會(huì)花很多時(shí)間在網(wǎng)絡(luò)連線和交換機(jī)上,但如果只是喜歡軟件,你可能在兩個(gè)小時(shí)焦頭爛額地機(jī)器指令檢查之后,才發(fā)現(xiàn)問題原來是網(wǎng)絡(luò)連線松了。這可能是一個(gè)漫長(zhǎng)的過程,要試著將導(dǎo)致故障的原因定位更廣一點(diǎn),要確定你不會(huì)忽視任何一個(gè)故障原因。
查明出故障的時(shí)間
多數(shù)情況下,網(wǎng)絡(luò)從正常到不正常有一小段時(shí)間。弄清這個(gè)時(shí)間,或者查明故障發(fā)生的時(shí)間,能讓你排除和故障原因無關(guān)的癥狀,這對(duì)重新明確有關(guān)的癥狀是很重要的。
使用書寫板
對(duì)排除網(wǎng)絡(luò)故障來說一塊大的白色書寫板非常有用。開始排除故障時(shí),你可以將所有故障和癥狀寫在上面,縮小問題范圍之后可以刪掉或略過那些無用信息,這樣擺在你面前的就只有與故障有關(guān)的因素了。書寫板也有助于向同事們闡明當(dāng)前的問題。
最近,我在白色書寫板上寫道:我們不能正常ping通外部網(wǎng)。看到這個(gè)通告后,一位同事告訴我,我們的DNS服務(wù)器工作不正常。在書寫板上解決問題便于交流,并能使所有用戶都清楚問題。這種情況下,一旦故障正確定位,則問題也就解決了。
首先檢查硬件
開始排除故障的第一步是詳細(xì)分析故障癥狀,決定它主要是由軟件故障還是由硬件故障造成的。由于以下原因,大部分人都會(huì)忽略首先檢查硬件這一重要規(guī)則:
硬件看起來太簡(jiǎn)單
硬件通常在我們不愿接觸的地方。
用機(jī)器指令檢測(cè)故障比伸手、曲膝或者爬上爬下擺弄機(jī)器更輕松。
修復(fù)硬件故障所需成本更高,花費(fèi)時(shí)間更長(zhǎng),因此你可能將其視為最后的手段。
既然硬件故障最易排除,所以應(yīng)該首先檢查它,解決網(wǎng)絡(luò)故障要遵循以下步驟:
檢查網(wǎng)線及網(wǎng)線與機(jī)器的連接。
運(yùn)行硬件測(cè)試分析工具,察看它們是否存在細(xì)微錯(cuò)誤。
如果可以的話,重新啟動(dòng)服務(wù)器,路由器或硬件設(shè)備。這一方法排除了無數(shù)故障,從鍵盤鎖定引發(fā)的故障到路由故障。
在另一臺(tái)機(jī)器或另一個(gè)測(cè)試網(wǎng)絡(luò)上重現(xiàn)問題從而排除故障。
排除軟件故障
如果所有硬件都工作正常,那就應(yīng)該開始研究軟件故障了。談到網(wǎng)絡(luò)時(shí),與此相關(guān)的軟件故障通常有三類。下面一一列出。