ServersCheck7.0監(jiān)控網(wǎng)絡(luò)健康狀況

字號(hào):

ServersCheck是一個(gè)非常強(qiáng)力的監(jiān)控工具,讓IT管理員們可以監(jiān)控服務(wù)器以及全面的基礎(chǔ)健康狀態(tài)。
    很長(zhǎng)時(shí)間以來(lái),我一直在尋找一個(gè)產(chǎn)品,它的價(jià)格不是非常昂貴,又能夠完全以圖形,表格等提供給我非常直觀的操作狀態(tài),而且界面還要很漂亮。另外,我也希望這個(gè)產(chǎn)品能夠提供在必要時(shí)進(jìn)行深度挖掘的能力。最終,我找到了ServersCheck 7.0,我想它就是我所需要的產(chǎn)品。
    安裝和配置
    下載樂(lè)軟件后,你就可以開(kāi)始“ Start Configuration(開(kāi)始配置)”向?qū)нx項(xiàng),從而正式開(kāi)始。
    圖A ServersCheck的歡迎屏幕
    在公司里,可以使用配置向?qū)?lái)完成ServersCheck的初始安裝。在默認(rèn)狀態(tài)下,ServersCheck服務(wù)將以localsystem帳戶(hù)的上下文來(lái)運(yùn)行。雖然這種方式對(duì)本地運(yùn)行的服務(wù)來(lái)說(shuō)很好,但是該服務(wù)將無(wú)法存取其他電腦——如果該服務(wù)試圖獲取其他電腦上的任何東西,該服務(wù)就必須獲得能夠跨越其他系統(tǒng)的信任方才可以。
    在如圖B所示的屏幕上,你應(yīng)當(dāng)輸入某個(gè)賬號(hào)的用戶(hù)名和密碼,而該帳號(hào)應(yīng)當(dāng)擁有在你計(jì)劃監(jiān)控的每一個(gè)系統(tǒng)上的管理權(quán)限。
    圖B 管理權(quán)限
    在許多公司里——特別是在一些大公司里——對(duì)需要監(jiān)控的每一個(gè)基礎(chǔ)設(shè)施,常常不是一個(gè)人負(fù)責(zé)的。舉例來(lái)說(shuō),在許多公司里,管理服務(wù)器的人,一般并不是在發(fā)現(xiàn)數(shù)據(jù)中心過(guò)熱時(shí)需要報(bào)告的人選。
    通過(guò)使用團(tuán)隊(duì),(圖C),你可以讓ServersCheck在發(fā)現(xiàn)問(wèn)題時(shí)向多個(gè)人發(fā)出通知。通過(guò)建立面向不同問(wèn)題的不同團(tuán)隊(duì),你可以確保通知只發(fā)向最合適的人選,這一點(diǎn)可以保證你的SLA正常運(yùn)作。
    圖C 建立團(tuán)隊(duì)
    雖然你可以單獨(dú)的一臺(tái)一臺(tái)向ServersCheck中添加服務(wù)器,但是這么做實(shí)在相當(dāng)無(wú)趣。在絕大多數(shù)具有良好IP地址預(yù)定義策略的公司里,服務(wù)器一般都會(huì)被賦予特定范圍的地址。在ServersCheck的配置中,你可以定義一個(gè)起始和終止地址,然后ServersCheck會(huì)尋找在該地址范圍內(nèi)存在的每一臺(tái)設(shè)備。另外,ServersCheck還提供給你一個(gè)機(jī)會(huì),可以自動(dòng)為任何一個(gè)被它定位的設(shè)備建立一個(gè)“Ping規(guī)則”。一個(gè)Ping規(guī)則很簡(jiǎn)單,就是簡(jiǎn)單的定期向被監(jiān)控的設(shè)備發(fā)送Ping數(shù)據(jù)包,以確定它正常在線(xiàn)。一旦該設(shè)備無(wú)法完成Ping測(cè)試,ServersCheck就會(huì)向指定的團(tuán)隊(duì)發(fā)出警報(bào)。
    ServersCheck可以使用公司的SMTP服務(wù)器,也可以使用自帶的SMTP服務(wù)器。如圖D所示,你在配置頁(yè)所指定的信息,將決定ServersCheck是否可以使用自帶的SMTP服務(wù)器。我推薦你應(yīng)該盡自己一切可能,使用ServersCheck的內(nèi)置SMTP服務(wù)器。畢竟,如果不這么做的話(huà),萬(wàn)一公司的SMTP服務(wù)器也壞了,到時(shí)你又該怎么辦呢?又該如何通知系統(tǒng)管理員呢?
    圖D 指派SMTP服務(wù)器
    ServersCheck并不一定需要在所安裝的服務(wù)器上進(jìn)行管理。你可以使用任意網(wǎng)頁(yè)瀏覽器來(lái)訪(fǎng)問(wèn)ServersCheck服務(wù)器,然后進(jìn)行配置方面的修改。而且正如你可能所期望的那樣,ServersCheck的配置由一個(gè)用戶(hù)名和口令所保護(hù)。在配置精靈完成后,你可以添加其他用戶(hù)。
    生效
    完成了配置向?qū)е?,進(jìn)入主屏幕,你在這里可以看到ServersCheck的初始化儀表板視圖(圖E)。在本截圖中,你可以看到一個(gè)單獨(dú)的監(jiān)控服務(wù)器——本地系統(tǒng)。如果在配置向?qū)нM(jìn)行的過(guò)程中,ServersCheck定位過(guò)其他服務(wù)器的話(huà),那么那些服務(wù)器也會(huì)一并列出在這個(gè)屏幕上。
    圖E 儀表板
    注意,圖E中展示了非常豐富的信息。巨大的綠色圓形,提示了在被監(jiān)控的設(shè)備上一切都很正常,并且ServersCheck甚至還計(jì)算出了你的“當(dāng)前服務(wù)級(jí)別”。還有,ServersCheck報(bào)告了多個(gè)通斷情形,以及哪些情形是“可疑的”(橘色)。在窗口下半部,注意和被監(jiān)控設(shè)備相關(guān)聯(lián)的標(biāo)尺。這些標(biāo)尺讓你可以一目了然的了解該設(shè)備的健康狀態(tài)。
    一旦你擁有了相關(guān)設(shè)備合理數(shù)量的信息之后,你就可以開(kāi)始執(zhí)行趨勢(shì)分析了。一個(gè)趨勢(shì)分析會(huì)非常有助于計(jì)劃未來(lái)對(duì)磁盤(pán)空間的需求,確定未來(lái)在CPU性能方面會(huì)否有問(wèn)題,以及其他很多。要建立一份趨勢(shì)報(bào)告,只要選中你打算出具報(bào)告的被監(jiān)控項(xiàng)目,然后給報(bào)告取個(gè)名字,然后選好應(yīng)當(dāng)被包含在分析中的時(shí)間和日期即可。
    在圖F中的圖形展示了在我的GoodLink服務(wù)器上的CPU活動(dòng)狀態(tài)。該服務(wù)器的利用率并不算特別高,但是該圖形指出,其不規(guī)則的狀態(tài)值得研究。
    在主屏幕中,如果你點(diǎn)擊了一臺(tái)設(shè)備,ServersCheck就會(huì)提供你有關(guān)該設(shè)備的一系列信息。在如圖G所示的屏幕里,你可以看到本地系統(tǒng)CPU正運(yùn)行在1%的繁忙度,而75%的內(nèi)存空閑可用。你也可以看到,在屏幕的底部的圖形上,該信息隨著時(shí)間的變化趨勢(shì)。
    圖G 設(shè)備信息
    對(duì)于每一臺(tái)你監(jiān)控的設(shè)備,你都可以添加大量的規(guī)則,以確認(rèn)該設(shè)備的監(jiān)控情況。你可以執(zhí)行一個(gè)常見(jiàn)的Ping檢查,運(yùn)行一個(gè)Tracert以確認(rèn)被用于訪(fǎng)問(wèn)該設(shè)備的路徑,以及對(duì)該設(shè)備的特定方面進(jìn)行監(jiān)控。比方說(shuō),如果你是在運(yùn)行一個(gè)網(wǎng)頁(yè)服務(wù)器,一個(gè)Ping檢查能夠告訴你該服務(wù)器正常在線(xiàn),而絕大多數(shù)合理監(jiān)控的程序?qū)⒛軌蛟试S你查看網(wǎng)頁(yè)服務(wù)器的服務(wù),從而確認(rèn)它正常工作。但是,你怎么才能知道你的內(nèi)容頁(yè)面也在正常工作呢?
    簡(jiǎn)單!在你的網(wǎng)頁(yè)服務(wù)器上,建立一個(gè)“傻瓜”頁(yè)面,該頁(yè)面將僅用于被監(jiān)控;然后建立一條ServersCheck規(guī)則,不斷查看在訪(fǎng)問(wèn)該頁(yè)面時(shí),是否返回了特定的文本。如果該文本正常返回,就說(shuō)明你的網(wǎng)頁(yè)服務(wù)器在內(nèi)容提供方面也是一切正常的。
    多久應(yīng)當(dāng)執(zhí)行一次新檢查呢?對(duì)于某些檢查來(lái)說(shuō),你希望狀態(tài)更新非常迅速,但是對(duì)其他的檢查來(lái)說(shuō),較長(zhǎng)的時(shí)間間隔也是很合理的。要留意,不要因?yàn)樘^(guò)頻繁的執(zhí)行檢查,而導(dǎo)致對(duì)系統(tǒng)或者網(wǎng)絡(luò)造成過(guò)載。
    對(duì)我來(lái)說(shuō),我一般執(zhí)行新檢查,是選擇監(jiān)控一個(gè)特定的服務(wù)器服務(wù),以確認(rèn)不會(huì)消耗太多的CPU時(shí)間。在這個(gè)例子里,如圖H所示,該服務(wù)運(yùn)行在本地服務(wù)器上,所以信任就不再像其他情況下那么重要。記住,對(duì)于遠(yuǎn)程檢查而言,你必須對(duì)一個(gè)帳戶(hù)提供信任,且該賬戶(hù)應(yīng)當(dāng)擁有獲取指定信息的相關(guān)權(quán)限。
    在精靈的最后屏幕上,你可以指定具體授權(quán)發(fā)布警報(bào)的情形,以及該警報(bào)是如何發(fā)布的。注意,ServersCheck提供了一系列的警報(bào)選擇。我推薦你不要單純依靠電子郵件。畢竟,萬(wàn)一你的互聯(lián)網(wǎng)連接中斷了的話(huà),你讓軟件用什么方法來(lái)通知你呢?
    隨著時(shí)間的推移,你很可能會(huì)在身邊的環(huán)境里添加更多服務(wù)器,并需要將它們也加入ServersCheck。你應(yīng)當(dāng)提供設(shè)備名稱(chēng),IP地址,說(shuō)明文字,操作系統(tǒng)版本,設(shè)備類(lèi)型,以及一個(gè)可用于掃描新設(shè)備的用戶(hù)帳號(hào)以及密碼。
    注意最小服務(wù)級(jí)別入口(圖I)。這個(gè)入口是用于測(cè)量某個(gè)設(shè)備上出現(xiàn)問(wèn)題的緊急程度。舉例來(lái)說(shuō),如果你進(jìn)行了10個(gè)檢查,其中一個(gè)失敗,那么你的服務(wù)級(jí)別就是90%。如果該服務(wù)器僅有80%的服務(wù)級(jí)別,你一般不會(huì)把它認(rèn)做是“當(dāng)機(jī)”。
    通過(guò)你提供的信任,新設(shè)備被掃描完畢,并返回正確監(jiān)控的選項(xiàng)。在我的示例里,我已經(jīng)添加了一個(gè)Windows域控制器,于是Windows健康檢查就可以用了,包括了CPU監(jiān)控,內(nèi)存監(jiān)控,以及磁盤(pán)空間監(jiān)控等。你可以另外執(zhí)行TCP檢查,從而確定特定的TCP端口能繼續(xù)保持被新設(shè)備訪(fǎng)問(wèn)。最后,你可以查看特定服務(wù),以確認(rèn)它們依舊正??捎?。
    如果你的某個(gè)系統(tǒng)出了問(wèn)題,儀表板會(huì)揭示出來(lái)。在圖J中,本地系統(tǒng)的“details(細(xì)節(jié))”選項(xiàng),顯示出“Error: Query returned zero processes(錯(cuò)誤:查詢(xún)返回零個(gè)進(jìn)程)”。在這個(gè)例子里,我是試圖掃描一個(gè)不存在于該服務(wù)器上的服務(wù),但是這個(gè)例子的確可以讓你看出,讓ServersCheck找出哪里有了錯(cuò)誤是多么的簡(jiǎn)單。
    當(dāng)你為一臺(tái)設(shè)備增加檢查時(shí),它們會(huì)出現(xiàn)在該設(shè)備的“device view(設(shè)備視圖)”中。如果一臺(tái)服務(wù)器當(dāng)機(jī)了,你碰到了問(wèn)題,ServersCheck就會(huì)變成紅色,從而讓你知道這一切。注意,在圖K中,名為AIS的服務(wù)器現(xiàn)在正處于當(dāng)機(jī)狀態(tài),在窗口前面中央的位置指出了這個(gè)事實(shí)。同時(shí),餅圖也改變了,反映出設(shè)備當(dāng)機(jī)的狀態(tài)。
    底線(xiàn)
    在我的測(cè)試中,我發(fā)現(xiàn)ServersCheck非常易于使用,而且它明確提供了我所希望的視覺(jué)線(xiàn)索。通過(guò)使用ServersCheck,我們可以在我們的IT設(shè)備當(dāng)中豎起一塊大型顯示器,然后追蹤我們所有設(shè)備的狀態(tài)。