網(wǎng)絡(luò)平臺的組成有很多的東西,其最本質(zhì)的核心是直接對業(yè)務(wù)的保障。舉例來說,我們的IT管理人員始終關(guān)注的是什么呢?應(yīng)用系統(tǒng)在上面走的好不好,我們是為業(yè)務(wù)系統(tǒng)提供支撐的,我們必須關(guān)注業(yè)務(wù)系統(tǒng)的好壞,業(yè)務(wù)系統(tǒng)怎么關(guān)注呢?很多人有個誤區(qū),認為關(guān)注服務(wù)器的狀態(tài)就等于關(guān)注了整個業(yè)務(wù)運行情況。事實上,服務(wù)器的狀態(tài)只是業(yè)務(wù)運行狀態(tài)的一部分。
曾經(jīng)有一個案例,用戶遇到收費系統(tǒng)跨掉的情況,信息中心的主任當時很驚訝,為什么會跨掉?這是不可能的,系統(tǒng)有監(jiān)控系統(tǒng),跨掉會告警的。經(jīng)過我們的調(diào)查和分析,發(fā)現(xiàn)最近發(fā)生了大量ARP的行為,我們通過運維管理系統(tǒng)進行了監(jiān)視,發(fā)現(xiàn)這些ARP包都是從某個IP地址發(fā)出來的,把這個IP地址所對應(yīng)的網(wǎng)絡(luò)設(shè)備端口關(guān)掉,系統(tǒng)就好了,我們不用主動去找使用者,他上不了網(wǎng)自然會打電話過來,最終查出來就是這個IP地址的使用者導(dǎo)致了收費系統(tǒng)的癱瘓。
網(wǎng)絡(luò)位置是不能有移動的,利用仿真技術(shù),模擬員工的行為去訪問它。這樣就可以通過仿真模仿用戶的訪問來保證業(yè)務(wù)系統(tǒng)的正常運行。最后才是監(jiān)控服務(wù)器內(nèi)部的進程是不是正常,通過全面的監(jiān)控才能保證整個業(yè)務(wù)系統(tǒng)是好的。我們的服務(wù)目的是保證業(yè)務(wù)的順利進行,所以我們要進行全方位的監(jiān)控。
層次化綜合管理是大勢所趨
各個管理員都有自己的權(quán)限和區(qū)域,整個大網(wǎng)絡(luò)不可能用一套系統(tǒng)管理,一旦網(wǎng)絡(luò)規(guī)模上去了,層次化的管理是非常重要的,目的是保證有問題的時候上級可以管到下級,在物理上分平臺但是邏輯上是整體。我發(fā)現(xiàn)某一個地方的IP地址有病毒,層次化管理就是所查找的區(qū)域即使不是本地的網(wǎng)管平臺,也可以很快定位到下邊某個縣、市的交換機平臺端口上,否則我們無法實現(xiàn)綜合管理。
以低成本易用性滿足實際需求而不改變規(guī)則是首要考慮的
首先要考慮的問題是實施管理的代價。這個系統(tǒng)要花多少代價,并不是指購買產(chǎn)品多少代價,你還要考慮設(shè)備和人力的投資,這些都是非常重要的。我買了一個管理產(chǎn)品來,必須要請一個高管的人,必須要基礎(chǔ)設(shè)施改過,這也是非常大的。必須要考慮管理代價,規(guī)則的制定也是非常重要的,我上了管理系統(tǒng)必須根據(jù)管理工具把整個企業(yè)的管理思路和規(guī)則重新制定一下,這是不行的。我們遇到過這方面的情況。PC桌面管理,早在2000年的時候,可以算是一個前衛(wèi)的概念,在國內(nèi)鮮有成功案例,但有一個企業(yè)敢為天下先,部署了一套美國產(chǎn)的的桌面管理系統(tǒng),主要是進行PC行為管理和監(jiān)控。當時,是臺灣的一家公司負責(zé)實施的,施工長達兩個月,結(jié)果用了多長時間呢?兩個禮拜,原因是實在沒有辦法用了,他試圖去改管理規(guī)則和控制人的行為,監(jiān)控人家的桌面。上面的生產(chǎn)部門不愿意了,你憑什么看我的桌面和控制我的行為,我想炒股和玩游戲是正常的,最后有的人就把機器搞壞了,最后只能放棄?,F(xiàn)在的PC桌面管理用戶用的更多的是資產(chǎn)統(tǒng)計等,而不再強調(diào)控制人的行為,這不是信息部門做的事情,是企業(yè)整個規(guī)章制度制訂了,總經(jīng)理辦公室下命令了才能做,不下命令是不能做的。不要試圖改變游戲規(guī)則,否則是很難的。
減少對環(huán)境的依賴,不要對完成有太大的依賴
某個管理思路很好,但要在服務(wù)器上加一點東西,結(jié)果沒有人敢做這件事。原因很簡單,因為業(yè)務(wù)系統(tǒng)很重要,萬一出了問題說不清楚。對國內(nèi)的產(chǎn)品來說,你要用戶把一本說明書讀懂是不太可能的,興趣就是15分鐘上去看到的功能是有的,沒有看到的就不能。另外不能依賴上門服務(wù),你要養(yǎng)多少人上門呢?要提供遠程技術(shù)支持,你在操作過程中碰到問題了,不會使用了,但只要能夠上互聯(lián)網(wǎng),就可以在你的機器上操作,就可以看到了,你一年獲得一百次服務(wù)都是沒有問題的。優(yōu)勢簡單說一下,就是易用性、主動性、實用性、擴展性、便捷性。
運維管理系統(tǒng)的發(fā)展思想是應(yīng)該按照用戶的需求來考慮的
給大家講一個廣交會的案例,大約有16000個布線點,每次開會的時候有13000臺電腦接入,在03年前是無法用的,上網(wǎng)下訂單、發(fā)傳真,而03年1萬多電腦接入不能保證是否有病毒,造成了網(wǎng)絡(luò)癱瘓。每次開會傳真排隊非常長。03年的時候他們改造成線速交換機,三層架構(gòu)。04年初開廣交會,網(wǎng)絡(luò)不癱了,但是互聯(lián)網(wǎng)端口堵塞,大家還是沒有辦法上。正好,運維管理系統(tǒng)給他們提供了一個解決方案,在端口放了一個探針,只要有異常的馬上告訴用戶,通過運維管理系統(tǒng)的IP定位功能,查看問題到底出現(xiàn)在什么地方的哪個交換機的幾號端口,把那個端口關(guān)掉,然后像管理員報警,管理員再去殺毒。憑借擁有對病毒和異常訪問的屏蔽功能,廣交會最終選用了BTNM網(wǎng)絡(luò)運維管理系統(tǒng)。以前的那種加帶寬,增加硬件來擴充帶寬試圖做到防止問題的發(fā)生是不正確的,管理是預(yù)防為主,有幾千臺機器有問題在實際管理中是無法快速有效解決的,要把問題屏蔽在網(wǎng)絡(luò)之外,達到我們服務(wù)的目的。
網(wǎng)絡(luò)運維管理的那些事兒,說到底還是要從基礎(chǔ)設(shè)施抓起,俗話說高樓平地起,基礎(chǔ)設(shè)施完善的業(yè)務(wù)平臺才可能為用戶創(chuàng)造真正的價值。
曾經(jīng)有一個案例,用戶遇到收費系統(tǒng)跨掉的情況,信息中心的主任當時很驚訝,為什么會跨掉?這是不可能的,系統(tǒng)有監(jiān)控系統(tǒng),跨掉會告警的。經(jīng)過我們的調(diào)查和分析,發(fā)現(xiàn)最近發(fā)生了大量ARP的行為,我們通過運維管理系統(tǒng)進行了監(jiān)視,發(fā)現(xiàn)這些ARP包都是從某個IP地址發(fā)出來的,把這個IP地址所對應(yīng)的網(wǎng)絡(luò)設(shè)備端口關(guān)掉,系統(tǒng)就好了,我們不用主動去找使用者,他上不了網(wǎng)自然會打電話過來,最終查出來就是這個IP地址的使用者導(dǎo)致了收費系統(tǒng)的癱瘓。
網(wǎng)絡(luò)位置是不能有移動的,利用仿真技術(shù),模擬員工的行為去訪問它。這樣就可以通過仿真模仿用戶的訪問來保證業(yè)務(wù)系統(tǒng)的正常運行。最后才是監(jiān)控服務(wù)器內(nèi)部的進程是不是正常,通過全面的監(jiān)控才能保證整個業(yè)務(wù)系統(tǒng)是好的。我們的服務(wù)目的是保證業(yè)務(wù)的順利進行,所以我們要進行全方位的監(jiān)控。
層次化綜合管理是大勢所趨
各個管理員都有自己的權(quán)限和區(qū)域,整個大網(wǎng)絡(luò)不可能用一套系統(tǒng)管理,一旦網(wǎng)絡(luò)規(guī)模上去了,層次化的管理是非常重要的,目的是保證有問題的時候上級可以管到下級,在物理上分平臺但是邏輯上是整體。我發(fā)現(xiàn)某一個地方的IP地址有病毒,層次化管理就是所查找的區(qū)域即使不是本地的網(wǎng)管平臺,也可以很快定位到下邊某個縣、市的交換機平臺端口上,否則我們無法實現(xiàn)綜合管理。
以低成本易用性滿足實際需求而不改變規(guī)則是首要考慮的
首先要考慮的問題是實施管理的代價。這個系統(tǒng)要花多少代價,并不是指購買產(chǎn)品多少代價,你還要考慮設(shè)備和人力的投資,這些都是非常重要的。我買了一個管理產(chǎn)品來,必須要請一個高管的人,必須要基礎(chǔ)設(shè)施改過,這也是非常大的。必須要考慮管理代價,規(guī)則的制定也是非常重要的,我上了管理系統(tǒng)必須根據(jù)管理工具把整個企業(yè)的管理思路和規(guī)則重新制定一下,這是不行的。我們遇到過這方面的情況。PC桌面管理,早在2000年的時候,可以算是一個前衛(wèi)的概念,在國內(nèi)鮮有成功案例,但有一個企業(yè)敢為天下先,部署了一套美國產(chǎn)的的桌面管理系統(tǒng),主要是進行PC行為管理和監(jiān)控。當時,是臺灣的一家公司負責(zé)實施的,施工長達兩個月,結(jié)果用了多長時間呢?兩個禮拜,原因是實在沒有辦法用了,他試圖去改管理規(guī)則和控制人的行為,監(jiān)控人家的桌面。上面的生產(chǎn)部門不愿意了,你憑什么看我的桌面和控制我的行為,我想炒股和玩游戲是正常的,最后有的人就把機器搞壞了,最后只能放棄?,F(xiàn)在的PC桌面管理用戶用的更多的是資產(chǎn)統(tǒng)計等,而不再強調(diào)控制人的行為,這不是信息部門做的事情,是企業(yè)整個規(guī)章制度制訂了,總經(jīng)理辦公室下命令了才能做,不下命令是不能做的。不要試圖改變游戲規(guī)則,否則是很難的。
減少對環(huán)境的依賴,不要對完成有太大的依賴
某個管理思路很好,但要在服務(wù)器上加一點東西,結(jié)果沒有人敢做這件事。原因很簡單,因為業(yè)務(wù)系統(tǒng)很重要,萬一出了問題說不清楚。對國內(nèi)的產(chǎn)品來說,你要用戶把一本說明書讀懂是不太可能的,興趣就是15分鐘上去看到的功能是有的,沒有看到的就不能。另外不能依賴上門服務(wù),你要養(yǎng)多少人上門呢?要提供遠程技術(shù)支持,你在操作過程中碰到問題了,不會使用了,但只要能夠上互聯(lián)網(wǎng),就可以在你的機器上操作,就可以看到了,你一年獲得一百次服務(wù)都是沒有問題的。優(yōu)勢簡單說一下,就是易用性、主動性、實用性、擴展性、便捷性。
運維管理系統(tǒng)的發(fā)展思想是應(yīng)該按照用戶的需求來考慮的
給大家講一個廣交會的案例,大約有16000個布線點,每次開會的時候有13000臺電腦接入,在03年前是無法用的,上網(wǎng)下訂單、發(fā)傳真,而03年1萬多電腦接入不能保證是否有病毒,造成了網(wǎng)絡(luò)癱瘓。每次開會傳真排隊非常長。03年的時候他們改造成線速交換機,三層架構(gòu)。04年初開廣交會,網(wǎng)絡(luò)不癱了,但是互聯(lián)網(wǎng)端口堵塞,大家還是沒有辦法上。正好,運維管理系統(tǒng)給他們提供了一個解決方案,在端口放了一個探針,只要有異常的馬上告訴用戶,通過運維管理系統(tǒng)的IP定位功能,查看問題到底出現(xiàn)在什么地方的哪個交換機的幾號端口,把那個端口關(guān)掉,然后像管理員報警,管理員再去殺毒。憑借擁有對病毒和異常訪問的屏蔽功能,廣交會最終選用了BTNM網(wǎng)絡(luò)運維管理系統(tǒng)。以前的那種加帶寬,增加硬件來擴充帶寬試圖做到防止問題的發(fā)生是不正確的,管理是預(yù)防為主,有幾千臺機器有問題在實際管理中是無法快速有效解決的,要把問題屏蔽在網(wǎng)絡(luò)之外,達到我們服務(wù)的目的。
網(wǎng)絡(luò)運維管理的那些事兒,說到底還是要從基礎(chǔ)設(shè)施抓起,俗話說高樓平地起,基礎(chǔ)設(shè)施完善的業(yè)務(wù)平臺才可能為用戶創(chuàng)造真正的價值。