Linux資格認證:使用Perl實現(xiàn)系統(tǒng)服務監(jiān)控和報警

字號:

一般的Web站點來說,都包括很多服務和應用,我們沒法實時知道系統(tǒng)運行是否正常,特別是晚上的時候,如果服務器宕機或應用掛掉了,都會影響業(yè)務和用戶訪問,這時候一套對系統(tǒng)監(jiān)控的錯設就必須得當。目前有很多軟件應的監(jiān)控通知和報警服務,有收費的也有免費的,大家都可以選擇。
    我們就嘗試自己來實現(xiàn)一個服務監(jiān)控和報警通知的程序,這樣能夠使用很小的代價,同樣讓我們的服務高可用性和高可靠性。
    【監(jiān)控原理】
    遠程服務
    對于遠程機器來說,我們可以有一臺監(jiān)控服務器,或者隨便找一臺比較不容宕機的服務器來作為監(jiān)控服務器,那么就能夠監(jiān)控其他的服務機上的服務了,遠程監(jiān)控是比較大家需要的方式了。一般遠程監(jiān)控就監(jiān)控服務器和端口是否開放,比如說,我們的 Web 服務 Apache 一般都會開放 80 端口,那么我們就可以通過訪問這臺服務器的 80 端口來確定 Apache 是否在正常工作,如果無法連接上,那么說明該服務就停止了。
    本地服務
    對于本機來說,監(jiān)控進程和日志文件都是可行的,一般來說,長期頻繁工作的服務,比如 Apache 都會在每次訪問后把訪問信息記錄到 access 訪問日志文件里,如果這個文件長時間沒有更新,就可以懷疑該服務已經(jīng)停止了(當然了,不排除,這段時間內(nèi)都沒有人訪問的情況)。另外對于進程來說,本機是很容易可以查看到進程情況的,對于 MySQL 等服務器來說,守護進程都是長期開放的,如果發(fā)現(xiàn)當前系統(tǒng)中沒有了 MySQL 守護進程,那么也可以確認 MySQL 服務已經(jīng)停止了。
    報警通知
    服務停止了,自然需要通知系統(tǒng)維護人員,那么一般就是通過郵件或者短信的方式,短信是的了,但是頻繁短信同樣讓維護人員很郁悶,這個叫做短信炸彈(Message Bomb),所以郵件也許是個簡單實在的方式,本地再配置上 Outlook/Foxmail 定期接收和通知方式,也比較快捷,但是晚上回家后,一般都無法收到郵件了,所以合理的方式是白天郵件通知,晚上和周末短信通知 的報警方式更合理。
    【代碼實現(xiàn)】
    具體代碼實現(xiàn)可以使用各種代碼了,C/C++、 Ruby、Python、PHP ,只要能夠訪問文件、Socket ,能夠定期執(zhí)行的語言都可以,我們下面的代碼采用 Perl 來構建,因為 Perl 是很好的系統(tǒng)管理腳本語言,任何 Unix/Linux 都缺省安裝了 Perl 引擎,能夠很方便的在任何機器上面運行,同時 Perl 的靈活性強,而且有強大的 CPAN 包庫,所以編寫代碼很方便,在系統(tǒng)管理中也是值得推薦大家使用的,當然了,很多系統(tǒng)管理工作使用 shell 腳本也許更方便。
    下面的代碼實現(xiàn)對遠程監(jiān)控、本地日志文件監(jiān)控、本地進程監(jiān)控都進行了實現(xiàn),但是只使用了遠程端口監(jiān)控的方式,因為這樣就能夠監(jiān)控多臺機器和服務了,如果只是單臺機器或者只是想監(jiān)控本地進程,可以很簡單的修改主函數(shù)來實現(xiàn)。同時通知方式主要是采用郵件通知的方式,并且函數(shù)實現(xiàn)了SMTP協(xié)議進行郵件發(fā)送(因為我發(fā)現(xiàn)Perl內(nèi)置的 Net::SMTP 在進行型驗證的時候,并不是很靠譜),當然了,在報警通知方面,完全可以改寫成發(fā)送短信或者按照時間來分別調(diào)用短信和郵件的方式。
    代碼中主要監(jiān)控了包括 Apache、MySQL、Memcache、Search(假如你有的話)等服務,可以在這個基礎上進行增刪不同的服務器監(jiān)控,只需要增加一個常量配置和修改 main 函數(shù)代碼。
    說明:以下Perl代碼在 RHEL 4 + Perl v5.8.6 環(huán)境下測試通過
    #!/usr/bin/perl
    use IO::Socket;
    use IO::File;
    use MIME::Base64;
    ##############################
    # Constant define (configure)
    ##############################
    # mail config
    use constant MAIL_ADDR => ('to'=>'webmaster@example.com', 'from'=>'webmaster@example.com');
    use constant SMTP_INFO => ('host'=>'smtp.example.com', 'user'=>'webmaster', 'password'=>'pass',
    'debug'=>1, 'bufsize'=>1024);
    # common config
    use constant MD5SUM_FILE => '/tmp/__monitor_md5sum_hash';
    use constant APACHE_LOG_PATH => '/usr/local/apache2/logs/access';
    # apache
    use constant APACHE_PORT => 80;
    use constant APACHE_SERVERS => ('web1.example.com', 'web2.example.com');
    # mysql
    use constant MYSQL_PORT => 3306;
    use constant MYSQL_SERVERS => ('db1.example.com', 'db2.example.com');
    # memcache
    use constant MEMCACHE_PORT => 11211;
    use constant MEMCACHE_SERVERS => ('cache1.example.com', 'cache2.example.com');
    # search
    use constant SEARCH_PORT => 8000;
    use constant SEARCH_SERVERS => ('search1.example.com');
    ##############################
    # Server port is alive check
    ##############################
    sub check_server_alive {
    my($server, $port) = @_;
    $sock = IO::Socket::INET->new(PeerAddr=>$server, PeerPort=>$port, Proto=>'tcp', Timeout=>3);
    if (!$sock){
    return 0;
    }
    $sock->close();
    return 1;
    }
    ##############################
    # Check process is exist
    ##############################
    sub check_process_exist {
    my $proc_name = shift;
    $line = `/bin/ps auxw | /bin/grep $proc_name | /bin/grep -v grep | /usr/bin/wc -l`;
    $line =~ s/^s+|s+$//g;
    if ($line == 0){
    return 0;
    }
    return 1;
    }
    ##############################
    # Check file md5 fingerprint
    ##############################
    sub check_file_md5sum {
    my $io, $line;
    $filename = shift;
    @arr = split(/s/, `/usr/bin/md5sum $filename`);
    $filehash = shift(@arr);
    $io = IO::File->new();
    $io->open(MD5SUM_FILE, O_RDWR);
    if (!($line = $io->getLine())){
    $io->syswrite($filehash);
    $io->close;
    return true;
    } if ($line != $filehash){
    $io->truncate(0);
    $io->syswrite($filehash);
    $io->close;
    return true;
    }
    return true;
    }
    ##############################
    # SMTP execute command
    ##############################
    sub smtp_cmd {
    my ($sock, $cmd, $blocking) = @_;
    my %smtpinfo = SMTP_INFO;
    my $buf, $bufsize = $smtpinfo{'bufsize'}, $debug=$smtpinfo{'debug'};
    $sock->syswrite($cmd);
    if ($debug == 1){
    print ">>> $cmd ";
    }
    if ($blocking == 1){
    $sock->sysread($buf, $bufsize);
    if ($debug){
    print "<<< $buf";
    }
    }
    }
    ##############################
    # Send notice mail
    ##############################
    sub send_mail {
    my ($subject, $content) = @_;
    my $sock;
    my %mailaddr = MAIL_ADDR;
    my %smtpinfo = SMTP_INFO;
    my $debug = $smtpinfo{'debug'};
    # Count date time
    ($sec, $min, $hour, $day, $mon, $year, $wday, $yday, $isdst) = localtime(time());
    $datetime = sprintf("%s-%s-%s %s:%s:%s", "20".substr($year,1,2), length($mon)==1?"0$mon":$mon, length($day)==1?"0$day":$day, length($hour)==1?"0$hour":$hour, length($min)==1?"0$min":$min, length($sec)==1?"0$sec":$sec);
    $subject .= "[$datetime]";
    # Connect to SMTP server
    $sock = IO::Socket::INET->new(PeerAddr=>$smtpinfo{'host'}, PeerPort=>25, Proto=>'tcp', Timeout=>10);
    $sock->blocking(1);
    # Send smtp command
    if ($debug == 1){
    print "<<< ". $sock->sysread($buf, $smtpinfo{'bufsize'});
    }
    smtp_cmd($sock, "HELO locahost ", 1);
    smtp_cmd($sock, "AUTH LOGIN ", 1);
    smtp_cmd($sock, encode_base64($smtpinfo{'user'}), 1);
    smtp_cmd($sock, encode_base64($smtpinfo{'password'}), 1);
    smtp_cmd($sock, "MAIL FROM: <". $mailaddr{'from'} ."> ", 1);
    smtp_cmd($sock, "RCPT TO: <". $mailaddr{'to'} ."> ", 1);
    smtp_cmd($sock, "DATA ", 1);
    smtp_cmd($sock, "From: ". $smtpinfo{'from'} ." ", 0);
    smtp_cmd($sock, "To: ". $smtpinfo{'to'} ." ", 0);
    smtp_cmd($sock, "Subject: $subject ", 0);
    smtp_cmd($sock, "$content ", 0);
    smtp_cmd($sock, " . ", 1);
    smtp_cmd($sock, "QUIT ", 0);
    $sock->close();
    return 1;
    }
    ##############################
    # Check server alive main
    ##############################
    sub monitor_main {
    # check apache
    foreach $item (APACHE_SERVERS) {
    if (!check_server_alive($item, APACHE_PORT)) {
    send_mail("$item apache server is down", "$item apache server is down. please timely restoration");
    }
    }
    # check mysql
    foreach $item (MYSQL_SERVERS) {
    if (!check_server_alive($item, MYSQL_PORT)) {
    send_mail("$item mysql server is down", "$item mysql server is down. please timely restoration");
    }
    }
    # check memcache
    foreach $item (MEMCACHE_SERVERS) {
    if (!check_server_alive($item, MEMCACHE_PORT)) {
    send_mail("$item memcache server is down", "$item memcache server is down. please timely restoration");
    }
    }
    # check search
    foreach $item (SEARCH_SERVERS) {
    if (!check_server_alive($item, SEARCH_PORT)) {
    send_mail("$item search server is down", "$item search server is down. please timely restoration");
    }
    }
    }
    ##############################
    # Main running
    ##############################
    monitor_main();