运维需要对一些关键的服务进程进行守护,例如tomcat进程,mysql之类,这种进程没有自己的守护进程,而我们又不可能去改它们的源代码。
为此我用perl写了一个守护进程,根据传入的命令,启动要守护的进程,若是进程挂了,则重新启动进程。
即使子进程被杀死了,也能自动起来,但是程序有点缺陷:
1. 这个守护进程只是针对那些永远不退出的进程有效。 2. 若是杀死了守护进程,被守护的进程有可能不会退出,还要手动去杀死被守护进程,才能退出。因为我们找到杀死整个进程树的方法,
- #!/usr/bin/perl
-
- ####################################################
-
- #功能:实现把传入的命令执行,并守护,当命令被杀死了,能够重新启动命令
-
- #系统环境:centos 5
-
- #编译环境:perl, v5.8.8 built for i386-linux-thread-multi
-
- #执行:
-
- #echo "i=0;" > /root/w.sh
-
- #echo 'while(true)' >> /root/w.sh
-
- #echo "do" >> /root/w.sh
-
- #echo ' echo $i;let i=$i+1;sleep 1;' >> /root/w.sh
-
- #echo 'done' >> /root/w.sh
-
- #perl deamon.pl "sh /root/w.sh >> /root/w.log"
-
- #
-
- ####################################################
-
- use POSIX ();
-
- use Carp;
-
-
-
- our $logfile="/tmp/deamon.log"; #输出日志
-
- our $child_pid; #记录子进程的id,以便父进程去杀死子进程
-
- our $parent_pid;#记录父进程的id,以便区分父子进程
-
- our $maxloop=10000; #放置大量产生子进程
-
- our $loop=0;
-
- our $CMD=$ARGV[0];
-
- if(!$CMD){
-
- die("please input a cmd\n");
-
- }
-
-
-
- #杀死父子进程
-
- sub kill_pid{
-
- logs("catch quit signal\n");
-
- if($parent_pid){#判断是不是父进程
-
- #父进程杀死所有的子进程
-
- logs("parent kill child\n");
-
- kill(15,$child_pid);
-
- kill(15,-$$);
-
- logs("parent quit\n");
-
- exit 0;
-
- }else{
-
- #子进程退出
-
- logs("child quit\n");
-
- exit 0;
-
- }
-
- };
-
- $SIG{ 'INT'} = 'kill_pid'; # 中断退出
-
- $SIG{ 'TERM'} = 'kill_pid';
-
- $SIG{CHLD} = 'IGNORE'; # 忽略 SIGCHLD 信号,系统会自动回收结束的子进程
-
- #deamon方式
-
- daemonize();
-
- #启动服务
-
- logs("START deamon '$CMD'\n");
-
-
-
- while(1){
-
- #防止输入的命令不是服务性命令,例如ls,执行很短时间的命令,或者后台执行的命令,这样最多会产生$maxloop个进程,不会把系统崩溃
-
- $loop++;
-
- if($loop>$maxloop){
-
- exit 0;
-
- }
-
-
-
- #产生子进程
-
- $child_pid=fork();
-
- if (not defined $child_pid) {
-
- print "cannot fork\n";
-
- exit 0;
-
- }
-
- if($child_pid)
-
- { # child >; 0, so we're the parent
-
- $parent_pid=1;
-
- logs("launching '$CMD'\n");
-
- setpgrp(0, 0); #成为进程首领
-
- wait();#等待子进程结束,若是结束则继续循环生成子进程
-
- }else{
-
- $parent_pid=0;
-
- system($CMD);# child handles,子进程应该也是死循环的
-
- logs("system return : $r ");
-
- #执行命令非正常退出
-
- if ($? == -1) {
-
- logs("failed to execute: $! ");
-
- }
-
- elsif ($? & 127) {
-
- logs("child died with signal",($? & 127),",",($? & 128) ? 'with' : 'without',' coredump');
-
- }
-
- else {
-
- logs("child exited with value ",$? >> 8);
-
- #若是$CMD正常退出的话,表示$CMD不是服务性程序
-
- logs("cannot deamon on '$CMD'");
-
- }
-
- #子进程退出
-
- exit 0;
-
- }
-
- }
-
-
-
- #记录日志
-
- sub logs{
-
- open(LOGFILE,">>$logfile") or die("cannot open $logfile");
-
- my($sec,$min,$hour,$mday,$mon,$year)=localtime();
-
- print LOGFILE sprintf("%04d-%02d-%02d %02d:%02d:%02d ",($year< 2000?($year+1900):$year),($mon+1),$mday,$hour,$min,$sec);
-
- for my $msg (@_){
-
- print LOGFILE $msg;
-
- }
-
- print LOGFILE "\n";
-
- close(LOGFILE);
-
- }
-
-
-
- #deamon方式
-
- sub daemonize {
-
-
-
- # 使当前进程对自己所写文件拥有完全控制权,避免继承的umask()设置带来困挠。这一步可选
-
- umask(0);
-
- # 关闭0、1、2三个句柄。许多daemon程序用sysconf()获取_SC_OPEN_MAX,并在一个偱环中关闭所有可能打开的文件句柄。目的在于释放不必要的系统资源,它们是有限资源。
-
- close STDIN;
-
- close STDOUT;
-
- close STDERR;
-
- chdir '/' or croak "Can't chdir to /: $!"; #减少管理员卸载(unmount)文件系统时可能遇上的麻烦。这一步可选,也可chdir()到其它目录。
-
- open STDIN, '/dev/null' or croak "Can't read /dev/null: $!";
-
- open STDOUT, '>/dev/null' or croak "Can't write to /dev/null: $!";
-
- open STDERR, '>&STDOUT' or croak "Can't dup stdout: $!";
-
- defined(my $pid = fork) or croak "Can't fork: $!";
-
- exit if $pid;
-
- #创建新的session和process group,成为其leader,并脱离控制终端。
-
- setsid or croak "Can't start a new session: $!";
-
- $SIG{CHLD} = 'IGNORE
本文转自yifangyou 51CTO博客,原文链接:http://blog.51cto.com/yifangyou/607099,如需转载请自行联系原作者