SIGCHLD信號被堵塞,而且信號不被緩存,這樣就會導致信號丟失,這樣會產生很多的僵屍進程。。解決辦法是父進程用waitpid來等待子進程信
號。。。
wait
1.1 簡介
wait函數所需頭文件:
#include <sys/types.h>
#include <sys/wait.h>
wait函數原型:
pid_t wait(int *status);
進程壹旦調用了
wait,就立即阻塞自己,由wait自動分析是否當前進程的某個子進程已經退出,如果讓它找到了這樣壹個已經變成僵屍的子進程,wait就會收集這個子
進程的信息,並把它徹底銷毀後返回;如果沒有找到這樣壹個子進程,wait就會壹直阻塞在這裏,直到有壹個出現為止。
參數status用來保存 被收集進程退出時的壹些狀態,它是壹個指向int類型的指針。但如果我們對這個子進程是如何死掉的毫不在意,只想把這個僵屍進程消滅掉,(事實上絕大多數 情況下,我們都會這樣想),我們就可以設定這個參數為NULL,就象下面這樣:
pid = wait(NULL);
如果成 功,wait會返回被收集的子進程的進程ID,如果調用進程沒有子進程,調用就會失敗,此時wait返回-1,同時errno被置為ECHILD。
1.2 實戰
下面就讓我們用壹個例子來實戰應用壹下wait調用,程序中用到了系統調用fork,如果妳對此不大熟悉或已經忘記了,請參考fork函數的使用。
/* wait1.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdlib.h>
int main()
{
pid_t pc,pr;
pc = fork();
if (pc < 0) /* 如果出錯 */
printf("error ocurred!\n");
else if (pc == 0) /* 如果是子進程 */
{
printf("This is child process with pid of %d\n",getpid());
sleep(10); /* 睡眠10秒鐘 */
}
else /* 如果是父進程 */
{
pr = wait(NULL); /* 在這裏等待 */
printf("I catched a child process with pid of %d\n"),pr);
exit(0);
}
}
編譯並運行:
# cc wait1.c -o wait1
# ./wait1
#This is child process with pid of 1508I
#catched a child process with pid of 1508
可以明顯註意到,在第2行結果打印出來前有10秒鐘的等待時間,這就是我們設定的讓子進程睡眠的時間,只有子進程從睡眠中蘇醒過來,它才能正常退出,也就
才能被父進程捕捉到。其實這裏我們不管設定子進程睡眠的時間有多長,父進程都會壹直等待下去,讀者如果有興趣的話,可以試著自己修改壹下這個數值,看看會
出現怎樣的結果。
1.3 參數status
如果參數status的值不是NULL,wait就會把子進程退出時的狀態取出並存入其中,這是壹個整數值(int),指出了子進程是正常退出
還是被非正常結束的(壹個進程也可以被其他進程用信號結束),以及正常結束時的返回值,或被哪壹個信號結束的等信息。由於這些信息被存放在壹個整數的不同
二進制位中,所以用常規的方法讀取會非常麻煩,人們就設計了壹套專門的宏(macro)來完成這項工作,下面我們來學習壹下其 中最常用的兩個:
1,WIFEXITED(status) 這個宏用來指出子進程是否為正常退出的,如果是,它會返回壹個非零值。
(請註意,雖然名字壹樣,這裏的參數status並不同於wait唯壹的參數--指向整數的指針status,而是那個指針所指向的整數,切記不要搞混
了。)
2,WEXITSTATUS(status)
當WIFEXITED返回非零值時,我們可以用這個宏來提取子進程的返回值,如果子進程調用exit(5)退出,WEXITSTATUS(status)
就會返回5;如果子進程調用exit(7),WEXITSTATUS(status)就會返回7。請註意,如果進程不是正常退出的,也就是
說,WIFEXITED返回0,這個值就毫無意義。
下面通過例子來實戰壹下我們剛剛學到的內容:
/* wait2.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
int main()
{
int status;
pid_t pc,pr;
pc = fork(); /*調用fork函數*/
if (pc < 0) /* 如果出錯 */
printf("error ocurred!\n");
else if (pc == 0) /* 子進程 */
{
printf("This is child process with pid of %d.\n",getpid());
exit(3); /* 子進程返回3 */
}
else /* 父進程 */
{
pr = wait(&status);
if (WIFEXITED(status))
{
printf("the child process %d exit normally.\n",pr);
printf("the return code is %d.\n",WEXITSTATUS(status));
}
else /* 如果WIFEXITED返回零 */
printf("the child process %d exit abnormally.\n",pr);
}
}
編譯並運行:
# cc wait2.c -o wait2
# ./wait2
#This is child process with pid of 1538.
#the child process 1538 exit normally.
#the return code is 3.
#the child process 1538 exit abnormally.
父進程準確捕捉到了子進程的返回值3,並把它打印了出來。
當然,處理進程退出狀態的宏並不止這兩個,但它們當中的絕大部分在平時的編程中很少用到,就也不在這裏浪費篇幅介紹了,有興趣的讀者可 以自己參閱Linux man pages去了解它們的用法。
waitpid
2.1 簡介
waitpid系統調用在Linux函數庫中的所需頭文件:
#include <sys/types.h>
#include <sys/wait.h>
waitpid系統調用在Linux函數庫中的原型是:
pid_t waitpid(pid_t pid,int *status,int options);
從本質上講,系統調用waitpid和 wait的作用是完全相同的,但waitpid多出了兩個可由用戶控制的參數pid和options,從而為我們編程提供了另壹種更靈活的方式。下面我們 就來詳細介紹壹下這兩個參數:
pid
從參數的名字pid和類型 pid_t中就可以看出,這裏需要的是壹個進程ID。但當pid取不同的值時,在這裏有不同的意義。
pid>0時,等待進程ID等於 pid的子進程,不管其它已經有多少子進程運行結束退出了,只要指定的子進程還沒有結束,waitpid就會壹直等下去。
pid=-1時,等待任何壹個子進程退出,沒有任何限制,此時waitpid和wait的作用壹模壹樣。
pid=0時,等待同壹個進程組中的任何子進程,如果子進程已經加入了別的進程組,waitpid不會對它做任何理睬。
pid<-1時,等待壹個指定進程組中的任何子進程,這個進程組的ID等於pid的絕對值。
options
options提供了壹些額外的選項來控制waitpid,目前在Linux中只支持WNOHANG和WUNTRACED兩個選項,這是兩個常數,可以用"|"運算符把它們連接起來使用,比如:
ret=waitpid(-1,NULL,WNOHANG | WUNTRACED);
如果我們不想使用它們,也可以把options設為0,如:
ret=waitpid(-1,NULL,0);
如果使用了 WNOHANG參數調用waitpid,如果沒有任何已終止的進程,它也會立即返回,不會像wait那樣永遠等下去。
而WUNTRACED參數,如果子進程進入暫停執行則馬上返回,但終止狀態不予理睬。
看到這裏,聰明的讀者可能已經看出端倪了--wait不就是經過包裝的waitpid嗎?沒錯,察看<內核源碼目錄>/include/unistd.h文件349-352行就會發現以下程序段:
static inline pid_t wait(int * wait_stat){return waitpid(-1,wait_stat,0);}
2.2 返回值和錯誤
waitpid的返回值比wait稍微復雜壹些,壹***有3種情況:
當正常返回的時候,waitpid返回收集到的子進程的進程ID;
如果設置了選項WNOHANG,而調用中waitpid發現沒有已退出的子進程可收集,則返回0;
如果調用中出錯,則返回-1,這時errno會被設置成相應的值以指示錯誤所在;
當pid所指示的子進程不存在,或此進程存在,但不是調用進程的子進程,waitpid就會出錯返回,這時errno被設置為ECHILD;
/* waitpid.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
int main()
{
pid_t pc, pr;
pc = fork();
if (pc < 0) /* 如果fork出錯 */
printf("Error occured on forking.\n");
else if (pc == 0) /* 如果是子進程 */
{
sleep(10); /* 睡眠10秒 */
exit(0);
}
else /* 如果是父進程 */
do
{
pr = waitpid(pc, NULL, WNOHANG); /* 使用了WNOHANG參數,waitpid不會在這裏等待 */
if (pr == 0) /* 如果沒有收集到子進程 */
{
printf("No child exited\n");
sleep(1);
}
}
while (pr == 0); /* 沒有收集到子進程,就回去繼續嘗試 */
if (pr == pc)
printf("successfully get child %d\n", pr);
else
printf("some error occured\n");
}
編譯並運行:
#gcc waitpid.c -o waitpid
#./waitpid
#No child exited
#No child exited
#No child exited
#No child exited
#No child exited
#No child exited
#No child exited
#No child exited
#No child exited
#No child exited
#successfully get child 1526
父進程經過10次失敗的嘗試之 後,終於收集到了退出的子進程。
因為這只是壹個例子程序,不便寫得太復雜,所以我們就讓父進程和子進程分別睡眠了10秒鐘和1秒鐘,代表它們分 別作了10秒鐘和1秒鐘的工作。父子進程都有工作要做,父進程利用工作的簡短間歇察看子進程的是否退出,如退出就收集它。