[ 永遠的UNIX::UNIX技術資料的寶庫 ]   GB | BIG5

首頁 > 系統管理 > 其它 > 正文
如何自動殺死UNIX僵死的進程
本文出自: http://tech.china.com/zh_cn/ 作者:曹蘇華 (2001-06-20 17:04:00)
  人保系統的計算機應用,已從單機運行方式過渡到以公司為中心的集中處理方式,各縣級支公司通過廣域網、
遠程telnet登錄到市公司主機。由網絡的原因,有些進程會突然僵死。這些僵死的進程,會消耗系統大量的資源,
直接影響機器的正常運行。為了實時地、自動地殺死這些僵死的進程,本人編寫了 Shell程序Autokill。 

  Autokill程序腳本 
  # 

  # autokill 

  # 

  ps -ef | awk ‘{ print $1,$2,$7,$8 }‘ | 

   awk ‘/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }‘ | 

   awk ‘!/root/ { print "kill -9 " $2}‘ > /tmp/k_kill 

  chmod 777 /tmp/k_kill 

  /tmp/k_kill 

  Autokill程序解釋 
  首先,用UNIX 命令 ps -ef 查看進程狀態,通過管道傳送給 awk 進行處理。 

  在第一個 awk 中,獲取進程的用戶標識(UID)、進程號(PID)、進程佔用CPU時間(Time)、進程執行命令
(CMD)四個字段的值。 

  在第二個awk 中,通過模式匹配,選取所有匹配模式的行。在awk 中,[0-9]匹配0∼9中任一個數字,[1-9]匹配
1∼9中任何一個數字,連用兩個[0-9][0-9]則匹配一個任意兩位數,因此[0-9][0-9]:[0-9][0-9]:[1-9][0-9]則匹
配 Time時間字段值,查找佔用 CPU 時間超過 10 秒的進程;如果要查找佔用 CPU 時間超過半小時的進程,則把模式
改成 [0-9][0-9]:[3-9][0-9]:[0-9][0-9]。 

  在第三個 awk 中,用 “!/root/ ”過濾掉由 Root用戶生成的進程,並進行Shell語言拼裝,並將最終結果定向到
文件 /tmp/k_kill。在 /tmp/k_kill 文件中,都是形如 kill -9 123 的Shell命令。 

  在Autokill程序的最,執行 /tmp/k_kill 殺死進程。 

  查看中間結果 
  Autokill程序採用了管道處理方式,如要查看中間結果,則可以依次斷開管道。 

  第一步執行:ps -ef 

  第二步執行:ps -ef | awk ‘{ print $1,$2,$7,$8 }‘ 

  第三步執行:ps -ef | awk ‘{ print $1,$2,$7,$8 }‘ | 

   awk ‘/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }‘ 

  第四步執行:ps -ef | awk ‘{ print $1,$2,$7,$8 }‘ | 

   awk ‘/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }‘ | 

   awk ‘!/root/ { print "kill -9 " $2}‘ > /tmp/k_kill 


  最終查看 /tmp/k_kill 文件。 

  再有,如只想自動殺死由某一用戶執行的進程(如jdc3206),只要將模式“!/root/”改成 “/jdc3206/”即可;
如只想殺死執行某一命令的進程(如 xinmu ),只要將模式“!/root/” 改成“/xinmu/”即可。 

  最用 crontab -e 增加一個 cron 作業。 

  0,30 * * * * /tmp/autokill 

  Kill命令失靈怎辦 
  經過以上步驟,系統每隔半小時執行一次/tmp/autokill。但在UNIX系統中,有些僵死的進程會莫名其妙地不能用
 Kill 命令殺死,這就需要重新引導機器,一方面清除系統垃圾,另一方面需要對資源重新分配。採用中心運行模式,
 機器不能隨意開關機,總要等到夜晚沒有用戶使用機器時,才能重新開關機。為此編寫一個Shell程序,讓機器自動
 開關機。以下是Autoreboot 程序腳本。 

  # 

  # autoreboot 

  # 

  PATH=/bin:/etc:/usr/bin:/tcb/bin:/usr/informix/bin 

  INFORMIXDIR=/usr/informix 

  INFORMIXSERVER=da3206a 

  ONCONFIG=onconfig.yca 

  export PATH INFORMIXDIR INFORMIXSERVER ONCONFIG 

  onmode -ky 

  sync 

  sync 

  reboot 

  Autoreboot程序前 5 行,是設置 Informix系統環境,命令 onmode -ky 是關閉 Informix Online數據庫,命令 
sync 是UNIX 文件系統超級塊回寫,命令 reboot 是UNIX 系統中的系統重新啟動命令。 

  用 crontab -e 命令,增加一行 cron 作業30 6 * * * /tmp/auto_boot。 

  該命令使系統每天6:30 重新開關機。如果使用的是雙機系統,則要在兩台機器上,都要進行重新開關機,時
間定成一致。
(http://www.fanqiang.com)
    進入【UNIX論壇

相關文章
 

★  樊強制作 歡迎分享  ★