仅在尚未运行时运行 cron 作业
Posted
技术标签:
【中文标题】仅在尚未运行时运行 cron 作业【英文标题】:Run cron job only if it isn't already running 【发布时间】:2011-01-22 22:15:42 【问题描述】:我正在尝试将 cron 作业设置为我创建的守护程序的一种看门狗。如果守护程序出错并失败,我希望 cron 作业定期重新启动它......我不确定这有多大可能,但我通读了几个 cron 教程并且找不到任何可以做的事情正在寻找...
我的守护程序是从一个 shell 脚本启动的,所以我真的只是在寻找一种方法来运行一个 cron 作业,前提是该作业的上一次运行尚未运行。
I found this post,它确实为我尝试使用锁定文件所做的事情提供了解决方案,但我不确定是否有更好的方法来做到这一点......
【问题讨论】:
【参考方案1】:使用flock
。这是新的。它更好。
现在您不必自己编写代码。在此处查看更多原因:https://serverfault.com/a/82863
/usr/bin/flock -n /tmp/my.lockfile /usr/local/bin/my_script
【讨论】:
一个非常简单的解决方案 最好的解决方案,我已经用了很长时间了。 我还在这里创建了一个不错的 cron 模板要点:gist.github.com/jesslilly/315132a59f749c11b7c6setlock
、s6-setlock
、chpst
和 runlock
在它们的非阻塞模式下是替代方案,不仅在 Linux 上可用。 unix.stackexchange.com/a/475580/5132
我觉得这应该是公认的答案。如此简单!【参考方案2】:
我为自己编写的打印后台处理程序执行此操作,它只是一个 shell 脚本:
#!/bin/sh
if ps -ef | grep -v grep | grep doctype.php ; then
exit 0
else
/home/user/bin/doctype.php >> /home/user/bin/spooler.log &
#mailing program
/home/user/bin/simplemail.php "Print spooler was not running... Restarted."
exit 0
fi
它每两分钟运行一次,非常有效。如果由于某种原因进程没有运行,我会通过电子邮件向我发送特殊信息。
【讨论】:
不是一个非常安全的解决方案,但是,如果有其他进程与您在 grep 中所做的搜索相匹配怎么办? rsanden 的回答使用 pidfile 防止了这种问题。 这个***已经在别处发明了 :) 例如,serverfault.com/a/82863/108394 你可以用grep [d]octype.php
代替grep -v grep | grep doctype.php
。
请注意,如果是cron运行脚本,则不需要&
。【参考方案3】:
正如其他人所说,编写和检查 PID 文件是一个很好的解决方案。这是我的 bash 实现:
#!/bin/bash
mkdir -p "$HOME/tmp"
PIDFILE="$HOME/tmp/myprogram.pid"
if [ -e "$PIDFILE" ] && (ps -u $(whoami) -opid= |
grep -P "^\s*$(cat $PIDFILE)$" &> /dev/null); then
echo "Already running."
exit 99
fi
/path/to/myprogram > $HOME/tmp/myprogram.log &
echo $! > "$PIDFILE"
chmod 644 "$PIDFILE"
【讨论】:
+1 使用 pidfile 可能比使用 grep 搜索具有相同名称的正在运行的程序更安全。 /path/to/myprogram & > $HOME/tmp/myprogram.log & ??????你的意思是 /path/to/myprogram >> $HOME/tmp/myprogram.log & 脚本完成后文件不应该被删除吗?还是我遗漏了一些非常明显的东西? @matteo:是的,你是对的。几年前我在笔记中修复了这个问题,但忘了在这里更新。更糟糕的是,我在您的评论中也错过了它,只注意到“>
”与“>>
”。对此感到抱歉。
@Hamzahfrq:它是这样工作的:脚本首先检查PID文件是否存在(“[ -e "$PIDFILE" ]
”。如果不存在,那么它将在后台启动程序,写它的 PID 到一个文件(“echo $! > "$PIDFILE"
”),然后退出。如果 PID 文件确实存在,那么脚本将检查您自己的进程(“ps -u $(whoami) -opid=
”)并查看您是否正在运行一个相同的进程PID("grep -P "^\s*$(cat $PIDFILE)$"
")。如果你不是,那么它会像以前一样启动程序,用新的 PID 覆盖 PID 文件,然后退出。我认为没有理由修改脚本;是吗?跨度>
【参考方案4】:
令人惊讶的是,没有人提到run-one。我已经解决了我的问题。
apt-get install run-one
然后在您的 crontab 脚本之前添加 run-one
*/20 * * * * * run-one python /script/to/run/awesome.py
查看this askubuntu SE 的答案。您也可以在那里找到详细信息的链接。
【讨论】:
值得一提的是,这个工具在 Ubuntu 20 中开箱即用(也可能是之前的版本) 帮助很大【参考方案5】:不要试图通过 cron 来做。无论如何都让 cron 运行一个脚本,然后让脚本决定程序是否正在运行并在必要时启动它(注意你可以使用 Ruby 或 Python 或你最喜欢的脚本语言来执行此操作)
【讨论】:
经典的方法是读取服务启动时创建的PID文件,检查该PID的进程是否还在运行,如果没有则重启。【参考方案6】:您也可以直接在您的 crontab 中以单行方式执行此操作:
* * * * * [ `ps -ef|grep -v grep|grep <command>` -eq 0 ] && <command>
【讨论】:
不是很安全,万一还有其他的命令匹配搜索grep呢? 这也可以写成 * * * * * [ps -ef|grep [c]ommand
-eq 0 ] && [ "$(ps -ef|grep [c]ommand|wc -l)" -eq 0 ] && <command>
这太可怕了。 [ $(grep something | wc -l) -eq 0 ]
是写! grep -q something
的一种非常迂回的方式。所以你只需要ps -ef | grep '[c]ommand' || command
(另外,顺便说一句,如果你真的想计算匹配行的数量,那就是grep -c
。)【参考方案7】:
我在运行php脚本时的做法是:
crontab:
* * * * * php /path/to/php/script.php &
php代码:
<?php
if (shell_exec('ps aux | grep ' . __FILE__ . ' | wc -l') > 1)
exit('already running...');
// do stuff
此命令正在系统进程列表中搜索当前的php文件名 如果存在,则行计数器 (wc -l) 将大于 1,因为搜索命令本身包含文件名
所以如果你运行 php crons 将上面的代码添加到你的 php 代码的开头,它只会运行一次。
【讨论】:
这是我所需要的,因为所有其他解决方案都需要在客户端服务器上安装一些东西,而我无权这样做。【参考方案8】:作为 Earlz 回答的后续行动,您需要一个包装脚本,该脚本在启动时创建一个 $PID.running 文件,并在结束时删除。包装脚本调用您希望运行的脚本。包装器是必要的,以防目标脚本失败或出错,pid 文件被删除..
【讨论】:
哦,太棒了...我从没想过使用包装器...我想不出使用锁定文件的方法,因为我不能保证文件会被删除,如果守护程序出错了...包装器可以完美运行,我将尝试 jjclarkson 的解决方案,但如果不起作用,我会这样做...【参考方案9】:使用lockrun
,您无需为您的 cron 作业编写包装脚本。 http://www.unixwiz.net/tools/lockrun.html
【讨论】:
【参考方案10】:我建议使用现有的工具,例如monit,它会监控和自动重启进程。有更多信息可用here。它应该在大多数发行版中都很容易获得。
【讨论】:
除此之外的每个答案都回答了表面问题“我的 cron 作业如何确保它只运行一个实例?”当真正的问题是“我怎样才能让我的进程在重新启动时保持运行?”,而正确的答案确实是不使用 cron,而是使用像 monit 这样的进程主管。其他选项包括runit、s6,或者,如果您的发行版已经使用 systemd,则只需为需要保持活动状态的进程创建一个 systemd 服务。【参考方案11】:# one instance only (works unless your cmd has 'grep' in it)
ALREADY_RUNNING_EXIT_STATUS=0
bn=`basename $0`
proc=`ps -ef | grep -v grep | grep "$bn" | grep -v " $$ "`
[ $? -eq 0 ] &&
pid=`echo $proc | awk 'print $2'`
echo "$bn already running with pid $pid"
exit $ALREADY_RUNNING_EXIT_STATUS
更新 .. 使用羊群的更好方法:
/usr/bin/flock -n /tmp/your-app.lock /path/your-app args
【讨论】:
【参考方案12】:This one 从来没有让我失望过:
one.sh:
LFILE=/tmp/one-`echo "$@" | md5sum | cut -d\ -f1`.pid
if [ -e $LFILE ] && kill -0 `cat $LFILE`; then
exit
fi
trap "rm -f $LFILE; exit" INT TERM EXIT
echo $$ > $LFILE
$@
rm -f $LFILE
cron 作业:
* * * * * /path/to/one.sh <command>
【讨论】:
【参考方案13】:我建议以下作为对rsanden's answer 的改进(我会作为评论发布,但没有足够的声誉......):
#!/usr/bin/env bash
PIDFILE="$HOME/tmp/myprogram.pid"
if [ -e "$PIDFILE" ] && (ps -p $(cat $PIDFILE) > /dev/null); then
echo "Already running."
exit 99
fi
/path/to/myprogram
这避免了可能的错误匹配(以及 grepping 的开销),并且它抑制了输出并且仅依赖于 ps 的退出状态。
【讨论】:
您的ps
命令将匹配系统上其他用户的 PID,而不仅仅是您自己的。在ps
命令中添加“-u
”会改变退出状态的工作方式。【参考方案14】:
简单的自定义php就足够实现了。无需与 shell 脚本混淆。
假设你想运行 php /home/mypath/example.php 如果没有运行
然后使用下面的自定义 php 脚本来做同样的工作。
创建以下/home/mypath/forever.php
<?php
$cmd = $argv[1];
$grep = "ps -ef | grep '".$cmd."'";
exec($grep,$out);
if(count($out)<5)
$cmd .= ' > /dev/null 2>/dev/null &';
exec($cmd,$out);
print_r($out);
?>
然后在你的 cron 中添加以下内容
* * * * * php /home/mypath/forever.php 'php /home/mypath/example.php'
【讨论】:
【参考方案15】:文档:https://www.timkay.com/solo/
solo 是一个非常简单的脚本(10 行),它可以防止程序 一次运行多个副本。使用 cron 来制作很有用 确保在前一个作业完成之前不会运行作业。
例子
* * * * * solo -port=3801 ./job.pl blah blah
【讨论】:
【参考方案16】:如果您打算走这条路,请考虑使用 pgrep(如果可用)而不是 ps 通过 grep 管道。不过,就个人而言,我已经从表单脚本中获得了很多里程
while(1)
call script_that_must_run
sleep 5
虽然这可能会失败,但 cron 作业 通常是处理重要内容的最佳方式。只是另一种选择。
【讨论】:
这只会一遍又一遍地启动守护进程,并不能解决上述问题。以上是关于仅在尚未运行时运行 cron 作业的主要内容,如果未能解决你的问题,请参考以下文章
Azure DevOps Pipelines - 仅在上一次运行成功时运行 YAML 管道