利用Crontab命名完成定时任务

crontab是干啥的

通过crontab命名,我们可以在固定的时间间隔执行指定的系统命名或者shell script脚本。时间间隔的单位分别是分、小时、日、月、周及以上任意组合,想定时跑啥就干啥+

crontab怎么用

1.命名格式

1
2
crontab [-u user] file
crontab [-u user] [ -e | -l | -r ]

2.命令参数

  • -u : 设定某个用户的crontab服务
  • file : 表示命令文件,crontab会执行这个命名文件,如果没有文件,则接受标准输入(键盘)上键入的命令,并将它们载入crontab
  • -e : 编辑crontab文件内容
  • -l : 显示crontab文件内容
  • -r : 从/var/spool/cron目录中删除某个用户的crontab文件,如果不指定用户,则默认删除当前用户的crontab文件。
  • -i : 在删除用户的crontab文件时给确认提示

3.文件格式

分 时 日 月 星期 要运行的命令

  • 第一列:分钟0-59
  • 第二列:小时0-23(0表示子夜)
  • 第3列:日1~31
  • 第4列:月1~12
  • 第5列:星期0~7(0和7表示星期天)
  • 第六列:要运行的命令

常用方法

编辑-e,显示-l,新建删除一般用不着,需要用的时候看~

使用实例

1.每分钟执行一个命令
1
* * * * * myCommand
2.每小时的第3和第15分钟执行
1
3,15 * * * * myCommand
3.在上午8点到11点的第3和第15分钟执行
1
3,15 8-11 * * * myCommand
4.每天18 : 00至23 : 00之间每隔30分钟执行我的脚本
1
*/30 18-23 * * * cd /home/xxx;sh xxx.sh

crontab的坑

环境变量

有时候我们使用crontab去执行一个定时任务,发现在shell里面手动执行是没有问题的,但是无法自动执行。导致这种问题的原因一般是crontab文件中没有配置环境变量造成的。

在crontab文件中定义多个调度任务时,需要特别注环境变量的设置,因为我们手动执行某个任务时,是在当前shell环境下进行的,程序当然能找到环境变量,而系统自动执行任务调度时,是不会加载任何环境变量的,因此,就需要在crontab文件中指定任务运行所需的所有环境变量,这样,系统执行任务调度时就没有问题了

不要假定cron知道所需要的特殊环境,它其实并不知道,我们使用的时候,需要注意以下三点:

  1. 脚本执行中文件路径要写全局路径
  2. 脚本执行要用到java或其他环境变量时,通过source命令引入环境变量 — 这个还没用过
  3. 当手动执行脚本OK,但是crontab死活不执行时,很可能是环境变量惹的祸
    1
    2
    3
    #!/usr/bin/env bash
    export JAVA_HOME='/usr/java/xxx'
    export HADOOP_HOME='/home/maintain/hadoop/xxxx'

第三点真的是踩的陨石巨坑!!!

清理邮件日志

每条任务调度执行完毕,系统都会将任务输出信息通过电子邮件的形式发送给当前系统用户,这样日积月累,日志信息会非常大,可能会影响系统的正常运行,因此对每条任务进行重定向处理很重要,比如可以这么设置,忽略日志输出:

1
* * * * * date > /logs/time.log 2>&1

“/logs/time.log 2>&1”表示先将标准输出重定向到/dev/null,然后将标准错误重定向到标准输出

其他问题

  • 在crontab中%是有特殊含义的,表示换行的意思。如果要用的话必须进行转义%,如经常用的date ‘+%Y%m%d’在crontab里是不会执行的,应该换成date ‘+%Y%m%d’
  • 当crontab失效时,可以尝试/etc/init.d/crond restart解决问题。或者查看日志看某个job有没有执行/报错tail -f /var/log/cron。
  • 不要乱删。。。