Linux项目开发,你必须了解Systemd服务!

2024年06月18日 17:26    发布者:武汉万象奥科
1. Systemd 简介Systemd是什么,以前linux系统启动init机制,由于init一方面对于进程的管理是串行化的,容易出现阻塞情况,另一方面init也仅仅是执行启动脚本,并不能对服务本身进行更多的管理。Systemd就是为了解决这些问题而诞生的。它的设计目标是,为系统的启动和管理提供一套完整的解决方案,根据Linux惯例,字母d是守护进程(daemon)的缩写,Systemd这个名字的含义,就是它要守护整个系统。使用了Systemd,就不需要再用init了。Systemd取代了initd,成为系统的第一个进程(PID 等于 1),其他进程都是它的子进程。Systemd是目前Linux系统上主要的系统守护进程管理工具,有如下特点:1.支持并行化任务2.同时采用socket式与D-Bus总线式激活服务;3.按需启动守护进程(daemon);4.利用Linux的cgroups监视进程;5.支持快照和系统恢复;6.维护挂载点和自动挂载点;7.各服务间基于依赖关系进行精密控制。Systemd可以管理所有系统资源,不同的资源统称为 Unit(单元),Unit一共分成以下12种。1.Service:装守护进程的启动、停止、重启和重载操作,是最常见的一种 Unit 文件2.Target:多个Unit构成的一个逻辑组,用于对 Unit 文件进行逻辑分组,引导其它 Unit 的执行。它替代了 SysV-init 运行级别的作用,并提供更灵活的基于特定设备事件的启动方式3.Device:硬件设备,主要用于定义设备之间的依赖关系4.Mount:文件系统的挂载点,可以替代过去的 /etc/fstab 配置文件5.Automount:自动挂载点,相当于 SysV-init 的 autofs 服务6.Path:用于监控指定文件或路径的变化,并触发其它 Unit 运行7.Scope:不是用户创建的,而是 Systemd 运行时产生的,描述一些系统服务的分组信息8.Slice:进程组,用于表示一个 CGroup 的树,通常也不是用户创建的9.Snapshot:Systemd快照,可以切回某个快照10. Socket:监控来自于系统或网络的数据消息,用于实现基于数据自动触发服务启动11. Swap:虚拟内存的交换分区12. Timer Unit:定时器,用于配置在特定时间触发的任务,替代了 Crontab 的功能2. Systemd Service配置文件每一个被管理单元(Unit)都需要有一个配置文件用于告知systemd对于该单元(Unit)的管理方式。Systemd默认从目录/etc/systemd/system/读取配置文件,但是里面存放的大部分文件都是符号链接,指向目录/lib/systemd/system,配置文件存放于/lib/systemd/system/,开机启动后会在/etc/systemd/system目录建立软链接文件,systemctl enable命令用于在/etc/systemd/system/与/lib/systemd/system/两个目录之间建立符号链接关系。systemctl disable命令用于在两个目录之间撤销符号链接关系,相当于撤销开机启动。配置文件的后缀名,就是该Unit的种类,比如sshd.socket;如果命令行中省略后缀名,Systemd默认后缀名为.service,所以当systemctl enable sshd会被理解成systemctl enable sshd.service。以sshd.service的配置为例,可用”systemctl cat sshd.service” 命令查看sshd服务的配置文件:# /lib/systemd/system/ssh.service​Description=OpenBSD Secure Shell serverDocumentation=man:sshd(8) man:sshd_config(5)After=network.target auditd.serviceConditionPathExists=!/etc/ssh/sshd_not_to_be_run​​EnvironmentFile=-/etc/default/sshExecStartPre=/usr/sbin/sshd -tExecStart=/usr/sbin/sshd -D $SSHD_OPTSExecReload=/usr/sbin/sshd -tExecReload=/bin/kill -HUP $MAINPIDKillMode=processRestart=on-failureRestartPreventExitStatus=255Type=notifyRuntimeDirectory=sshdRuntimeDirectoryMode=0755​​WantedBy=multi-user.targetAlias=sshd.service通常一个service服务单元的配置包含3个区块:Unit,Service和Install。2.1      Unit区块区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他 Unit 的关系。它的主要字段如下:Description:简短描述Documentation:文档地址Requires:当前Unit依赖的其他Unit,如果它们没有运行,当前Unit会启动失败Wants:与当前Unit配合的其他Unit,如果它们没有运行,当前Unit不会启动失败BindsTo:与Requires类似,它指定的 Unit 如果退出,会导致当前Unit停止运行Before:如果该字段指定的Unit也要启动,那么必须在当前Unit之后启动After:如果该字段指定的Unit也要启动,那么必须在当前Unit之前启动Conflicts:这里指定的Unit 不能与当前Unit同时运行Condition...:当前Unit运行必须满足的条件,否则不会运行Assert...:当前Unit运行必须满足的条件,否则会报启动失败2.2      Service区块区块用来Service的配置,只有Service类型的Unit才有这个区块。它的主要字段如下:Type:定义启动时的进程行为。它有以下几种值。Type=simple:默认值,执行ExecStart指定的命令,启动主进程Type=forking:以fork方式从父进程创建子进程,创建后父进程会立即退出Type=oneshot:一次性进程,Systemd会等当前服务退出,再继续往下执行Type=dbus:当前服务通过D-Bus启动Type=notify:当前服务启动完毕,会通知Systemd,再继续往下执行Type=idle:若有其他任务执行完毕,当前服务才会运行ExecStart:启动当前服务的命令ExecStartPre:启动当前服务之前执行的命令ExecStartPost:启动当前服务之后执行的命令ExecReload:重启当前服务时执行的命令ExecStop:停止当前服务时执行的命令ExecStopPost:停止当其服务之后执行的命令RestartSec:自动重启当前服务间隔的秒数Restart:定义何种情况Systemd会自动重启当前服务,可能的值包括always(总是重启)、on-success、on-failure、on-abnormal、on-abort、on-watchdogTimeoutSec:定义Systemd停止当前服务之前等待的秒数Environment:指定环境变量2.3      Install区块通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动。它的主要字段如下:WantedBy:它的值是一个或多个Target,当前Unit激活时(enable)符号链接会放入/etc/systemd/system目录下面以Target名+.wants后缀构成的子目录中RequiredBy:它的值是一个或多个Target,当前Unit激活时,符号链接会放入/etc/systemd/system目录下面以Target 名 + .required后缀构成的子目录中Alias:当前Unit 可用于启动的别名Also:当前Unit激活(enable)时,会被同时激活的其他Unit3. 服务监控启动3.1      socket 触发的服务涉及网络的服务,可以通过 socket 来触发启动。也就是说服务本身在没连接业务时不用一直空跑着,可以让systemd 帮忙监听一个 socket ,以减少资源消耗。当真正有业务连接进来时,才唤醒目标服务。要达成这样的配置,目标服务程序在实现上也有一定要求。开发一个常规的网络服务,一般有以下几个关键步骤:1.创建一个 socket2.调用 bind 将该 socket 绑定一个端口3.调用 listen 监听端口,将该 socket 变成监听文件描叙符 fd4.调用 accept 接收一个客户端连接,得到一个新的连接文件描叙符 fd5.读写连接 socket 的 fd,完成业务逻辑借助 systemd 强大且通用的服务功能,它可以帮忙完成前两步,并且将 socket 的 fd 传给被激活的程序,后者就只要从第3步开始实现工作。由socker触发的服务对应于 systemd 的配置文件要有两个,后缀分别是.socket与.service ,除后缀外的文件名要相同,这样就能自动关联,例如名为hello-world-socket的服务:hello-world-socket.socketDescription=Hello World Socket​​ListenStream=0.0.0.0:1234hello-world-socket.serviceDescription=Hello World Socket Service​​ExecStart=/absolute/path/to/hello-world-socket.exe如上,.socket 的配置,需要有 段,ListenStream 字段表示了要监听 的地址与端口。相应的 .service 配置,与之前例子一样,描叙了如何启动服务。因为这是想由 socket 激活的 service ,故没有配置重启字段。在 systemctl 的大多数子命令中,如 start ,其参数默认是假定 .service 单元 配置的。例如systemctl start hello-world-socket 等效于 systemctl start hello-world-socket.service 。但在这个例子中,有两种同名单元配置, 且按要求先只启动 hello-world-socket.socket ,所以要写完整的单元名:systemctl start hello-world-socket.socket3.2      定时器触发的服务对于定时器触发的服务首先要配置一个 .timer 单元文件,例如:hello-world.timerDescription=The Hello-World Timer​OnCalendar=*-*-* *:*:00其中,OnCalendar 的配置格式同 crontab ,上例表示每分钟触发。然后需要一个同名的 .service 单元文件。本文开头编译的 hello-world.exe 正好 可作为该定时器启动的程序,例如:hello-world.serviceDescription=The Hello-World Timer​​Type=oneshotExecStart=/absolute/path/to/hello-world.exeStandardOutput=file:/absolute/path/to/stdout-file然后启动定时器,并查看状态:systemctl start hello-world.timersystemctl status hello-world.timer4. 服务异常重运行为了确保服务在遭遇故障时能够自动重启。在Systemd的服务单元文件中,Restart指令是控制服务重启行为的核心设置。本文章将探讨Restart=on-failure与Restart=always这两个选项的区别,帮助开发人员对系统服务做出更适合的选择。Restart指令定义了当服务停止时Systemd的行为。它可以精细控制服务在遇到不同退出情况时是否应该重启。这是确保关键服务可靠性的重要机制,尤其是在生产环境中,服务的持续运行对业务至关重要4.1           Restart=on-failure:智能重启当服务单元文件中设置了Restart=on-failure时,Systemd会在服务因错误退出时尝试重启服务。"错误退出"通常是指服务以非零状态码结束运行,这可能是由于程序崩溃、遇到未处理的异常或其他非正常情况导致的。例如,如果你的服务由于内存不足而崩溃,on-failure将确保服务尝试重新启动。但如果服务是由于正常的系统维护任务而被停止,或者开发人员故意停止服务进行调试,那么它将不会被重启。其应用场景如下:生产环境:在不希望因为维护或更新操作而自动重启服务的生产环境中使用。故障排除:当服务可能需要在出现问题时停止,以便进行故障排除时。有条件的重启:当你只想在服务因特定问题而停止时重启。4.2      Restart=always:无条件重启与on-failure相对的是Restart=always选项。不管服务是如何终止的,系统都会尝试将其重启。这意味着即使服务被管理员有意关闭,或者服务正常结束,Systemd也会立即尝试将其重启。这种策略适用于那些必须始终运行的服务,无论它们是因为何种原因停止的。这确保了即使在进行系统更新或维护时,服务也能尽可能快地恢复运行。其应用场景如下:关键服务:对于那些系统的核心功能,如数据库服务或Web服务器,这些服务的任何停机时间都是不可接受的。高可用性要求:在需要最大程度减少服务停机时间的环境中。简化管理:在希望无论服务如何停止都能立即重启的情况下。