Garland +

理解 Unix 进程阅读笔记

浅入浅出,大概花了一周左右看完了,之前刷过一半英文版的,这次看的是中文版的,译者文笔很不错,读起来丝毫没有生硬的感觉。总的来讲这本书属于非科班程序员快速补一补的那类,其中的每个点单拿出来可能都要写好几篇文章讲,原作是用 ruby 实现的,读的时候把部分的例子用 python 实现了下,这里小记一下。

系统调用允许用户空间程序间接的与计算机硬件进行交互

  1. #1. 一般命令
  2. #2. 系统调用
  3. #3. C库函数
  4. #4. 特殊文件
  5. man 2 getpid
  6. man 3 malloc

所有的代码都是在进程中执行的。

PID: 系统中运行的所有进程都有的唯一标示符

  1. import os
  2. pid = os.getpid()
  3. ppid = os.getppid()
  4. # shell
  5. ps aux | grep <ppid>

打开资源就会获得一个文件描述符编号,内核靠这个编号来跟踪进程对这个资源的调用。

文件描述符只存在于当前的进程中,进程结束会和被这个进程打开的其他资源一起关闭。

  1. f = open('a')
  2. f.fileno()
  1. 所分配的文件描述符编号是尚未使用的最小的数值
  2. 资源一旦关闭就会释放当时所分配的文件描述符
  3. 由2,关闭的资源是没有文件描述符的
  4. 文件描述符最小值是3

每个 Unix 进程都有三个打开的资源

  1. #1. STDIN: 标准输入
  2. #2. STDOUT: 标准输出
  3. #3. STDERR: 标准错误
  4. import sys
  5. sys.stdin.fileno()
  6. sys.stdout.fileno()
  7. sys.stderr.fileno()
  8. # 0 1 2

进程能拥有的最大文件描述符数受系统配置而定

  1. import resource
  2. resource.getrlimit(resource.RLIMIT_DATA)
  3. # (软限制, 硬限制)
  4. # (9223372036854775807, 9223372036854775807)
  5. resource.RLIM_INFINITY
  6. # 9223372036854775807 (没有限制)

超过软限制会产生异常,但是可以被修改,所有进程都能修改自己的软限制;只有有足够权限的进程才能够修改硬限制。

超出限制会提示:too many open files

在一些压测工具上可能会有修改最大文件描述符数的需求

所有的进程都从父进程处继承环境变量。每一个进程都有环境变量,环境变量对于特定进程而言是全局性的。

  1. import os
  2. os.environ
  3. os.environ.setdefault(k, v)

所有进程都可以访问名为 ARGV 的特殊数组

  1. import sys
  2. sys.argv
  1. 文件系统层面:进程可以通过向文件系统写入信息的方式来了解彼此的状态信息
  2. 网络层面:借助网络使用 socket 来同其他进程实现通信
  3. 进程层面:进程名称,退出码

每个进程都有名称,进程在运行期间也可以动态的修改名称

  1. # 没找着官方实现,可以使用第三方包 psutil

所有进程在退出的时候都带有数字退出码 (0-255),用于指明进程是否顺利退出。

按惯例,退出码是 0 的进程被认为是正常退出,其他退出码则表示出现了错误。

默认以状态码0退出,也可以传入自定义的状态码,在 exit 执行前会调用 atexit 注册的回调

  1. import sys
  2. sys.exit(1)
  3. # 退出前的回调
  4. import atexit
  5. def p():
  6. print('doing before exit')
  7. atexit.register(p)
  1. sys.exit:正常退出,会执行 atexit 注册的回调
  2. os._exit:非正常退出,不会执行 atexit 注册的回调
  3. os.abort
  4. raise

fork可以从一个父进程创建一个子进程,子进程会继承父进程所占内存的所有内容,以及属于父进程的已打开的文件描述符、套接字等,子进程拥有唯一的 pid,子进程的 ppid 即父进程的 pid,并且子进程享有自己单独的内存空间,即子进程的改动不会对父进程产生影响。

fork 的一次调用会在父进程和新创建的子进程中同时返回。在 python 中,子进程收到的值是 0,父进程收到的值是子进程的 pid

fork 炸弹会把内存耗尽

父进程结束或被退出的进程

  1. 守护进程是一种长期运行的进程
  2. 与脱离终端会话的进程进行通信
  1. # coding: utf-8
  2. import os
  3. import time
  4. def run_children():
  5. print('my pid:', os.getpid())
  6. print('my father pid:', os.getppid())
  7. for i in range(5):
  8. print('sleeping', i + 1)
  9. time.sleep(1)
  10. if i == 4:
  11. print('where is father', os.getppid())
  12. def main():
  13. pid = os.fork()
  14. if pid < 0:
  15. return
  16. if pid > 0:
  17. print('-----father---')
  18. print('father pid', os.getpid())
  19. if pid == 0:
  20. print('-----children---')
  21. run_children()
  22. if __name__ == "__main__":
  23. # run in terminal
  24. main()

fork 复制数据会产生不小的开销,现代 unix 系统采用了 COW (copy-on-write) 来克服,即将真正的内存复制操作推迟到了真正需要写入的时候。

也就是说父进程和子进程一开始在共享内存中的数据,直到其中某一个需要对数据进行修改,这时才会进行内存复制。

python 的需要试一下

  1. def main():
  2. pid = os.fork()
  3. if pid < 0:
  4. return
  5. if pid > 0:
  6. print('-----father---')
  7. print('father pid', os.getpid())
  8. os.wait()
  9. print('father died')
  10. if pid == 0:
  11. print('-----children---')
  12. run_children()

os.wait 是一个阻塞调用,父进程一直等待到他某个子进程退出后再继续执行。 os.wait 的返回值是子进程的 pid 和退出状态码 status

  1. os.wait
  2. os.wait3
  3. os.wait4
  4. os.waitpid

内核会将退出的进程信息加入队列,这样一来父进程总是能依照子进程退出的顺序接收到信息。

preforking

有一个衍生出多个并发子进程的进程,这个进程看管着这些进程,确保他们能够相应,并对子进程的退出做出回应。

内核会一直保留已退出的子进程的状态信息,直到父进程使用 .wait 请求这些信息。如果父进程一直发不出请求,那么状态信息就会一直被内核保留着。

detach in ruby: 父进程生成一个新线程,这个线程会等待由指定pid的子进程退 出,确保内核不会一直保留那些状态信息

任何已经结束的进程,如果他的状态信息一直没能被读取,那么他就是一个僵尸进程。

os.wait 是一个阻塞调用

信号发送是不可靠的,如果一个进程收到一个 CHID 的信号,然后执行信号绑定函数,第二个 CHID2 信号又来了,如果第一个信号没有被处理完毕的话,第二个信号就会被丢弃。

可以在信号处理函数中使用 await

信号是一种异步通信,当进程从内核接收到一个信号时,可以执行下列某一操作:

  1. 忽略该信号
  2. 执行特定的操作
  3. 执行默认的操作

信号是以内核为中介由一个进程发送到另一个进程

常用信号:

  1. SIGINT: 终止进程 中断进程 ctrl+C(Term)
  2. SIGTREM: 终止进程 根据需要来关闭程序,可以做一些文件关闭等清理操作 (Term)
  3. SIGKILL: 终止进程 杀死进程 不管做什么都立刻停止(python: 无法)(Term)

信号的动作:

  1. Term: 表示进程会立即结束
  2. Core: 表示进程会立即结束并进程核心转储(栈跟踪)
  3. Ign: 表示进程会忽略该信号
  4. Stop: 表示进程会停止运行(暂停)
  5. Cont: 表示进程会恢复运行(继续)
  1. # file1
  2. # coding: utf-8
  3. import os
  4. import signal
  5. from time import sleep
  6. def on_term(a, b):
  7. print("SIGTERM 信号")
  8. if __name__ == '__main__':
  9. signal.signal(signal.SIGTERM, on_term)
  10. print('my pid: ', os.getpid())
  11. sleep(120)
  12. # file2
  13. # coding: utf-8
  14. import os
  15. import signal
  16. if __name__ == '__main__':
  17. os.kill(73045, signal.SIGTERM)
  18. os.kill(73045, signal.SIGKILL)

重新定义

singnal.signal(signalnum, handler),根据 handler 的类型来操作

进程可以在任何时候接收到信号。

管道

管道是一个单向数据流,即一个进程拥有管道的一端,另一个进程拥有管道的另一端,然后数据就沿着管道单向传递

默认的管道是匿名管道,所以用于具有亲缘关系进程间的通信;而命名管道是持久化的,支持亮哥独立的进程间的通信。

  1. # coding: utf-8
  2. import os
  3. def main():
  4. r, w = os.pipe()
  5. w_ = os.fdopen(w, 'w')
  6. data = 'you will receiving pipe data'
  7. w_.write(data)
  8. w_.close()
  9. r_ = os.fdopen(r)
  10. assert r_.read() == data
  11. assert r_.read() == ''
  12. print('write and read done!')
  13. if __name__ == '__main__':
  14. main()

read 会一直阻塞并试图从管道中读取数据,直到读到一个文件结束符号,表示已经没有数据可以读取了

管道也是一种资源,有自己的文件描述符和其他的一切,因此也可以子进程共享

  1. # coding: utf-8
  2. import os
  3. import sys
  4. import time
  5. r, w = os.pipe()
  6. def deal_child():
  7. print('child writing .... ')
  8. os.close(r)
  9. w_ = os.fdopen(w, 'w')
  10. for i in range(10):
  11. time.sleep(0.1)
  12. w_.write('writing ... {}\n'.format(i))
  13. w_.close()
  14. sys.exit(0)
  15. def deal_father():
  16. print('father reading .... ')
  17. os.close(w)
  18. r_ = os.fdopen(r)
  19. while True:
  20. line = r_.read()
  21. if not line:
  22. break
  23. print('{} father read {} in {}'.format(os.getpid(), line, time.time()))
  24. sys.exit(0)
  25. def main():
  26. pid = os.fork()
  27. if pid < 0:
  28. return
  29. if pid > 0:
  30. deal_father()
  31. if pid == 0:
  32. deal_child()
  33. if __name__ == '__main__':
  34. main()

多进程中,文件描述符也会被 fork,所以会出现4个文件描述符,这里关闭掉不用的两个。管道是一个 IO 对象,可以在他之上调用任意的 IO 方法。即管道中流淌的是数据流。

流与消息

unix socket 是一种只能用于在同一台物理主机中进行通信的套接字

父子进程的 unix socket 通信

IPC: InterProcess Communication

  1. # coding: utf-8
  2. import os
  3. import socket
  4. def main():
  5. father, child = socket.socketpair()
  6. pid = os.fork()
  7. if pid:
  8. print('father {} send message'.format(os.getpid()))
  9. child.close()
  10. father.sendall(b'father ping')
  11. res = father.recv(1024)
  12. print('res from child: {}'.format(res))
  13. father.close()
  14. else:
  15. print('child {} waiting message'.format(os.getpid()))
  16. father.close()
  17. msg = child.recv(1024)
  18. print('msg from father: {}'.format(msg))
  19. child.sendall(b'child pong')
  20. child.close()
  21. if __name__ == '__main__':
  22. main()

管道提供的是单向通信,套接字提供的是双向通信,父套接字可以读写子套接字,子套接字也可以读写父套接字

守护进程是在后台运行的进程,不受终端用户控制。

当内核被引导时会产生一个叫做 init 的进程,这个进程的 pid 是 0, 作为所有进程的祖父。它是首个进程没有祖先,它的 pid 是1

孤儿进程的 ppid 始终是 1,这时内核能够确保一直运行的唯一进程。

  1. # coding: utf-8
  2. import time
  3. import os
  4. import sys
  5. def main():
  6. pid = os.fork()
  7. if pid:
  8. time.sleep(2)
  9. father_pid = os.getpid()
  10. print('father {} quit...'.format(father_pid))
  11. sys.exit()
  12. else:
  13. count = 0
  14. while True:
  15. time.sleep(0.5)
  16. print('child pid is: {}, ppid is: {}'.format(os.getpid(), os.getppid()))
  17. count += 1
  18. if count >= 10:
  19. sys.exit()
  20. if __name__ == '__main__':
  21. main()

setsid 作用

  1. 该进程变成一个新会话的会话领导
  2. 该进程变成一个新进程组的组长
  3. 该进程没有控制终端

进程组和会话组

进程组和会话组都和作业控制有关,作业控制即终端处理进程的方法。

  1. # coding: utf-8
  2. """
  3. 在 terminal 里执行
  4. """
  5. import os
  6. def main():
  7. pid = os.fork()
  8. if pid == 0:
  9. print('child {} has father {} in pgroup {}'.format(os.getpid(), os.getppid(), os.getpgrp()))
  10. else:
  11. print('father {} in pgroup {}'.format(os.getpid(), os.getpgrp()))
  12. if __name__ == '__main__':
  13. main()

子进程有唯一的pid,子进程的组id是从父进程中继承而来,并且子进程和父进程都是同一个进程组的成员。

终端会接收信号,并将其转发给前台进程组中的所有进程。

会话组

会话组是更高一级的抽象,是进程组的集合。

一个会话组可以依附一个终端,也可以不依附于任何一个终端,比如守护进程。

终端:发送给会话领导的信号被被转发到该会话中的所有进程组内,然后在被转发到这些进程组中的所有进程

os.getsid() 可以检索当前会话组ID

创建守护进程

  1. 主进程 fork 一个子进程,然后主进程退出,此时子进程变成孤儿进程
  2. 调用该脚本的终端认为该命令已经执行完毕,于是返回终端
  3. 子进程仍拥有从父进程继承而来的组id和会话ID,此时子进程并非会话领导,也非组长
  4. 调用 os.setsid 会使子进程成为一个新进程组和新会话组的组长兼领导(只能从子进程调用)
  5. 然后该子进程 fork 一个孙子进程,然后退出,孙子进程也不是进程组组长和会话领导,由于子进程没有控制终端,所以孙子进程绝对不会有控制终端。终端只能分配给会话领导

这时进程就完全脱离了控制终端可以自主运行。

exec: 使用另一个进程来替换当前进程,无法恢复。

通常使用 fork 创建一个新进程,然后用 exec 把这个进程变成其他想要的进程。exec 默认不会关闭任何打开的文件描述符或是进行内存清理

另外发现了个 go 版的

本文部分同步发于豆瓣

言:

Blog

Thoughts

Project