当前位置: 首页 > news >正文

Linux/AndroidOS中进程间的通信线程间的同步 - IPC方式简介

前言

  • 从来没有总结过Linux/Android系统中进程间的通信方式和线程间的同步方式,这个专栏就系统总结讨论一下。
  • 首先从标题可知,讨论问题的主体是进程和线程、通信和同步;在这里默认你理解进程和线程的区别。
  • 通信和同步有什么概念上的区别?理论上说进程也可以通信/同步,线程也可以通信/同步,只不过现实情况进程更多的需要是通信,而线程更多的需要是同步。
  • 参考了一些书籍和资料,太多就不列出来了。

1 通信/同步 工具分类

Inter-Process Communication(IPC)和Inter-Thread Synchronization(ITS)

  1. 通信:这些工具关注进程之间的数据交换
  2. 同步:这些进程关注进程和线程操作之间的同步
  3. 信号:尽管信号的主要作用并不在此,但在特定场景下仍然可以将它作为一种同步技术。更罕见的是信号还可以作为一种通信技术:信号编号本身是一种形式的信息,并且可以在实时信号上绑定数据(一个整数或指针)。
    在这里插入图片描述

2 通信工具

上图列出的各种通信工具允许进程间相互交换数据。(这些工具还可以用来在同一个进程中不同线程之间交换数据,但很少需要这样做,因为线程之间可以通过共享全局变量来交换信息。)

可以将通信工具分成两类。

  • 数据传输工具:区分这些工具的关键因素是写入和读取的概念。为了进行通信,一个进程将数据写入到 IPC 工具中,另一个进程从中读取数据。这些工具要求在用户内存和内核内存之间进行两次数据传输:一次传输是在写入的时候从用户内存到内核内存,另一次传输是在读取的时候从内核内存到用户内存。
  • 共享内存:共享内存允许进程通过将数据放到由进程间共享的一块内存中以完成信息的交换。(内核通过将每个进程中的页表条目指向同一个 RAM 分页来实现这一功能,如图 49-2 所示。)一个进程可以通过将数据放到共享内存块中使得其他进程读取这些数据。由于通信无需系统调用以及用户内存和内核内存之间的数据传输,因此共享内存的速度非常快。

2.1 数据传输

可以进一步将数据传输工具分成下列类别。

  • 字节流:通过管道、FIFO 以及数据报 socket 交换的数据是一个无分隔符的字节流。每个读取操作可能会从 IPC 工具中读取任意数量的字节,不管写者写入的块的大小是什么。这个模型参考了传统的 UNIX“文件是一个字节序列”模型。

  • 消息:通过 System V 消息队列、POSIX 消息队列以及数据报 socket 交换的数据是以分隔符分隔的消息。每个读取操作读取由写者写入的一整条消息,无法只读取部分消息,而把剩余部分留在 IPC 工具中,也无法在一个读取操作中读取多条消息。

  • 伪终端:伪终端是一种在特殊情况下使用的通信工具,在 64 章将会介绍有关伪终端的详细信息。数据传输工具和共享内存之间的差别包括以下几个方面。

  • 尽管一个数据传输工具可能会有多个读取者,但读取操作是具有破坏性的。读取操作会消耗数据,其他进程将无法获取所消耗的数据。

  • 读取者和写者进程之间的同步是原子的。如果一个读取者试图从一个当前不包含数据的数据传输工具中读取数据,那么在默认情况下读取操作会被阻塞直至一些进程向该工具写入了数据。

2.2 共享内存

大多数现代 UNIX 系统提供了三种形式的共享内存:System V 共享内存、POSIX 共享内存以及内存映射。在后面介绍这些工具的章节中将会描述它们之间的差别。下面是使用共享内存时的注意点。

  • 尽管共享内存的通信速度更快,但速度上的优势是用来弥补需要对在共享内存上发生的操作进行同步的不足的。如当一个进程正在更新共享内存中的一个数据结构时,另一个进程就不应该试图读取这个数据结构。在共享内存中,信号量通常用来作为同步方法。

  • 放入共享内存中的数据对所有共享这块内存的进程可见。(这与上面数据传输工具中介绍的破坏性读取语义不同。)

3 同步工具

通过图 1 中的同步工具可以协调进程的操作。通过同步可以防止进程执行诸如同时更新一块共享内存或同时更新文件的同一个数据块之类的操作。如果没有同步,那么这种同时更新的操作可能会导致应用程序产生错误的结果。UNIX 系统提供了下列同步工具。

  • 信号量:一个信号量是一个由内核维护的整数,其值永远不会小于 0。一个进程可以增加或减小一个信号量的值。如果一个进程试图将信号量的值减小到小于 0,那么内核会阻塞该操作直至信号量的值增长到允许执行该操作的程度。(或者进程可以要求
    执行一个非阻塞操作,那么就不会发生阻塞,内核会让该操作立即返回并返回一个标示无法立即执行该操作的错误。)信号量的含义是由应用程序来确定的。一个进程减小一个信号量(如从 1 到 0)是为了预约对某些共享资源的独占访问,在完成了资源
    的使用之后可以增加信号量来释放共享资源以供其他进程使用。最常用的信号量是二元信号量——一个值只能是 0 或 1 的信号量,但处理一类共享资源拥有多个实例的应用程序需要使用最大值等于共享资源数量的信号量。Linux 既提供了 System V 信号量,又提供了 POSIX 信号量,它们的功能是类似的。

  • 文件锁:文件锁是设计用来协调操作同一文件的多个进程的动作的一种同步方法。它也可以用来协调对其他共享资源的访问。文件锁分为两类:读(共享)锁和写(互斥)锁。任意进程都可以持有同一文件(或一个文件的某段区域)的读锁,但当一个进程
    持有了一个文件(或文件区域)的写锁之后,其他进程将无法获取该文件(或文件区域)上的读锁和写锁。Linux 通过 flock()和 fcntl()系统调用来提供文件加锁工具。flock()系统调用提供了一种简单的加锁机制,允许进程将一个共享或互斥锁加到整个文件
    上。由于功能有限,现在已经很少使用 flock()这个加锁工具了。fcntl()系统调用提供了记录加锁,允许进程在同一文件的不同区域上加上多个读锁和写锁。

  • 互斥体和条件变量:这些同步工具通常用于 POSIX 线程。

在执行进程间同步时通常需要根据功能需求来选择工具。当协调对文件的访问时文件记录加锁通常是最佳的选择,而对于协调对其他共享资源的访问来讲,信号量通常是更佳的选择。
通信工具也可以用来进行同步。如在 44.3 节中使用了一个管道来同步父进程与子进程的动作。一般来讲,所有数据传输工具都可以用来同步,只是同步操作是通过在工具中交换消息来完成的。

4 IPC工具比较

在需要使用 IPC 时会发现有很多选择,在一开始可能会对这些选择感到迷惑。下面介绍在确定选择何种 IPC 工具时通常需要考虑的事项。

4.1 IPC 对象标识和打开对象的句柄

要访问一个 IPC 对象,进程必须要通过某种方式来标识出该对象,一旦将对象“打开”之后,进程必须要使用某种句柄来引用该打开着的对象。下表对各种类型的 IPC 工具的属性进行了总结。
在这里插入图片描述

4.2 功能

各种 IPC 工具在功能上是存在差异的,因此在确定使用何种工具时需要考虑这些差异。下面首先对数据传输工具盒共享内存之间的差异进行总结。

  • 数据传输工具提供了读取和写入操作,传输的数据只供一个读者进程消耗。内核会自动处理读者和写者之间的流控以及同步(这样当读者试图从当前为空的工具中读取数据时将会阻塞)。在很多应用程序设计中,这个模型都表现得很好。

  • 其他应用程序设计则更适合采用共享内存的方式。一个进程通过共享内存能够使数据对共享同一内存区域的所有进程可见。通信“操作”是比较简单的——进程可以像访问自己的虚拟地址空间中的内存那样访问共享内存中的数据。另一个方面,同步处理(可能还会有流控)会增加共享内存设计的复杂性。在需要维护共享状态(如共享数据结构)的应用程序中,这个模型表现得很好。

关于各种数据传输工具,下面几点是值得注意的。

  • 一些数据传输工具以字节流的形式传输数据(管道、FIFO 以及流 socket),另一些则是面向消息的(消息队列和数据报 socket)。到底选择何种方法则需要依赖于应用程序。(应用程序也可以在一个字节流工具上应用面向消息的模型,这可以通过使用分隔字符、固定长度的消息,或对整条消息长度进行编码的消息头来实现)。

  • 与其他数据传输工具相比,System V 和 POSIX 消息队列特有的一个特性是它们能够给消息赋一个数值类型或优先级,这样递送消息的顺序就可以与发送消息的顺序不同了。

  • 管道、FIFO 以及 socket 是使用文件描述符来实现的。这些 IPC 工具都支持 I/O 多路复用(select()和 poll()系统调用)、信号驱动的 I/O、以及 Linux 特有的 epoll API。这些技术的主要优势在于它们允许应用程序同时监控多个文件描述符以判断是否可以在某些文件描述符上执行 I/O 操作。与之相比,System V 消息队列没有使用文件描述符,因此并不支持这些技术。

  • POSIX 消息队列提供了一个通知工具,当一条消息进入了一个之前为空的队列中时可以使用它来向进程发送信号或实例化一个新线程。

  • UNIX domain socket 提供了一个特性允许在进程间传递文件描述符。这样一个进程就能够打开一个文件并使之对另一个本来无法访问该文件的进程可用。

  • UDP(Internet domain datagram)socket 允许一个发送者向多个接收者广播或组播一条消息。

关于进程同步工具,下面几点是值得注意的。

  • 使用 fcntl()加上的记录锁由加锁的进程拥有。内核使用这种所有权属性来检测死锁(两个或多个进程持有的锁会阻塞对方后续的加锁请求的场景)。如果发生了死锁,那么内核会拒绝其中一个进程的加锁请求,因此会在 fcntl()调用中返回一个错误标示出死锁的发生。System V 和 POSIX 信号量并没有所有权属性,因此内核不会为信号量进行死锁检测。

  • 当使用 fcntl()获得记录锁的进程终止之后会自动释放该记录锁。System V 信号量提供了一个类似的特性,即“撤销”特性,但这个特性仅在部分场景中可靠。POSIX 信号量并没有提供类似的特性。

4.3 网络通信

在图 1 中给出所有 IPC 方法中,只有 socket 允许进程通过网络来通信。socket 一般用于两个域中:一个是 UNIX domain,它允许位于同一系统上的进程进行通信另一个是 Internet domain,它允许位于通过 TCP/IP 网络进行连接的不同主机上的进程进行通信。通常,将一个使用 UNIX domain socket进行通信的程序转换成一个使用 Internet domain socket进行通信的程序只需要做出微小的改动,这样只需要对使用 UNIX domain socket 的应用程序做较小的改动就可以将它应用于网络场景。

4.4 可移植性

现代 UNIX 实现支持图 1 中的大部分 IPC 工具,但 POSIX IPC 工具(消息队列、信号量以及共享内存)的普及程度远远不如 System V IPC,特别是在较早的 UNIX 系统上。(只有版本为 2.6.x 的 Linux 内核系列才提供了一个 POSIX 消息队列的实现以及对 POSIX 信号量的完全支持。)因此,从可移植性的角度来看,System V IPC 要优于 POSIX IPC。

4.5 可访问性

下表中的第二列总结了各种 IPC 工具的一个重要特性:权限模型控制着哪些进程能够访问对象。下面介绍各种模型的细节信息。

  • 对于一些 IPC 工具(如 FIFO 和 socket),对象名位于文件系统中,可访问性是根据相关的文件权限掩码(指定了所有者、组和其他用户的权限)来确定的。虽然 System V IPC 对象并不位于文件系统中,但每个对象拥有一个相关的权限掩码,其语义与文件的权限掩码类似。

  • 一些 IPC 工具(管道、匿名内存映射)被标记成只允许相关进程访问。这里“相关”指通过 fork()关联的。为了使两个进程能够访问同一个对象,其中一个必须要创建该对象,然后调用 fork()。而 fork()调用的结果就是子进程会继承引用该对象的一个句柄,这样两个进程就能够共享对象了。

  • POSIX 的未命名信号量的可访问性是通过包含该信号量的共享内存区域的可访问性来确定的。

  • 为了给一个文件加锁,进程必须要拥有一个引用该文件的文件描述符(即在实践中它必须要拥有打开文件的权限)。

  • 对 Internet domain socket 的访问(即连接或发送数据报)没有限制。如果有需要的话,必须要在应用程序中实现访问控制。
    在这里插入图片描述

4.6 持久性

术语持久性是指一个 IPC 工具的生命周期。持久性有三种。

  • 进程持久性只要存在一个进程持有进程持久的 IPC 对象,那么该对象的生命周期就不会终止。如果所有进程都关闭了对象,那么与该对象的所有内核资源都会被释放,所有未读取的数据会被销毁。管道、FIFO 以及 socket 是进程持久的 IPC 工具。
  • 内核持久性只有当显式地删除内核持久的 IPC 对象或系统关闭时,该对象才会销毁。这种对象的生命周期与是否有进程打开该对象无关。这意味着一个进程可以创建一个对象,向其中写入数据,然后关闭该对象(或终止)。在后面某个时刻,另一个进程可以打开该对象,然后从中读取数据。具备内核持久性的工具包括 System V IPC 和POSIX IPC。
  • 文件系统持久性具备文件系统持久性的 IPC 对象会在系统重启的时候保持其中的信息,这种对象一直存在直至被显式地删除唯一一种具备文件系统持久性的 IPC 对象是基于内存映射文件的共享内存

4.7 性能

在一些场景中,不同 IPC 工具的性能可能存在显著的差异。但一般不会对它们的性能进行比较,其原因如下。

  • 在应用程序的整体性能中,IPC 工具的性能的影响因素可能不是很大,并且确定选择何种 IPC 工具可能并不仅仅需要考虑其性能因素。

  • 各种 IPC 工具在不同 UNIX 实现或 Linux 的不同内核中的性能可能是不同的。

  • 最重要的是,IPC 工具的性能可能会受到使用方式和环境的影响。相关的因素包括每个 IPC 操作交换的数据单元的大小、IPC 工具中未读数据量可能很大、每个数据单元的交换是否需要进行进程上下文切换、以及系统上的其他负载。

如果 IPC 性能是至关紧要的,并且不存在应用程序在与目标系统匹配的环境中运行的性能基准,那么最好编写一个抽象软件层来向应用程序隐藏 IPC 工具的细节,然后在抽象层下使用不同的 IPC 工具来测试性能。

相关文章:

  • 智能配送机器人控制系统设计
  • MySQL 8.4企业版 安装和配置审计插件
  • 0422--在网页中上传头像(图片)
  • ChatBEV:一种理解 BEV 地图的可视化语言模型
  • 【论文阅读25】-滑坡时间预测-PFTF
  • 解耦旧系统的利器:Java 中的适配器模式(Adapter Pattern)实战解析
  • bert4keras
  • UV: Python包和项目管理器(从入门到不放弃教程)
  • SQL 时间转换的CONVERT()函数应用说明
  • 实验二 多线程编程实验
  • [蓝桥杯 2025 省 Python B] 最多次数
  • HashedWheelTimer源码分析
  • Scrapy框架爬虫官网的学习
  • OpenCV 图形API(55)颜色空间转换-----将图像从 RGB 色彩空间转换为 I420 格式函数RGB2I420()
  • 第九章:Agent Protocol Implementation
  • 香港云服务器内存使用率过高如何解决此问题
  • PH热榜 | 2025-04-23
  • 【金仓数据库征文】从 HTAP 到 AI 加速,KingbaseES 的未来之路
  • 《AI大模型应知应会100篇》第35篇:Prompt链式调用:解决复杂问题的策略
  • day4 pandas学习
  • 外交部回应菲律宾涉仁爱礁言论:菲方7轮运补均提前通报中方
  • 新任乒协副主席马龙:感谢刘国梁,愿把经验传给年轻运动员
  • 透纳仍是英国最好的艺术家,浦东美术馆有他的画展
  • “仅退款”将成过去时!多个电商平台集体修改售后规则,商家获得更多自主权
  • 今天是世界读书日,上海准备了哪些文化大餐?
  • 开发国内首个泌尿专科智能体,医生们将临床经验转变为知识图谱