目录
常见进程通信方式
一些理论基础
- 临界资源:每次仅允许一个进程访问的资源。
- 临界区:每个进程中访问临界资源的那段代码叫临界区
所谓临界区(也称为临界段)就是访问和操作共享数据的代码段。
进程互斥:两个或以上的进程不能同时进入关于同一组共享变量的临界区域,即一个进程正在访问临界资源,另一个进程要想访问必须等待。
进程同步:主要研究如何确定数个进程之间的执行顺序和避免数据竞争的问题 即,如何让多个进程能一块很好的协作运行
所谓同步,就是并发进程/线程在一些关键点上可能需要互相等待与互通消息,这种相互制约的等待与互通信息称为进程/线程同步。
举个生活的同步例子,你肚子饿了想要吃饭,你叫妈妈早点做菜,妈妈听到后就开始做菜,但是在妈妈没有做完饭之前,你必须阻塞等待,等妈妈做完饭后,自然会通知你,接着你吃饭的事情就可以进行了。
注意,同步与互斥是两种不同的概念:
同步就好比:「操作 A 应在操作 B 之前执行」,「操作 C 必须在操作 A 和操作 B 都完成之后才能执行」等;
互斥就好比:「操作 A 和操作 B 不能在同一时刻执行」;
system V 信号量
信号量用途:主要用于多进程或多线程对公共资源对象的访问控制。 用来解决多进程(多线程同步的问题),类似于一把锁,访问前获取锁(获取不到则等待),访问后释放锁。
多进程/多线程一般是并发执行,如果对公共资源访问没有做同步处理,很容易造成数据破坏
信号量其实是一个整型的计数器,主要用于实现进程间的互斥与同步,而不是用于缓存进程间通信的数据。
信号量表示资源的数量,控制信号量的方式有两种原子操作:
一个是 P 操作,这个操作会把信号量减去 -1,相减后如果信号量 < 0,则表明资源已被占用,进程需阻塞等待;相减后如果信号量 >= 0,则表明还有资源可使用,进程可正常继续执行。
另一个是 V 操作,这个操作会把信号量加上 1,相加后如果信号量 <= 0,则表明当前有阻塞中的进程,于是会将该进程唤醒运行;相加后如果信号量 > 0,则表明当前没有阻塞中的进程;
P 操作是用在进入共享资源之前,V 操作是用在离开共享资源之后,这两个操作是必须成对出现的。
举个类比,2 个资源的信号量,相当于 2 条火车轨道,PV 操作如下图过程:
一辆火车进入轨道,相当于信号量的P操作,资源-1,这样就剩下一条轨道
接着又一辆火车占用另一条轨道,也就是P操作,资源-1
此时交通信号灯变为红色,因为没有轨道可用,第三辆火车必须等待
第一辆火车离开轨道,相当于V操作,此时轨道资源为1,交通灯变为绿灯
第三辆火车发现交通信号灯变绿,于是进入火车轨道,轨道资源耗尽为0,于是交通信号灯变为红灯
在这个火车轨道系统中,轨道是公共资源,每辆火车好比一个线程,交通信号灯起的就是信号量的作用。信号量可以实现锁的互斥操作,也可以实现进程/线程同步
信号量类型
1)二进制信号量(也叫二值信号量)
此时信号量的初值只能是0和1。(二进制信号量可以实现互斥锁操作)
2)一般/计数信号量
此时信号量的初值可以是任意非负数。显然,其包含二进制信号量。上面举的火车轨道例子就可以使用计数信号量来实现,一般计数信号量与锁的区别是它可以允许多个线程/进程(线程的数量由计数信号量初值定义) 同时操作公共资源
一般只有在开发多进程的时候才可能遇到需要使用信号量的场景,phper 几乎很少有使用信号量的场景,就算有多进程对公共资源操作,大多也是使用 flock 文件锁做互斥操作
php模拟多进程操作公共资源
<?php $file = "num.txt";//定一个空文件 $count =0; file_put_contents($file,$count); $pid = pcntl_fork();//fork 一个进程 if($pid == 0){//子进程执行逻辑 $x = (int)file_get_contents($file);//读取文件内容 //i 循环累加 for($i=0; $i<1000; $i++){ $x = $x + 1; } //写入文件 file_put_contents($file,$x); //子进程退出 exit(0); } //父进程执行逻辑 $x = (int)file_get_contents($file); for($i=0; $i<1000; $i++){ $x = $x+1; } //累加写入 file_put_contents($file,$x);
在编写一个shell 脚本辅助
#!/bin/bash for a in {1..1000} do (php demo1.php) b=`cat num.txt` if [ $b != 2000 ] then echo -e "错误$b" fi done
按理来说,变量 $x
最后写入文件的值应该是2000,但很不幸,并不是如此,我们对上面的脚本执行一下:
运行了1000次,发现出现了变量$x值结果是 1000 的有8次,虽然发生错误的概率比较小,但是在计算机里是不能容忍的。
为什么会出现这种情况,我们知道单核cpu系统里为了实现多个程序同时运行的假象,操作系统通常都采用时间片调度,一个进程时间片用完就切换下一个进程运行,加上我们的高级语言不是每一行代码都是原子性的,比如x = (int)file_get_contents(
$file)
这行代码对于我们来说是不可分割是原子性的,但是经过编译器编译成汇编码【机器指令】可能是多条指令实现,这样就会出现问题,如果指令只执行到一半进程分配的时间片用完或者被其他进程打断,都有可能造成数据损坏,导致最后计算结果出现误差
使用php封装system v 信号量集函数
<?php $file = "num.txt";//定一个空文件 $count =0; $key = ftok("demo1.php","x"); $sem_id = sem_get($key,1);// 第二个参数是个整数,表示设置信号量集,设置为1 把它当做二值信号量来用,用于互斥 file_put_contents($file,$count); $pid = pcntl_fork();//fork 一个进程 if($pid == 0){//子进程执行逻辑 sem_acquire($sem_id); // P -1 操作 获取一个信号量 , 如果为0表示资源被占用进程挂起等待信号量释放 $x = (int)file_get_contents($file);//读取文件内容 //i 循环累加 for($i=0; $i<1000; $i++){ $x = $x + 1; } //写入文件 file_put_contents($file,$x); sem_release($sem_id); //V +1 操作 释放信号量 //子进程退出 exit(0); } //父进程执行逻辑 sem_acquire($sem_id); // P -1 操作 获取信号量, 如果为0表示资源被占用进程挂起等待信号量释放 $x = (int)file_get_contents($file); for($i=0; $i<1000; $i++){ $x = $x+1; } //累加写入 file_put_contents($file,$x); sem_release($sem_id); //V +1 操作 释放信号量
加入信号量后,那就一定保证100%是2000,绝对不会出现其他数值。