php进程通信之信号量浅析介绍

来自:网络
时间:2023-01-03
阅读:
目录

常见进程通信方式

php进程通信之信号量浅析介绍

一些理论基础

  • 临界资源:每次仅允许一个进程访问的资源。
  • 临界区:每个进程中访问临界资源的那段代码叫临界区

所谓临界区(也称为临界段)就是访问和操作共享数据的代码段。

进程互斥:两个或以上的进程不能同时进入关于同一组共享变量的临界区域,即一个进程正在访问临界资源,另一个进程要想访问必须等待。

进程同步:主要研究如何确定数个进程之间的执行顺序和避免数据竞争的问题 即,如何让多个进程能一块很好的协作运行

所谓同步,就是并发进程/线程在一些关键点上可能需要互相等待与互通消息,这种相互制约的等待与互通信息称为进程/线程同步。

举个生活的同步例子,你肚子饿了想要吃饭,你叫妈妈早点做菜,妈妈听到后就开始做菜,但是在妈妈没有做完饭之前,你必须阻塞等待,等妈妈做完饭后,自然会通知你,接着你吃饭的事情就可以进行了。

注意,同步与互斥是两种不同的概念:

同步就好比:「操作 A 应在操作 B 之前执行」,「操作 C 必须在操作 A 和操作 B 都完成之后才能执行」等;

互斥就好比:「操作 A 和操作 B 不能在同一时刻执行」;

system V 信号量

信号量用途:主要用于多进程或多线程对公共资源对象的访问控制。 用来解决多进程(多线程同步的问题),类似于一把锁,访问前获取锁(获取不到则等待),访问后释放锁。

多进程/多线程一般是并发执行,如果对公共资源访问没有做同步处理,很容易造成数据破坏

信号量其实是一个整型的计数器,主要用于实现进程间的互斥与同步,而不是用于缓存进程间通信的数据。

信号量表示资源的数量,控制信号量的方式有两种原子操作:

一个是 P 操作,这个操作会把信号量减去 -1,相减后如果信号量 < 0,则表明资源已被占用,进程需阻塞等待;相减后如果信号量 >= 0,则表明还有资源可使用,进程可正常继续执行。

另一个是 V 操作,这个操作会把信号量加上 1,相加后如果信号量 <= 0,则表明当前有阻塞中的进程,于是会将该进程唤醒运行;相加后如果信号量 > 0,则表明当前没有阻塞中的进程;

P 操作是用在进入共享资源之前,V 操作是用在离开共享资源之后,这两个操作是必须成对出现的。

举个类比,2 个资源的信号量,相当于 2 条火车轨道,PV 操作如下图过程:

php进程通信之信号量浅析介绍

一辆火车进入轨道,相当于信号量的P操作,资源-1,这样就剩下一条轨道

php进程通信之信号量浅析介绍

接着又一辆火车占用另一条轨道,也就是P操作,资源-1

php进程通信之信号量浅析介绍

此时交通信号灯变为红色,因为没有轨道可用,第三辆火车必须等待

php进程通信之信号量浅析介绍

第一辆火车离开轨道,相当于V操作,此时轨道资源为1,交通灯变为绿灯

php进程通信之信号量浅析介绍

第三辆火车发现交通信号灯变绿,于是进入火车轨道,轨道资源耗尽为0,于是交通信号灯变为红灯

php进程通信之信号量浅析介绍

在这个火车轨道系统中,轨道是公共资源,每辆火车好比一个线程,交通信号灯起的就是信号量的作用。信号量可以实现锁的互斥操作,也可以实现进程/线程同步

信号量类型

1)二进制信号量(也叫二值信号量)

此时信号量的初值只能是0和1。(二进制信号量可以实现互斥锁操作)

2)一般/计数信号量

此时信号量的初值可以是任意非负数。显然,其包含二进制信号量。上面举的火车轨道例子就可以使用计数信号量来实现,一般计数信号量与锁的区别是它可以允许多个线程/进程(线程的数量由计数信号量初值定义) 同时操作公共资源

一般只有在开发多进程的时候才可能遇到需要使用信号量的场景,phper 几乎很少有使用信号量的场景,就算有多进程对公共资源操作,大多也是使用 flock 文件锁做互斥操作

php模拟多进程操作公共资源

<?php
$file = "num.txt";//定一个空文件
$count =0;
file_put_contents($file,$count);

$pid = pcntl_fork();//fork 一个进程

if($pid == 0){//子进程执行逻辑
    $x = (int)file_get_contents($file);//读取文件内容
    //i 循环累加
    for($i=0; $i<1000; $i++){
        $x = $x + 1;
    }
    //写入文件
    file_put_contents($file,$x);
    //子进程退出
    exit(0);
}
//父进程执行逻辑
$x = (int)file_get_contents($file);
for($i=0; $i<1000; $i++){
    $x = $x+1;
}
//累加写入
file_put_contents($file,$x);

在编写一个shell 脚本辅助

#!/bin/bash
for a in {1..1000}
do
    (php demo1.php)
    b=`cat num.txt`
    if [ $b != 2000 ]
    then
        echo -e "错误$b"
    fi
done

按理来说,变量 $x 最后写入文件的值应该是2000,但很不幸,并不是如此,我们对上面的脚本执行一下:

php进程通信之信号量浅析介绍

运行了1000次,发现出现了变量$x值结果是 1000 的有8次,虽然发生错误的概率比较小,但是在计算机里是不能容忍的。

为什么会出现这种情况,我们知道单核cpu系统里为了实现多个程序同时运行的假象,操作系统通常都采用时间片调度,一个进程时间片用完就切换下一个进程运行,加上我们的高级语言不是每一行代码都是原子性的,比如x = (int)file_get_contents($file) 这行代码对于我们来说是不可分割是原子性的,但是经过编译器编译成汇编码【机器指令】可能是多条指令实现,这样就会出现问题,如果指令只执行到一半进程分配的时间片用完或者被其他进程打断,都有可能造成数据损坏,导致最后计算结果出现误差

使用php封装system v 信号量集函数

<?php
$file = "num.txt";//定一个空文件
$count =0;
$key = ftok("demo1.php","x");
$sem_id = sem_get($key,1);// 第二个参数是个整数,表示设置信号量集,设置为1 把它当做二值信号量来用,用于互斥
file_put_contents($file,$count);
$pid = pcntl_fork();//fork 一个进程
if($pid == 0){//子进程执行逻辑
sem_acquire($sem_id); // P -1 操作 获取一个信号量 , 如果为0表示资源被占用进程挂起等待信号量释放
    $x = (int)file_get_contents($file);//读取文件内容
    //i 循环累加
    for($i=0; $i<1000; $i++){
        $x = $x + 1;
    }
    //写入文件
    file_put_contents($file,$x);
       sem_release($sem_id); //V +1 操作 释放信号量
    //子进程退出
    exit(0);
}
//父进程执行逻辑
sem_acquire($sem_id); // P -1 操作  获取信号量, 如果为0表示资源被占用进程挂起等待信号量释放
$x = (int)file_get_contents($file);
for($i=0; $i<1000; $i++){
    $x = $x+1;
}
//累加写入
file_put_contents($file,$x);
sem_release($sem_id); //V +1 操作 释放信号量

加入信号量后,那就一定保证100%是2000,绝对不会出现其他数值。

返回顶部
顶部