PHP作为一种解释型语言,不同于编译型语言编译结果即为当前CPU体系的指令,PHP源代码只有编译成opcode才能够被zend虚拟机直接执行。
下面就简单描述PHP7语言执行原理:
1. 源代码首先利用Re2c实现的词法分析器进行词法分析,将源代码切割为多个字符串单元,分割后的字符串称为Token;
2. 基于Bison实现的语法分析器将Token和符合BNF文法规则的代码生成抽象语法树;
3. 抽象语法树(AST)编译生成opcode;
我们常常讨论的解释型语言执行效率较低,原因在于PHP执行过程中要多了翻译为opcode的过程。
不仅如此,与常驻内存的Java等语言不同,PHP代码在执行过后,内存会马上释放,基本上所有数据都会在此时销毁(仅有极少数数据会缓存)。
这种执行机制的优点在于有效避免内存泄漏,内存回收机制更简单,缺点就是每个PHP请求都得重复执行请求-翻译-执行的过程。
备注:内存泄漏(Memory Leak)是指程序中己动态分配的堆内存由于某种原因程序未释放或无法释放,造成系统内存的浪费,导致程序运行速度减慢甚至系统崩溃等严重后果。
为了弥补不是常驻内存的缺憾,引入opcode缓存,zend虚拟机会将第一次执行的PHP代码编译结果缓存到内存或者硬盘中,当下次执行该部分代码时直接读取缓存,一定程度上可以提高PHP运行速度。
参考资料
1. 陈雷,PHP7底层设计与源码实现
2. 列旭松,陈文,PHP核心技术与最佳实践