深入理解PHP——内存管理垃圾回收


一、内存管理机制

概述

  • 1) 操作系统直接管理着内存,所以操作系统也需要进行内存管理,计算机中通常都有内存管理单元(MMU) 用于处理CPU对内存的访问。
  • 2) 应用程序无法直接调用物理内存, 只能向系统申请内存。
    • 向操作系统申请内存空间会引发系统调用。
    • 系统调用会将CPU从用户态切换到内核。
    • 为了减少系统调用开销。通常在用户态进行内存管理。 申请大块内存备用。使用完的内存不马上释放,将内存复用,避免多次内存申请和释放所带来性能消耗。
  • 3) PHP不需要显示内存管理,由Zend引擎进行管理。

PHP内存限制

  • 1)php.ini中的默认32MB
    • memory_limit = 32M
  • 2)动态修改内存
    • ini_set (“memory_limit”, “128M”)
  • 3)获取目前内存占用
    • memory_get_usage() : 获取PHP脚本所用的内存大小
    • memory_get_peak_usage() :返回当前脚本到目前位置所占用的内存峰值。

先看一段代码:

<?php
//内存管理机制
var_dump(memory_get_usage());//获取内存方法,加上true返回实际内存,不加则返回表现内存
$a = "laruence";
var_dump(memory_get_usage());
unset($a);
var_dump(memory_get_usage());
//输出(在我的个人电脑上, 可能会因为系统,PHP版本,载入的扩展不同而不同):
//int 240552
//int 240720
//int 240552

定义变量之后,内存增加,清除变量之后,内存恢复(有些可能不会恢复和以前一样),好像定义变量时申请了一次内存,其实不是这样的,php会预先申请一块内存,不会每次定义变量就申请内存。

首先我们要打破一个思维: PHP不像C语言那样, 只有你显示的调用内存分配相关API才会有内存的分配. 也就是说, 在PHP中, 有很多我们看不到的内存分配过程.

比如对于:

$a = "laruence";
隐式的内存分配点就有:
  • 1.1. 为变量名分配内存, 存入符号表
  • 2.2. 为变量值分配内存

所以, PHP的unset确实会释放内存, 但这个释放不是C编程意义上的释放, 不是交回给OS.
对于PHP来说, 它自身提供了一套和C语言对内存分配相似的内存管理API: 

emalloc(size_t size);
efree(void *ptr);
ecalloc(size_t nmemb, size_t size);
erealloc(void *ptr, size_t size);
estrdup(const char *s);
estrndup(const char *s, unsigned int length);

这些API和C的API意义对应, 在PHP内部都是通过这些API来管理内存的.

当我们调用emalloc申请内存的时候, PHP并不是简单的向OS要内存, 而是会像OS要一个大块的内存, 然后把其中的一块分配给申请者, 这样当再有逻辑来申请内存的时候, 就不再需要向OS申请内存了, 避免了频繁的系统调用.

比如如下的例子:

var_dump(memory_get_usage(true));//注意获取的是real_size
$a = "laruence";
var_dump(memory_get_usage(true));
unset($a);
var_dump(memory_get_usage(true));
//输出
//int 262144
//int 262144
//int 262144

也就是我们在定义变量$a的时候, PHP并没有向系统申请新内存.同样的, 在我们调用efree释放内存的时候, PHP也不会把内存还给OS, 而会把这块内存, 归入自己维护的空闲内存列表.

对于小块内存来说, 更可能的是, 把它放到内存缓存列表中去(后记, 某些版本的PHP, 比如我验证过的PHP5.2.4, 5.2.6, 5.2.8, 在调用get_memory_usage()的时候, 不会减去内存缓存列表中的可用内存块大小, 导致看起来, unset以后内存不变).

$a = “hello”;

定义变量时,存储两个方面:
  1. 变量名,存储在符号表
  2. 变量值存储在内存空间
  3. 在删除变量的时候,会将变量值存储的空间释放,而变量名所在的符号表不会减小(只增不减)

只增不减的数组

Hashtable是PHP的核心结构, 数组也是用她来表示的, 而符号表也是一种关联数组, 对于如下代码:

var_dump(memory_get_usage());
for($i=0;$i<100;$i++)
{
$a = "test".$i;
$$a = "hello";    
}
var_dump(memory_get_usage());
for($i=0;$i<100;$i++)
{
$a = "test".$i;
unset($$a);    
}
var_dump(memory_get_usage());

我们定义了100个变量, 然后又按个Unset了他们, 来看看输出:

//int 242104
//int 259768
//int 242920

Wow, 怎么少了这么多内存?
这是因为对于Hashtable来说, 定义它的时候, 不可能一次性分配足够多的内存块, 来保存未知个数的元素, 所以PHP会在初始化的时候, 只是分配一小部分内存块给HashTable, 当不够用的时候再RESIZE扩容。

Hashtable, 只能扩容, 不会减少, 对于上面的例子, 当我们存入100个变量的时候, 符号表不够用了, 做了一次扩容, 而当我们依次unset掉这100个变量以后, 变量占用的内存是释放了(118848 – 104448), 但是符号表并没有缩小, 所以这些少的内存是被符号表本身占去了…

二、垃圾回收机制

PHP变量存储在一个zval容器里面的

    1. 变量类型
    1. 变量值
    1. is_ref 代表是否有地址引用
    1. refcount 指向该值的变量数量

变量赋值的时候:is_ref为false, refcount为1

$a = 1;
xdebug_debug_zval('a');
echo PHP_EOL;//换行符,提高代码的源代码级可移植性

输出:

a:

(refcount=1, is_ref=0),

int

1

将变量a的值赋给变量b,变量b不会立刻去在内存中存储值,而是先指向变量a的值,一直到变量a有任何操作的时候

$b = $a;
xdebug_debug_zval('a');
echo PHP_EOL;

输出:

a:

(refcount=2, is_ref=0),

int

1
再来看一个
$c = &$a;
xdebug_debug_zval('a');
echo PHP_EOL;

xdebug_debug_zval('b');
echo PHP_EOL;

输出:

a:

(refcount=2, is_ref=1),

int

1

b:

(refcount=1, is_ref=0),

int

1

因为程序又操作了变量a,所以变量b会自己申请一块内存将值放进去。
所以变量a的zval容器中refcount会减1变为1,变量c指向a,所以refcount会加1变为2,is_ref变为true

垃圾回收
  1. 在5.2版本或之前版本,PHP会根据refcount值来判断是不是垃圾
  • 如果refcount值为0,PHP会当做垃圾释放掉
  • 这种回收机制有缺陷,对于环状引用的变量无法回收
环状引用:
$attr = array("hello");
$attr[]= &$attr;

xdebug_debug_zval('attr');
echo PHP_EOL;

输出:

attr:

(refcount=2, is_ref=1),
array (size=2)
0 => (refcount=1, is_ref=0),

string

'hello' (length=5)

1 => (refcount=2, is_ref=1),
&array

2.在5.3之后版本改进了垃圾回收机制

  • 如果发现一个zval容器中的refcount在增加,说明不是垃圾
  • 如果发现一个zval容器中的refcount在减少,如果减到了0,直接当做垃圾回收
  • 如果发现一个zval容器中的refcount在减少,并没有减到0,PHP会把该值放到缓冲区,当做有可能是垃圾的怀疑对象
  • 当缓冲区达到临界值,PHP会自动调用一个方法取遍历每一个值,如果发现是垃圾就清理
坚持原创技术分享,您的支持将鼓励我继续创作!