一、内存开销
Task 初体验一节中我们提到,server 中的代码修改之后,要先按 Ctrl+C 终止 server 再重新启动下 server 才会生效,当时我们一言以过之,本节我们主要就来看看这个常驻内存相关的事。
在传统的 web 开发模式中,我们知道,每一次 php 请求,都要经过 php 文件从磁盘上读取、初始化、词法解析、语法解析、编译等过程,而且还要与 nginx 或者 apache 通信,如果再涉及数据库的交互,还要再算上数据库的握手、验权、关闭等操作,可见一次请求的背后其实是有相当繁琐的过程,无疑,这个过程也就带来了相当多的开销!当然,所有的这些资源和内存,在一次请求结束之前,都会得到释放。
二、常驻内存
但是,swoole 是常驻内存运行的。这有几点不同,我们分别了解下。
在运行 server 之后所加载的任何资源,都会一直持续在内存中存在。
也就是说假设我们开启了一个 server,有 100 个 client 要 connect,
加载一些配置文件、初始化变量等操作,只有在第一个 client 连接的时候才有这些操作,
后面的 client 连接的时候就省去了重复加载的过程,直接从内存中读取就好了。
这样好不好呢?很明显非常好,如此一来还可以提升不小的性能。
但是,对开发人员的要求也更高了。
因为这些资源常驻内存,并不会像 web 模式下,在请求结束之后会释放内存和资源。
也就是说我们在操作中一旦没有处理好,就会发生内存泄漏,久而久之就可能会发生内存溢出。
之前一直对 swoole 印象不错,没想到都是坑。其实这都不算坑,
如果你觉得是坑,权且当做是一种提升自身能力的约束好了。
回到我们的开篇提到的问题上,
再啰嗦的解释一遍:server 一开始就把我们的代码加载到内存中了,
无论后期我们怎么修改本地磁盘上的代码,客户端再次发起请求的时候,
永远都是内存中的代码在生效,所以我们只能终止server,
释放内存然后再重启 server,重新把新的代码加载到内存中,
如此,明白否?那有同学要说了,感觉好麻烦,
是不是说在 swoole中 申请的内存啥的都要自己手动 unset 释放呢?
对于局部变量,就没必要操这个心了,swoole 会在事件回调函数返回之后释放。
但是对于全局变量你就要悠着点了,因为他们在使用完之后并不会被释放。
不会被释放?那在 php 中,
这几种全局变量:global 声明的变量,
static 声明的对象属性或者函数内的静态变量和超全局变量谁还敢用?
一个不小心服务器直接就玩完的节奏!
三、全局变量
我们想一下为什么要用全局变量?
是不是就是想全局共享?但是,在多进程开发模式下,进程内的全局变量所用的内存那也是保存在子进程内存堆的,也并非共享内存,所以在 swoole 开发中我们还是尽量避免使用全局变量!
那我要是非用不可呢?就是乐意,就是想用。
四、内存泄漏
比如有一个 static 大数组,用于保存客户端的连接标识。我们就可以在 onClose 回调内清理变量。
此外,swoole 还提供了 max_request 机制,我们可以配置 max_request 和 task_max_request 这两个参数来避免内存溢出。
max_request 的含义是 worker 进程的最大任务数,当 worker 进程处理的任务数超过这个参数时,
worker 进程会自动退出,如此便达到释放内存和资源的目的。不必担心 worker 进程退出后,
没“人”处理业务逻辑了,因为我们还有 Manager 进程,
Worker 进程退出后 Manager 进程会重新拉起一个新的 Worker 进程。
task_max_request 针对 task 进程,含义同 max_request。
光溜溜的说了半天,我们来看下是不是这么玩的。
server 的代码简写如下
$serv = new swoole_server("127.0.0.1", 9501);
$serv->set([
"worker_num" => 1,
"task_worker_num" => 1,
"max_request" => 3,
"task_max_request" => 4,
]);
$serv->on("Connect", function ($serv, $fd) {
});
$serv->on("Receive", function ($serv, $fd, $fromId, $data) {
$serv->task($data);
});
$serv->on("Task", function ($serv, $taskId, $fromId, $data) {
});
$serv->on("Finish", function ($serv, $taskId, $data) {
});
$serv->on("Close", function ($serv, $fd) {
});
$serv->start();
client 代码如下
$client = new swoole_client(SWOOLE_SOCK_TCP, SWOOLE_SOCK_SYNC);
$client->connect("127.0.0.1", 9501) || exit("connect failed. Error: {$client->errCode}\n");
// 向服务端发送数据
$client->send("Just a test.");
$client->close();
为了方便测试,我们开了一个 Worker 进程,一个 Task 进程,Worker 进程的最大任务设置为 3 次,Task 进程的最大任务设置为 4 次。
运行 server 后,在 client 未请求前我们看下当前的进程结构
注意进程 id 等于 15644 和 15645 哦,这两个一个是 Worker 进程,一个是 Task 进程。Mac 下我们就不区分到底谁是谁了。
随后我们让客户端请求 3 次,再看下结果
有没有发现原先进程 id 等于 15645 的现在变成 15680 了?请求 3 次后我们确定是 Worker 进程自动退出了,并且 Manager 进程拉起了一个 15680 的 Worker 进程。
我们再请求一次,第四次
发现进程 id 等于 15644 的 Task 进程消失了,有一个新的子进程 15704 被重新创建了。
看来官方没有骗人,说的都对。
So…原来我在一开始介绍的那么多都是废话?
不全是,因为 max_request 参数对 server 有下面几种限制条件。
max_request 只能用于同步阻塞、无状态的请求响应式服务器程序
纯异步的 Server 不应当设置 max_request
使用 Base 模式时 max_request 是无效的,其中 Base 模式是 swoole 运行模式的一种,
我们主要介绍多进程模式
五、总结
常驻内存减少了不小开销,swoole 不错
应尽量避免使用全局变量,不用最好,没啥用
max_request 可以解决 php 的内存溢出问题,但是主要还是要养成释放内存的习惯,
因为 max_request 也有限制场景