php多线程功能是php5.3才真正的支持了,下面我就尝试了pthreads功能的一个测试同时也发测试时发现了一些bug了,具体bug原因还无法解决看其它朋友有经验吗.
近日用PHP处理约7k条网络数据,现有网络情况下,耗时通常一秒一条,跑完整个程序大约近两个小时.
由于跑一次数据的时间太长,因此计划通过多个线程实现并行处理,我们可以通过pthreads扩展来实现真正的多线程,而不是常见的fsockopen来“模拟”。pthreads的官网介绍在这里:http://pthreads.org/
需要注意的是,如果尝试用数组在线程间交换数据,你会失望的,因为php的数组本身不是线程安全的,正确的做法是继承Stackable类,一个简单的demo如下所示:
- <?php
- class storage extends Stackable {
- public function run(){}
- }
-
- class my extends Thread {
- public function __construct($storage) {
- $this->storage = $storage;
- }
-
- public function run(){
- $i = 0;
- while(++$i < 10) {
- $this->storage[]=rand(0,1000);
- }
-
- $this->synchronized(function($thread){
- $thread->notify();
- }, $this);
- }
- }
-
- $storage = new storage();
- $my = new my($storage);
- $my->start();
-
- $my->synchronized(function($thread){
- $thread->wait();
- }, $my);
-
- var_dump($storage);
- ?>
上例如果$storage是array,那么dump出来的将是null,启用多线程后,跑一次数据的时间可以压缩到1000秒内,不到二十分钟,已经在我的接受范围内了.
最后发现一个自动加载BUG
线程的run方法可以继承主线程的常量,函数定义,ini_set()和自动加载不能继承,具体什么能继承什么不能继承没找到相关文档,只能自己摸索.
继承过来的函数中只能进行一些基本操作,如果试图new一个对象(比如PDO)然后返回这个对象就会导致进程意外终止,就目前来说基本不能用于生产环境. |