PHP Curl多线程实现原理与实例详解

时间：2015-01-23 来源：西部数据作者：西部数据

因为工作中我们经常会需要使用到Curl多线程来处理一些事情,不得己就深入了对Curl多线程研究了,下面小编来给各位同学介绍一下Curl多线程实例与原理吧.

相信许多人对php手册中语焉不详的curl_multi一族的函数头疼不已,它们文档少,给的例子更是简单的让你无从借鉴,我也曾经找了许多网页,都没见一个完整的应用例子。

curl_multi_add_handle

curl_multi_close

curl_multi_exec

curl_multi_getcontent

curl_multi_info_read

curl_multi_init

curl_multi_remove_handle

curl_multi_select

一般来说,想到要用这些函数时,目的显然应该是要同时请求多个url,而不是一个一个依次请求,否则不如自己循环去调curl_exec好了.

步骤总结如下：

第一步：调用curl_multi_init

第二步：循环调用curl_multi_add_handle,这一步需要注意的是，curl_multi_add_handle的第二个参数是由curl_init而来的子handle。

第三步：持续调用curl_multi_exec

第四步：根据需要循环调用curl_multi_getcontent获取结果

第五步：调用curl_multi_remove_handle，并为每个字handle调用curl_close

第六步：调用curl_multi_close

这里有PHP手册上的例子,代码如下:

<?php

// 创建一对cURL资源

$ch1 = curl_init();

$ch2 = curl_init();



// 设置URL和相应的选项

curl_setopt($ch1, CURLOPT_URL, "http://lxr.php.net/");

curl_setopt($ch1, CURLOPT_HEADER, 0);

curl_setopt($ch2, CURLOPT_URL, "http://www.php.net/");

curl_setopt($ch2, CURLOPT_HEADER, 0);



// 创建批处理cURL句柄

$mh = curl_multi_init();



// 增加2个句柄

curl_multi_add_handle($mh,$ch1);

curl_multi_add_handle($mh,$ch2);



$active = null;

// 执行批处理句柄

do {

    $mrc = curl_multi_exec($mh, $active);

} while ($mrc == CURLM_CALL_MULTI_PERFORM);



while ($active && $mrc == CURLM_OK) {

    if (curl_multi_select($mh) != -1) {

        do {

            $mrc = curl_multi_exec($mh, $active);

        } while ($mrc == CURLM_CALL_MULTI_PERFORM);

    }

}

// 关闭全部句柄

curl_multi_remove_handle($mh, $ch1);

curl_multi_remove_handle($mh, $ch2);

curl_multi_close($mh);

?>

整个使用过程差不多就是这样,但是,这个简单代码有个致命弱点,就是在do循环的那段,在整个url请求期间是个死循环,它会轻易导致CPU占用100%。

现在我们来改进它,这里要用到一个几乎没有任何文档的函数curl_multi_select了,虽然C的curl库对select有说明,但是,php里的接口和用法确与C中有不同。

把上面do的那段改成下面这样,实例代码如下:

do {

                        $mrc = curl_multi_exec($mh,$active);

                 } while ($mrc == CURLM_CALL_MULTI_PERFORM);

                while ($active and $mrc == CURLM_OK) {

                        if (curl_multi_select($mh) != -1) {

                                do {

                                        $mrc = curl_multi_exec($mh, $active);

                                 } while ($mrc == CURLM_CALL_MULTI_PERFORM);

                         }

                 }