用户名:
密 码: 记住
您当前的位置:首页 > 网络编程 > php教程

PHP用DOM方式处理HTML之Simple HTML DOM

时间:2015-01-23  来源:西部数据  作者:西部数据

近经常需要采集一些网上的数据,发现一个PHP处理HTML的利器 simple html dom,看了一下文档,使用非常方便,关键是能够用CSS选择器来访问DOM树,和jquery相似,实在是难得的利器.

入门级

simple_html_dom插件

用dom处理html文件的利器

使用:加载simple_html_dom.php文件

require_once 'simple_html_dom.php'

new simple_html_dom对象

$dom = new simple_html_dom()

加载html:

$dom->load($html);

find()方法

$dom->find('div.lookLeftname', 0)->plaintext

class=‘lookLeftname'的div中的纯文本

$dom->find('div.lookLeftname', 0)->innertext

class='lookLeftname'的div中的内部文本

完整测试实例,代码如下:

  1. <?php 
  2. require_once("simple_html_dom.php"); 
  3. ini_set('memory_limit','1000M'); 
  4. ini_set("max_execution_time",6000000); 
  5.  
  6. for($i=1;$i<=21;$i++){ 
  7.  $html = file_get_html(http://www.111cn.net); 
  8.  $as = $html->find('.shopname a'); 
  9.  $sum = 0; 
  10.  foreach($as as $a) { 
  11.   if($a->plaintext != "分店"){ 
  12.    $a->href = "http://www.xx.com".$a->href; 
  13.    echo $a->outertext."------".$a->href."-------<br>"
  14.    $sum++; 
  15.   }//开源代码phpfensi.com 
  16.  } 
  17.  echo "<br><br>第 {$i} 页结束 ,数目:{$sum}<hr>"
  18. ?> 
来顶一下
返回首页
返回首页
推荐资讯
WiFi太不安全:7岁女孩11分钟内入侵公共网络 WiFi太不安全:7岁女孩11分钟内入侵近期刚刚发布研究说WiFi网络能获得人们手机里多少私人信息,
不服跑个分?人工智能也出现“刷分”乱象 不服跑个分?人工智能也出现“刷分2014年,人工智能领域突然爆发,成为了科研和科技创业的热门
相关文章
栏目更新
栏目热门