搜索

当前位置: 首页  >  下载站  >  类库  >  其它类库  >  phP的抓取网站类库

phP的抓取网站类库

phP的抓取网站类库

phP的抓取网站类库
分类:   类库下载 / 其它类库 发布时间:  2018-01-06 访问量:  4810
下载量:  317
点击下载
更多>

最新下载

50个优秀经典PHP算法大集合

经典PHP算法,学习优秀的思想 , 开拓思维
2241 2020-03-26

PHPExcel-1.8类库(值得收藏!)

PHPExcel 操作Office Excel 文档的PHP类库
11473 2018-09-26

依赖注入容器的PHP库

依赖注入容器的PHP库
374 2018-01-26

小巧的优化图片的PHP库

小巧的优化图片的PHP库
580 2018-01-26

提取GIF动画帧信息的PHP库

提取GIF动画帧信息的PHP库
259 2018-01-26

面向对象流包装PHP库

面向对象流包装PHP库
245 2018-01-26

远程文件下载php类库

远程文件下载php类库
658 2018-01-25

两表合并成一张新表的php类库

两表合并成一张新表的php类库
381 2018-01-25

静态文件生成的php类库

静态文件生成的php类库
365 2018-01-25

php小型日历类库

php小型日历类库
528 2018-01-25
更多>

最新教程

下载首页 / 类库下载 / 其它类库
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

支持抓取网站,进行爬虫,非常强大,是一个基于PHP的服务端开源项目,它可以让PHP开发人员轻松处理DOM文档内容,比如获取某新闻网站的头条信息。更有意思的是,它采用了jQuery的思想,你可以像使用jQuery一样处理页面内容,获取你想要的页面信息。

本站所有资源都是由网友投搞发布,或转载各大下载站,请自行检测软件的完整性!本站所有资源仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!如有侵权请联系我们删除下架,联系方式:admin@php.cn

相关推荐

phP的抓取网站类库

phP的抓取网站类库
其它类库
2018-01-06

网页抓取图片的PHP类

网页抓取图片的PHP类
其它类库
2017-12-30

php抓取国内视频网站的视频信息工具类

php抓取国内视频网站的视频信息工具类
其它类库
2017-03-18

php应用curl扩展抓取网页类

php应用curl扩展抓取网页类
curl类库
2017-04-07

php抓取图片的函数类

php抓取图片的函数类
图片类库
2017-04-27

php网页抓图片的类

php网页抓图片的类
图片类库
2017-06-08

热门下载

关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号