博主信息
博文 61
粉丝 1
评论 0
访问量 82570
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
0628-抓取京东商品列表
我的博客
原创
1149人浏览过


QQ图片20190630194750.png

实例 抓取页面

<?php
require __DIR__ . '/../sataic/function.php';

$url = 'https://list.jd.com/list.html?cat=1315,1343,9719&page=1';
$data = curl_data($url);
//echo $data;

$pattem = '/<li class="gl-item">(.*?)<i class="promo-words">/si';  //.*匹配前边原子以后的所有的内容  i 不分大小写
//中间数值必须为字符串,不能是数组
$preg = preg_match_all($pattem,$data,$matches);
//print_r($matches);
$con = preg_replace('/data-lazy-img/','src',$matches[0]);
//print_r($con);

//用循环匹配每个数组里面的汉字说明
$pattem1 = '/<img.*src="(.+)"/i';
$pattem2 = '/(<em>)(.*?)<\/em>/si'; //文字正则


foreach ($con as $mat){
    $preg_text = preg_match_all($pattem2,$mat,$con_text); //匹配汉字
    $preg_img = preg_match_all($pattem1,$mat,$con_img);  //匹配图片链接
    $text = trim($con_text[2][2]);
    $img = trim($con_img[1][0]);

    $im=[
          'text'=>$text,
           'img'=>$img,];
    // print_r($im);
    insert('list',$im);

//    if( $img==$find['img'])
//    {      echo '数据存在';
//        //echo  print_r($find['img']).'<br>'.print_r($im['img']).'<hr>';
//
//    }
//    else{
//        echo  print_r($find['img']).'<br>'.print_r($im['img']).'<hr>';
//
//   }
//  //  print_r($im);

}

//find() 查询一条   select()查询所有
//$find = select('list','id,img,text');
//
//print_r($find);

运行实例 »

点击 "运行实例" 按钮查看在线实例

实例 显示页面

<!doctype html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport"
          content="width=device-width, user-scalable=no, initial-scale=1.0, maximum-scale=1.0, minimum-scale=1.0">
    <meta http-equiv="X-UA-Compatible" content="ie=edge">
    <title>美女图片</title>
    <style>


        .div1{
            width: 222px;
            list-style-type: none;
            margin: 0 30px 30px 0;
            border:2px solid lightseagreen;
            float:left;
        }
        .div2{
            /*border:1px solid red;*/


        }
        .div3{
            /*border:1px solid deepskyblue;*/
            text-align: left;
            color: #ff9c01;

        }


        body{
            clear: both;

        }
    </style>


</head>
<body>


<ul>


<?php
    require __DIR__.'/../sataic/function.php';
    $a = select('list','img,text');
    foreach ($a as $b){
   echo "<div class='div1'><div class='div2'><img src='{$b['img']}'></div><div class='div3'>{$b['text']}</li></div></div>";
    }
   ?>

</ul>

<script>
    var ul = document.getElementsByTagName('ul');
    //从数据库读取数据

</script>


</body>
</html>

运行实例 »

点击 "运行实例" 按钮查看在线实例



批改状态:未批改

老师批语:
本博文版权归博主所有,转载请注明地址!如有侵权、违法,请联系admin@php.cn举报处理!
全部评论 文明上网理性发言,请遵守新闻评论服务协议
0条评论
作者最新博文
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

  • 登录PHP中文网,和优秀的人一起学习!
    全站2000+教程免费学