一个简单PHP采集器
PHP代码
<?php //**************************************************************** $url = "http://book.sina.com.cn/nzt/lit/zhuxian2/index.shtml";// 图书地址 $ver = "old"; //新旧版本 //**************************************************************** $r = file_get_contents($url); //用file_get_contents将网址打开并读取所打开的页面的内容 preg_match("/<meta name=\"description\" content=\"(.*?)\">/is",$r,$booktitle);//匹配此页面的标题 $bookname = $booktitle[1];//取第二层数组 $preg = '/<li><a href=(.*).shtml target=_blank class=a03>/isU'; preg_match_all($preg, $r, $zj); //将此页面的章节连接匹配出来 $bookzj = count($zj[1]);// 计算章节标题数量 if ($ver=="new"){ $content_start = "<!--正文内容开始-->"; $content_end = "<!--正文内容结束-->"; } if ($ver=="old"){ $content_start = "<\/table><!--NEWSZW_HZH_END-->"; $content_end = "<br>"; } header("Content-Type:text/html;charset=gb2312"); writer($bookname." 共".$bookzj."节\r\n帅哥刘并于".date("D M j G:i:s T Y")."为了毕业而设计小说整理收集\r\n", "./ailaopo/".$bookname.".txt","w+"); for ($i=0;$i<$bookzj;$i++) { //echo "http://book.sina.com.cn".$zj[1][$i]".shtml";die(); //用file_get_contents将章节连接打开并读取所打开的页面的内容 $str = file_get_contents("http://book.sina.com.cn".$zj[1][$i].".shtml"); preg_match("/(<title>)(.*?)(<\/title>)/is",$str,$title);//匹配此连接页面的标题 $title = str_replace("_读书频道_新浪网","",$title[2]);//把$title[2]里面有_读书频道_新浪网的换成空 preg_match("/(".$content_start.")(.*?)(".$content_end.")/is",$str,$content);//匹配此连接页面的内容 $content = preg_replace("/<(.*?)>/s","",str_replace("</p>","\r\n",$content[2]));//用str_replace把$content[2]里有</p> 的换成\r\n print_r($content); exit; //把第".($i+1)."节和标题与内容连接在一起放在变量 $result = " \r\n第".($i+1)."节--------".$title."_汪老师就是帅 --------- \r\n".$content; writer($result, "./ailaopo/".$bookname.".txt","a+");//调用函数把$result echo "小说".$bookname."共".$bookzj."节,现在整理到第".$i."节 _".$title."<br>"; } echo "小说".$bookname."共".$bookzj."节 已全部整理完成!"; function writer($content,$url,$mode)//定义函数名 writer 参数$content,$url,$mode { $fp = fopen($url, $mode);//打开文件$url fwrite($fp, $content);//把$content放入到$fp fclose($fp); //关闭$fp } ?>
로그인 후 복사
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사
<garden> : 정원 재배 - 완전한 돌연변이 가이드
3 몇 주 전
By DDD
<gum> : Bubble Gum Simulator Infinity- 로얄 키를 얻고 사용하는 방법
3 몇 주 전
By 尊渡假赌尊渡假赌尊渡假赌
KB5055612 수정 방법 Windows 10에 설치되지 않습니까?
3 몇 주 전
By DDD
Blue Prince : 지하실에가는 방법
1 몇 달 전
By DDD
Nordhold : Fusion System, 설명
3 몇 주 전
By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)