目录
以正方教务系统为例,用php模拟登陆抓取课表、空教室,抓取课表
首页 后端开发 php教程 以正方教务系统为例,用php模拟登陆抓取课表、空教室,抓取课表_PHP教程

以正方教务系统为例,用php模拟登陆抓取课表、空教室,抓取课表_PHP教程

Jul 13, 2016 am 09:53 AM
php 抓取 模拟 登陆 系统

以正方教务系统为例,用php模拟登陆抓取课表、空教室,抓取课表

  课程格子和超级课程表这两个应用,想必大学生都很熟悉,使用自己的学号和教务系统的密码,就可以将自己的课表导入,随时随地都可以在手机上查看。

  其实稍微了解一点php的话,我们也可以做一个类似这样的web 应用。

  1,解决掉验证码

    其实这是正方的一个小bug,当我们进入登陆界面时,浏览器会去请求服务器,服务器会生成一个验证码图片。如果我们不去请求这个图片,那么正方后台也不会生成相应的        验证码,于是这样我们就有了可乘之机,让我高兴会儿~这时,我们在不填写验证码的情况下,可以很流畅的进入。大家可以在自己的电脑上禁止访问验证码的地址,然后试试这        是不是真的~当然,这只对正方有效。

  2,php 的curl 模拟登陆

    这里直接贴一个脚本之家对 curl 的讲解吧 http://www.jb51.net/article/51299.htm

    接下来就是相关代码了,相信很多人和我一样,只喜欢看例子,对于长篇大论的讲解,转头就走……不过这个习惯还是不好……废话不多说!

    

//模拟登陆
	function curl_request($url,$post='',$cookie='', $returnCookie=0){
	        $curl = curl_init();
	        curl_setopt($curl, CURLOPT_URL, $url);
	        curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)');
	        curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
	        curl_setopt($curl, CURLOPT_AUTOREFERER, 1);
	        curl_setopt($curl, CURLOPT_REFERER, "这里一定要换成教务系统登陆的url"); //填写教务系统url
	        if($post) {
	            curl_setopt($curl, CURLOPT_POST, 1);
	            curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));
	        }
	        if($cookie) {
	            curl_setopt($curl, CURLOPT_COOKIE, $cookie);
	        }
	        curl_setopt($curl, CURLOPT_HEADER, $returnCookie);
	        curl_setopt($curl, CURLOPT_TIMEOUT, 20);
	        curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
	        $data = curl_exec($curl);
	        if (curl_errno($curl)) {
	            return curl_error($curl);
	        }
	        curl_close($curl);
	        if($returnCookie){
	            list($header, $body) = explode("\r\n\r\n", $data, 2);
	            preg_match_all("/Set\-Cookie:([^;]*);/", $header, $matches);
	            $info['cookie']  = substr($matches[1][0], 1);
	            $info['content'] = $body;
	            return $info;
	        }else{
	            return $data;
	        }
    }
登录后复制

  3,教务系统登陆页面的隐藏字段

    举个栗子

    

    <input type="hidden" name="__VIEWSTATE" value="dDwyODE2NTM0OTg7Oz61eIbnKVojBioGYtg2vsy2SklwiA==">
登录后复制

    这些东西在登陆的时候也是需要带上的,顺便贴出函数,顺便暴漏了博主的学校……皇家种地大学(主要是正则表达式的运用)

    

    <br />  //登陆页面的隐藏字段<br />  function getView(){
	    $url = 'http://jw.hzau.edu.cn/default2.aspx';
	    $result = curl_request($url);
	    $pattern = '/<input type="hidden" name="__VIEWSTATE" value="(.*?)" \/>/is';
	    preg_match_all($pattern, $result, $matches);
	    $res[0] = $matches[1][0];
	         
	    return $res[0] ;
	}
登录后复制

  //返回教室查询页面的隐藏值
  private function getViewJs($cookie,$xh){
    $url = "http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";
    $result = curl_request($url,'',$cookie);
    $pattern = '//is';
    preg_match_all($pattern, $result, $matches);
    $res[0] = $matches[1][0];
    return $res[0] ;
  }

  4,cookie 的获取

    

function login($xh,$pwd){
	    $url = 'http://jw.hzau.edu.cn/default2.aspx';
	    $post['__VIEWSTATE'] = $this->getView();
	    $post['txtUserName'] = $xh; //填写学号
	    $post['TextBox2'] = $pwd;  //填写密码
	    $post['txtSecretCode'] = '';
	    $post['lbLanguage'] = '';
	    $post['hidPdrs'] = '';
	    $post['hidsc'] = '';
	    $post['RadioButtonList1'] = iconv('utf-8', 'gb2312', '学生');
	    $post['Button1'] = iconv('utf-8', 'gb2312', '登录');
	    $result = curl_request($url,$post,'', 1);
	    return $result['cookie'];
	}
登录后复制

  5,让我们来试试查课表的功能,格式有点乱额,大家凑合着看,我把课表转成了一个二维关联数组

    

//返回课表字符串
private function classresult($xh,$pwd){
    	date_default_timezone_set("PRC"); //时区设置
    	$classList = "";//声明课表变量

    	$cookie = $this->login($xh,$pwd);
    	$view = $this->getViewJs($cookie,$xh);//验证密码是否正确

    	//如果密码正确
        if (!empty($view)) {
        	$url = "http://jw.hzau.edu.cn/xskbcx.aspx?xh={$xh}";
	        $result = curl_request($url,'',$cookie);  //保存的cookies
			preg_match_all('/<table id="Table1"[\w\W]*?>([\w\W]*?)<\/table>/',$result,$out);
	        $table = $out[0][0]; //获取整个课表

	        preg_match_all('/<td [\w\W]*?>([\w\W]*?)<\/td>/',$table,$out);
	        $td = $out[1];
	        $length = count($td);

	    	//获得课程列表
	    	for ($i=0; $i < $length; $i++) { 
	    		$td[$i] = str_replace("<br>", "", $td[$i]);

	    		$reg = "/{(.*)}/";
	    	
	    		if (!preg_match_all($reg, $td[$i], $matches)) {
	    			unset($td[$i]);
	    		}
			}

			$td = array_values($td); //将课程列表数组重新索引
			$tdLength = count($td);
			for ($i=0; $i < $tdLength; $i++) { 
				$td[$i] = iconv('GB2312','UTF-8',$td[$i]);
			}

			//将课表转换成数组形式
			function converttoTable($table){
				$list = array(
					'sun' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'mon' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'tues' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'wed' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'thur' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'fri' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					),
					'sat' => array(
						'1,2' => '',
						'3,4' => '',
						'5,6' => '',
						'7,8' => '',
						'9,10' => ''
					)
				);
				$week = array("sun"=>"周日","mon"=>"周一","tues"=>"周二","wed"=>"周三","thur"=>"周四","fri"=>"周五","sat"=>"周六");
				$order = array('1,2','3,4','5,6','7,8','9,10');
				foreach ($table as $key => $value) {
					$class = $value;
					foreach ($week as $key => $weekDay) {
						$pos = strpos($class,$weekDay);
						// echo $pos;
						if ($pos) {
							$weekArrayDay = $key; //获取list数组中的第一维key 
							foreach ($order as $key => $orderClass) {
								$pos = strpos($class,$orderClass);
								if ($pos) {
									$weekArrayOrder = $orderClass; //获取该课程是第几节
									break;
								}
							}
							break;
						}
					}
					$list[$weekArrayDay][$weekArrayOrder] = $class;
				}
				return $list;
			}
					
			//调用函数
			return converttoTable($td);
        }else{
        	return 0;
        }
	}
登录后复制

  6,再试试查询空教室的功能

    

//空教室查询结果
	public function roomresult(){
		$xh = ""; //设置学号
		$pwd = "";  //学号对应的密码

		$cookie = $this->login($xh,$pwd);
        $url = "http://jw.hzau.edu.cn/xs_main.aspx?xh={$xh}";
        $result = curl_request($url,'',$cookie);  //保存的cookies

        $url="http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";
        $post['Button2'] = iconv('utf-8', 'gb2312', '空教室查询');
        $post['__EVENTARGUMENT']='';
        $post['__EVENTTARGET']='';
        $post['__VIEWSTATE'] = $this->getViewJs($cookie,$xh);
        $post['ddlDsz'] = iconv('utf-8', 'gb2312', '单');
        $post['ddlSyXn'] = '2014-2015'; //学年
        $post['ddlSyxq'] = '1'; 
        $post['jslb'] = '';
        $post['xiaoq'] = '';

        $post['kssj']=$_GET['start'];  //提交的开始查询时间  
        $post['sjd']=$_GET['class'];//提交的课程节次

        $post['xn']='2014-2015';//所在学年
        $post['xq']='2';//所在学期
        $post['xqj']='6';//当天星期几
        $post['dpDataGrid1:txtPageSize']=90;//每页显示条数

        $result = curl_request($url,$post,$cookie,0);
		
		preg_match_all('/<span[^>]+>[^>]+span>/',$result,$out);
        $tip = iconv('gb2312', 'utf-8', $out[0][3]);//获取页面前部的提示内容
        preg_match_all('/<table[\w\W]*?>([\w\W]*?)<\/table>/',$result,$out);
        $table = iconv('gb2312', 'utf-8', $out[0][0]); //获取查询列表
		
		$this->load->view("classroom",array('tip'=>$tip,'table'=>$table));
    }
登录后复制

  总结起来就是这些了,每个学校的教务系统都不尽相同,这时我们可以借助火狐浏览器的 firebug 抓包,看看到底提交了哪些东西。如果不成功,要看看自己该提交的东西post 上去了没有,如果再不成功,额……可以联系我 imzhongshan@126.com

  就这些了,赶快去试试吧!

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/1001450.htmlTechArticle以正方教务系统为例,用php模拟登陆抓取课表、空教室,抓取课表 课程格子和超级课程表这两个应用,想必大学生都很熟悉,使用自己的学...
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1676
14
CakePHP 教程
1429
52
Laravel 教程
1333
25
PHP教程
1278
29
C# 教程
1257
24
PHP和Python:比较两种流行的编程语言 PHP和Python:比较两种流行的编程语言 Apr 14, 2025 am 12:13 AM

PHP和Python各有优势,选择依据项目需求。1.PHP适合web开发,尤其快速开发和维护网站。2.Python适用于数据科学、机器学习和人工智能,语法简洁,适合初学者。

PHP行动:现实世界中的示例和应用程序 PHP行动:现实世界中的示例和应用程序 Apr 14, 2025 am 12:19 AM

PHP在电子商务、内容管理系统和API开发中广泛应用。1)电子商务:用于购物车功能和支付处理。2)内容管理系统:用于动态内容生成和用户管理。3)API开发:用于RESTfulAPI开发和API安全性。通过性能优化和最佳实践,PHP应用的效率和可维护性得以提升。

PHP的持久相关性:它还活着吗? PHP的持久相关性:它还活着吗? Apr 14, 2025 am 12:12 AM

PHP仍然具有活力,其在现代编程领域中依然占据重要地位。1)PHP的简单易学和强大社区支持使其在Web开发中广泛应用;2)其灵活性和稳定性使其在处理Web表单、数据库操作和文件处理等方面表现出色;3)PHP不断进化和优化,适用于初学者和经验丰富的开发者。

PHP和Python:解释了不同的范例 PHP和Python:解释了不同的范例 Apr 18, 2025 am 12:26 AM

PHP主要是过程式编程,但也支持面向对象编程(OOP);Python支持多种范式,包括OOP、函数式和过程式编程。PHP适合web开发,Python适用于多种应用,如数据分析和机器学习。

PHP和Python:代码示例和比较 PHP和Python:代码示例和比较 Apr 15, 2025 am 12:07 AM

PHP和Python各有优劣,选择取决于项目需求和个人偏好。1.PHP适合快速开发和维护大型Web应用。2.Python在数据科学和机器学习领域占据主导地位。

PHP:处理数据库和服务器端逻辑 PHP:处理数据库和服务器端逻辑 Apr 15, 2025 am 12:15 AM

PHP在数据库操作和服务器端逻辑处理中使用MySQLi和PDO扩展进行数据库交互,并通过会话管理等功能处理服务器端逻辑。1)使用MySQLi或PDO连接数据库,执行SQL查询。2)通过会话管理等功能处理HTTP请求和用户状态。3)使用事务确保数据库操作的原子性。4)防止SQL注入,使用异常处理和关闭连接来调试。5)通过索引和缓存优化性能,编写可读性高的代码并进行错误处理。

PHP的目的:构建动态网站 PHP的目的:构建动态网站 Apr 15, 2025 am 12:18 AM

PHP用于构建动态网站,其核心功能包括:1.生成动态内容,通过与数据库对接实时生成网页;2.处理用户交互和表单提交,验证输入并响应操作;3.管理会话和用户认证,提供个性化体验;4.优化性能和遵循最佳实践,提升网站效率和安全性。

PHP的当前状态:查看网络开发趋势 PHP的当前状态:查看网络开发趋势 Apr 13, 2025 am 12:20 AM

PHP在现代Web开发中仍然重要,尤其在内容管理和电子商务平台。1)PHP拥有丰富的生态系统和强大框架支持,如Laravel和Symfony。2)性能优化可通过OPcache和Nginx实现。3)PHP8.0引入JIT编译器,提升性能。4)云原生应用通过Docker和Kubernetes部署,提高灵活性和可扩展性。

See all articles