正则获取网页源码keyword和description ,蛋有点疼
情况一:
<META NAME="description" CONTENT="华尔街债券(bond.wswire.com) 是全球第一债券网站,为您提供全球债券市场最迅速最专业的债券资讯和全天候的债券理财、债券评级及报价服务, 华尔街债券覆盖交易所债券市场、银行间债券市场、银行同业拆借及公开市场等各方面的债券信息服务。华尔街债券汇聚多家顶级专业机构分析研究报告、每日两次的精确数据分析以及图文并茂的市况报道。"><META NAME="keywords" CONTENT="华尔街,电讯,华尔街电讯,全球债券,国债,债券,债市,企业债,企债,可转债,回购,正回购,赎回,债券公告,利率,金融债,央行,短期融资券,记账式国债,货币政策,财经,汇率,票据,公开市场,稳定收益,公债,柜台交易,银行间债市,同业拆借,债券资讯,融资债,债券理财,债券评级,银行间市场,交易所市场,海外市场,央行票据">
情况二:
<meta name=keywords content="微波炉使用高火档能耗低更节能(图),环保新知,,,微波炉,,,高火,,,节能,,,省电,,"><meta name=description content="微波炉使用高火档能耗低更节能(图)">
注意:可能大小写,还有就是name,和content属性[color=#FF6600] 位置 不一样[/color]
小弟试着写了一下,只能匹配一写网页,不知道有什么问题。大牛请解答,拜谢!
keyword:
1.preg_match("/<meta[\s]+name=['\"]keywords['\"] content=['\"](.*)['\"]/isU",$this->tmpHtml,$inarr); 2.preg_match("/<meta[\s] content=['\"](.*)['\"] name=['\"]keywords['\"]/isU",$this->tmpHtml,$inarr2);
1.preg_match("/<meta[\s]+name=['\"]description['\"] content=['\"](.*)['\"]/isU",$this->tmpHtml,$inarr); 2.preg_match("/<meta[\s]+content=['\"](.*)['\"] name=['\"]description['\"]/isU",$this->tmpHtml,$inarr2);
说明:一些网页能匹配,一些不能
回复讨论(解决方案)
哦对了,忘了说明了,有的网页 是这样的:
keywords 和description没有双引号。匹配不了、希望大哥们帮我完善一下,最好测试通过
不是有个get_meta_tags函数么
不是有个get_meta_tags函数么
+1,可以返回一个meta的数组的,再提取需要的就是了
呵呵,见笑了,恩谢谢啊,foolbirdflyfirst yangball
name在前面:
<meta(\s)name=(\'|\"|)keywords(\'|\"|)(\s*)content=(\'|\"|)(.*)(\'|\"|)(\s*)><meta(\s)name=(\'|\"|) keywords(\'|\"|)(\s*)content=(\'|\"|)|(\'|\"|)(\s*)><meta(\s)name=(\'|\"|)description(\'|\"|)(\s*) content=(\'|\"|)(.*)(\'|\"|)(\s*)><meta(\s)name=(\'|\"|)description(\'|\"|)(\s*)content=(\'|\"|)|(\'|\"|)(\s*)>
name在后面:
<meta(\s)content=(\'|\"|)(.*)(\'|\"|)(\s*)name=(\'|\"|)keywords(\'|\"|)(\s*)> <meta(\s)content=(\'|\"|)|(\'|\"|)(\s*)name=(\'|\"|)keywords(\'|\"|)(\s*)> <meta(\s)content=(\'|\"|)(.*)(\'|\"|)(\s*)name=(\'|\"|)description(\'|\"|)(\s*)> <meta(\s)content=(\'|\"|)|(\'|\"|)(\s*)name=(\'|\"|)description(\'|\"|)(\s*)>
name在前面:
<meta(\s)name=(\'|\"|)keywords(\'|\"|)(\s*)content=(\'|\"|)(.*)(\'|\"|)(\s*)><meta(\s)name=(\'|\"|) keywords(\'|\"|)(\s*)content=(\'|\"|)|(\'|\"|)(\s*)><meta(\s)name=(\'|\"|)description(\'|\"|)(\s*) content=(\'|\"|)(.*)(\'|\"|)(\s*)><meta(\s)name=(\'|\"|)description(\'|\"|)(\s*)content=(\'|\"|)|(\'|\"|)(\s*)>
name在后面:
<meta(\s)content=(\'|\"|)(.*)(\'|\"|)(\s*)name=(\'|\"|)keywords(\'|\"|)(\s*)><meta(\s) content=(\'|\"|)|(\'|\"|)(\s*)name=(\'|\"|)keywords(\'|\"|)(\s*)><meta(\s)content=(\'|\"|)(.*)(\'|\"|)(\s*) name=(\'|\"|)description(\'|\"|)(\s*)><meta(\s)content=(\'|\"|)|(\'|\"|)(\s*)name=(\'|\"|) description(\'|\"|)(\s*)>
根据楼上,进一步得出:
name在前:
<(\s*)(meta|META|Meta)(\s*)(name|NAME|Name)=(\'|\"|)(keywords|KEYWORDS|Keywords)(\'|\"|)(\s*) (content|CONTENT|Content)=(\'|\"|)(.*)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(name|NAME|Name)=(\'|\"|)( keywords|KEYWORDS|Keywords)(\'|\"|)(\s*)(content|CONTENT|Content)=(\'|\"|)|(\'|\"|)(\s*)><(\s*)(meta|META|Meta) (\s*)(name|NAME|Name)=(\'|\"|)(description|DESCRIPTION|Description)(\'|\"|)(\s*) (content|CONTENT|Content)=(\'|\"|)(.*)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(name|NAME|Name)=(\'|\"|) (description|DESCRIPTION|Description)(\'|\"|)(\s*)(content|CONTENT|Content)=(\'|\"|)|(\'|\"|)(\s*)>
name在后:
<(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\'|\"|)(.*)(\'|\"|)(\s*)(name|NAME|Name)=(\'|\"|)(keywords|KEYWORDS|Keywords)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\'|\"|)|(\'|\"|)(\s*)(name|NAME|Name)=(\'|\"|)(keywords|KEYWORDS|Keywords)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\'|\"|)(.*)(\'|\"|)(\s*)(name|NAME|Name)=(\'|\"|)(description|DESCRIPTION|Description)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\'|\"|)|(\'|\"|)(\s*)(name|NAME|Name)=(\'|\"|)(description|DESCRIPTION|Description)(\'|\"|)(\s*)>
以上就是正则获取网页源码keyword和description ,蛋有点疼的内容,更多相关内容请关注PHP中文网(www.php.cn)!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Golang正则表达式使用管道符|来匹配多个单词或字符串,将各个选项作为逻辑OR表达式分隔开来。例如:匹配"fox"或"dog":fox|dog匹配"quick"、"brown"或"lazy":(quick|brown|lazy)匹配"Go"、"Python"或"Java":Go|Python|Java匹配单词或4位邮政编码:([a-zA

PHP正则表达式是一种针对文本处理和转换的有力工具。它可以通过解析文本内容,并按照特定的模式进行替换或截取,达到有效管理文本信息的目的。其中,正则表达式的一个常见应用是替换以特定字符开头的字符串,对此,我们进行如下的讲解

php用正则去除中文的方法:1、创建一个php示例文件;2、定义一个含有中文和英文的字符串;3、通过“preg_replace('/([\x80-\xff]*)/i','',$a);”正则方法去除查询结果中的中文字符即可。

在本文中,我们将学习如何使用PHP正则表达式删除HTML标签,并从HTML字符串中提取纯文本内容。 为了演示如何去掉HTML标记,让我们首先定义一个包含HTML标签的字符串。

PHP正则替换实例:快速掌握替换技巧随着互联网的发展,网站开发变得越来越常见。在网站开发中,经常需要对字符串进行替换操作,而正则表达式是一种非常强大的工具,能够在字符串中快速进行搜索和替换操作。本文将介绍如何利用PHP语言中的正则表达式进行替换操作,并提供具体的代码示例,帮助读者快速掌握替换技巧。1.preg_replace函数在PHP中,可以使用preg

使用PHP正则实现中文替换功能的技巧分享在web开发中,经常会遇到需要对中文内容进行替换的情况。PHP作为一种流行的服务器端脚本语言,提供了强大的正则表达式功能,可以很方便地实现中文替换。本文将分享一些在PHP中使用正则实现中文替换的技巧,同时提供具体的代码示例。1.使用preg_replace函数实现中文替换PHP中的preg_replace函数可以用来

网站安全性越来越受到关注,使用HTTPS协议保证数据传输的安全性已成为当前网站开发的一个重要内容。在PHP开发中,如何使用正则表达式验证URL是否为HTTPS协议呢?下面我们就来了解一下。正则表达式正则表达式是一种用来描述规律的表达式,是处理文本的强大工具,被广泛应用于文本匹配、搜索和替换等方面。在PHP开发中,我们可以通过正则表达式来匹配URL中的http

正则表达式是一种用于匹配字符串的强大工具,它可以方便地进行字符串操作。然而,在编写正则表达式的过程中,有时可能需要匹配一些特殊字符,如“\”,“|”、“{”等,这些字符在正则表达式中具有特殊含义,需要进行转义。
