正则获取网页源码keyword和description ，蛋有点疼-php教程-PHP中文网

首页

后端开发

php教程

正则获取网页源码keyword和description ，蛋有点疼

PHP中文网

Jun 23, 2016 pm 02:00 PM

情况一：

<META NAME="description" CONTENT="华尔街债券（bond.wswire.com）
是全球第一债券网站，为您提供全球债券市场最迅速最专业的债券资讯和全天候的债券理财、债券评级及报价服务，
华尔街债券覆盖交易所债券市场、银行间债券市场、银行同业拆借及公开市场等各方面的债券信息服务。华尔街债券汇聚多家顶级专业机构分析研究报告、每日两次的精确数据分析以及图文并茂的市况报道。"><META NAME="keywords" CONTENT="华尔街，电讯，华尔街电讯，全球债券，国债，债券，债市，企业债，企债，可转债，回购，正回购，赎回，债券公告，利率，金融债，央行，短期融资券，记账式国债，货币政策，财经，汇率，票据，公开市场，稳定收益，公债，柜台交易，银行间债市，同业拆借，债券资讯，融资债，债券理财，债券评级，银行间市场，交易所市场，海外市场，央行票据">

登录后复制

情况二:

<meta name=keywords content="微波炉使用高火档能耗低更节能(图),环保新知,,,微波炉,,,高火,,,节能,,,省电,,"><meta name=description content="微波炉使用高火档能耗低更节能(图)">

登录后复制

注意：可能大小写，还有就是name，和content属性[color=#FF6600] 位置不一样[/color]

小弟试着写了一下，只能匹配一写网页，不知道有什么问题。大牛请解答，拜谢！
keyword：

 1.preg_match("/<meta[\s]+name=[&#39;\"]keywords[&#39;\"] content=[&#39;\"](.*)[&#39;\"]/isU",$this->tmpHtml,$inarr);
 2.preg_match("/<meta[\s] content=[&#39;\"](.*)[&#39;\"] name=[&#39;\"]keywords[&#39;\"]/isU",$this->tmpHtml,$inarr2);

登录后复制

1.preg_match("/<meta[\s]+name=[&#39;\"]description[&#39;\"] content=[&#39;\"](.*)[&#39;\"]/isU",$this->tmpHtml,$inarr);
2.preg_match("/<meta[\s]+content=[&#39;\"](.*)[&#39;\"] name=[&#39;\"]description[&#39;\"]/isU",$this->tmpHtml,$inarr2);

登录后复制

说明：一些网页能匹配，一些不能

回复讨论(解决方案)

哦对了，忘了说明了，有的网页是这样的：

keywords 和description没有双引号。匹配不了、希望大哥们帮我完善一下，最好测试通过

不是有个get_meta_tags函数么

不是有个get_meta_tags函数么
+1，可以返回一个meta的数组的，再提取需要的就是了

呵呵，见笑了，恩谢谢啊，foolbirdflyfirst yangball

name在前面：

<meta(\s)name=(\&#39;|\"|)keywords(\&#39;|\"|)(\s*)content=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)><meta(\s)name=(\&#39;|\"|)
keywords(\&#39;|\"|)(\s*)content=(\&#39;|\"|)|(\&#39;|\"|)(\s*)><meta(\s)name=(\&#39;|\"|)description(\&#39;|\"|)(\s*)
content=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)><meta(\s)name=(\&#39;|\"|)description(\&#39;|\"|)(\s*)content=(\&#39;|\"|)|(\&#39;|\"|)(\s*)>

登录后复制

name在后面：

<meta(\s)content=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)name=(\&#39;|\"|)keywords(\&#39;|\"|)(\s*)> 
<meta(\s)content=(\&#39;|\"|)|(\&#39;|\"|)(\s*)name=(\&#39;|\"|)keywords(\&#39;|\"|)(\s*)> 
<meta(\s)content=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)name=(\&#39;|\"|)description(\&#39;|\"|)(\s*)> 
<meta(\s)content=(\&#39;|\"|)|(\&#39;|\"|)(\s*)name=(\&#39;|\"|)description(\&#39;|\"|)(\s*)>

登录后复制

name在前面：

<meta(\s)name=(\&#39;|\"|)keywords(\&#39;|\"|)(\s*)content=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)><meta(\s)name=(\&#39;|\"|)
keywords(\&#39;|\"|)(\s*)content=(\&#39;|\"|)|(\&#39;|\"|)(\s*)><meta(\s)name=(\&#39;|\"|)description(\&#39;|\"|)(\s*)
content=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)><meta(\s)name=(\&#39;|\"|)description(\&#39;|\"|)(\s*)content=(\&#39;|\"|)|(\&#39;|\"|)(\s*)>

登录后复制

name在后面：

<meta(\s)content=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)name=(\&#39;|\"|)keywords(\&#39;|\"|)(\s*)><meta(\s)
content=(\&#39;|\"|)|(\&#39;|\"|)(\s*)name=(\&#39;|\"|)keywords(\&#39;|\"|)(\s*)><meta(\s)content=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)
name=(\&#39;|\"|)description(\&#39;|\"|)(\s*)><meta(\s)content=(\&#39;|\"|)|(\&#39;|\"|)(\s*)name=(\&#39;|\"|)
description(\&#39;|\"|)(\s*)>

登录后复制

根据楼上，进一步得出：
name在前：

<(\s*)(meta|META|Meta)(\s*)(name|NAME|Name)=(\&#39;|\"|)(keywords|KEYWORDS|Keywords)(\&#39;|\"|)(\s*)
(content|CONTENT|Content)=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(name|NAME|Name)=(\&#39;|\"|)(
keywords|KEYWORDS|Keywords)(\&#39;|\"|)(\s*)(content|CONTENT|Content)=(\&#39;|\"|)|(\&#39;|\"|)(\s*)><(\s*)(meta|META|Meta)
(\s*)(name|NAME|Name)=(\&#39;|\"|)(description|DESCRIPTION|Description)(\&#39;|\"|)(\s*)
(content|CONTENT|Content)=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(name|NAME|Name)=(\&#39;|\"|)
(description|DESCRIPTION|Description)(\&#39;|\"|)(\s*)(content|CONTENT|Content)=(\&#39;|\"|)|(\&#39;|\"|)(\s*)>

登录后复制

name在后：

<(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)(name|NAME|Name)=(\&#39;|\"|)(keywords|KEYWORDS|Keywords)(\&#39;|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\&#39;|\"|)|(\&#39;|\"|)(\s*)(name|NAME|Name)=(\&#39;|\"|)(keywords|KEYWORDS|Keywords)(\&#39;|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\&#39;|\"|)(.*)(\&#39;|\"|)(\s*)(name|NAME|Name)=(\&#39;|\"|)(description|DESCRIPTION|Description)(\&#39;|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\&#39;|\"|)|(\&#39;|\"|)(\s*)(name|NAME|Name)=(\&#39;|\"|)(description|DESCRIPTION|Description)(\&#39;|\"|)(\s*)>

登录后复制

以上就是正则获取网页源码keyword和description ，蛋有点疼的内容，更多相关内容请关注PHP中文网（www.php.cn）！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

Java教程

1666

CakePHP 教程

1425

Laravel 教程

1325

PHP教程

1273

C# 教程

1252

显示更多

Related knowledge

如何用 Golang 正则匹配多个单词或字符串？ May 31, 2024 am 10:32 AM

如何用php正则替换以什么开头的字符串 Mar 24, 2023 pm 02:57 PM

PHP正则表达式是一种针对文本处理和转换的有力工具。它可以通过解析文本内容，并按照特定的模式进行替换或截取，达到有效管理文本信息的目的。其中，正则表达式的一个常见应用是替换以特定字符开头的字符串，对此，我们进行如下的讲解

php 如何用正则去除中文 Mar 03, 2023 am 10:12 AM

php用正则去除中文的方法：1、创建一个php示例文件；2、定义一个含有中文和英文的字符串；3、通过“preg_replace('/([\x80-\xff]*)/i','',$a);”正则方法去除查询结果中的中文字符即可。

php怎么利用正则匹配去掉html标签 Mar 21, 2023 pm 05:17 PM

在本文中，我们将学习如何使用PHP正则表达式删除HTML标签，并从HTML字符串中提取纯文本内容。为了演示如何去掉HTML标记，让我们首先定义一个包含HTML标签的字符串。

PHP正则替换实例：快速掌握替换技巧 Feb 29, 2024 pm 06:33 PM

PHP正则替换实例：快速掌握替换技巧随着互联网的发展，网站开发变得越来越常见。在网站开发中，经常需要对字符串进行替换操作，而正则表达式是一种非常强大的工具，能够在字符串中快速进行搜索和替换操作。本文将介绍如何利用PHP语言中的正则表达式进行替换操作，并提供具体的代码示例，帮助读者快速掌握替换技巧。1.preg_replace函数在PHP中，可以使用preg

使用PHP正则实现中文替换功能的技巧分享 Mar 24, 2024 pm 05:57 PM

使用PHP正则实现中文替换功能的技巧分享在web开发中，经常会遇到需要对中文内容进行替换的情况。PHP作为一种流行的服务器端脚本语言，提供了强大的正则表达式功能，可以很方便地实现中文替换。本文将分享一些在PHP中使用正则实现中文替换的技巧，同时提供具体的代码示例。1.使用preg_replace函数实现中文替换PHP中的preg_replace函数可以用来

如何使用PHP正则表达式验证URL是否为HTTPS协议 Jun 24, 2023 am 08:16 AM

网站安全性越来越受到关注，使用HTTPS协议保证数据传输的安全性已成为当前网站开发的一个重要内容。在PHP开发中，如何使用正则表达式验证URL是否为HTTPS协议呢？下面我们就来了解一下。正则表达式正则表达式是一种用来描述规律的表达式，是处理文本的强大工具，被广泛应用于文本匹配、搜索和替换等方面。在PHP开发中，我们可以通过正则表达式来匹配URL中的http

深入详解PHP正则表达式转义 Mar 21, 2023 pm 02:52 PM

正则表达式是一种用于匹配字符串的强大工具，它可以方便地进行字符串操作。然而，在编写正则表达式的过程中，有时可能需要匹配一些特殊字符，如“\”，“|”、“{”等，这些字符在正则表达式中具有特殊含义，需要进行转义。

See all articles

正则获取网页源码keyword和description ，蛋有点疼

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题