python - 为什么正则表达式抓取不到数据?
高洛峰
高洛峰 2017-04-18 09:17:41
[Python讨论组]

已经把需要抓取的html写入txt,但是无法使用正则表达式抓取数据,抓取结果永远是空的,请问为什么会出现这种问题?

def zhengze():

material=open(r"c:\test.txt","r")
print(material.read())
pattern=re.compile(r"<p>")
joke=re.search(pattern,material.read())
print(joke)

这行代码应该是抓取整个html里所有的"<p>",但返回结果一直是none,为什么?

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全部回复(2)
怪我咯

material.read() 你用了两次!!!
你确定第二次能读到数据.
read() 方法是读取整个文件,读完文件指针应该到了文件末尾,再次读取就返回''了,建议这样写:

def zhengze():
    material=open(r"c:\test.txt","r")
    res = material.read()
    print(res)
    pattern=re.compile(r"<p>")
    joke=re.search(pattern,res)
    print(joke)
伊谢尔伦

先把read()后的数据保存的变量里。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号