python - 为什么/s/blog_4701280b0102elmo在正则表达生成器里生成不出来?
天蓬老师
天蓬老师 2017-04-17 13:52:22
[Python讨论组]

原地址 http://blog.sina.com.cn/s/blog_4701280b0102elmo.html

start_urls =['http://blog.sina.com.cn']
rules = [Rule(LinkExtractor(allow=['/s/blog_4701280b0102e[\da-zA-Z]+']), 'parse_torrent')]

rules里的正则表达式(黑体倾斜的)对吗?

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

全部回复(2)
PHPz

后面的.html没有匹配,这样就匹配不到完整的URL了。
应该加上后面的.html,正则规则如下:
/s/blog_4701280b0102e[\da-zA-Z]+.html

阿神

不知道你是想要匹配出什么内容

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号