python怎么给原有模块添加自定义方法?
黄舟
黄舟 2017-04-18 09:44:15
[Python讨论组]
from bs4 import BeautifulSoup as bs
soup=bs(html_code) #伪代码
text=soup.get_text()       #这个get_text()方法是bs定义好了的方法
my_text=soup.my_get_text() #这个my_get_text()方法是bs没有的方法,会报异常

如上代码,比如bs中本来没有my_get_text()这个方法,
我是否可以写一个自定义模块,比如叫做'my_bs',

import my_bs

当如上导入自定义的模块后,
就能正常运行如下代码:my_text=soup.my_get_text()
说白了,我就是想给已有的bs4包添加一个我自己定义的方法.
但是不是通过修改bs4的源代码,而是自定义一个模块,
在自己的代码中导入自定义模块来达到目的.
多谢!

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

全部回复(3)
黄舟
# 如果是类, 试试
# 让bs继承my_bs的方法
my_bs.register(bs)

# for module
# setattr(module, attr, newitem)
setattr(bs, "my_get_text", my_bs.my_get_text)
高洛峰

继承

class mybs(bs):
    def my_get_text(self):
        pass
天蓬老师

新建myBS.py文件,内容如下:

import bs4

def getTextWithoutScript(self, separator=u"", strip=False,
                                     withoutScript=True, withoutComment=True):
    """获取网页文本,不包含html源码中的script脚本的内容"""
    return separator.join([s for s in self._all_strings(strip) if s.parent.name.lower() != 'script'])

bs4.Tag.getTextWithoutScript = getTextWithoutScript

使用方法:
首先导入myBS.py,其他使用方法就是直接调用,与bs的原生方法一样:

import myBS
from bs4 import BeautifulSoup as bs

s=bs(html_code,'html5lib')
s.getTextWithoutScript()

不方便的地方:在pycharm下该新加入BS的方法不能智能提示!
感谢诸位老师!

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号