python - MongoDb startswith和全文索引问题
PHPz
PHPz 2017-04-18 09:38:12
[Python讨论组]

场景是目前有个Mongo的collection中的name字段,name字段长度正常在4-10个中文左右,25W数据量。如果我用startswith匹配name查询的话性能会有怎样的压力呢?
如果给name字段加上全文索引又会有什么样的好处和坏处呢?

PHPz
PHPz

学习是最好的投资!

全部回复(1)
怪我咯

如果有普通索引的情况下,前缀固定的查询是可以用到索引的。但是不知道你说的startswith是什么方法,如果是驱动里面的,具体还要看是什么驱动及它的文档怎么说。我所指的前缀固定是正则表达式以^开头的匹配,比如:

db.collection.find({name: /^张/})

如果看一下执行计划,是能看到IX_SCAN的:

db.collection.find({name: /^张/}).explain(true)

全文索引就是另一个东西了。简单地说,可以不考虑前缀是否固定,但是全文索引的基本单位是不是字。所以下面这段话:

一师 是 个 好学校

搜索的时候可以直接找你要的词,比如:

db.collection.find({ $text: { $search: "好学校" } })

但是直接搜“校”很可能是搜不到的:

db.collection.find({ $text: { $search: "校" } })  // 无结果

当然这跟不同的分词引擎怎么分法有关,例子只是为说明全文索引的局限性。
另外冠词,量词等没有实际意义的词也是会被过滤掉的,比如“个”:

db.collection.find({ $text: { $search: "个" } })  // 无结果

另外可能你也注意到了上面的查询根本没提到name这个字段,因为一个集合上面只能有一个全文索引。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号