MongoDB快速上手指南:MongoDB 的索引

2022-08-0222:20:02数据库教程Comments1,295 views字数 3193阅读模式

4.1 概述

索引支持在 MongoDB 中高效地执行查询.如果没有索引, MongoDB 必须执行全集合扫描, 即扫描集合中的每个文档, 以选择与查询语句 匹配的文档.这种扫描全集合的查询效率是非常低的, 特别在处理大量的数据时, 查询可以要花费几十秒甚至几分钟, 这对网站的性能是非常致命的.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

如果查询存在适当的索引, MongoDB 可以使用该索引限制必须检查的文档数.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

索引是特殊的数据结构, 它以易于遍历的形式存储集合数据集的一小部分.索引存储特定字段或一组字段的值, 按字段值排序.索引项的排 序支持有效的相等匹配和基于范围的查询操作.此外, MongoDB 还可以使用索引中的排序返回排序结果.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB 和MySQL 一样使用的都是是 B+ Tree文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

在之前的版本中Mongo使用的是B树,但是现在都是使用B+树了文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

索引常用命令:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

// create index
db.<collection_name>.createIndex({ userid : 1, username : -1 })

// retrieve indexes
db.<collection_name>.getIndexes()

// remove indexes
db.<collection_name>.dropIndex(index)

// there are 2 ways to remove indexes:
// 1. removed based on the index name
// 2. removed based on the fields

db.<collection_name>.dropIndex( "userid_1_username_-1" )
db.<collection_name>.dropIndex({ userid : 1, username : -1 })

// remove all the indexes, will only remove non_id indexes
db.<collection_name>.dropIndexes()
复制代码

4.2 索引的类型

4.2.1 单字段索引

MongoDB 支持在文档的单个字段上创建用户定义的升序/降序索引, 称为单字段索引(Single Field Index)文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

对于单个字段索引和排序操作, 索引键的排序顺序(即升序或降序)并不重要, 因为 MongoDB 可以在任何方向上遍历索引.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

4.2.2 复合索引

MongoDB 还支持多个字段的用户定义索引, 即复合索引 Compound Index,这个其实非常类似MySQL中的联合索引,因为底层都是B+树,所有联合索引可能也有最左原则这种东西文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

复合索引中列出的字段顺序具有重要意义.例如, 如果复合索引由 { userid: 1, score: -1 } 组成, 则索引首先按 userid 正序排序, 然后 在每个 userid 的值内, 再在按 score 倒序排序.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

4.2.3 其他索引

  • 地理空间索引 Geospatial Index
  • 文本索引 Text Indexes
  • 哈希索引 Hashed Indexes
地理空间索引(Geospatial Index)

为了支持对地理空间坐标数据的有效查询, MongoDB 提供了两种特殊的索引: 返回结果时使用平面几何的二维索引和返回结果时使用球面几何的二维球面索引.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

文本索引(Text Indexes)

MongoDB 提供了一种文本索引类型, 支持在集合中搜索字符串内容.这些文本索引不存储特定于语言的停止词(例如 “the”, “a”, “or”), 而将集合中的词作为词干, 只存储根词.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

哈希索引(Hashed Indexes)

为了支持基于散列的分片, MongoDB 提供了散列索引类型, 它对字段值的散列进行索引.这些索引在其范围内的值分布更加随机, 但只支持相等匹配, 不支持基于范围的查询.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

4.3 索引的管理操作

4.3.1 索引的查看

语法文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

db.collection.getIndexes()
复制代码

提示:该语法命令运行要求是MongoDB 3.0+文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

【示例】 查看comment集合中所有的索引情况文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

结果中显示的是默认 _id 索引。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

默认 _id 索引: MongoDB 在创建集合的过程中, 在 _id 字段上创建一个唯一的索引, 默认名字为 _id , 该索引可防止客户端插入两个具有相同值的文 档, 不能在 _id 字段上删除此索引.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

注意:该索引是唯一索引, 因此值不能重复, 即 _id 值不能重复的.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

在分片集群中, 通常使用 _id 作为片键.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

4.3.2 索引的创建

语法文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

db.collection.createIndex(keys, options)
复制代码

参数文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

options(更多选项)列表文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

注意在 3.0.0 版本前创建索引方法为 db.collection.ensureIndex() , 之后的版本使用了 db.collection.createIndex() 方法, ensureIndex() 还能用, 但只是 createIndex() 的别名.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

举个?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

userid:1 表示由userid按照升序创建索引,userid:1,nickname:-1}表示先按userid升序,如果userid相等再按照nickname降序创建索引,这里和MySQL一摸一样文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

// 先由userid按照升序创建索引
$  db.comment.createIndex({userid:1})
{
  "createdCollectionAutomatically" : false,
  "numIndexesBefore" : 1,
  "numIndexesAfter" : 2,
  "ok" : 1
}
// 先按userid升序,如果userid相等再按照nickname降序创建索引
$ db.comment.createIndex({userid:1,nickname:-1})
...
复制代码

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

4.3.3 索引的删除

语法文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

# 删除某一个索引
$ db.collection.dropIndex(index)

# 删除全部索引
$ db.collection.dropIndexes()
复制代码

其中index类型为:string or document,表示指定要删除的索引。可以通过索引名称或索引规范文档指定索引。若要删除文本索引,请指定索引名称。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

提示:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

_id 的字段的索引是无法删除的, 只能删除非 _id 字段的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

示例文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

# 删除 comment 集合中 userid 字段上的升序索引
$ db.comment.dropIndex({userid:1})
复制代码

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

4.4 索引使用

4.4.1 执行计划

分析查询性能 (Analyze Query Performance) 通常使用执行计划 (解释计划 - Explain Plan) 来查看查询的情况文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

$ db.<collection_name>.find( query, options ).explain(options)
复制代码

比如: 查看根据 user_id 查询数据的情况文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

未添加索引之前文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

"stage" : "COLLSCAN", 表示全集合扫描文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

添加索引之后文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

"stage" : "IXSCAN", 基于索引的扫描文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

4.4.2 覆盖索引查询(Covered Queries)

这里如果直接看的话其实还是满难理解的,但是如果我们结合MySQL来看就会发现,这不就是MySQL里面的覆盖索引吗?覆盖索引不就是减少了回表操作吗?这样的话其实一下就能理解下面的介绍,看来知识都是相通的,还是应该多学底层,应用层的东西会变,但是底层的东西大部分都不会改变,你看AVL树、红黑树这些数据结构,都是上个世纪中期产生的,现在用的还是这一套文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

当查询条件和查询的投影仅包含索引字段时, MongoDB 直接从索引返回结果, 而不扫描任何文档或将文档带入内存, 这些覆盖的查询十分有效文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

docs.mongodb.com/manual/core…文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

例如我们查询下面的索引执行计划:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

MongoDB快速上手指南:MongoDB 的索引文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

作者:是小梁同学呀
链接:https://juejin.cn/post/7126746699527094303
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html

文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/26459.html
  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/sjk/26459.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定