索引怎么建立使用

Posted 2023-03-09

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了索引怎么建立使用相关的知识，希望对你有一定的参考价值。

Sqlserver 中，有一张百万级的表，要 select * 去输出，如何建立索引和使用?
查所有字段去输出，索引要怎么建，在某几个字段上建立索引效率会有所提高吗？

Create Relational Index
CREATE [ UNIQUE ] [ CLUSTERED | NONCLUSTERED ] INDEX index_name
ON <object> ( column [ ASC | DESC ] [ ,...n ] )
[ INCLUDE ( column_name [ ,...n ] ) ]
[ WHERE <filter_predicate> ]
[ WITH ( <relational_index_option> [ ,...n ] ) ]
[ ON partition_scheme_name ( column_name )
| filegroup_name
| default

]
[ FILESTREAM_ON filestream_filegroup_name | partition_scheme_name | "NULL" ]

参数
UNIQUE
为表或视图创建唯一索引。唯一索引不允许两行具有相同的索引键值。视图的聚集索引必须唯一。

无论 IGNORE_DUP_KEY 是否设置为 ON，数据库引擎都不允许为已包含重复值的列创建唯一索引。否则，数据库引擎会显示错误消息。必须先删除重复值，然后才能为一列或多列创建唯一索引。唯一索引中使用的列应设置为 NOT NULL，因为在创建唯一索引时，会将多个 Null 值视为重复值。

CLUSTERED
创建索引时，键值的逻辑顺序决定表中对应行的物理顺序。聚集索引的底层（或称叶级别）包含该表的实际数据行。一个表或视图只允许同时有一个聚集索引。

具有唯一聚集索引的视图称为索引视图。为一个视图创建唯一聚集索引会在物理上具体化该视图。必须先为视图创建唯一聚集索引，然后才能为该视图定义其他索引。

在创建任何非聚集索引之前创建聚集索引。创建聚集索引时会重新生成表中现有的非聚集索引。

如果没有指定 CLUSTERED，则创建非聚集索引。

注意：
因为按照定义，聚集索引的叶级别与其数据页相同，所以创建聚集索引和使用 ON partition_scheme_name 或 ON filegroup_name 子句实际上会将表从创建该表时所在的文件组移到新的分区方案或文件组中。对特定的文件组创建表或索引之前，应确认哪些文件组可用并且有足够的空间供索引使用。

NONCLUSTERED
创建一个指定表的逻辑排序的索引。对于非聚集索引，数据行的物理排序独立于索引排序。

无论是使用 PRIMARY KEY 和 UNIQUE 约束隐式创建索引，还是使用 CREATE INDEX 显式创建索引。每个表都最多可包含 999 个非聚集索引。

对于索引视图，只能为已定义唯一聚集索引的视图创建非聚集索引。

默认值为 NONCLUSTERED。

index_name
索引的名称。索引名称在表或视图中必须唯一，但在数据库中不必唯一。索引名称必须符合标识符的规则。

column
索引所基于的一列或多列。指定两个或多个列名，可为指定列的组合值创建组合索引。在 table_or_view_name 后的括号中，按排序优先级列出组合索引中要包括的列。

一个组合索引键中最多可组合 16 列。组合索引键中的所有列必须在同一个表或视图中。组合索引值允许的最大大小为 900 字节。

不能将大型对象 (LOB) 数据类型 ntext、text、varchar(max)、 nvarchar(max)、varbinary(max)、xml 或 image 的列指定为索引的键列。另外，即使 CREATE INDEX 语句中并未引用 ntext、text 或 image 列，视图定义中也不能包含这些列。

如果 CLR 用户定义类型支持二进制排序，则可以为该类型的列创建索引。另外，对于已定义为用户定义类型列的方法调用的计算列，只要这些方法标记为确定性方法且不执行数据访问操作，便可为该计算列创建索引。

[ ASC | DESC ]
确定特定索引列的升序或降序排序方向。默认值为 ASC。

INCLUDE ( column [ ,...n ] )
指定要添加到非聚集索引的叶级别的非键列。非聚集索引可以唯一，也可以不唯一。

在 INCLUDE 列表中列名不能重复，且不能同时用于键列和非键列。

除 text、ntext 和 image 之外，允许所有数据类型。如果指定的任一非键列属于 varchar(max)、nvarchar(max) 或 varbinary(max) 数据类型，则必须脱机 (ONLINE = OFF) 创建或重新生成该索引。

精确或不精确的确定性计算列都可以是包含列。从 image、ntext、text、varchar(max)、nvarchar(max)、varbinary(max) 和 xml 数据类型派生的计算列可以包含在非键列中，前提是允许将这些计算列数据类型作为包含列。

WHERE <filter_predicate>
通过指定索引中要包含哪些行来创建筛选索引。筛选索引必须是对表的非聚集索引。为筛选索引中的数据行创建筛选统计信息。

筛选谓词使用简单比较逻辑且不能引用计算列、UDT 列、空间数据类型列或 hierarchyID 数据类型列。比较运算符不允许使用 NULL 文本的比较。请改用 IS NULL 和 IS NOT NULL 运算符。

下面是 Production.BillOfMaterials 表的筛选谓词的一些示例：

WHERE StartDate > '20000101' AND EndDate <= '20000630'

WHERE ComponentID IN (533, 324, 753)

WHERE StartDate IN ('20000404', '20000905') AND EndDate IS NOT NULL

筛选索引不适用于 XML 索引和全文索引。对于 UNIQUE 索引，仅选定的行必须具有唯一的索引值。筛选索引不允许有 IGNORE_DUP_KEY 选项。

ON partition_scheme_name ( column_name )
指定分区方案，该方案定义要将分区索引的分区映射到的文件组。必须通过执行 CREATE PARTITION SCHEME 或 ALTER PARTITION SCHEME，使数据库中存在该分区方案。column_name 指定将作为分区索引的分区依据的列。该列必须与 partition_scheme_name 使用的分区函数参数的数据类型、长度和精度相匹配。column_name 不限于索引定义中的列。除了在对 UNIQUE 索引分区时，必须从用作唯一键的列中选择 column_name 外，还可以指定基表中的任何列。通过此限制，数据库引擎可验证单个分区中的键值唯一性。

注意：
在对非唯一的聚集索引进行分区时，如果尚未指定分区依据列，则默认情况下数据库引擎将在聚集索引键列表中添加分区依据列。在对非唯一的非聚集索引进行分区时，如果尚未指定分区依据列，则数据库引擎会添加分区依据列作为索引的非键（包含）列。

如果未指定 partition_scheme_name 或 filegroup 且该表已分区，则索引会与基础表使用相同分区依据列并被放入同一分区方案中。

有关将索引分区的详细信息，请参阅已分区索引的特殊指导原则。

ON filegroup_name
为指定文件组创建指定索引。如果未指定位置且表或视图尚未分区，则索引将与基础表或视图使用相同的文件组。该文件组必须已存在。

ON "default"
为默认文件组创建指定索引。

在此上下文中，“default”不是关键字。它是默认文件组的标识符，并且必须进行分隔（类似于 ON "default" 或 ON[default]）。如果指定了 "default"，则当前会话的 QUOTED_IDENTIFIER 选项必须为 ON。这是默认设置。
[ FILESTREAM_ON filestream_filegroup_name | partition_scheme_name | "NULL" ]
在创建聚集索引时，指定表的 FILESTREAM 数据的位置。FILESTREAM_ON 子句用于将 FILESTREAM 数据移动到不同的 FILESTREAM 文件组或分区方案。

filestream_filegroup_name 是 FILESTREAM 文件组的名称。该文件组必须包含一个使用 CREATE DATABASE 或 ALTER DATABASE 语句为该文件组定义的文件；否则，将引发错误。

如果表已分区，则必须包含 FILESTREAM_ON 子句并且必须指定 FILESTREAM 文件组的分区方案，且此分区方案需使用与该表分区方案相同的分区函数和分区列。否则将引发错误。

如果该表未分区，则无法对 FILESTREAM 列分区。该表的 FILESTREAM 数据必须存储在一个由 FILESTREAM_ON 子句指定的文件组中。

如果创建的是聚集索引且该表不包含 FILESTREAM 列，则可在 CREATE INDEX 语句中指定 FILESTREAM_ON NULL。参考技术A 索引是以表列为基础的数据库对象，索引中保存着表中排序的索引列，并且纪录了索引列在数据库表中的物理存储位置，实现了表中数据的逻辑排序。
通过索引，可以加快数据的查询速度和减少系统的响应时间;
可以使表和表之间的连接速度加快。
用SQL建立索引：
为了给一个表建立索引，启动任务栏SQL Sever程序组中的ISQL/w程序。进入查询窗口后，输入下面的语句：
CREATE [UNIQUE] [CLUSER] INDEX <索引名> ON <表名> (<列名>);
UNIQUE 表明此索引的每一个索引值只对应唯一的数据记录
CLUSTER 表明要建立的是聚簇索引（指索引项的顺序与表中记录的物理顺序一致）
例：CREATE CLUSER INDEX Stuname ON Student(Sname);
在student表的sname列建立一个聚簇索引，student中记录按照sname值的升序排列. 参考技术B 如果你查询的字段都在索引中，那么可以只查询索引，不用查询表，就可以输出数据。
这是建索引时的一种考虑。
但是在你这种情况下不适用。
我猜你是想输出大批数据，而不是根据索引选择有数的那么几条。
输出数据占总数据量达到一定比例以后，再用索引就是浪费更多资源而得不到回报了。
因为数据行存储在块中。一块存多行。用索引时是根据索引信息，每一行访问一次数据块。
数据多了会覆盖大多数数据块，并且一个数据块会被访问多次。就不如全表扫描一次，访问一个数据块就把该块所有行都输出。这样效率最高。
所以你这种情况不应该用索引的。

以上是关于索引怎么建立使用的主要内容，如果未能解决你的问题，请参考以下文章

MYSQL 如何建立索引及如何使用索引

mysql数据库怎么建索引？

我要对mysql中的数据建立倒排索引应该怎么

Mysql建立索引经验

阿里四面：为何MySQL没有使用建立的索引？

在数据表中索引有啥用，怎么建立索引