SQL SERVER数据库 唯一索引 非唯一索引 聚集索引 非聚集索引 之间区别
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL SERVER数据库 唯一索引 非唯一索引 聚集索引 非聚集索引 之间区别相关的知识,希望对你有一定的参考价值。
这里说的聚集索引是聚簇索引吧。。。聚簇索引即建立在聚簇上的索引,创建聚簇索引时,需要对已有表数据重新进行排序(若表中已有数据),即删除原始的表数据后再将排序结果按物理顺序插回,故聚簇索引建立完毕后,建立聚簇索引的列中的数据已经全部按序排列。
一个表中只能包含一个聚簇索引,但该索引可以包含多个列。
B-树索引中,聚簇索引的叶层就是数据页。
非聚簇索引类似书本索引,索引与数据存放在不同的物理区域,建立非聚簇索引时数据本身不进行排序。一个表中科含多个非聚簇索引。
B-树索引中,非聚簇索引的叶层仍是索引页,其以指针指向数据页实际存储位置。
唯一性索引保证表中没有两行在定义索引的列上具有重复值,ORACLE自动为主键和唯一键列创建唯一索引;主键本身就是唯一索引,反之不成立(唯一索引允许一个NULL值),唯一性索引比非唯一性索引效率高,故在一般情况下,在无重复值的列上应尽量建立唯一性索引。
若为谋个表的某个列创建了唯一索引,则即使这个列没有唯一值约束,也会被强制限制不能插入重复记录。
这样回答LZ满意么? 参考技术A 聚集索引:如果定义了一个聚集索引A,那么A的顺序就决定了这个表内记录的物理摆列顺序。
非聚集索引:索引排列顺序不影响表内记录的物理顺序。
聚集索引查询快,更新慢。但是不适合大量不同数据。非聚集索引则相反。
唯一索引:可以理解为在索引上加了一个唯一约束
SQL Server之索引解析
堆表通过IAM连接一起,查询时全表扫描。
结构
- 中间节点数据结构:
中间2字节有疑问?
- (非聚集唯一索引)行数据结构+分割符?+ Page(4)
- 堆表非聚集索引结构
组织结构
聚集索引表由根节点(Root Node)、中间节点(Branch Nodes)、叶子节点组成。
如果叶子节点不够多时,根节点(Root Node)、中间节点(Branch Nodes)将不存在。
- 根节点、中间节点行结构
- 系统头部信息(2字节)+Key+&+PageId
- 叶子节点
- 参见行数据结构
- 插入操作对BTree影响
- 删除操作对索引树影响
- 更新操作对索引树影响
注意事项
1. 聚集索引键值不能超过900字节,因为生成keyhashvalue时,如果大于900字节性能会有很大影响。Keyhashvalue用于查询页的数据行
2. 聚集索引键值尽量保持短,每页只有8096字节可用。减少中间节点的层数。
3. 聚集索引键值采用递增原则,有利于数据页连续性,减少BTree调整。
- 非聚集索引在索引表中数据结构
- 根节点(root nodes)、中间节点(page nodes)结构:2字节系统信息+非聚集索引键值+ChildPage(4字节)+Key
- 叶子节点leaf nodes数据结构:2字节系统信息+非聚集索引键值+ Key(keyhasvalue)
-
索引覆盖
避免聚集索引查找
最大键列数为 16,最大索引键大小为 900 字节
-
过滤索引
索引tree是否包含部分数据。一部分不需要建立索引,减少索引层数。
- 建立聚集索引规则
- 唯一性:如果非唯一性,索引节点会增加一列唯一表示。
- 静态的: 如果对聚集索引键值进行更新时,中间节点页会发生变化,叶子节点页也会发生变化。操作次数增加,页空间造成浪费。
- 连续性:非连续性会造成页分拆,页空间浪费,碎片增多。
- 键值大小:键值长度越长,中间节点的层数越多,读取层数越多,性能下降。
- 索引覆盖
对常用查询指定列的索引可以适当增加列覆盖。
- 非聚集索引
- 数据密度原则:数据密度是指列值唯一的记录占总记录数的百分比,这个比率越高,则说明此列越适合建立索引。
- 复合索引键列顺序:在索引中,索引的顺序主要由索引中的每一个键列确定,因此,对于复合索引,索引中的列顺序是很重要的,应该优先把数据密度大,选择性列,存储空间小的列放在索引键列的前面。
- 选择性原则:选择性是满足条件的记录占总记录数的百分比,这个比率应该尽可能低,这样才能保证通过索引扫描后,只需要从基础表提取很少的数据。
DBCC IND
用于分析表组织和索引组织查询命令。
- 命令行
DBCC IND ( { \'dbname\' | dbid }, { \'objname\' | objid }, { nonclustered indid | 1 | 0 | -1 | -2 } [, partition_number] )
- 参数
- Dbname:数据库名
- Dbid:数据库Id
- Objname:表名
- Objid:表ID
- nonclustered indid:非聚集索引ID,-2 根节点 -1 中间节点 Branch Nodes 0 叶子节点、1 所有节点
- 下列查询语句等同于 DBCC IND
Select * from sys.dm_db_database_page_allocations(DB_ID(), object_id(\'TestData8000\'),NULL,NULL,\'DETAILED\')
sys.dm_db_database_page_allocations(@DatabaseId , @TableId , @IndexId , @PartionID , @Mode)
- @DatabaseId:数据库Id
- @TableId:表名
- @indexId:
- @PartionId:分区Id
堆表
聚集索引表
查询结果集,字段说明
列 |
说明 |
PageFID |
索引所在文件Id |
PagePid |
索引所在页Id |
IAMFID |
索引所在IAM文件Id |
IAMPID |
索引所在IAM的页Id |
objectId |
对象ID,表对象ID |
IndexId |
索引类型 0堆、1聚集索引、2-250非聚集索引 |
PartitionNumber |
索引所在分区编号 |
PartitionId |
索引所在的分区Id |
Iam_Chain_Type |
该页存放的数据类型、in-row data 数据页或索引页、Row-overflow-data 溢出数据行页 Blob data 大文件类型页 |
PageType |
数据类型见页类型 |
IndexLevel |
索引级别 null 根级,0 叶子级,其他索引级 |
NextPageFID |
双链表前级文件Id |
NextPagePID |
双链表前级页Id |
PrevPageFID |
双链表后级文件Id |
PrevPagePID |
双链表后级页Id |
DBCC Page
用于查看页数据信息。
DBCC PAGE
(
[\'database name\'|database id], -- can be the actual name or id of the database
file number, -- the file number where the page is found
page number, -- the page number within the file
print option = [0|1|2|3] -- display option; each option provides differing levels of information
)
- database name:数据库名
- file Number:页所在文件Id
- Page Number:页id
- Print 0、1、2、3:不同的级别,3为最高级
--DBCC IND(\'DataPageTestDb\',\'TestData8000\',-1) 先查看表在数据里页数据信息
--DBCC PAGE(DataPageTestDb,1,8,3) 以文本信息查看
--DBCC PAGE(DataPageTestDb,1,8,3) with tableresults,以表格信息查看
查看索引情况
--dbcc show_statistics ([tablename], [indexname])
--dbcc show_statistics (TestDataUnIndex, PK_TestDataUnIndex)
命令详细见
https://docs.microsoft.com/zh-cn/previous-versions/sql/sql-server-2008-r2/ms174384(v=sql.105)
-- 打开IO开销统计 set STATISTICS io ON
-- 打开执行时间统计 set STATISTICS TIME ON
-- Select * from Table
或
Sql Profiler 用于跟踪程序生成的语句。
参考文章
https://www.cnblogs.com/yx007/p/7268310.html
下图用于跟踪Net sqlclient data provider 产生的语句,net体系应用。
以下语句用于跟踪,在线运行时,SQL操作用时比较长的语句
SELECT TOP 50 total_worker_time/execution_count AS [Avg CPU Time], (SELECT SUBSTRING(text,statement_start_offset/2, (CASE WHEN statement_end_offset = -1 then LEN(CONVERT(nvarchar(max), text)) * 2 ELSE statement_end_offset end -statement_start_offset)/2) FROM sys.dm_exec_sql_text(sql_handle)) AS query_text, * FROM sys.dm_exec_query_stats ORDER BY [Avg CPU Time] DESC
select request_session_id,OBJECT_NAME(resource_associated_entity_id) tableName from sys.dm_tran_locks where resource_type=\'OBJECT\' use master go --检索死锁进程 select spid, blocked, loginame, last_batch, status, cmd, hostname, program_name from sysprocesses where spid in ( select blocked from sysprocesses where blocked <> 0 ) or (blocked <>0) select request_session_id,OBJECT_NAME(resource_associated_entity_id) tableName from sys.dm_tran_locks where resource_type=\'OBJECT\'
类型 |
字节数 |
定长 |
变长 |
blob类型 |
uniqueidentifier |
16 |
1 |
||
date |
3 |
1 |
||
time |
5 |
1 |
||
datetime2 |
8 |
1 |
||
datetimeoffset |
10 |
1 |
||
tinyint |
1 |
1 |
||
smallint |
2 |
1 |
||
int |
4 |
1 |
||
smalldatetime |
4 |
1 |
||
real |
4 |
1 |
||
money |
8 |
1 |
||
datetime |
8 |
1 |
||
float |
8 |
1 |
||
sql_variant |
8016 |
1 |
||
bit |
1 |
1 |
||
decimal(18.2) |
9 |
1 |
||
numeric(18.2) |
9 |
1 |
||
varchar(max) |
1 |
|||
nvarchar(max) |
1 |
|||
varbinary(max) |
1 |
|||
XML |
1 |
|||
Image |
1 |
|||
text |
||||
ntext |
||||
varchar() |
1 |
|||
nvarchar() |
1 |
|||
varbinary() |
1 |
|||
char |
1 |
|||
nchar |
1 |
以上是关于SQL SERVER数据库 唯一索引 非唯一索引 聚集索引 非聚集索引 之间区别的主要内容,如果未能解决你的问题,请参考以下文章