数据库基础:讲解MySQL索引的概念及数据库索引的应用[2]
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据库基础:讲解MySQL索引的概念及数据库索引的应用[2]相关的知识,希望对你有一定的参考价值。
参考技术A五 索引分类
直接创建索引和间接创建索引
直接创建索引 CREATE INDEX mycolumn_index ON mytable (myclumn)
间接创建索引 定义主键约束或者唯一性键约束 可以间接创建索引
普通索引和唯一性索引
普通索引 CREATE INDEX mycolumn_index ON mytable (myclumn)
唯一性索引 保证在索引列中的全部数据是唯一的 对聚簇索引和非聚簇索引都可以使用
CREATE UNIQUE COUSTERED INDEX myclumn_cindex ON mytable(mycolumn)
单个索引和复合索引
单个索引 即非复合索引
复合索引 又叫组合索引 在索引建立语句中同时包含多个字段名 最多 个字段
CREATE INDEX name_index ON username(firstname lastname)
聚簇索引和非聚簇索引(聚集索引 群集索引)
聚簇索引 物理索引 与基表的物理顺序相同 数据值的顺序总是按照顺序排列
CREATE CLUSTERED INDEX mycolumn_cindex ON mytable(mycolumn) WITH
ALLOW_DUP_ROW(允许有重复记录的聚簇索引)
非聚簇索引 CREATE UNCLUSTERED INDEX mycolumn_cindex ON mytable(mycolumn)
六 索引的使用
当字段数据更新频率较低 查询使用频率较高并且存在大量重复值是建议使用聚簇索引
经常同时存取多列 且每列都含有重复值可考虑建立组合索引
复合索引的前导列一定好控制好 否则无法起到索引的效果 如果查询时前导列不在查询条件中则该复合索引不会被使用 前导列一定是使用最频繁的列
多表操作在被实际执行前 查询优化器会根据连接条件 列出几组可能的连接方案并从中找出系统开销最小的最佳方案 连接条件要充份考虑带有索引的表 行数多的表;内外表的选择可由公式 外层表中的匹配行数*内层表中每一次查找的次数确定 乘积最小为最佳方案
where子句中对列的任何操作结果都是在sql运行时逐列计算得到的 因此它不得不进行表搜索 而没有使用该列上面的索引;如果这些结果在查询编译时就能得到 那么就可以被sql优化器优化 使用索引 避免表搜索(例 select * from record where substring(card_no )=
&& select * from record where card_no like % )任何对列的操作都将导致表扫描 它包括数据库函数 计算表达式等等 查询时要尽可能将操作移至等号右边
where条件中的 in 在逻辑上相当于 or 所以语法分析器会将in ( ′ ′)转化为column= ′ or column= ′来执行 我们期望它会根据每个or子句分别查找 再将结果相加 这样可以利用column上的索引;但实际上它却采用了 or策略 即先取出满足每个or子句的行 存入临时数据库的工作表中 再建立唯一索引以去掉重复行 最后从这个临时表中计算结果 因此 实际过程没有利用column上索引 并且完成时间还要受tempdb数据库性能的影响 in or子句常会使用工作表 使索引失效;如果不产生大量重复值 可以考虑把子句拆开;拆开的子句中应该包含索引
要善于使用存储过程 它使sql变得更加灵活和高效
lishixinzhi/Article/program/mysql/201311/29603
第五十一课 NoSQL基础概念及MongoDB应用数据库分配概念
NoSQL基础概念及MongoDB |
MongoDB基础应用 |
MongoDB索引及复制集 |
数据库分片的概念及Mongodb sharding的实现 |
一、NoSQL基础概念
NoSQL(Not Only SQL),是一种技术流派,非关系型数据库;适合用在大数据领域,各种nosql有各自的查询语句,这也是nosql的缺点之一。
大数据(BigDate)也称海量数据是一个模糊的概念,像Google、百度收集大量数据,分析现在、预测未来;这些数据通过某些特定的特征和算法得出某些预测的结果,这些数据为大数据。
大数据的四种形式:
1、 并行数据库:关系型数据库水平切割,分区查询
2、NoSQL数据库管理系统:非关系模型,分布式,不支持ACID数据库设计范式成为NoSQL
优点:简单数据模型、元数据和数据分离、弱一致性、高吞吐量、高水平扩展能力和低端 硬件群集
缺点:数据模型没有经过验证、不支持ACID特性、功能简单、没有统一的查询语言
3、NewSQL数据库管理系统:代表产品Cluterix、GenieDB、ScaleBase、NimbusDB、Drizzleyun
4、云数据管理系统:
大数据的分析处理:
MapReduce
最终一致性细分:
因果一致性、读自己写一致性、会话一致性、单调读一致性、时间轴一致性
ACID: 强一致性、隔离性、采用悲观保守的方法、难以变化;
BASE:弱一致性、可用性优先、采用乐观的方法、适应变化、更简单、更快
数据一致性的实现技术:NRW、2PC、Paxos、Vector Clock
数据存储模型: www.nosql-databases.org
列式存储模型 、文档数据模型 、 键值数据模型 、图式数据模型
列式模型:
应用场景:在分布式文件系统之上提供支持随机读写的分布式数据存储
典型产品:Hadoop/HBase、Hypertable(Facebook研发)、Cassandra(Facebook)
数据模型:以“列”为中心进行存储,将同一列数据存储在一起
优点:快速查询、高可扩展性、易于实现分布式扩展
文档模型:
应用场景:非强事务需求的web应用
典型产品:MongoDB、ElasticSearch、CouchDB、CouchBase Server
数据模型:键值模型,存储为文档
优点:数据模型无须事先定义
键值模型:
应用场景:内容缓存,用于大量并行数据访问高负载场景
典型产品:DynamoDB(亚马逊研发)、Riak、Redis、MemcacheDB(新浪研发)
数据模型:基于哈希表实现的key-value
优点:查询迅速
图式模型:
应用场景:社交网络、推荐系统、关系图谱
典型产品:Neo4j、Infinite Graph、TiTan
数据模型:图式结构
优点:适应于图式计算场景
二、MongoDB (官方下载站点 www.mongodb.org/downloads/)
MongoDB是Nosql的一种,文档数据存储模型,jons数据模型,功能次于MySQL,性能强于MySQL。
CentOS RPM包下载地址:http://downloads-distro.mongodb.org/repo/redhat/os/x86_64/RPMS/
安装mongodb:三个包
(mongo-org-server.rpm、mongol-org-shell.prm客户端、mongol-org-tools.rpm工具)
#rpm -ql mongodb 查看mongodb配置文件为/etc/mongod.conf
#mkdir -pv /mongodb/data 自定义数据库存放路径(默认/var/lib/mongo)
#chown -R mongod:mongod /mongodb/ (系统默认创建mongod用户来运行mongod,修改目录权限)
#vi /etc/mongod.conf 修改配置文件中定义的数据库路径
#配置文件打开http接口: httpinterface=true (添加rest=true)
#service mongod start
#ls /mongodb/data (查看数据库初始化话的数据,非常大)
#du -sh /mongodb/data/ 显示3.1G
#ss -tnl #查看监听的27017和28017端口
#mongo --host 172.16.100.7 #连入数据库
>show dbs #无需创建数据库,创建collections(容器,相当于表)后自动延时创建数据库!
>db.stats() #查看数据库信息
>db.serverstats() #查看服务器状态
以上是关于数据库基础:讲解MySQL索引的概念及数据库索引的应用[2]的主要内容,如果未能解决你的问题,请参考以下文章