SQL 压力测试实战篇
Posted 有关SQL
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL 压力测试实战篇相关的知识,希望对你有一定的参考价值。
针对数据库的测试,市面上已经有很多工具了,Google 上搜一下 sql testing tool , 他为你选出的工具,琳琅满目,看花双眼。
比如:40+ Best Database Testing Tools - Popular Data Testing Solutions 这篇文章列举了总共 43 个测试工具,可以用来完成 SQL 的测试,包括生成测试数据,功能性测试,逻辑性测试,当然还有压力测试。
在这里罗列几个工具,以便有应用场景的时候,可以拿起来直接用。
现在的应用系统,一般都会有好几层,比如 UI, Access Layer, Business Layer, 数据库。每一层都有自己独立的测试工具,下面的工具可能会同时支持其中1,2层对应的测试。
Test Data Generator:
1. data factory
商业用数据库数据生成工厂。主要特点有:
1.生成数据
2.压力测试
2. MockupData
3. DTM Data Generator
SQL-Based Tools:
1. SQL Server Database tools
2. SQL Test: uses tSQLt framework to make test on views, stored procedures and functions。 使用的是 tSQLt 测试框架,用来测试试图,存储过程以及函数
3. tSQLt:dedicated to sql server
4. oracle sql developer:
5. NoSQLUnit:
6.NoSQLMap:
7. SeLite:combination of selenium and SQLite, known as Selenium extension
8. SQLMap: open source tool for SQLite, mysql, SQL Server, DB2, PostgreSQL
DB based Level Testing tools:
1. HammerDB: open source tool for database load testing, used as benchmarking tool for sql server, mysql, db2, oracle。 这款工具的优点在于,他是 open source即开源的工具,意味着你可以完全看到他的测试方案。看不到测试方案的工具,其实对自己理解测试报告,是有障碍的,比如并发是怎么协调的,测试用的逻辑脚本是不是能体现出测试要求。
UI Enhanced Tools: 自带绚丽UI的一体化工具
1. Toad。 这款工具就不用多说了,和 Oracle 打交道并且是大厂项目的话,Toad 基本是必用工具。
2.DBVisualizer: toad 旗下的可视化开发工具, 最有用的一点是可以快速建立ER图
3. Database benchmark: open source tool for performing stress testing on a database that contains a large volume of data. Graphic visualization and reporting options are advanced features of this tool. 开源工具,可视化配置测试用例,性能测试报告。
针对 MySQL, Oracle, MariaDB :
1. Navicat: for mySQL, also manage data in sql server , oracle, mysql, SQLite
2. LoadRunner for Oracle:
在 Brent Ozar 的博客上找到一个非常棒的工具: SQLQueryStress, 并且是open source 开源的。可以从github 上下载并使用。
https://www.brentozar.com/archive/2015/05/how-to-fake-load-tests-with-sqlquerystress
说了那么多,这才是本文的主角。
如果你是手机的 Geek, 我想你一定会喜欢 Andriod.
iPhone 当然也有玩头,只不过 App Store 上线一应用,审批实在麻烦。
这款 SQLQueryStress 就像是 Andriod 上的应用一样,随你拆开来玩,一睹内部玄妙的机关。Github 是个重武器库,当今的软件替代品差不多都能找到。大家看到的题图,都是用了 GitHub 上的小爬虫,从 Instagram 上扣下来的。
首先交代测试环境:
1. 测试工具: SQLQueryStress
下载路径:https://github.com/ErikEJ/SqlQueryStress
2. 测试用 SQL Server 服务器:
个人的vmware 虚拟机,配置较低
Windows Server 2012
2GB RAM
Intel Core i3CPU @3.07 GHZ
20GB SSD
3. 测试方案:
3.1 用户响应时间:读
3.2 服务器 CPU 利用率
今天暂时针对 CPU 做测试。
1. 10 个并发的情况下, 平均响应时间在 0.4973 秒。可以说妥妥的。但细心的朋友肯定注意到,其实这里只是单纯的运行同一个 SQL, 想想是不是哪里不够严谨,哪里可以提高,哪里是瓶颈?
2. 200个并发下,平均响应时间已经超过 1s, 接近 2s 了
当这 200个并发,一直在运行着查询的时候,即使是同一个查询,响应时间也已经不可接受了。
我们在本次实验中,应用的是同一段脚本,同一段脚本运行完了之后,执行计划会被缓存起来,相应的数据,也会在数据库的缓存中保留下来,这样的环境下,连续的发出查询请求,其实对服务器的CPU考核已经不是很严格了,不需要硬解析,不需要从数据库磁盘拿出数据,但并发的响应时间依然不合格。
假如我们用一个总调度,根据线程ID来随机抽取一个只读存储过程进行查询,这样的查询对CPU的考验才叫严格与真实。
刚才我们用10个并发的时候,系统没有明显的压力,响应时间够快。
这次我们就做10个存储过程,当10个并发同时调用这10个存储过程的时候,检查响应时间,是不是依然合格!
1 利用 AdventureWorks 数据库,编写10个简单的存储过程
2 编写一个总调度存储过程,根据各自的线程ID,即 session_id, 来随机调取其中一个存储过程
10 个简单的存储过程可以这么快速生成:
DECLARE @sql_body NVARCHAR(max);
DECLARE my_cur CURSOR
FOR
SELECT TOP 10 'create procedure ' + schema_name(schema_id) + '.get' + NAME + ' as begin ' + 'select count(*) as cnt from ' + schema_name(schema_id) + '.' + NAME + ' end ' + CHAR(10) + 'go'
FROM sys.objects
WHERE type_desc = 'user_table'
OPEN my_cur
FETCH NEXT
FROM my_cur
INTO @sql_body
PRINT @sql_body
WHILE @@fetch_status = 0
BEGIN
FETCH NEXT
FROM my_cur
INTO @sql_body
PRINT @sql_body;
END
CLOSE my_cur
DEALLOCATE my_cur
GO
总调度存储过程:
CREATE PROCEDURE dbo.usp_randRunQuery @threads INT = 10
AS
BEGIN
DECLARE @sql_body NVARCHAR(max);
CREATE TABLE #temp_procs (
procedurename NVARCHAR(max)
,id INT identity(1, 1)
)
INSERT INTO #temp_procs
SELECT TOP 10 'exec ' + schema_name(schema_id) + '.' + NAME
FROM sys.objects
WHERE type_desc = 'SQL_STORED_PROCEDURE'
ORDER BY create_date DESC
SELECT @sql_body = procedurename
FROM #temp_procs
WHERE id = @@spid % @threads
EXEC sp_executesql @stmt = @sql_body;
DROP TABLE #temp_procs
END
当 10 个线程,调用不同的存储过程时,响应速度依旧可以。有峰值,但不过百
在执行过程中,我发现并不是每一次的 iteration 都是固定的线程,有可能每一次执行,分配的处理线程会改变,因此需要多循环几次,来保证每一个存储过程都被调用,并且一段时间内有足够多的并发在运行
我的猜想是,到了一定的时间之后,相应时间会趋稳。
所以做了一个记录每一个查询的执行时间的功能,如下:
1 加一张Log表:
create table execution_log(execid bigint identity(1,1), spid int, procname nvarchar(2000),start_dt datetime, end_dt datetime)
2. 修改我们的调度过程
CREATE PROCEDURE dbo.usp_randRunQuery @threads INT = 10
AS
BEGIN
BEGIN
DECLARE @execid BIGINT
DECLARE @sql_body NVARCHAR(2000);
CREATE TABLE #temp_procs (
procedurename NVARCHAR(2000)
,id INT identity(1, 1)
)
INSERT INTO #temp_procs
SELECT TOP 10 'exec ' + schema_name(schema_id) + '.' + NAME
FROM sys.objects
WHERE type_desc = 'SQL_STORED_PROCEDURE'
ORDER BY create_date DESC
SET IDENTITY_INSERT #temp_procs OFF
INSERT INTO #temp_procs (
id
,procedurename
)
SELECT 0
,procedurename
FROM #temp_procs
WHERE id = 6
SET IDENTITY_INSERT #temp_procs ON
SELECT @sql_body = procedurename
FROM #temp_procs
WHERE id = @@spid % @threads % 10
INSERT INTO execution_log (
spid
,procname
,start_dt
)
VALUES (
@@spid
,@sql_body
,getutcdate()
)
SELECT @execid = SCOPE_IDENTITY()
EXEC sp_executesql @stmt = @sql_body;
UPDATE execution_log
SET end_dt = getutcdate()
WHERE execid = @execid;
DROP TABLE #temp_procs
END
END
果不出所料,再多的请求,相应时间也稳定下来了
以上是关于SQL 压力测试实战篇的主要内容,如果未能解决你的问题,请参考以下文章