mysql insert语句注意啥

Posted 2023-03-11

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了mysql insert语句注意啥相关的知识，希望对你有一定的参考价值。

1. 基础的Insert语句示例
下面的语句向员工表插入一条新记录。在这个例子中，后的“values”指定要插入到表中的所有字段对应的值。
INSERT INTO employee VALUES(100,'Thomas','Sales',5000);

用SELECT语句来验证数据是否插入成功。
SELECT * FROM employee;

2. 只针对选定的字段插入值
如果你只想向选定的字段插入值，你需要在INSERT语句中明确指定要插入的字段名字。下面的代码仅插入id和name列的数据
INSERT INTO employee(id,name) VALUES(200,'Jason');

以上代码中，我们未对dept和salary列指定任何值。所以，以上两个字段的值为NULL，当我们用SELECT语句检索数据时。需要注意的是，NULL不是指"NULL"字符串，SELECT语句使用"NULL"来表示这个字段的值是空的而已。
mysql> SELECT * FROM employee;+-----+--------+-------+--------+| id | name | dept | salary |+-----+--------+-------+--------+| 100 | Thomas | Sales | 5000 || 200 | Jason | NULL | NULL |+-----+--------+-------+--------+2 rows in set (0.00 sec)

3. INSERT SET示例
INSERT语句不仅仅可以使用"VALUE"关键字，也可以使用"SET"关键字。下面的例子与上面的例子结果一样，但是使用的是SET关键字。
mysql> INSERT INTO employee SET id=300, name='Mayla';mysql> select * from employee;+-----+--------+-------+--------+| id | name | dept | salary |+-----+--------+-------+--------+| 100 | Thomas | Sales | 5000 || 200 | Jason | NULL | NULL || 300 | Mayla | NULL | NULL |+-----+--------+-------+--------+

4.从另一个表中检索数据插入
下面的例子中，我们会使用INSERT ... SELECT语句，这个语句可以从其他表中检索数据，并插入到目标表。下面的代码从Contractor表中检索所有数据并插入到Employee表。
INSERT INTO employee SELECT * FROM contractor;

SELECT语句中可以根据需要使用WHERE子句，用来检索需要的从Contractor表插入到Employee表的数据。
INSERT INTO employee SELECT * FROM contractor WHERE salary >= 7000;

注意:如果你使用oracle数据库，你的SQL应该这样写"INSERT INTO employee AS SELECT * FROM contractor"。需要注意在MySQL中不适用AS关键字。
5.从其他表中选择部分字段插入
当然，你也可以从其他表中选择部分字段的数据插入到你的表中。下面的例子将从contractor表中选择id，name字段的所有数据插入到employee表。
INSERT INTO employee(id,name) SELECT id,name FROM contractor;

跟前面的例子一样，可以使用WHERE子句过滤数据。
INSERT INTO employee(id,name) SELECT id,name FROM contractor WHERE salary >= 7000;

注意:如果employee表中已存在相同主键（这里的主键是id）的记录，你会得到一条错误信息。下面是一个示例错误信息，指出employee表中已经存在id为100的记录。
ERROR 1062 (23000): Duplicate entry '100' for key 'PRIMARY'

6. 插入数据到指定分区
如果创建了分区表（分区类型为range）并希望将输入插入到指定分区，可以参考下面代码。将数据插入到分区p1中的employee表。
INSERT INTO employee PARTITION (p1) VALUES(100,'Thomas','Sales',5000);

注意:如果该分区的employee表中已包含相应的数据（这里是id=100的employee数据），你会得到如下错误信息。
ERROR 1729 (HY000): Found a row not matching the given partition set

注意: 分区仅在MySQL5.6及以上版本可用。
7. 插入数据到多个分区
可以使用单条SQL语句将数据插入到多个分区。下面的INSERT语句将id为100的记录插入到p1分区，将id为200的记录插入到p2分区。
INSERT INTO employee PARTITION (p1, p2) VALUES(100,'Thomas','Sales',5000), (200,'Jason','Technology',5500);

注意: 在上例中，如果MySQL往任意分区插入数据失败，那么整个INSERT语句将失败。当然，这同样仅能在MySQL5.6及以上版本使用。
8. 在插入过程中忽略错误
在一些场景中（比如：批处理），你可能希望忽略插入过程中MySQL产生的错误信息，你可以使用INSERT IGNORE语句。比如：下面的例子会抛出错误信息，提示数据已经存在。
mysql> INSERT INTO employee VALUES(100,'Thomas','Sales',5000);ERROR 1062 (23000): Duplicate entry '100' for key 'PRIMARY'

要忽略上面的错误信息，可以使用INSERT IGNORE来替换INSERT语句（执行前请确保这条对应的主键已经存在）。
mysql> INSERT IGNORE INTO employee VALUES(100,'Thomas','Sales',5000);Query OK, 0 rows affected (0.00 sec)

INSERT IGNORE仅仅只是忽略错误信息，不会进行其他任何处理。
9. INSERT语句的默认值
如果MySQL运行在strict模式下，并且在我们的INSERT语句中并未指定默认值，那么MySQL将抛出错误信息。不过，如果MySQL并未启用strict模式（这个是默认启用的）时，同时INSERT语句没有为字段指定值，那么MySQL会为该字段使用字段类型的默认值。比如，bonus表的所有字段都不允许为空(not null)。
mysql> DESC bonus;+--------+---------+------+-----+---------+-------+| Field | Type | Null | Key | Default | Extra |+--------+---------+------+-----+---------+-------+| id | int(11) | NO | | NULL | || amount | int(11) | NO | | NULL | |+--------+---------+------+-----+---------+-------+

我们先执行以下语句，插入一条数据(id=100)
INSERT INTO bonus(id) VALUES(100);

查看刚插入的数据，可以看到amount字段被设置为默认值0
SELECT * FROM bonus;+-----+--------+| id | amount |+-----+--------+| 100 | 0 |+-----+--------+

如果，SQL语句中同时不指定id和amount字段的值，那么他们都会被自动设置为默认值0。参考下面例子。
INSERT INTO bonus VALUES();mysql> select * 参考技术A

背景

有人问mysqldump出来的insert语句，是否可以按每 10 row 一条insert语句的形式组织。

思考1：参数--extended-insert回忆过去所学：

我只知道有一对参数

--extended-insert(默认值)

表示使用长 INSERT ，多 row 在合并一起批量 INSERT，提高导入效率

--skip-extended-insert一行一个的短INSERT

均不满足群友需求，无法控制按每 10 row 一条 insert 语句的形式组织。

思考2：“避免大事务”之前一直没有考虑过这个问题。这个问题的提出，相信主要是为了“避免大事务”。所以满足 insert 均为小事务即可。下面，我们来探讨一下以下问题：1. 什么是大事务？

2. 那么 mysqldump 出来的 insert 语句可能是大事务吗？

什么是大事务？

定义：运行时间比较长，操作的数据比较多的事务我们称之为大事务。

大事务风险：

∘ 锁定太多的数据，造成大量的阻塞和锁超时，回滚所需要的时间比较长。

∘ 执行时间长，容易造成主从延迟。

∘ undo log膨胀

避免大事务：我这里按公司实际场景，规定了，每次操作/获取数据量应该少于5000条，结果集应该小于2M

mysqldump出来的SQL文件有大事务吗？

前提，MySQL 默认是自提交的，所以如果没有明确地开启事务，一条 SQL 语句就是一条事务。在 mysqldump 里，就是一条 SQL 语句为一条事务。

按照我的“避免大事务”自定义规定，答案是没有的。原来，mysqldump 会按照参数--net-buffer-length，来自动切分 SQL 语句。默认值是 1M。按照我们前面定义的标准，没有达到我们的 2M 的大事务标准。--net-buffer-length 最大可设置为 16777216，人手设置大于这个值，会自动调整为 16777216，即 16M。设置 16M，可以提升导出导入性能。如果为了避免大事务，那就不建议调整这个参数，使用默认值即可。[root@192-168-199-198 ~]# mysqldump --net-buffer-length=104652800 -uroot -proot -P3306 -h192.168.199.198 test t >16M.sqlmysqldump: [Warning] option 'net_buffer_length': unsigned value 104652800 adjusted to 16777216#设置大于16M，参数被自动调整为16M

注意，指的是 mysqldump 的参数，而不是 mysqld 的参数。官方文档提到: If you increase this variable, ensure that the MySQL server net_buffer_length system variable has a value at least this large.

意思是 mysqldump 增大这个值，mysqld 也得增大这个值，测试结论是不需要的。怀疑官方文档有误。

不过，在导入的时候，受到服务器参数 max_allowed_packet 影响，它控制了服务器能接受的数据包的最大大小，默认值是 4194304，即 4M。所以导入数据库时需要调整参数 max_allowed_packet 的值。set global max_allowed_packet=16*1024*1024*1024;

不调整的话，会出现以下报错：[root@192-168-199-198 ~]# mysql -uroot -proot -P3306 -h192.168.199.198 test <16M.sqlmysql: [Warning] Using a password on the command line interface can be insecure.ERROR 2006 (HY000) at line 46: MySQL server has gone away

相关测试最后，我放出我的相关测试步骤mysql> select version();+------------+| version() |+------------+| 5.7.26-log |+------------+1 row in set (0.00 sec)

造100万行数据

create database test;

use test;

CREATE TABLE `t` (

`a` int(11) DEFAULT NULL,

`b` int(11) DEFAULT NULL,

`c` varchar(255) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

insert into t values (1,1,'abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyztuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz');

insert into t select * from t; #重复执行20次

# 直到出现Records: 524288 Duplicates: 0 Warnings: 0

# 说明数据量达到100多万条了。

mysql> select count(*) from t;

+----------+

| count(*) |

+----------+

| 1048576 |

+----------+

1 row in set (1.04 sec)

数据大小如下，有 284MB[root@192-168-199-198 test]# pwd/data/mysql/mysql3306/data/test[root@192-168-199-198 test]# du -sh t.ibd284M t.ibd

--net-buffer-length=1M[root@192-168-199-198 ~]# mysqldump -uroot -proot -S /tmp/mysql3306.sock test t >1M.sql[root@192-168-199-198 ~]# du -sh 1M.sql225M 1M.sql[root@192-168-199-198 ~]# cat 1M.sql |grep -i insert |wc -l226

默认 --net-buffer-length=1M 的情况下，225M 的SQL文件里有 226 条 insert ，平均下来确实就是每条 insert 的 SQL 大小为 1M。

--net-buffer-length=16M

[root@192-168-199-198 ~]# mysqldump --net-buffer-length=16M -uroot -proot -S /tmp/mysql3306.sock test t >16M.sql[root@192-168-199-198 ~]# du -sh 16M.sql225M 16M.sql[root@192-168-199-198 ~]# cat 16M.sql |grep -i insert |wc -l15

默认--net-buffer-length=16M 的情况下，225M 的 SQL 文件里有 15 条 insert，平均下来确实就是每条 insert 的 SQL 大小为 16M。所以，这里证明了 --net-buffer-length 确实可用于拆分 mysqldump 备份文件的SQL大小的。

性能测试insert 次数越多，交互次数就越多，性能越低。但鉴于上面例子的 insert 数量差距不大，只有 16 倍，性能差距不会很大(实际测试也是如此)。我们直接对比 --net-buffer-length=16K 和 --net-buffer-length=16M 的情况，他们insert次数相差了 1024 倍。

[root@192-168-199-198 ~]# time mysql -uroot -proot -S /tmp/mysql3306.sock test <16K.sql

mysql: [Warning] Using a password on the command line interface can be insecure.

real 0m10.911s #11秒

user 0m1.273s

sys 0m0.677s

[root@192-168-199-198 ~]# mysql -uroot -proot -S /tmp/mysql3306.sock -e "reset master";

mysql: [Warning] Using a password on the command line interface can be insecure.

[root@192-168-199-198 ~]# time mysql -uroot -proot -S /tmp/mysql3306.sock test <16M.sql

mysql: [Warning] Using a password on the command line interface can be insecure.

real 0m8.083s #8秒

user 0m1.669s

sys 0m0.066s

结果明显。--net-buffer-length 设置越大，客户端与数据库交互次数越少，导入越快。

结论mysqldump 默认设置下导出的备份文件，符合导入需求，不会造成大事务。性能方面也符合要求，不需要调整参数。

请点击输入图片描述

以上是关于mysql insert语句注意啥的主要内容，如果未能解决你的问题，请参考以下文章