mysql - MySQL 死锁与复合主键和触发自动增量
问题描述
我有独立的服务器和 2000 个在线用户(不是很多)。带有表 request_action 的 MySQL DB 5.6(没有自动增量但增量的复合 PK 在触发器中,您可以在下面看到它):
CREATE TABLE `request_action` (
`ra_id` bigint(20) NOT NULL,
`cl_id` int(11) NOT NULL DEFAULT '0',
`ra_r_id` bigint(20) NOT NULL,
`ra_tr_id` bigint(20) DEFAULT '0',
`ra_ss_id` bigint(20) NOT NULL DEFAULT '0',
`ra_h_id` int(11) NOT NULL DEFAULT '0',
`ra_uch_id` bigint(20) DEFAULT '0',
`ra_u_id` int(11) DEFAULT '0',
`ra_datetime` datetime NOT NULL,
`ra_uct_id` int(11) NOT NULL DEFAULT '0',
`ra_text` longtext NOT NULL,
`ra_datetime_reply` datetime NOT NULL,
`ra_reply` longtext NOT NULL,
`ra_line_breaks` tinyint(4) NOT NULL DEFAULT '0',
`ra_plan` tinyint(4) NOT NULL DEFAULT '0',
`ra_shw` tinyint(4) NOT NULL DEFAULT '1',
`ra_to_u_id` int(11) DEFAULT '0',
`ra_created_at` datetime DEFAULT NULL,
`ra_seen` tinyint(4) NOT NULL DEFAULT '0',
`ra_seen_u_id` bigint(20) NOT NULL DEFAULT '0',
PRIMARY KEY (`cl_id`,`ra_id`),
KEY `rm_r_id` (`ra_r_id`),
KEY `ra_u_id` (`ra_u_id`),
KEY `ra_plan` (`ra_plan`),
KEY `ra_rat_id` (`ra_ss_id`),
KEY `ra_h_id` (`ra_h_id`),
KEY `ra_tr_id` (`ra_tr_id`),
KEY `ra_id` (`ra_id`),
KEY `ra_datetime` (`ra_datetime`,`ra_seen`),
KEY `ra_shw` (`ra_shw`,`ra_seen`,`ra_to_u_id`),
KEY `ra_r_id` (`ra_r_id`,`ra_tr_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
在此表上触发(插入前):
if (cast(NEW.ra_id as UNSIGNED) = 0) then
SET NEW.ra_id = (SELECT COALESCE(MAX(ra_id)+1, 1) FROM request_action WHERE cl_id = NEW.cl_id);
end if
而且我一天中有很多次死锁((例如,一天有 100 次。
LATEST DETECTED DEADLOCK
------------------------
2019-02-21 21:09:34 7f5e11f3b700
*** (1) TRANSACTION:
TRANSACTION 2947112777, ACTIVE 0 sec inserting
mysql tables in use 11, locked 11
LOCK WAIT 5 lock struct(s), heap size 1184, 3 row lock(s)
MySQL thread id 19952598, OS thread handle 0x7f5e10e38700, query id 248552715 192.168.0.7 vh_uon_com_ru
insert into request_action (
ra_r_id,
ra_u_id,
ra_datetime,
ra_text,
ra_datetime_reply,
ra_reply,
ra_plan,
cl_id,
ra_tr_id,
ra_ss_id,
ra_h_id,
ra_uch_id,
ra_to_u_id,
ra_uct_id,
ra_shw
) values (
40053,
906,
'2019-02-21 21:09:34',
'Звонок',
'2019-02-21 21:09:34',
'',
'0',
698,
0,
0,
0,
171114,
0,
*** (1) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 2320 page no 546708 n bits 104 index `PRIMARY` of table `request_action` trx id 2947112777 lock_mode X locks gap before rec insert intention waiting
*** (2) TRANSACTION:
TRANSACTION 2947112774, ACTIVE 0 sec inserting
mysql tables in use 11, locked 11
5 lock struct(s), heap size 1184, 3 row lock(s)
MySQL thread id 19952597, OS thread handle 0x7f5e11f3b700, query id 248552705 192.168.0.7
insert into request_action (
ra_r_id,
ra_u_id,
ra_datetime,
ra_text,
ra_datetime_reply,
ra_reply,
ra_plan,
cl_id,
ra_tr_id,
ra_ss_id,
ra_h_id,
ra_uch_id,
ra_to_u_id,
ra_uct_id,
ra_shw
) values (
25182,
906,
'2019-02-21 21:09:34',
'Звонок',
'2019-02-21 21:09:34',
'',
'0',
698,
0,
0,
0,
171113,
0,
*** (2) HOLDS THE LOCK(S):
RECORD LOCKS space id 2320 page no 546708 n bits 104 index `PRIMARY` of table `request_action` trx id 2947112774 lock mode S locks gap before rec
*** (2) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 2320 page no 546708 n bits 104 index `PRIMARY` of table `request_action` trx id 2947112774 lock_mode X locks gap before rec insert intention waiting
*** WE ROLL BACK TRANSACTION (2)
在 my.cf 中,我们有以下选项:
max_connections = 10000
key_buffer_size = 1024M
join_buffer_size = 256M
read_buffer_size = 256M
sort_buffer_size = 256M
tmp_table_size = 512M
read_rnd_buffer_size = 8M
max_heap_table_size = 512M
thread_cache_size = 8192
query_cache_type = 1
query_cache_size = 15G
wait_timeout = 6000
connect_timeout = 15
interactive_timeout = 60
max_allowed_packet = 512M
bulk_insert_buffer_size = 64M
innodb_log_file_size = 512M
innodb_log_buffer_size = 2G
innodb_buffer_pool_size = 20G
你能帮我解决死锁问题吗?我该如何解决?我应该在死锁中重新运行查询吗?
解决方案
TL;DR - 当您尝试为每个 distinct 生成一个新的递增 id 时,您不能进行并发插入cl_id
。您必须使用表锁来执行此操作,从而导致并发插入串行运行。
绕过这个死锁的原因AUTO_INCREMENT
是它获取了一个简短的表锁来生成下一个 id。从技术上讲,这会导致所有执行 INSERT 的并发会话串行执行。幸运的是,表锁非常简短。默认情况下,它会在 id 生成后立即释放。你可以在这里阅读更多:https ://dev.mysql.com/doc/refman/8.0/en/innodb-auto-increment-handling.html
而您生成 id 的方法会导致死锁,因为它使用了两个锁定操作:
- 一个用于创建行的 X 锁。
- 一个用于读取表格的 S 锁。当您作为 INSERT/UPDATE/DELETE 的一部分读取表时,您会在所读取的行上创建一个共享锁。
但是锁不是一起获取的,两个步骤之间有一个短暂的时间,这就是竞争条件发生的地方。我们可以通过使用两个表来证明这一点:
mysql> create table foo ( id serial primary key);
mysql> insert into foo (id) values (1);
mysql> create table bar ( id serial primary key);
mysql> create trigger b before insert on bar
for each row set new.id=(select max(id) from foo);
现在我们有一个触发器bar
,它将读取一些行foo
以获取 max(id)。
mysql> begin;
mysql> insert into bar () values ();
bar
这应该使用它读取的值创建一个新行foo
。但交易仍然开放。
在第二个窗口中,执行以下操作:
mysql> update foo set id = 2;
...
这挂起,等待其 X-lock on foo
。它不能更新foo
,因为它上面已经有一个 S 锁,由会话放置在第一个窗口中。
返回第一个窗口并运行:
mysql> update foo set id = 3;
Query OK, 1 row affected (0.01 sec)
Rows matched: 1 Changed: 1 Warnings: 0
这会创建一个循环锁定等待,这就是死锁。两个事务都在等待另一个事务持有的锁。我们在第二个窗口中看到,该事务被终止:
mysql> update foo set id = 2;
...
ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction
“我该如何解决?我应该在死锁中重新运行查询吗?”
一种解决方法是强制并发会话串行运行,方法是在尝试插入之前获取 INSERT 或触发器引用的所有表上的表锁。
mysql> begin;
mysql> lock tables foo write, bar write;
mysql> insert into bar () values ();
第二个窗口挂起,但这次它挂在表锁上,而不是行锁上。
mysql> update foo set id = 2;
...
在第一个窗口中,完成交易。解锁表锁会隐式提交事务。
mysql> unlock tables;
第二个窗口停止等待,并成功完成更新。
mysql> update foo set id = 2;
...
Query OK, 1 row affected (3.50 sec)
Rows matched: 1 Changed: 1 Warnings: 0
请注意,它已经等待了 3.5 秒,这是我返回第一个窗口并提交事务所需的时间。
使会话连续插入会限制您的应用程序的吞吐量,因为会话正在排队。但它避免了死锁。
推荐阅读
- postman - 在 Postman 中断言数组中的元素
- azure - 如何配置两个前端应用在 Azure 应用服务上并行运行
- nagios - Nagios - 外部命令错误:命令失败
- javascript - 可以用 jquery 加入两个选择器吗?
- jquery - 将类添加到父 div,其中包含带有值的输入复选框
- angular - 将 Angular PWA 部署到 GitHub 页面时,CSS 位置未按预期工作
- android - 对话框没有关闭
- google-cloud-platform - 如何在 Airflow 中使用电子邮件运算符附加文件
- python - Tensorflow 对象检测:将大型输入图像裁剪成图块
- spring-boot - 在 Spring Boot 应用程序中添加 spring-boot-starter-data-redis 后启动 Tomcat 上下文时出错