mysql - 查找 MySQL 表之间的差异,仅返回特定列已更改的行
问题描述
我需要区分两个 MySQL 表,并报告对结果子集的更改。
假设我有这两个表:
表 A:
id name supplier value
-----------------------------------------
1 Alice X 100
2 Bob Y 200
3 Clare Z 300
4 Desmond X 400
表 B:
id name supplier value
-----------------------------------------
1 Alice X 150
2 Bob X 200
3 Clare Z 350
4 Desmond X 400
5 Emily X 500
我对涉及供应商 X 的任何行的更改感兴趣。鉴于上述情况,我想返回:
- ID 1,因为供应商是X,值变了;
- ID 2,因为供应商已从 Y 变为 X;
- ID 5,因为供应商是 X,表 A 中没有对应的行。
我对 ID 3 不感兴趣,因为虽然值已更改,但更改不涉及供应商 X。我对 ID 4 也不感兴趣,因为根本没有更改。
我可以UNION ALL
用来计算差异:
SELECT *
FROM
(
SELECT a.id, a.name, a.supplier, a.value, 'a' as tbl
FROM a
UNION ALL
SELECT b.id, b.name, b.supplier, b.value, 'b' as tbl
FROM b
) t
GROUP BY id, name, supplier, value
HAVING COUNT(*) = 1
ORDER BY id
这将返回数据已更改的所有行:
id name supplier value tbl
---------------------------------------------------
1 Alice X 100 a
1 Alice X 150 b
2 Bob Y 200 a
2 Bob X 200 b
3 Clare Z 300 a
3 Clare Z 350 b
5 Emily X 500 b
但是,它还包括我不感兴趣的 ID 3,因为表 A 或 B 中的行都没有供应商 X。
所以最后,我的问题是 -如何返回其中一个差异行是供应商 X 的结果?我当然可以在代码中过滤结果,但在单个查询中执行此操作会很棒。
解决方案
我会用两个LEFT JOINS
和一个来接近它UNION
:
CREATE TABLE `a` (
`id` INT(11) NOT NULL AUTO_INCREMENT,
`name` VARCHAR(50) NOT NULL DEFAULT '0',
`supplier` VARCHAR(50) NOT NULL DEFAULT '0',
`value` INT(11) NOT NULL DEFAULT '0',
PRIMARY KEY (`id`)
)
COLLATE='latin1_swedish_ci'
ENGINE=InnoDB
AUTO_INCREMENT=5
;
CREATE TABLE `b` (
`id` INT(11) NOT NULL AUTO_INCREMENT,
`name` VARCHAR(50) NOT NULL DEFAULT '0',
`supplier` VARCHAR(50) NOT NULL DEFAULT '0',
`value` INT(11) NOT NULL DEFAULT '0',
PRIMARY KEY (`id`)
)
COLLATE='latin1_swedish_ci'
ENGINE=InnoDB
AUTO_INCREMENT=6
;
INSERT INTO `a` (`id`, `name`, `supplier`, `value`) VALUES (1, 'Alice', 'X', 100);
INSERT INTO `a` (`id`, `name`, `supplier`, `value`) VALUES (2, 'Bob', 'Y', 200);
INSERT INTO `a` (`id`, `name`, `supplier`, `value`) VALUES (3, 'Clare', 'Z', 300);
INSERT INTO `a` (`id`, `name`, `supplier`, `value`) VALUES (4, 'Desmond', 'X', 400);
INSERT INTO `b` (`id`, `name`, `supplier`, `value`) VALUES (1, 'Alice', 'X', 150);
INSERT INTO `b` (`id`, `name`, `supplier`, `value`) VALUES (2, 'Bob', 'X', 200);
INSERT INTO `b` (`id`, `name`, `supplier`, `value`) VALUES (3, 'Clare', 'Z', 350);
INSERT INTO `b` (`id`, `name`, `supplier`, `value`) VALUES (4, 'Desmond', 'X', 400);
INSERT INTO `b` (`id`, `name`, `supplier`, `value`) VALUES (5, 'Emily', 'X', 500);
SELECT a.name AS name, a.supplier AS a_supplier, a.value AS a_value, b.supplier AS b_supplier, b.value AS b_value FROM a
LEFT JOIN b ON a.name = b.name
WHERE (a.supplier ='X' OR b.supplier = 'X') AND (a.value <> b.value OR a.supplier <> b.supplier OR b.name IS NULL)
UNION
SELECT b.name AS name, a.supplier AS a_supplier, a.value AS a_value, b.supplier AS b_supplier, b.value AS b_value FROM b
LEFT JOIN a ON b.name = a.name
WHERE (a.supplier ='X' OR b.supplier = 'X') AND (a.value <> b.value OR a.supplier <> b.supplier OR a.name IS NULL)
首先,将表连接A
到表B
,然后进行反向连接。
我不确定您是否可以通过它们的 id 连接表,所以我使用名称作为此示例的连接列。
每个联接都包含一个WHERE
子句,该子句使用您的 cirteria 过滤行:“更改涉及供应商 X 的任何行”。
这是一个 SQLFiddle:http ://sqlfiddle.com/#!9/46f213/1
推荐阅读
- python - 如何修复 tf.tensor_scatter_add 中的“InternalError: Missing 0-th output from node”
- python - 用while函数做乘法表的问题
- python - 如何在 python 中使用加密的 RSA 私钥(AES-256-CBC)对数据进行签名
- python - 如何找到 3 个大集合交集的 100 个元素的列表?
- javascript - 一天中的时间问候代码在上午/下午格式中不起作用
- python-2.7 - Google Cloud Dataflow:数据流编程模型的计算时间与普通 VM 机器上的计算时间相同吗?
- javascript - 调用通过其 props 传递的函数
- javascript - 如何在字符串文字中编写 addEventListener?
- javascript - Javascript 字谜算法
- javascript - 为什么我的何时滚动在以下代码中不起作用